بسته جامع پژوهشی تشخيص حروف صدا دار از روي تصاوير لب

این بسته پژوهشی مجموعه کاملی از آخرین پژوهش های انجام شده در زمینه تشخيص حروف صدا دار از روي تصاوير لب است. در تدوین این بسته از جدیدترین مقالات و پایان نامه های موجود در این زمینه استفاده شده است. مخاطبان این بسته دانشجویان تحصیلات تکمیلی و پژوهش گرانی هستند که قصد فعالیت در این زمینه دارند.

  • در فصل اول این پژوهش لب خواني به كمك پردازش تصاوير به منظور كمك به معلولين حركتي گفتاري بررسی شده است
  • در فصل دوم این پژوهش تشخيص حروف صدا دار از روي تصاوير لب بررسی شده است
  • در فصل سوم این پژوهش طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج بررسی شده است

از ديرباز تشخيص و بازشناسي صحبت به عنوان اولين وسـيله ارتبـاطي بـين انسـانهـا از اهميـت بسـياريبرخوردار بوده است. تاكنون تكنيكهاي بازشناسي صحبت با استفاده از پردازش صوت با تنوع بسيار و با موفقيت نسبي بكار گرفته شدهاند. اما وجود نويز در برخي شرايط عامل اصـلي بـروز اشـتباهات اساسـي در تشـخيص بوده است كه در اين گونه موارد استفاده از پردازش تصوير و به ويژه بررسي شكل لبها و حركت آنها مـي توانـدبراي ارتقاء نتايج مورد استفاده قرار گيرد. استخراج اطلاعات ديداري از تصاوير لب كمك شاياني به تشـخيصصوت و تصديق گوينده بويژه در محيطهاي نويزي را فراهم آورده است به همين دليل توجه زيـادي را بـه خـودجلب نموده است در اين فصل يك مروركلي بر روي روشهاي انجام شده تـا بـه حـال صـورت خـواهيم داد و درمورد دستهبنديهاي موجود براي روشها صحبت خواهيم كرد.

قسمت هایی از فصل اول لب خواني به كمك پردازش تصاوير به منظور كمك به معلولين حركتي گفتاري

اولين گام در اكثر كاربردهاي بينايي ماشين از قبيل شناسايي چهره ، تشـخيص حالـت چهـره ، رديـابيچهره و لبخواني تشخيص نقاط ويژگي صورت است. نقاط ويژگي صورت شامل نقـاط بـر جسـته صـورت ازقبيل گوشه چشمها ، گوشه ابروها ، گوشه و نقاط مياني كانتور بيروني لب، حفره هاي بيني و برآمـدگي روي چانه و بيني ميباشد. از الگوريتمهايي كه امروزه بطور گسـترده بـراي رديـابي و همراسـتا نمـودن چهـره در تصاوير استفاده ميشود ميتوان به ASM و AAM اشاره نمود. در اين الگوريتمها موقعيت نقاط ويژگـي بـهعنوان گام اوليه شناخته ميشود. به هر حال چون اين گام وابسته به علامت زني اين نقاط بطور دستي اسـت لذا استخراج اين نقاط يكي ازكارهاي مهم در اين كاربردها است. از ديگر كاربردهـاي نقـاط ويژگـي صـورت، موقعيت ثابت نقاط ويژگي از قبيل گوشه چشمها و گوشه دروني حفـره هـاي بينـي اسـت كـه از ايـن نقـاطمعمولاً براي ثابت نمودن هر بخش از فريم تصوير ورودي با اولين فريم به ترتيب مورد استفاده قرار ميگيـرد .
روشهاي قبلي كه براي تشخيص نقاط ويژگي صورت وجود دارند را ميتوان به دو دسته تقسيم نمود :
1-روشهاي مبتني بر بافت
2-روشهاي مبتني بر شكل

فهرست کامل فصل اول لب خواني به كمك پردازش تصاوير به منظور كمك به معلولين حركتي گفتاري

1-1 ) لب خواني به كمك پردازش تصاوير به منظور كمك به معلولين حركتي گفتاري

1.1.1 چکیده 1
1.1.2 مقدمه 1
1.1.3 مجموعه دادگان جمع آوري شده 2
1.1.4 استخراج كانتور لب 3
1.1.5 مدل لب 3
1.1.6 توصيف محدوديتهاي هندسي لب 3
1.1.7 نرماليزه كردن 3
1.1.8 جداسازي ناحيه لب 4
1.1.9 انطباق مدل پيشنهادي به كانتور لب 4
1.1.10 استفاده از عملگرهاي مورفولوژيك براي تعیین دقیق ناحیه لب 4
1.1.11 نتايج استخراج مرز لب 4
1.1.12 استخراج ويژگي هاي تصويري گفتار 5
1.1.13 يكسان كردن تعداد فريمها و بعد بردار ويژگي 5
1.1.14 كاهش بعد بردار ويژگي 5
1.1.15 دسته بندي 6
1.1.16 بحث و نتايج 6
1.1.17 نتیجه گیری 7
1.1.18 مراجع 7

1-2 ) لب خوانی نیمه اتوماتیک حروف آ،ف،م،و براساس حرکات لب به کمک نرم افزار پردازش تصویر

1.2.1 چکیده 8
1.2.2 مقدمه 8
1.2.3 بررسی کارهاي انجام شده در زمینه ي آشکارسازي لب 9
1.2.4 روش پیشنهادی 9
1.2.5 پایگاه داه و ورودی نرم افزار 9
1.2.6 دلیل استفاده از فضای segmentation برای شناسایی ناحیه ی لب 10
1.2.7 جداکردن محدوده ی لب 10
1.2.8 نحوه ی تبدیل به فضای رنگ L*A*B* 10
1.2.9 سگمنت بندی تصویر لب با استفاده از فضای رنگی L*A*B* 11
1.2.10 بازتشخیص حرف آ 12
1.2.11 نتایج 12
1.2.12 بازتشخیص حرف ف 12
1.2.13 بازتشخیص حرف م 13
1.2.14 باز تشخیص حرف و 13
1.2.15 نتیجه گیری 14
1.2.16 مراجع 14

1-3 ) يک روش جديد براي لب خواني با استفاده از پردازش تصوير و تصميم گيري فازي

1.3.1 چکیده 15
1.3.2 مقدمه 15
1.3.3 بررسي کارهاي انجام شده در زمينه آشکار سازي لب 15
1.3.4 يافتن حاشيه هاي لب و تشکيل شکل تخميني لب 16
1.3.5 قطعه بندی WATERSHED 16
1.3.6 الگوريتم جديد قطعه بندي بکار رفته درمقاله 17
1.3.7 بدست آوردن 6 ضلعي تخميني معادل حاشيه لب 18
1.3.8 انتخاب فریم 19
1.3.9 دلايل استفاده از سيستم فازي درمقاله 20
1.3.10 متغيرهاي زباني بکار رفته درمقاله 20
1.3.11 متغيرزباني ، تغييرات نسبي پهناي لب 20
1.3.12 متغيرزباني ، تغييرات نسبي ميانگين زواياي پايين لب 21
1.3.13 قوانين استدلال فازي در مقاله 22
1.3.14 مرحله فازي زدايي در مقاله 22
1.3.15 نتايج 22
1.3.16 REFERENCE 23

1-4 ) پیاده سازی موثر درخت صفر ادغام شده درفشرده سازی تصویر برپایه موجک بانرخ فشرده سازی بالا

1.4.1 چکیده 24
1.4.2 مقدمه 24
1.4.3 بررسی الگوریتم موجک درخت درخت صفر ادغام شده EZW 24
1.4.4 تبدیل موجک برای تصاویر 24
1.4.5 الوریتم موجک درخت صفر ادغام شده EZW 25
1.4.6 الگوریتم موجک درخت صفر ادغام شده موثر EEZW 25
1.4.7 نقاط ضعف الگوریتم EZW 25
1.4.8 چگونگی عملکرد الگوریتم EZW 25
1.4.9 پیشنهادهایی برای بهبود نقاط ضعف الگوریتم EZW 26
1.4.10 پیاده سازی وبررسی نتایج 26
1.4.11 پیاده سازی الگوریتم EEZW 26
1.4.12 بررسی نتایج 27
1.4.13 نتیجه گیری 27
1.4.14 مراجع 27

1-5 ) لب خوانی حروف صدا دار به کمک پردازش تصویر

1.5.1 چکیده 28
1.5.2 مقدمه 29
1.5.3 گردآوری تصاویر 29
1.5.4 پیش پردازش 30
1.5.5 فیلتر حذف نویزی 30
1.5.6 تبدیل تصاویر RGB به GRAY 30
1.5.7 انتخاب نواحی کاندید 31
1.5.8 نتایج آزمایشات 32
1.5.9 نتیجه گیری 32
1.5.10 مراجع 33

i

ارجاع دهی و رفرنس نویسی

تمام مطالب این بسته مطابق با استاندارد های دانشگاههای وزارت علوم ایران رفرنس دهی شده اند و هیچ قسمتی از بسته وجود ندارد که بدون منبع باشد.

نگارش گروهی

در نگارش و جمع آوری این بسته آموزشی کارشناسان مربوطه ما را همراهی کرده اند.کار گروهی بستر بهتری برای پژوهش فراهم میکند.

<

معرفی منبع برای ادامه پژوهش

در این بسته بیش از 1000 مقاله و منبع در این زمینه معرفی شده است که می توان از آنها برای ادامه مسیر پژوهشی استفاده کرد.

Z

پاسخ به سوالات و پشتیبانی علمی

در قسمت دیدگاه ها  اماده پاسخگویی به سوالات احتمالی شما در حد توان علمی خود هستیم.در صورت نیاز شماره تماس برای ارتباط با محققین برای شما ارسال می گردد.

بخش هایی از فصل دوم تشخيص حروف صدا دار از روي تصاوير لب

براي نگارش مقالات فارسی ضروري یکی از بحث ها و چالش هاي موجود در این موضوع روش و نوع استخراج ویژگی می باشد. از طرفی با توجه به اینکه دادگان، تصاویر ناحیه چهره و لب می باشند، لذا داراي ابعاد بالا بوده و به نوعی بایستی بهترین و بهینه ترین معیارها براي استخراج ویژگی از این تصاویر استفاده گردد. در این راستا با توجه به مقالات و تحقیقاتی که در این زمینه انجام گرفته است روش هاي متعددي براي این امر تولید گشته و استفاده شده است که عمدتا به دو بخش کلی تقسیم بندي می گردند: روش هاي مبتنی بر تصویر و روش هاي مبتنی بر مدل. در روش مبتنی بر تصویر، ویژگی ها به طور مستقیم با اعمال تبدیلات ریاضی مانند فوریه و ویولت بر روي تصاویر داده شده، استخراج می شوند که مهمترین مشکل این روشها ، ابعاد بزرگ ویژگی ها، تکراري بودن اطلاعات در بردار ویژگی و حساس بودن به چرخش و جابجایی لب می باشد که با یکسري عملیات پیش پردازشی و اعمال الگوریتم هاي کاهش بعد می توان تا حدودي بر این مشکل ها فائق آمد. قابل ذکر است که مزیت مهم این نوع روش ها دقت بالا و عدم نویز پذیري آنها می باشد

فهرست کامل فصل دوم تشخيص حروف صدا دار از روي تصاوير لب

2-1) تشخيص حروف صدا دار از روي تصاوير لب

2.1.1 مروري بر روشها 50
2.1.1.1 مقدمه 51
2.1.1.2 مروري بر تحقيقات انجام شده 52
2.1.1.3 استخراج مشخصههاي ديداري براي لبخواني 54
2.1.1.4 روش پايين به بالا 54
2.1.1.5 كانتور فعال 55
2.1.1.6 لبخواني با كمك اطلاعات شدت نور 55
2.1.1.7 آناليز فضاي رنگ 56
2.1.1.8 روش بالا به پايين 57
2.1.1.9 روش مبتني برالگوهاي انعطاف پذير 58
2.1.1.10 مدل سازيهاي شكل فعال 58
2.1.1.11 آشكارسازي لب مبتني بر مدل دگرديسپذير 58
2.1.1.12 تكنيكهاي مبتني بر زمينه تصادفي ماركوف 60
2.1.1.13 روشهاي مبتني بر خوشهبندي فازي 61
2.1.1.14 دستهبندي و تشخيص كلمات 63
2.1.1.15 معرفي سيستم ارائه شده 65
2.1.2 مکان یابی و بازنمایی ناحیه لب 67
2.1.2.1 مقدمه 68
2.1.2.2 مكانيابي لب 69
2.1.2.3 تشخيص چهره 71
2.1.2.4 مكانيابي لب 71
2.1.2.5 مسائل مرتبط با رنگ 73
2.1.2.6 توصيف انواع مدل هاي رنگ 74
2.1.2.7 فضاي رنگ ادراكي 78
2.1.2.8 فضاي رنگ يكنواخت ادراكي 81
2.1.2.9 مراحل پيشپردازش تصوير لب 85
2.1.3 استخراج ناحيه مربوط به لب 88
2.1.3.1 مقدمه 89
2.1.3.2 خوشهبندي 90
2.1.3.3 الگوریتم K-MEANS 93
2.1.3.4 الگوریتم C- میانگین فازی 94
2.1.3.5 مقایسه الگوریتم K-MEANS و FCM 95
2.1.3.6 الگوریتم C- میانگین فازی با ارتباط مکانی 100
2.1.3.7 پس پردازش 105
2.1.3.8 شکل شناسی 105
2.1.3.9 قرينه سازي 107
2.1.3.10 روشنايي 108
2.1.3.11 شكل دهي 108
2.1.3.12 تبديل موجك 110
2.1.4 استخراج ويژگيهاي مناسب وطبقه بدی آنها 116
2.1.4.1 مقدمه 117
2.1.4.2 استخراج مشخصههاي ديداري 118
2.1.4.3 جداسازي ناحيه لب 118
2.1.4.4 مشخصههاي ديداري مورد استفاده 119
2.1.4.5 پارامترهاي معمول 120
2.1.4.6 پارامترهای جدید 121
2.1.4.7 دسته بندي و تشخيص كلمات 122
2.1.4.8 پرسپترون 122
2.1.4.9 تصديق تقاطعي 124
2.1.5 نتايج و مشاهدات تجربي 129
2.1.5.1 بانک های داده 130
2.1.5.2 تعيين خطاي بخشبندي 133
2.1.5.3 استفاده از پارامترهاي طولي 134
2.1.5.4 وزندهي خروجي شبكهها به منظور افزايش دقت 136
2.1.6 نتيجهگيري و پيشنهادات 138
2.1.6.1 نتیجه گیری 139
2.1.6.2 منابع و ماخذ 142
2.1.6.3 ABSTRACT 147

تعداد صفحه بسته آموزشی

تعداد منابع معرفی شده برای ادامه کار

تعداد پشتیبانان مخصوص این فایل

قسمت هایی از فصل سوم طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج

کي از کاربرد هاي پردازش تصوير، در زمينه پردازش تصاوير انسان براي اهداف مختلف مي باشد ، که يکي از اهداف مي توانند. تشخيص فرآمين از طريق حرکات لب به وسيله پردازش فريم هاي متوالي که از صورت افراد مختلف مي گيرند . براي لب خواني معمولاً از روشهاي ترکيبي ، بر اساس پردازش تصوير و پردازش صدا استفاده مي شود . اين فصل لب خواني يا تشخيص فرآمين بر اساس حرکات لب فقط با پردازش بر روي تصوير انجام شده است . ازآنجاييکه تحليل ها فقط بر اساس پردازش تصوير صورت مي گيرد و متّکي به پردازش صدا نمي باشد مي بايست يک سري قوانين و تمهيدات در زمينه بيان کلمات را در اين فصل در نظر گرفت ، بر اساس اين تمهيدات و متغير هاي زباني در نظر گرفته شده به نسبت خوبي مي توان تمايز بين کلمات را براي افراد مختلف بدست آورد

فهرست کامل فصل سوم طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج

3-1 ) طراحی سیستم هوشمند لب خوانی با ارائه روش جدید استخراج ویژگی مبتنی بر تحلیل یک بعدی تصویر

3.1.1 خلاصه 166
3.1.2 مقدمه 166
3.1.3 روش پیشنهادی 167
3.1.4 ارزیابی تحقیق 173
3.1.5 نتیجه گیری 174
3.1.6 مراجع 175

%

میزان رضایت

میزان رضایت افراد خریدار این بسته بعد از خرید

(نظر سنجی به وسیله ایمیل و یک هفته بعد ازخرید بسته انجام می گیرد)

تمام منابع معرفی شده هم به صورت فایل Word و هم به صوت فایل PDF در اختیار شما قرار می گیرد.

تومان35,000افزودن به سبد خرید