50 در صد تخفیف ویژه برای این بسته پژوهشی به مدت محدود

005

روز

:

16

ساعت

:

27

دقیقه

:

04

ثانیه(s)

بسته جامع پژوهشی تشخیص گفتاراز موسیقی به روش شبکه عصبی

این بسته پژوهشی مجموعه کاملی از آخرین پژوهش های انجام شده در زمینه تشخیص گفتاراز موسیقی به روش شبکه عصبی است. در تدوین این بسته از جدیدترین مقالات و پایان نامه های موجود در این زمینه استفاده شده است. مخاطبان این بسته دانشجویان تحصیلات تکمیلی و پژوهش گرانی هستند که قصد فعالیت در این زمینه دارند.

  • در فصل اول این پژوهش جداسازي گفتار از موسيقي با استفاده از الگوريتمهاي تكاملي برنامهنويسي ژنتيك بررسی شده است
  • در فصل دوم این پژوهش تشخیص گفتاراز موسیقی به روش شبکه عصبی مصنوعی بررسی شده است
  • در فصل سوم این پژوهش تشخيص گفتار از موسيقي با استفاده از شبكه عصبي عميق بررسی شده است

با افزايش روز افزون مخازن دادهاي چندرسانهاي، خصوصا دادههاي صوتي، توسعهي تكنولوژيهايي كه بتواند به طور خودكار نمايهگذاري و بازيابي را انجام دهد، اهميت پيدا ميكند. جداسازي گفتار از موسيقي يك قسمت مهم در اين سيستمهاست. در گذشته كارهاي نسبتا زيادي براي دستهبندي فايلهاي صوتي صورت پذيرفته است. در ويژگي مختلف براي دستهبندي مورد استفاده قرار گرفته و براي عمل دستهبندي دسته كنندهي مختلف بررسي شده است. نرخ خطاي بهترين دسته كننده 5.8درصد بدست آمده است. مقايسهاي بين ويژگيهاي مختلف انجام داده و براي دستهبندي از مدل GMM استفاده نموده و به نرخ خطاي 1.2 درصد دست پيدا كرده است. نويسندگان از ويژگي براي كلاسبندي استفاده نمودند و براي دستهبندي از 2 الگوريتم K نزديكترين همسايگي و دسته كنندهي گاوسي درجه 2 استفاده كردند و به دقت 80.85 درصد دست يافتند

قسمت هایی از فصل اول جداسازي گفتار از موسيقي با استفاده از الگوريتمهاي تكاملي برنامهنويسي ژنتيك

براي ساخت مدل جداكننده گفتار از موسيقي ابتدا فايل صوتي ورودي به بخشهاي 1 ثانيه اي تقسيم شد، سپس عمل فريمبندي روي هر قسمت صورت گرفت و ويژگيها از هر فريم استخراج شدند. در نهايت ميانگين و واريانس اين ويژگيها در طول قسمتهاي 1 ثانيهاي محاسبه شده و به عنوان ويژگيهاي نهايي براي تشخيص دستهاي كه اين بخش از فايل به آن تعلق دارد مورد استفاده قرار گرفتند. طول فريمهاي در نظر گرفته شده 20 ميلي ثانيه با 10 ميلي ثانيه همپوشاني ميباشد. براي استخراج ويژگيها از ابزار MIRtoolkit استفاده شد. پس از استخراج ويژگيها از بخشهاي 1 ثانيه اي، بردارهاي ويژگي بدست آمده براي آموزش الگوريتمهاي GP و AIRS مورد استفاده قرار گرفتند. با استفاده از اين 2 الگوريتم مدلهاي جداكننده گفتار از موسيقي توليد گرديد. در فاز تست نيز ابتدا بردارهاي ويژگي از دادههاي تست به همان صورت كه براي دادههاي آموزشي ذكر گرديد استخراج شدند و به عنوان ورودي به اين مدلها داده شد و عمل ارزيابي بر اساس خروجيهاصورت گرفت. در ادامه ويژگيهاي مورد استفاده و پارامترهاي مورد استفاده در الگوريتم GP و سيستم تشخيص ايمني مصنوعي توضيح داده شده است

فهرست کامل فصل اول جداسازي گفتار از موسيقي با استفاده از الگوريتمهاي تكاملي برنامهنويسي ژنتيك

1-1 ) جداسازي گفتار از موسيقي با استفاده از الگوريتمهاي تكاملي برنامه نويسي ژنتيك و سيستم تشخيص ايمني مصنوعي

1.1.1 چکیده 1
2.1.1 مقدمه 1
3.1.1 سيگنال گفتار و موسيقي 2
4.1.1 سيستم جداكننده گفتار از موسيقي 2
5.1.1 برنامه نويسي ژنتيك 3
6.1.1 سيستم تشخيص ايمني مصنوعي 3
7.1.1 سيستم پيادهسازي شده 4
8.1.1 آزمايشات وارزیابي 6
9.1.1 نتیجه گیری 7

i

ارجاع دهی و رفرنس نویسی

تمام مطالب این بسته مطابق با استاندارد های دانشگاههای وزارت علوم ایران رفرنس دهی شده اند و هیچ قسمتی از بسته وجود ندارد که بدون منبع باشد.

نگارش گروهی

در نگارش و جمع آوری این بسته آموزشی کارشناسان مربوطه ما را همراهی کرده اند.کار گروهی بستر بهتری برای پژوهش فراهم میکند.

<

معرفی منبع برای ادامه پژوهش

در این بسته بیش از 1000 مقاله و منبع در این زمینه معرفی شده است که می توان از آنها برای ادامه مسیر پژوهشی استفاده کرد.

Z

پاسخ به سوالات و پشتیبانی علمی

در قسمت دیدگاه ها  اماده پاسخگویی به سوالات احتمالی شما در حد توان علمی خود هستیم.در صورت نیاز شماره تماس برای ارتباط با محققین برای شما ارسال می گردد.

بخش هایی از فصل دوم تشخیص گفتاراز موسیقی به روش شبکه عصبی مصنوعی

نياز به جداسازي خودكار گفتار از موسيقي در كاربردهايي نظير سيستمهاي بازيابي مستندات صوتي از اهميت زيادي برخوردار است. در گذشته روشهاي متعددي براي جداسازي مورد استفاده قرار گرفته است. در اين فصل از 11 ويژگي سيگنال صوتي به عنوان ويژگيهاي متمايز كننده و از الگوريتمهاي تكاملي برنامهنويسي ژنتيك و سيستم تشخيص ايمني مصنوعي كه از عملكرد سيستمهاي زيستي موجود در طبيعت الهام گرفته شدهاند، براي توليد مدل جداكننده استفاده شده است. نتايج حاصل نشاندهندي كارايي بالاي دو الگوريتم برنامهنويسي ژنتيك و سيستم تشخيص ايمني مصنوعي براي دستهبندي گفتار از موسيقي است. دادههاي موسيقي و گفتار در شرايط تميز و نيز شرايط نويزي مورد استفاده قرار گرفته و كارائي روشهاي پيشنهادي براي تشخيص گفتار از موسيقي در شرايط نويزي بررسي شده است. همچنين اين فصل تاثير كاهش حجم دادههاي آموزشي با سا تفاده از روش چنديسازي برداري و نيز قابليت برنامه نويسي ژنتيك در انتخاب ويژگيهاي مناسبتر را مورد ارزيابي قرار داده است

فهرست کامل فصل دوم تشخیص گفتاراز موسیقی به روش شبکه عصبی مصنوعی

2-1) تشخیص گفتاراز موسیقی به روش شبکه عصبی مصنوعی

چکیده 18
مقدمه 19
1.1.2 مفاهیم پایه پردازش گفتار 21
1.1.1.2 مقدمه 22
2.1.1.2 تولید صحبت 22
3.1.1.2 برخی مفاهیم پایه 24
4.1.1.2 پیش پردازش روی سیگنال گفتار 26
2.1.2 آنالیز ویولت 32
1.2.1.2 مقدمه 33
2.2.1.2 تبدیل ویولت wt 34
3.2.1.2 ویولت در مقایسه با تبدیل فوریه زمان کوتاه 36
4.2.1.2 تبدیل ویولت پیوسته 39
5.2.1.2 تبدیل ویولت گسسته 41
3.1.2 کلیات شبکه های عصبی 74
1.3.1.2 مقدمه 48
2.3.1.2 تاریخچه شبکه های عصبی 50
3.3.1.2 شبکه عصبی 51
4.3.1.2 کاربرد شبکه های عصبی 57
5.3.1.2 شبکه های عصبی چگونه به کار میروند 57
6.3.1.2 آموزش شبکه عصبی mlp 66
4.1.2 تشخیص گفتار از موسیقی 70
1.4.1.2 مقدمه 71
2.4.1.2 ساختار کای سیستم 73
3.4.1.2 استخراج ویژگی 74
4.4.1.2 طبقه بندی با شبکه عصبی پرسپترون چند لایه 76
5.4.1.2 پردازش ثانویه مبتنی بر محتوا 79
6.4.1.2 ارزیابی سیستم 80
5.1.2 نتیجه گیری و پیشنهادات 82
1.5.1.2 نتیجه گیری 83

تعداد صفحه بسته آموزشی

تعداد منابع معرفی شده برای ادامه کار

تعداد پشتیبانان مخصوص این فایل

قسمت هایی از فصل سوم تشخيص گفتار از موسيقي با استفاده از شبكه عصبي عميق

ك سري خصوصيات وجود دارد كه سيگنال گفتار را از ساير سيگنالها متمايز ميسازد. به طور كلي گفتار از توالي از 3دسته آوا كه خصوصيات صوتي متفاوتي دارند تشكيل ميشود. اين دستهها شامل واكهها، شبه واكهها، همخوانهاي واكدار (دسته ي اول)، همخوانهاي سايشي (دسته ي دوم) و همخوان هاي انسدادي (دسته ي سوم) است. اين 3 دسته آوا به دنبال هم ميآيند و ساختار هجايي گفتار را تشكيل ميدهند. بنابراين تغييرات زماني شديدي در دامنهي سيگنال گفتار مشهود است. نوسان فركانس به طور ميانگين 4 هرتز است كه برابر با نرخ هجايي است. تغييرات طيفي كوتاه مدت در زمان قابل مشاهده است. برخي از تغييرات بسيار سريع اتفاق ميافتد، نظير انتقال طيفي همخوانهاي انسدادي.
سيگنال موسيقي از كنار هم قرار گرفتن چندين نوا ساخته ميشود كه هر كدام توزيع هارمونيكي خاص خود را دارند. معمولا تغييرات كوچكي در طيف سيگنال در طي زمان روي ميدهد. از طرف ديگر فركانس پايه نواها ميتواند بسرعت تغيير كند و اين تغييرات نسبت به سيگنال گفتار سريعتر روي ميدهد. كنتور انرژي تعداد قله و نشيب هاي كمتري دارد و تغييرات كمي را در طي يك دوره تناوب از خود نشان ميدهد. با اين بيانات ميتوان تفاوت گفتار از موسيقي را به طور خلاصه به صورت زير بيان كرد

فهرست کامل فصل سوم تشخيص گفتار از موسيقي با استفاده از شبكه عصبي عميق

3-1 ) تشخيص گفتار از موسيقي با استفاده از شبكه عصبي عميق

1.1.3 چکیده 88
2.1.3 مقدمه 88
3.1.3 مفاهيم اوليه مورد نياز 89
4.1.3 روش پيشنهادی 90
5.1.3 ارزیابی 91
6.1.3 نتیجه گیری 92

%

میزان رضایت

میزان رضایت افراد خریدار این بسته بعد از خرید

(نظر سنجی به وسیله ایمیل و یک هفته بعد ازخرید بسته انجام می گیرد)

تمام منابع معرفی شده به صوت فایل PDF در اختیار شما قرار می گیرد.

تومان70,000 تومان35,000افزودن به سبد خرید