عرض القائمة
الرئیسیة
البحث المتقدم
قائمة المکتبات
حول الموقع
اتصل بنا
نشأة
عنوان
یادگیری چندوجهی برای بازشناسی بین دادگانی احساس گفتار
پدید آورنده
شیراوند، فاطمه
موضوع
مهندسی برق,برق
رده
کتابخانه
كتابخانه مركزي و مركز اسناد دانشگاه صنعتي خواجه نصير الدين طوسى
محل استقرار
استان:
طهران
ـ شهر:
طهران
تماس با کتابخانه :
88881052
-
88881042
-
021
ف
شیراوند، فاطمه
یادگیری چندوجهی برای بازشناسی بین دادگانی احساس گفتار
تهران
۶۹ ص.
بابک ناصر شریف
کارشناسی ارشد
صنعتی خواجه نصیرالدین طوسی
۱۳۹۹
کامپیوتر
با توجه به گسترش واسط های انسان ماشین در سال های اخیر، شناسایی عواطف و احساسات انسان به وسیله ی ماشین و توانایی پاسخ مناسب به این احساس ها از سوی ماشین، از اهمیت فراوانی برخوردار گشته است. از این رو بازشناسی احساس با استفاده از گفتار، متن، تصویر چهره و سیگنال های مغزی به طور هم زمان یا ترکیب برخی از آن ها، بسیار مورد توجه قرار گرفته است که تحت عنوان بازشناسی چندوجهی احساس شناخته می شوند. یکی از مشکلاتی که در این حوزه وجود دارد، یکسان نبودن توزیع داده های آموزش (دادگان منبع) و ارزیابی (دادگان هدف) در هر یک از وجوه است. یکی از روش های رفع این مشکل استفاده از روش های انتقال یادگیری است. در این پایان نامه، هدف استفاده از داده های گفتار و متن و به کار بردن روش های انتقال یادگیری برای بازشناسی احساس است. به همین منظور با استفاده از دو روش انتقال یادگیری و دو روش ترکیب ویژگی های چندوجهی، چهار روش ارائه شده و برای دسته بندی احساس از ساختارهای مختلف شبکه ی عصبی استفاده شده است. در روش پیشنهادی اول از یک لایه ی تطبیق بعد از اولین لایه ی پنهان شبکه ی عصبی برای تطبیق دامنه و از تحلیل هم بستگی کانونی (ACC) برای ترکیب ویژگی های گفتار و متن استفاده شده است. در روش پیشنهادی دوم از لایه ی تطبیق خطی و ترکیب مبتنی بر لایه های غیرخطی استفاده شده است. در روش پیشنهادی سوم، بلافاصله بعد از آموزش مدل ها با دادگان دامنه ی منبع، از بخشی از دادگان دامنه ی هدف برای آموزش مدل ها استفاده می شود و به این ترتیب انتقال یادگیری صورت می گیرد. در این روش برای ترکیب ویژگی های گفتار و متن، از ACC استفاده شده است. روش پیشنهادی چهارم نیز مشابه روش سوم است با این تفاوت که برای ترکیب ویژگی های گفتار و متن، به جای ACC از ترکیب مبتنی بر لایه های غیرخطی استفاده شده است. برای ارزیابی روش ها، PACOMEI با زبان انگلیسی به عنوان دادگان منبع و BDOME با زبان آلمانی و EEVAS با زبان انگلیسی، به عنوان دادگان هدف مورد استفاده قرار گرفته اند. با استفاده از اضافه کردن لایهی تطبیق بعد از اولین لایهی پنهان مدل آموزش دیده با دادگان دامنهی منبع، بهترین نتیجه روی دادگان BDOME برابر 7/%07 به دست آمدهاست. برای یادگیری چندوجهی در بازشناسی بیندادگانی برای دادگان EEVAS، با استفاده از روش پیشنهادی اول ۴/۴۷ افزایش دقت، با استفاده از روش پیشنهادی دوم ۲/۶۶ افزایش دقت، با استفاده از روش پیشنهادی سوم ۶/۳۷ افزایش دقت و با استفاده از روش پیشنهادی چهارم ۶/۷۶ افزایش دقت نسبت به مدل پایه به دست آمده است.
بازشناسی احساس گفتار
یادگیری چندوجهی
انتقال یادگیری
تطبیق دامنه
مهندسی برق
برق
پ
فاطمه شیراوند
استاد راهنما: ناصر شریف، بابک
۶۶۷۲
CF
دانشکده برق
الاقتراح / اعلان الخلل
×
الاقتراح / اعلان الخلل
×
تحذیر!
دقق في تسجیل المعلومات
اعلان الخلل
اقتراح