طراحی شبکه عصبی عمیق پیچشی به منظور تشخیص حالت چهره افراد بر اساس تصاویر ویدیویی
عنوان اصلي
Developing a convolutional deep neural network to detect the facial expression of people in videos
وضعیت نشر و پخش و غیره
محل نشرو پخش و غیره
تهران
مشخصات ظاهری
ساير جزييات
۶۶ ص.
یادداشتهای مربوط به عنوان و پدیدآور
متن يادداشت
محمد تشنه لب
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
کسي که مدرک را اعطا کرده
صنعتی خواجه نصیرالدین طوسی
زمان اعطا مدرک
۱۴۰۰
نظم درجات
مهندسی پزشکی
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
امروزه تشخیص حالت چهره افراد در تصاویر و ویدیوها به یک مسئله بسیار مهم در حوزه هوش مصنوعی و بینایی کامپیوتر تبدیل شده است. دلیل این اهمیت، کاربردهای فراوان تشخیص حالت چهره در حوزه های مختلف مانند پزشکی، روانشناسی، رباتیک، امنیت و سرگرمی می باشد. یکی از کاربردهای مهم تشخیص حالت چهره در تصاویر ویدیوئی به دست آمده از دوربین های قرار گرفته شده در مکان های مختلف مثل بیمارستان ها، ادارات، مکان های عمومی و همچنین روی ربات ها به منظور درک بهتر از حالت های عادی و غیر عادی رفتار انسانها می باشد. در این پژوهش یک ساختار مبتنی بر شبکه های عصبی پیچشی برای تشخیص حالت چهره افراد به صورت بلادرنگ در تصاویر ویدیویی پیشنهاد شده که با حفظ دقت میتواند تشخیص احساسات را با سرعت بالاتری نسبت به سایر روش های موجود انجام دهد. در این روش به جای استفاده از یک ساختار مجزای عمیق در کنار شبکهی تشخیص چهره برای طبقهبندی احساسات از روی تصویر چهره ، با استفاده از مفهوم یادگیری انتقالی، از خود شبکهی تشخیص چهره و ویژگیهای به دست آمده توسط آن استفاده کرده و احساسات چهره را توسط یک ساختار کوچکتر طبقه بندی مینماییم. آزمایشها روی دو مجموعه دادهی SSEDVAR و xEFaD انجام شده و دقت طبقهبندی هر کدام به ترتیب %88 و %4.99 به دست آمده است که نسبت به پژوهشهای مشابه به دلیل استفاده از روش یادگیری انتقالی بهبود قابل توجهی دارد. همچنین به دلیل استفاده از ویژگیهای به دست آمده توسط مدل تشخیص چهره برای طبقهبندی حالت چهره مدل قابلیت پردازش تا 55 فریم بر ثانیه را داشته که آن را برای استفاده در سخت افزارهای قابل حمل مناسب میکند.
متن يادداشت
Nowadays, recognizing the facial expressions of people in images and videos has become a very important issue in the field of artificial intelligence and computer vision. The reason for this importance is the many applications of facial expression recognition in various fields such as medicine, psychology, robotics, security and entertainment. One of the most important applications of facial emotion recognition is in video images obtained from cameras located in various places such as hospitals, offices, public places, as well as on robots in order to better understand normal and non-normal situations. In this thesis, we presented a Deep convolutional neural network to determine the facial expression of people in videos in real time, which can detect the facial expression faster than other existing methods without losing classification accuracy. In this method, using the concept of transfer learning, instead of using a separate deep network next to the face detection network to classify emotions from the face image, we used the face detection network itself and the features obtained by it and classified the face emotions by a smaller network. The experiments were performed on two datasets, RAVDESS and DaFEx, and the classification accuracy of each was 88% and 99.4%, respectively, which is a significant improvement over similar studies due to the use of transfer learning technique. Also, due to the use of features obtained by the face detection model to classify the face emotion, the model has the ability to process up to 55 frames per second, which makes it suitable to use in edge devices.
موضوع (اسم عام یاعبارت اسمی عام)
تقسیم فرعی موضوعی
تشخیص حالت چهره
تقسیم فرعی موضوعی
یادگیری انتقالی
تقسیم فرعی موضوعی
شبکه های عصبی پیچشی
تقسیم فرعی موضوعی
پردازش بلادرنگ
تقسیم فرعی موضوعی
تشخیص احساسات
تقسیم فرعی موضوعی
مهندسی برق
عنصر شناسه ای
برق
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )