پیش بینی خودکار شخصیت افراد از روی متن با استفاده از شبکه عصبی عمیق و Transformer ها
امیر رضا فیضی درخشی
مهندسی برق و کامپیوتر
۱۴۰۱
۶۳ص.
سی دی
کارشناسی ارشد
معماری کامپیوتر
۱۴۰۱/۰۶۱۶
تعیین خودکار شخصیت با استفاده از کامپیوتر جهت پی بردن به شخصیت افراد با استفاده از فعالیت افراد در زندگی روزمره اطلاق میشود. شخصیت انسان به طور قابل توجهی توسط کلماتی که در سخنان و یا نوشتار خود استفاده میکند قابل مشاهده است. معمولاً طبقه بندی خودکار شخصیت از روی انواع محتوای تولید شده یا مبادله شده توسط انسان (مانند متن، گفتار، عکس، ویدیو) انجام میشود. حال برای اینکه بتوان متن نوشته شده توسط انسان برای کامپیوتر قابل فهم باشد باید تعبیه کلمه صورت پذیرد. تعبیه کننده کلمات بسیاری موجود میباشند که هر کدام دارای نقاط ضعف و قدرتی هستند. بدین منظور در این پژوهش از جدیدترین متدهای تعبیه کلمات مبتنی بر ترنسفورمرها شامل BERT، Electra، AlBert، RoBerta و DistilBert استفاده شده است. به منظور درک در سطح بالاتر از کلمه (متن ورودی) یک مدل شبکه عصبی عمیق متشکل از لایههای BiLSTM، LSTM و Dense طراحی و پیاده سازی شده است. سرانجام مدل پیشنهادی، توسط دو مجموعه داده مناسب برای تحلیل شخصیت یعنی مجموعه داده YouTube و مجموعه داده MyPersonality ارزیابی شده است. نتایج بهدست آمده از ارزیابی روش پیشنهادی با استفاده از معیار RMSE حاکی از برتری Electra بر سایر روشهای تعبیه کلمات در زمینه تشخیص خودکار شخصیت میباشد
personality prediction by a computer yields to find out the personality of people by using people's activities in daily life. The words can determine a person's character uses in speech or writing. Automatic personality prediction is made on different types of human generated/exchanged contents (such as text, speech, image, and video). Now, in order to make a human written text understandable to the computer, pre-trained word embedding models act very well. There are many embedding words, each of which has its strengths and weaknesses. So, in this research, novel pre-trained word embedding methods based on transformers such as BERT, Electra, AlBert, etc., has been deployed. In order to understand at a higher level than the word (document), a deep neural network model consisting of BiLSTM, LSTM and Dense layers is proposed and implemented. Finally, to evaluate the presented model, two datasets suitable for the system, the YouTube dataset and the MyPersonality dataset, each of which has its own unique characteristics, have been used. The proposed approach evaluated by the RMSE metric indicated considerable improvements in personality prediction in all of the proposed pre-trained models.
a master's degree Computer Engineering major in Computer Architecture