تحلیل احساسات کامنت های فارسی اینستاگرام با ترکیب شبکه عصبی کانولوشن و LSTM
سهیلا عیوضی عبدالجبار
مهندسی برق و کامپیوتر
۱۴۰۱
۵۳ص.
سی دی
کارشناسی ارشد
مهندسی کامپیوتر گرایش هوش مصنوعی
۱۴۰۱/۰۴/۰۱
با گسترش شگرف استفاده از اینترنت و شبکههای اجتماعی با حجم انبوهی از نظرات کاربران در ارتباط با موضوعات مختلف روبرو هستیم. با توجه به افزایش حجم بالای نظرات و احساسات، تحلیل احساسات مطرح شد که به عنوان شاخهای از متنکاوی با تمرکز بر روی استخراج عقاید شناخته میشود. تحلیل احساسات میتواند با هدف آگاهسازی خوانندگان در زمینههای مختلف از جمله سیاست، مدیریت، صنعت، تجارت و مواردی از این قبیل مفید باشد. در این پایاننامه برای تحلیل احساسات ما از ترکیب شبکه عصبی کانولوشن و شبکه عصبی LSTM روی کامنتهای فارسی اینستاگرام استفاده کردیم. علت ترکیب دستهبندهای مذکور این است که شبکه عصبی کانولوشن با استفاده از فیلترهای متعدد، اطلاعات مربوط به ساختار محلی دادهها را استخراج کرده و شبکه عصبی LSTM برای استخراج همبستگیها و وابستگیهای موقت در متن مناسب هستند.در انجام این پژوهش، 7 معماری متفاوت استفاده شده است که شامل: روش پایه، شبکه عصبی کانولوشن به تنهایی، شبکه عصبی LSTM به تنهایی، ترکیب شبکه عصبی کانولوشن و LSTM (به ترتیب)، ترکیب شبکه عصبی LSTM و کانولوشن (به ترتیب)، ادغام روشهای اول تا چهارم با استفاده از لایه تمام متصل و ترکیب روشهای اول تا چهارم با دستهبند ترکیبی بهصورت رایگیری با تخصیص وزن به مدلها است. این 7 روش به صورت مجزا پیادهسازی شده و نتایج آنها با هم مقایسه شده است.در ارزیابی روش پایه و روشهای پیشنهادی، دستهبند ترکیبی یا مدل انسمبل بهصورت رایگیری با تخصیص وزن به مدلها که مدل پیشنهادی پایاننامه است، توانست بالاترین صحت 337/72 و F1-score 315/72 را در مقایسه با کارایی سایر سیستمها کسب کند. علت تخصیص وزن به مدلها بهبود عملکرد دستهبند ترکیبی براساس رایگیری اکثریت است؛ به اینصورت دستهای که براساس وزنهای داده شده اگر بالاترین مجموع وزنی را داشته باشد انتخاب شود.
With the dramatic expansion of the use of the internet and social networks, we are facing a huge volume of user opinions on various topics. Due to the increasing volume of opinions and emotions, emotion analysis was introduced, which is known as a branch of textual analysis with a focus on extracting ideas. Emotion analysis can be useful with the aim of informing readers in various fields such as politics, management, industry, business and so on.In this thesis, to analyze emotions, we used the combination of convolutional neural network and LSTM neural network on Persian Instagram comments. The reason for ombining these categories is that the convolutional neural network uses multiple filters to extract information about the local structure of the data, and the LSTM neural network is suitable for extracting temporary correlations and dependencies in the text. For this study, 7 methods have been proposed. These are including:the base method, the first method of convolutional neural network lonely, the second method of LSTM neural network lonely, the third method of combining convolutional neural network and LSTM (sequentially), the fourth method of combining LSTM and convolutional neural network (sequentially), the fifth method combineds the first to fourth methods within a concatenate method in deep learning and the six method comines the first to forth methods with a combined and ensemble model,which is the proposed model of the thesis. These 7 methods have been implemented separately and the results have been compared.In the evaluation of the experiment, the ensemble model by voting by assigning weights to the models which is the proposed model of the dissertaion, was able to have the high accuracy of 72.337 and F1-score 72.315, which has achieved better results compared to the efficiency of other systems. The reason for assigning weights to the models is to improve the performance of the hybrid category based on majority voting; In this way, the category based on the given weights will be selected if it has the highest vote
Sentiment Analysis of Persian Comments on Instagram with a Combined Model of CNN and LSTM