تشخیص هیجانات متون خبری با ترکیب کردن دستهبندها و استفاده از فارس نت
عنوان اصلي به زبان ديگر
Recognizing emotions in news texts by combining classifiers and using FarsNet
نام نخستين پديدآور
/موریتا تارویردیانس
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: مهندسی برق و کامپیوتر
تاریخ نشرو بخش و غیره
، ۱۳۹۸
نام توليد کننده
، راشدی
مشخصات ظاهری
نام خاص و کميت اثر
۶۳ص
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی - الکترونیکی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی کامپیوتر-گرایش هوش مصنوعی و رباتیکز
زمان اعطا مدرک
۱۳۹۸/۱۱/۱۴
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
هیجان پدیدهصای پیچیده و رخدادی درونی است که از طریق گفتار، چهره و نوشتار بیان میصشود .شناسایی هیجانات موجود در متن به منظور تعیین وجود هیجان یا شناسایی انواع هیجانات، یکی از موضوعات مورد توجه است که با چالشصهای فراوانی روبهصرو است؛ زیرا هیجانات معمولا به طور صریح از کلمات موجود در متن قابل شناسایی نبوده و شناسایی آنها نیازمند به کارگیری مجموعهای از عملیات ژرف است .در این پایاننامه روشی برای شناسایی هیجانات از عناوین خبری فارسی ارائه شده است که هدف، شناسایی هیجانات خواننده خبر است .علت استفاده از عناوین خبری برای این کار، ساختار و جنبه هیجانی آنصها برای جذب و تاثیرگذاری در خواننده می-باشد .از هیجانات ششصگانه اکمن، یعنی خوشحالی، ناراحتی، عصبانیت، تنفر، ترس و تعجب برای برچسبصگذاری عناوین استفاده شده است .بدین منظور دادگان موردنیاز به صورت میدانی از یک سایت خبری فارسیص زبان با برچسبصگذاری مستقیم خوانندگان خبر گردآوری شده است .مزیت این روش برخورداری از هیجانات خوانندگان واقعی بهصجای استفاده از یک نفر برچسبصگذار با هیجانات ثابت است .در اینصصورت هیجان خوانندگان مختلف درباره یک خبر میصتواند متفاوت باشد، بسیاری از روشصهای موجود با نادیده گرفتن این مورد از دستهصبندهای تک برچسبی استفاده میصکنند ولی نوآوری این پایانصنامه پیاده-سازی یک دستهصبند ترکیبی چندبرچسبی برای شناسایی و دستهصبندی هیجانات است .روش ترکیبی مذکور، از ترکیب روش مبتنیصبر یادگیری با استفاده از شبکه عصبی LSTM و روش معنایی با استفاده از محاسبه شباهتصهای معنایی با رویکرد هستیصشناسی ایجاد شده است .علت ترکیب روش معنایی پیشنهادی با روش مبتنیصبر یادگیری، دو قابلیت منحصربفرد این روش است؛ روش معنایی برخلاف بسیاری روشصهای موجود، بر پایه ساختار نحوی جمله است و صرفا از بردار کلمات ساده استفاده نمیصکند همچنین برای محاسبه شباهت معنایی از مفهوم هستیصشناسی استفاده میصکند که این رویکرد بسیار جامعصتر از روشصهای مبتنیصبر کلمات کلیدی است که صرفا وجود کلمات یک متن در واژهصنامهصهای هیجانی را بررسی میصکنند .برای ارزیابی روش پیشنهادی، از بین روشصهای موجود برای ارزیابی دستهصبندهای چندبرچسبی، دو روش مبتنیصبر برچسب و مبتنیصبر مثال استفاده شده است .روش پیشنهادی با روشصهایECC ،CC ، Rakel۱D و هستیشناسی مقایسه شده، بدین منظور معیارهای دقت، یادآوری وmeasure - fآنصها با روشصهای ارزیابی مذکور محاسبه شده است .نتایج حاصل از هر دو رویکرد بیانصگر آن است که روش پیشنهادی از عملکرد بهتری در مقایسه با روشهای دیگر، برخوردار است .در ارزیابی با رویکرد مبتنی برمثال، دقت سیستم پیشنهادی ۰.۸۰۷ وmeasure - Fآن ۰.۶۶۴ بوده و در ارزیابی با رویکرد مبتنیصبر برچسب، نرخ یادآوری این روش ۰.۷۷۵ وmeasure - Fحاصل ۰.۶۷۷ میصباشد که در مقایسه با کارایی دیگر سیستمصها نتایج بهتری کسب کرده است
متن يادداشت
Emotions are complex and intrinsic phenomena that are expressed through speech, face and text. Recognizing emotion in text means determining existence of emotion or to determine type of emotion that faces a lot of challenges. Because emotions are usually not explicitly identifiable by the words in the text, their identification requires a set of other operations. This thesis presents a method for identifying emotions from Persian news headlines that aims to identify the emotions of the news reader. The reason we use news headlines for this is because of their structure and emotional appeal to the reader. Ekman's six emotions which are happiness, sadness, anger, hatred, fear, and wonder, have been used to tag the headlines. For this purpose, the required data were collected from a Persian news site with direct tagging of news readers. The advantage of this method is having real readers' emotions instead of using one person as annotator, so the emotion of different readers about the news can be different. Most of the existing methods ignoring this issue by using single-label classification, but in this thesis we propose a multi-label approach to identify and classify emotions. The hybrid method is created by combining the learning-based approach using the LSTM neural network and the semantic method by calculating semantic similarities with the ontology approach. The reason for combining the proposed semantic method with the learning-based method is that it has two unique features; unlike many existing methods, the semantic method is based on the syntactic structure of the sentence and does not merely use the simple word vector. It also uses the concept of ontology to calculate semantic similarity, which is much more comprehensive than keyword-based approaches that only check the existence of words in the emotion lexicons. To evaluate the proposed method, two methods have been used to evaluate multi-label classifiers: label-based evaluation and example-based evaluation. These methods have been used in order to calculate the precision, recall, and f-measure metrics of the proposed method and the ECC, CC, Rakel1D and ontology methods used in similar problems in other papers. The results of both evaluation approaches indicate that the proposed method performs better than the other methods. In the evaluation with the example-based approach, the precision of the proposed system is 0.807 and its F-measure is 0.664, and in the evaluation with the label-based approach, the recall rate of this method is 0.775 and the F-measure is 0.677, which has gotten better results compared to other systems
عنوان اصلی به زبان دیگر
عنوان اصلي به زبان ديگر
Recognizing emotions in news texts by combining classifiers and using FarsNet
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )