تحلیل احساسات برای پیشبینی بازار سهام با استفاده از یادگیری عمیق
لانه عادل محمد
ریاضی،آمار و علوم کامپیوتر
۱۴۰۱
۱۰۲ص.
سی دی
کارشناسی ارشد
علوم کامپیوتر گرایش محاسبات نرم و هوش مصنوعی
۱۴۰۱/۰۸/۰۳
امروزه پیش¬بینی و تحلیل احساسات به عنوان یکی از ارکان اصلی در زمینه¬های مختلف از جمله بازار سهام، بازاریابی، پیش¬بینی تغیرات اقتصادی در کشورهای مختلف بکار گرفته می¬شود. توانایی پیش¬بینی قیمت سهام ممکن است آرزوی ناگفته سرمایه¬گذاران سهام باشد. اگرچه پیشبینی قیمت سهام پیچیده است، اما تئوریهای زیادی در مورد اینکه چه چیزی بر حرکات آنها تأثیر میگذارد، از جمله نرخ بهره، اخبار و رسانههای اجتماعی وجود دارد. با کمک یادگیری عمیق، الگوهای پیچیده در داده¬ها را می¬توان فراتر از عقل انسان شناسایی کرد. در این پایان¬نامه، یک مدل یادگیری عمیق برای پیش¬بینی سری¬های زمانی ایجاد و برای پیش¬بینی قیمت سهام ارائه می¬شود. این مدل بر اساس یک شبکه عصبی با چندین لایه کانولوشن یک بعدی و لایههای کاملاً متصل است. این با ارزش¬های تاریخی سهام، شاخص¬های فنی و اطلاعات ویژگی¬های توییتر بازیابی، استخراج و محاسبه شده از پست¬ها در پلتفرم رسانه¬های اجتماعی توییتر آموزش داده شده است. این ویژگیها عبارتند از امتیاز احساسات، موارد دلخواه، فالوورها، ریتوییتها و اگر یک حساب تایید شده باشد. برای جمع آوری دادهها از توییتر، از API توییتر استفاده میشود. تجزیه و تحلیل احساسات با فرهنگ لغت آگاه ارزش و دلیل احساسات (VADER) انجام می¬شود. نتایج نشان میدهد که با افزودن ویژگیهای بیشتر توییتر، میانگین مربعات خطا (MSE) بین قیمتهای پیشبینیشده و قیمتهای واقعی 23 درصد بهبود یافته است. با در نظر گرفتن تحلیل تکنیکال، MSE از 0.1617 به 0.0937 کاهش می¬یابد که بهبودی در حدود 21 درصد است. محدودیت¬های این مطالعه شامل این است که سهام منتخب باید به صورت عمومی در بازار سهام فهرست شود و در توییتر و در بین سرمایه گذاران فردی محبوب باشد. علاوه بر این، ساعات کار بازارهای سهام از توییتر است که دائماً در دسترس است. بنابراین ممکن است نویزهایی را در مدل ایجاد کند. مدل¬های شبکه عصبی کانولوشن یک بعدی عمیق به ترتیب به دقت کلی 86.45٪ و 65.20% و زمان طبقهبندی در مدل اول هر نمونه 4 دقیقه در مدل 1D_CNN دست یافته است.
Today, prediction and analysis of sentiments are used as one of the main elements in various fields such as the stock market, marketing, and forecasting economic changes in different countries. The ability to predict stock prices may be the unspoken wish of stock investors. Although predicting stock prices is complicated, there are many theories about what influences their movements, including interest rates, news, and social media. With the help of deep learning, complex patterns in data can be identified beyond human intelligence. In this thesis, a deep learning model for time series forecasting is developed and tested for stock price forecasting. This model is based on a neural network with several one-dimensional convolutional layers and fully connected layers. It is trained with historical stock values, technical indicators and Twitter feature information retrieved, extracted, and calculated from posts on the Twitter social media platform. These features include sentiment score, favorites, followers, retweets, and if an account is verified. To collect data from Twitter, the Twitter API is used. Sentiment analysis is performed with the Value Aware and Reason Sentiment Dictionary (VADER). The results show that by adding more Twitter features, the mean squared error (MSE) between predicted and actual prices improved by 23%. Considering the technical analysis, the MSE decreases from 0.1617 to 0.0937, which is an improvement of about 21%. Limitations of this study include that the selected stocks must be publicly listed on the stock market and popular on Twitter and among individual investors. In addition, the working hours of the stock markets are from Twitter, which is constantly available. Therefore, it may cause noise in the model. The one-dimensional deep convolutional neural network models have achieved an overall accuracy of 86.45% and 65.20%, respectively, and the classification time in the first model of each sample is 0.15 seconds in the 1D_CNN model. Compared to current research, the results of this study are one of the best to date.
Sentiment analysis for stock market price prediction using deep learning