دسته بندی چند رسانه ای موضوعی محتوا در شبکه های اجتماعی با استفاده از ترنسفورمر
نام نخستين پديدآور
پویا چاوشی اصل
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
مهندسي برق و کامپیوتر
تاریخ نشرو بخش و غیره
۱۴۰۱
مشخصات ظاهری
نام خاص و کميت اثر
۸۱ص.
مواد همراه اثر
سی دی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی کامپیوتر گرایش معماری سیستم
زمان اعطا مدرک
۱۴۰۱/۱۱/۲۷
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
محتوای تولید شده در شبکه¬های اجتماعی ممکن است دارای ساختار¬ مختلف متنی، تصویری یا صوتی باشند. هر یک از این ساختار¬ها می توانند در دسته بندی محتوای تولید شده مورد استفاده قرار گیرند. تعداد قابل توجهی از محتواهای تولید شده، دارای هر دو ویژگی متنی و تصویری می باشند. برای مثال: استوری هایی که هر روز در اینستاگرام منتشر می¬شوند، در صورتی که استوری¬ها دارای متن و تصویر پس زمینه باشند می¬توان از ویژگی¬های تصویری مثل: رنگ پس¬زمینه، رنگ متن و فونت استفاده شده برای افزایش دقت مدل دسته بندی استفاده کرد. در این تحقیق، از مجموعه داده مخصوصی که برای این تحقیق تهیه شده، استفاده شده است. در این مجموعه داده از3600 داده منتشر شده به زبان فارسی در استوری¬های اینستاگرام استفاده شده که با نظارت انسانی به 18 دسته مختلف تقسیم بندی شده است. 80% از داده¬ها¬ برای آموزش مدل یادگیری و 20% باقیمانده برای آزمون مدل یادگیری استفاده شده است. رویکرد این تحقیق برای ترکیب متن و ویژگی های تصویری موجود در مجموعه دادگان، استفاده از معماری ترنسفورمر و یک مدل زبانی چند زبانه برای دسته بندی متن و استفاده از یک شبکه عصبی برای دسته بندی ویژگی های تصویری و در نهایت ترکیب این دو مدل دسته بندی در یک مدل مبتنی بر یادگیری تجمعی است. روش پیشنهاد شده در این تحقیق توانسته است معیارهای دقت و F1-score را به میزان حدود 10 نسبت به دسته بندی متن بهبود بخشد
متن يادداشت
The content produced in social networks may have different textual, visual, or audio structures. Each of these structures can be used to classify generated contents. A significant number of produced contents have both textual and graphical features. Some of them, such as the stories published on Instagram, have the usual text and graphical features. In addition to text features, background color, text color, and font as graphical features can be used to improve the accuracy of the classification model. In this research, our 3660 Persian data published in Instagram stories have been used for the dataset. The data has been divided into 18 different classes by human supervision. The 80% of the data has been used for training and 20% remaining for testing the learning model. The approach of this research is to use transformer architecture and a multilingual model for text classification and a neural network for graphical features classification and then combine these two classification models in one model based on ensemble learning. The obtained results of proposed method show about 10% improvement in accuracy and F1-score respected to text classification.
عنوانهای گونه گون دیگر
عنوان گونه گون
Multimedia Topic Classification of Content in Social Networks using Transformer
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )