ارائه سیستم پیشنهاد دهنده افراد خبره مبتنی بر راهکارهای یادگیری عمیق
First Statement of Responsibility
نرجس نیک زاد خسمخی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
مهندسی برق وکامپیوتر
Date of Publication, Distribution, etc.
۱۴۰۰
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۱۴۸ص.
Accompanying Material
سی دی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی کامپیوتر گرايش هوش مصنوعی
Date of degree
۱۴۰۰/۰۶/۰۶
SUMMARY OR ABSTRACT
Text of Note
سیستمهای پیشنهاد دهنده فرد خبره نوعی از سیستمهای پیشنهاد دهنده هستند، که متخصصان مربوط به یک موضوع خاص را براساس سه امتیاز مختلف اعتبار، تشابه متن و سابقه پیشنهاد میکنند. از جمله کاربردهای این سیستمها میتوان به یافتن افراد خبره در سیستمهای پرسش و پاسخ اشاره کرد که هدف ارائهی لیست رتبهبندی شده از متخصصان دارای تخصص در مورد یک پرسش خاص است. اگرچه تاکنون سیستمهای پیشنهاد دهنده خبره مختلفی ارائهشده است اما این سیستمها با مشکلاتی نیز مواجه هستند. یکی از مشکلات اساسی در این سیستمها نبود منابع مناسب بهمنظور جمعآوری اطلاعات افراد خبره میباشد و این امر موجب محدود شدن این سیستمها به حوزه سیستمهای پرسش و پاسخ شده است. مشکل دیگر، چگونگی مدل کردن رفتار و تخصص افراد بر اساس اطلاعات گردآوریشده است تا به کمک آن بتوان افراد با بالاترین درجه از تخصص را با دقت بالایی انتخاب و معرفی نمود. ازاینرو، یکی از اهداف این رساله گردآوری و ارائه منبع اطلاعاتی مفید و جدید از نمایه اسکوپوس میباشد. مجموعه داده جمعآوری شده شامل ویژگیهای محتوا و غیرمحتوای داوطلبان خبره مانند مقالههای منتشر شدهی آنها، زمینههای موضوعی، وابستگیها، شاخص اچ و روابط همکاری بین آنها است. همچنین، در این رساله، ما یک روش تعبیه گرافِ مقیاسپذیر، دارای ابعاد تعبیه مناسب و ضامن اهداف هموفیلی و نقش ساختاری را با عنوان ExEm ارائه میدهیم که از تئوری مجموعه غالب و رویکردهای یادگیری عمیق برای یادگیری بازنمایی گرههای شبکه مشارکتی استفاده میکند. شبکه مشارکتی، یک شبکه اجتماعی است که ازافراد خبرهای تشکیل شده است که برای دستیابی به یک هدف خاص با یکدیگر مشارکت و همکاری میکنند. تحلیل این شبکه، اطلاعات معناداری را در خصوص تخصص این افراد و حوزههای موضوعی آنها ارائه میدهد. از اینرو، در ابتدا، ExEm گرههای غالب شبکه مشارکتی را مییابد و مسیرهای تصادفی هوشمندی را میسازد که حداقل از دو گره غالب تشکیل شدهاند. جهت توصیف مجاورت محلی، در ابتدای هر مسیر نمونه باید یک گره غالب ظاهر شود. همچنین، گره دوم غالب، اطلاعات ساختار سراسری را نشان میدهد. جهت یادگیری تعبیههای گره، ExEm از سه روش تعبیه Word2vec، fastText و الحاق این دو استفاده میکند. نتیجه نهایی، بردارهای ابعاد پایین افراد خبره است که به آنها تعبیههای خبره گفته میشود. تعبیههای خبره استخراج شده میتوانند در بسیاری از کاربردها اعمال شوند. به منظور گسترش این تعبیهها به سیستمهای پیشنهاد دهنده فرد خبره، استراتژی جدیدی را معرفی میکنیم که از بردارهای خبره برای محاسبه امتیاز افراد خبره و پیشنهاد افراد خبره استفاده مینماید. آزمایشهای گستردهای را برای اعتبار بخشیدن به اثربخشی ExEm از طریق ارزیابی عملکرد آن به صورت دستهبندی چند برچسبی، پیشبینی پیوند و پیشنهاد گره در مجموعه دادههای متداول و مجموعه داده اسکوپوس انجام میدهیم. آزمایشها نشان میدهند که ExEm از الگوریتمهای مبنا، به خصوص در شبکههای متراکم، پیشی گرفته و دارای عملکرد بهتری است. از سوی دیگر، اکثر مطالعات قبلی در سیستمهای پیشنهاد دهنده خبره، به طور جداگانه سه امتیاز اعتبار، تشابه متن و سابقه را محاسبه و با یک استراتژی ترکیبی خطی آنها را ادغام میکنند. در حالی که، در این رساله، ما یک سیستم پیشنهاد دهنده فرد خبره با رویکرد مبتنی بر یادگیری انتقالی و چندماهیتی، تحت عنوان BERTERS را معرفی میکنیم که داوطلب خبره را با یک بازنمایی برداری نمایش میدهد که این امتیازها را در خود جای داده است. BERTERS، یک بازنمایی برای هر داوطلب تعیین میکند که بیانگر سطح دانش، محبوبیت و اعتبار و سابقه داوطلب است. BERTERS، مستقیما از هر دو تکنیک ترنسفورمر و تعبیه گراف به ترتیب برای تبدیل محتوای منتشر شده توسط داوطلبان و روابط همکاری بین آنها به بردارهای با ابعاد پایین استفاده میکند. این بردارها امتیازهای تشابه متن و اعتبار داوطلبان را نشان میدهند. همچنین، برای افزایش دقت پیشنهاد، BERTERS ویژگیهای اضافی را بهعنوان امتیاز سابقه در نظر میگیرد. علاوه بر این، آزمایشهای گستردهای را تحت وظایف دستهبندی چند برچسبی، پیشنهاد و مصورسازی انجام میدهیم. افزون بر این، عملکرد BERTERS رابرحسب چهار دستهبندیکننده مختلف، تغییر نسبت داده آموزشی و ابعاد مختلف بردار تعبیه ارزیابی میکنیم. در وظیفه دستهبندی، BERTERS عملکرد را در مورد معیارهای Micro-Fl و Macro-Fl با 23/40% و 34/45% در مقایسه با روشهای مبتنی بر تک ماهیتی ارتقا میدهد. همچنین، BERTERS در مقایسه با الگوریتمهای ترکیبی بهرهی 9/12% را کسب میکند. علاوه بر این، نتایج توانایی BERTERS را برای تعمیم به حوزههای مختلف مانند دانشگاه و سیستمهای پرسش و پاسخ برای یافتن افراد خبره ثابت میکنند. به طور خلاصه، از آنجائی که تعبیههای خبرهی پیشنهادی ما حاوی اطلاعات معنایی و نحوی غنی از داوطلب است، باعث بهبود قابل توجه عملکرد سیستم پیشنهاد دهنده فرد خبره میشوند.
Text of Note
An expert recommendation system (ERS) suggests relevant experts of a particular topic based on three different scores authority, text similarity, and reputation. One of the applications of ERS is to find the experts in community question answering (CQA) systems. Although a number of ERSs have been proposed, they encounter some main issues. One of these problems is that there is not a suitable dataset to extend ERS into other domains, hence most previous studies have been limited to the CQA environment. Therefore, one of the aims of this thesis is to collect and present a useful and new source of information from Scopus. The gathered dataset includes the content and non-content features of expert candidates such as their published articles, subject areas, affiliations, h-index, and their co-author interactions. Also, in this thesis, we propose a graph embedding method, called ExEm, that uses dominating-set theory and deep learning approaches to capture node representations in collaborative network. A collaborative network is a social network that is comprised of experts who cooperate with each other to fulfill a special goal. Analyzing this network yields meaningful information about the expertise of these experts and their subject areas. Hence, at first, ExEm finds dominating nodes of the collaborative network and constructs intelligent random walks that comprise of at least two dominating nodes. One dominating node should appear at the beginning of each path sampled to characterize the local neighborhoods. Moreover, the second dominating node reflects the global structure information. To learn the node embeddings, ExEm exploits three embedding methods including Word2vec, fastText and the concatenation of these two. The final result is the low-dimensional vectors of experts, called expert embeddings. The extracted expert embeddings can be applied to many applications. In order to extend these embeddings into the expert recommendation system, we introduce a novel strategy that uses expert vectors to calculate experts’ scores and recommend experts. At the end, we conduct extensive experiments to validate the effectiveness of ExEm through assessing its performance over multi-label classification, link prediction, and recommendation tasks on common datasets and Scopus. The experiments demonstrate that ExEm outperforms the baselines especially in dense networks. On the other hand, most of previous studies individually compute these scores and join them with a linear combination strategy. While, in this thesis, we introduce an ERS based on transfer learning and multimodal approach, called BERTERS, that presents each expert candidate by a single vector representation that includes these scores in itself. BERTERS determines a representation for each candidate that presents the candidate's level of knowledge, popularity and influence, and history. BERTERS directly uses both transformers and the graph embedding techniques to convert the content published by candidates and collaborative relationships between them into low-dimensional vectors which show the candidates' text similarity and authority scores. Also, to enhance the accuracy of recommendation, BERTERS takes into account additional features as reputation score. We conduct extensive experiments over the multi-label classification, recommendation, and visualization tasks. Also, we assess its performance on four different classifiers, diverse train ratios, and various embedding sizes. In the classification task, BERTERS strengthens the performance on Micro-F1 and Macro-F1 metrics by 23.40% and 34.45% compared with single-modality based methods. Furthermore, BERTERS achieves a gain of 9.12% in comparison with the baselines. Also, the results prove the capability of BERTERS to extend into a variety of domains such as academic and CQA to find experts. In summary, since our proposed expert embeddings contain rich semantic and syntactic information of the candidate, it significantly improves the performance of the expert recommendation system
OTHER VARIANT TITLES
Variant Title
Expert recommendation system based on deep learning approaches