جستجوی معنایی در صفحات وب با استفاده از هستیشناسی
/سیده هاله سیددیزجی
: دانشگاه تبریز
، ۱۳۹۴
چاپی
کارشناسی ارشد
علوم کامپیوتر گرایش نرم افزار
۱۳۹۴/۰۷/۱۱
تبریز
با افزایش سریع اطلاعات وب و امکان بیشتر دسترسی به این اطلاعات، نیاز به بازیابی دقیق اطلاعات بیشتر از قبل احساس میشود .از این رو با این تحولات، روشهای جستجو در وب نیز دستخوش تحولاتی بودهاند که منجر به ایجاد روشهای جستجوی معنایی شدهاند .این روشها به کمک ابزاری همچون وب معنایی و هستیشناسیها تلاش میکنند با دقت بیشتری اطلاعات را از بین حجم وسیع دادهها استخراج کنند .در این پایاننامه روشی ترکیبی برای جستجوی معنایی ارائه میشود که در آن با استفاده از هستیشناسی فارسنت، روابط موجود در مستندات، کلمات مرتبط با پرسوجوی کاربر و فاصلههای معنایی کلمات، پیدا شده و با استفاده از آنها مستندات رتبهبندی میشوند .در این روش ابتدا با استفاده از هستیشناسی فارسنت مستندات زبان فارسی پردازش میشوند و شبکهای از معانی آن مستندات به اسم شبکههای معنایی مستندات ساخته میشوند .سپس در مرحله برخط پس از پردازش پرسوجوی کاربر، روابط موجود در این مستندات امتیازدهی میشوند و با استفاده از بردار وزندهیشده پرسوجوی کاربر و بردارهای مستندات به روش فضای برداری میزان مشابهت بین پرسوجو و مستندات محاسبه میشود .همینطور فاصلههای معنایی بین پرسوجو و مهمترین کلمات مستندات محاسبه شده و با استفاده از آنها امتیاز مستندات بهدست میآید .درنهایت با ترکیب این سه امتیاز رتبه نهایی مستندات محاسبه میشود .نتایج آزمایش نشان میدهند که دقت روش ترکیبی ارائه شده در سه نتیجه اول نسبت به روش مبنا حدود ۵ و میزان فراخوانی حدود ۱۱ درصد افزایش داشته است
As the amount of information of web increases rapidly and there is more feasibility of access to this information, the need for precise information retrieval is being felt more than before. Hence, by these changes, search methods on web have been changed and resulted the creation of semantic search methods. These methods by using some tools such as semantic web and ontologies try to retrieve information through large amounts of data more precisely. In this thesis a combined method for semantic search is presented in which relations in the documents, user query's related words and semantic distances are found using FarsNet ontology and documents are ranked using them. In this method first, documents are processed using FarsNet ontology and networks of their semantics known as semantic networks are constructed. Then at online phase after processing user query, scores of relations in the documents are calculated and similarity value between query and documents is calculated using weighted vector of user query and vectors of documents by vector space model. Also semantic distances between query words and most important words of documents are calculated and scores of documents are found using them. Finally by combining these three scores final ranks of documents are calculated. Experiment results show that precision of the combined method at first 3 results (P@3) has been increased about 5 and recall has been increased about 11 compared with base method