ارائه یک روش امتیازدهی جملات متون فارسی برای استفاده در خلاصهسازی
نام نخستين پديدآور
آرزو صفری اسفنجانی
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
برق و کامپیوتر
تاریخ نشرو بخش و غیره
۱۳۹۴
مشخصات ظاهری
نام خاص و کميت اثر
۷۸ص.
مواد همراه اثر
سی دی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی کامپیوتر گرایش نرم افزار
زمان اعطا مدرک
۱۳۹۴/۱۱/۰۷
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
چکیده:امروزه با توجه به افزایش حجم اطلاعات موجود در اینترنت نیاز به ابزارهایی که بتوانند خلاصهای از هر سند را تولید کنند بیش از پیش احساس میشود. خلاصهی یک سند به معنی «ارائهی یک نسخهی مختصر از متن ورودی با حفظ مفاهیم و اطلاعات اصلی آن» میباشد.در خلاصهسازی خودکار متون فارسی دو رویکرد کلی استخراجی و چکیدهای وجود دارد. مهمترین مشکل خلاصهسازهای استخراجی مربوط به کمبود پیوستگی و ارتباط نتایج آن میباشد لذا با این وجود، دستیابی به روشهای جایگزین همواره مورد توجه محققین بوده است. در این پایاننامه، پس از بررسی سیستمهای خلاصهساز استخراجی موجود در زبان فارسی یک سیستم خلاصهساز از نوع استخراجی ارائه شده است. در سیستم ارائه شده، سعی شده با بهبود مرحله امتیازدهی به جملات دقت خلاصههای تولیدی افزایش یابد. سیستم خلاصهساز پیشنهاد شده برای تعیین امتیاز هر جمله از پنج ویژگی فرکانس کلمه، تعداد کلمات کلیدی، تعداد کلمات عنوان، مکان جمله و طول جمله استفاده میکند. پس از تعیین مقادیر این پنج ویژگی، از ترکیب فرآیند تحلیل سلسله مراتبی و الگوریتم ژنتیک برای تعیین امتیاز نهایی مربوط به هر جمله استفاده شدهاست. از آنجاییکه اصلیترین عمل محاسباتی در فرآیند تحلیل سلسله مراتبی میانگین هندسی است و در اکثر سیستمهای موجود برای محاسبه امتیاز از میانگین حسابی و یا میانگین حسابی وزندار استفاده شده است، با توجه به ویژگیهای میانگین هندسی انتظار میرفت روش ارائه شده نتایج بهتری را نسبت به بقیه روشهای موجود داشته باشد. برای ارزیابی عملکرد سیستم ارائه شده، میزان دقت خلاصههای تولیدی با سه روش موجود مقایسه شدهاند. برای تعیین دقت خلاصههای تولیدی از پیکرهی پاسخ استفاده کردهایم. نتایج حاصل نشان میدهد که روش پیشنهادی با میانگین دقت 12/81 در مقایسه با روشهای میانگین حسابی مقادیر ویژگیها، میانگین حسابی وزندار و فرآیند تحلیل سلسله مراتبی بدون استفاده از ژنتیک عملکرد بهتری دارد.
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )