بهبود پالایش هرزنامهها با استفاده از نظریه بازیها
نام نخستين پديدآور
/سیده تینا صفاتی
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: پردیس
تاریخ نشرو بخش و غیره
، ۱۳۹۴
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
علوم کامپیوتر، گرایش هوش مصنوعی
زمان اعطا مدرک
۱۳۹۴/۱۱/۲۶
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
رشد روزافزون حجم هرزنامههایی که فرستاده میشود سبب شده محققان به دنبال یافتن راهی جهت حل این معضل باشند زیرا علاوه بر آسیب رساندن این پیامها به منافع کاربران و مصرف بالای منابع شبکه تهدیدی جدی برای امنیت، بهرهوری و قابلیت اطمینان شبکه است .روشهای متعددی برای مقابله با هرزنامهها مطرح شده است اما از آنجاییکه هرزنامهنویسان پیوسته با ترفندهایی سعی در شکست دادن این روشها دارند، بهروزرسانی مداوم فیلترها مورد نیاز است .در این پژوهش از بازی به نام استکلبرگ استفاده میشود و در آن رفتار بین رقیب و دستهبندی کننده، بهعنوان دو بازیکن مدلسازی میشود .حال با توجه به اینکه فضای مدل یادگیری رقیب در بازی استکلبرگ با مقادیر حقیقی مشخص شده است لذا در این پژوهش برای رسیدن به نقطه تعادل بازی از الگوریتمی به نام استراتژی پایدار تکاملی استفاده شده است .بازیکنهای ما هوشمند هستند و هرکدام از توابع پاداش و استراتژی طرف مقابل آگاهند .بنابراین با تصمیمگیری آگاهانه سعی میکنند پاداش خود را حداکثر کنند .برای بررسی اثر استفاده از نظریه بازیها در بهبود پالایش هرزنامههای فارسی، از معیارهای صحت، دقت، نرخ یادآوری وF استفاده شده است .مجموعهداده مورد استفاده، متشکل از ایمیلهای شخصی ۴ کاربر در مدت زمان ۸ ماه است که توسط ن.وصفی سیسی گردآوری شده است .در نتیجه آزمایشها دقت بالای ۹۰ برای فیلتر بهدست آمد که بیانگر بهتر بودن روش پیشنهاد شده نسبت به روش سهکلاسه کردن ایمیلهای فارسی با دقت ۸۶ است .همچنین این روش با میزان صحت ۷۹.۶ ، دقت ۹۰.۲ ، معیار- ۷۵.۵ Fو نرخ یادآوری ۷۰.۳ نسبت به استراتژی تکاملی با صحت ۷۹.۵ ، دقت ۸۹.۴ ، معیار- ۷۵.۴ Fو نرخ یادآوری ۶۹.۳ به مراتب دقیقتر عمل کرده است .اما زمان آموزش بالا باعث شد از یک روش تغییریافته استفاده شود که پیچیدگی زمانی کاهش پیدا کند و در کنار این بهبود دقتی معادل ۸۹ نیز بهدست آمد
متن يادداشت
Large amount of spam causes lots of troubles for the internet community. So, many methods to distin-guish spams have been proposed. Spam emails have a direct cost in terms of time, server storage space, network bandwidth consumption and indirect costs to protect privacy and security breaches. Efforts have been done to create new filter techniques to block spams, however, spammers have developed tac-tics to avoid these filters. A constant update to these techniques is required. As a solution in this study, we are going to propose an algorithm that tries to model behaviors of email classification and spammer as a sequential Stackelberg game. We also will use Evolutionary Stable Strategy algorithm to compute the Stackelberg equilibrium. Our players are smart and aware of adver-sary's payoff functions and strategies. So they decide consciously to maximize their rewards.To analyze the effect of our work, we will show results for accuracy, precision, recall and F-measure. The dataset consists of legal and spam emails obtained from [18]. It is collected from 4 persons' mailbox during eight months. Our experiment illustrates that evolutionary stable strategy have the ability of solv-ing this equilibrium, its precision is above 90 and its better than three class classification with precision of 86 , but training time is high. So we use a modified algorithm to compute the Stackelberg equilibri-um. With this new method training time has improved significantly. The precision of new algorithm is above 89
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )