پیاده سازی و کاربرد الگوریتم انتخابات برای خوشه بندی
First Statement of Responsibility
/لیلا دردمند حسین پور
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: مهندسی برق و کامپیوتر
Date of Publication, Distribution, etc.
، ۱۳۹۵
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
دکتری
Discipline of degree
مهندسی کامپیوترگرایش:هوش مصنوعی
Date of degree
۱۳۹۵/۰۴/۰۹
Body granting the degree
تبریز
SUMMARY OR ABSTRACT
Text of Note
خوشهصبندی دادهصها روشی برای تجزیه و تحلیل دادهصهای مورد نیاز میصباشد .یکی از بخشصهای کلیدی هر روش خوشهصبندی، انتخاب رویکردی جهت جستجوی فضای جواب و بهینهصسازی تابع هدف است .بهینهصسازی فرآیندی برای پیدا کردن یک روش جایگزین با بالاترین کیفیت جهت کمینهصسازی یا بیشینهصسازی فاکتورهای مورد نظر است .در سالصهای اخیر، الگوریتمصهای جستجو و بهینهصسازی متعددی برای خوشهصبندی ارائه شده است .یکی از الگوریتمصهای جستجو و بهینه-سازی جدید، الگوریتم انتخابات میصباشد که از انتخابات ریاست-جمهوری الهام گرفته شده است .الگوریتم انتخابات یک الگوریتم تکرارشونده است که با مجموعهصای از راهصحلصهای شناختهصشده به-عنوان جمعیت کار میصکند .مبارزهصی تبلیغاتی هستهصی الگوریتم است و شامل سه گام تبلیغات مثبت، تبلیغات منفی و ائتلاف میصباشد .این فرآیندها آنصقدر تکرار میصشوند تا الگوریتم به بهینه سراسری همگرا گردد .در این تحقیق، هدف پیادهصسازی و کاربرد الگوریتم انتخابات برای خوشهصبندی میصباشد که این کار برای اولین بار انجام شده است .در این الگوریتم هر نامزد انتخابات بهصعنوان نمایندهصی خوشه میصباشد .برای ارزیابی، روش ارائهصشده بر روی مجموعهصداده استاندارد مورد آزمایش قرار گرفت .همچنین از روشصهای شناخته شده نظیرmeans -ICA, K- ICA, FAC, PSO, CAS_C, GA, ACO, FACبرای مقایسهصی نتایج بهصدست آمده استفاده شده است .کمترین مقدار مجموع مجذور فاصله برای الگوریتم انتخابات بر روی مجموعهصدادهصی استاندارد Iris در مقایسه با روش GA مقدار کمتر و نتیجهصی مطلوبصتری داشته است .همچنین مقدار حداکثر و متوسط تابع هزینه برای الگوریتم انتخابات نسبت به روشصهایmeans - GA, Kمقدار کمتر و نتیجهصی بهتری داشت .همچنین با محاسبه انحراف معیار این نتیجه حاصل شد که به-کارگیری الگوریتم انتخابات در خوشهصبندی در مقایسه با روشصهایmeans - GA, CAS_C, kپایستگی بالاتر و در مقایسه با سایر روش ها پایستگی پایینی دارد
Text of Note
Data clustering is one of the main methods for the analysis of data. One of the fundamental parts of a clustering method is selecting an approach to search problem space and to optimize goal function. Therefore, optimization methods which try to find an alternative method with highest quality for minimizing or maximizing the factors would be effective in data clustering. In recent years, several researches and optimization algorithms are presented for clustering. One of the new search and optimization algorithms is Election algorithm that is inspired by the presidential election. Election algorithm is an iterative algorithm works with a set of solutions known as population. The advertising campaign is the core of Election algorithm, consists of three steps: positive advertisement, negative advertisement, coalition. These processes are repeated until the algorithm converges to the global optimal. This thesis is aimed to apply and implement Election algorithm for clustering. In this method, each candidate is represented as a center of cluster. Our proposed method is tested on Iris standard data set. In order to evaluate, the results of our research is compared with well-known algorithms such as K-means, GA and PSO. Compared with using GA for data clustering, the total sum of distance square for Election algorithm on the Iris data set has the better result. Furthermore, the maximum and the average of the cost function for Election algorithm get better results than GA, K-means. With respect to the standard deviation using Election algorithm for data clustering shows higher conservation than using GA, CAS_C and k-means for data clustering