شناسایی خوشه های غیرکروی شکل با استفاده از CURE تغییر یافته
First Statement of Responsibility
آرزو صفدری وایقانی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
مهندسی برق و کامپیوتر
Date of Publication, Distribution, etc.
۱۴۰۰
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۷۵ص.
Accompanying Material
سی دی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی کامپیوتر گرایش هوش مصنوعی ورباتیکز
Date of degree
۱۴۰۰/۰۶/۱۴
SUMMARY OR ABSTRACT
Text of Note
با توجه به حجم بالای داده¬های در دسترس و اهمیت استخراج اطلاعات از آن¬ها الگوریتم¬های خوشه¬بندی مختلف ارائه شده¬اند. الگوریتم خوشه¬بندی CURE که از نقاط نماینده برای خوشه-بندی داده¬ها استفاده می¬کند، یک الگوریتم قدرتمند در برابر داده¬های پرت و نویز است. ولی این الگوریتم در خوشه¬بندی برخی مجموعه داده¬ها در بیش از 2 بعد دچار مشکل می¬شود.در این پایاننامه هدف ارائه¬ی یک الگوریتم خوشه¬بندی است که بتواند خوشه¬های غیرکروی را به خوبی تشخیص دهد. بدین منظور با استفاده از مزایای الگوریتم¬های خوشه¬بندی مبتنی بر تراکم برای بهبود الگوریتم CURE و رفع ضعف¬های آن الگوریتم CURE تغییر یافته ارائه شده است. این الگوریتم از یک روش مبتنی بر تراکم تعیین مراکز خوشه¬ها بهره برده است تا از ترکیب خوشه¬ها جلوگیری کند. به این شکل که اگر هر دو خوشه که برای ادغام انتخاب شده¬اند، شامل داده¬ی مرکز خوشه باشند، از ادغام آن¬ها جلوگیری شود
Text of Note
Various clustering algorithms have been proposed due to the high volume of available data and the importance of extracting information from them. The CURE clustering algorithm, which uses representative points to cluster data, is a robust clustering algorithm against noise and outliers. However, this algorithm has problems with clustering some datasets in more than two dimensions.This thesis aims to propose a clustering algorithm that can detect non-spherical clusters well. For this purpose, the advantages of density-based clustering algorithms are used to improve the CURE algorithm and eliminate its weaknesses, the modified CURE algorithm is proposed. This algorithm uses a density-based method to determine the cluster centers to prevent merging some clusters. In this way, if both clusters selected for merging contain the cluster center data, they could not be merged. The results obtained from the clustering of real and fictitious data sets show that the correctly selected cluster centers help the modified CURE algorithm to be much more efficient than the traditional CURE algorithm and cover its weakness
OTHER VARIANT TITLES
Variant Title
Detecting Non-Spherical Clusters Using Modified CURE Algorithm