امروزه شاهد تولید حجم عظیمی از دادهصها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای دادهصها علم داده کاوی است .از تکنیک های پر کاربرد داده کاوی میصتوان به خوشه بندی اشاره کرد .خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون دادهصهاست معمولا الگوریتمصهای مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشهصها هستند و تعیین تعداد بهینه آنصها برای ارزیابی الگوریتمصها به کار میصرود .برای تعیین تعداد خوشهصها سه روش شامل آزمون فرض، معیارصهای داخلی و معیارصهای خارجی وجود دارد که هر کدام دارای شاخصصهای متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است .این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتمصهای آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل میصپردازیم
متن يادداشت
Today huge volumes of data are produced in the world. One of the most strategic and important sciences in data world is data mining. The clustering is one of the most commonly used techniques of data mining. Clustering is exploring unsupervised function of data mining in order to discover natural groupings within the data various clustering algorithms usually needs parameters as the number of clusters And the optimum number of them used for algorithms evaluation. There are three methods to estimate the number of clusters: hypothesis testing, external criteria, internal criteria, that each have several indices. In this work, binomial noised model was used for estimating the number of clusters. This thesis was collected in four separate chapters. The first chapter describes the concepts and definitions, the second chapter explains clustering and a variety of algorithms in R and the last chapter gives the analyses of binomial noised model and a numerical example for the model
عنوان اصلی به زبان دیگر
عنوان اصلي به زبان ديگر
binomial noised model for cluster validation A
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )