در دنیای فناوری اطلاعات ، جستجوی اطلاعات در وب با توجه به انبوه داده ها که همواره در حال افزایش می باشد،اهمیت خاصی پیدا کرده است .از طرفی تبادل اطلاعات بین سیستم های مختلف با امکاناتی که در XML وجود دارد، ساده تر شده است .به همین علت بیشتر منابع ، داده ها یشان را به فرمت اسنادXML ، تبدیل می کنند .همچنین در موتور های جستجو ،دسترسی سریع به اسناد XML از موارد ی می باشد .که در میزان محبوبت آن ها تاثیر دارد . خوشه بندی ،یکی از تکنیک های افزایش دقت و سرعت در دسترسی به اطلاعات می باشد .که موتور های جستجو از این روش برای تسریع دسترسی به اسناد XML از آن استفاده می کنند .موتور های جستجو، اسناد XMLرا بایکی از الگوریتم های خوشه بندی در دسته های بهم مرتبط قرار می دهند .و نتایج حاصل شده که خوشه های اسناد XML می باشد را در اختیار کاربران قرار می دهند، تا کاربر با انتخاب یکی از خوشه ها ،بازه جستجو خود را محدود تر کند و در مدت زمان کمتری به بهترین نتیجه دسترسی داشته باشد .در این پایان نامه یکی از الگوریتمهای خوشه بندی به نام++ XCLS، را که براساس ساختار اسناد XML عمل می کند،مورد بررسی قرار می دهیم . و با اعمال تغییراتی برروی الگوریتم++XCLS ، الگوریتمXCLS + pرا پیشنهاد می دهیم.که باتوجه به ارزیابی های انجام یافته اسناد XML را با دقت بهینه تری خوشه بندی می نماید
In the world of information technology, searching of information on the web has special significance regard to the masses of data which has always been on the rise. Furthermore the exchange of information has been easier based on facility of XML among the different systems. Therefore resources exchange their data format into XML format. As regards searching engines access XML documents promptly. So using XML is important. Clustering is technique which boosts accuracy and speed of information access. So search engines use this approach for accelerating access to the XML documents. Searching engines place XML documents into interrelated categories base on the clustering algorithms. Then those give clusters to users up to choose one for limiting search period and have been the best result in less time. In these thesis one of clustering algorithm based on structure called XCLS++, is studied. Then XCLS+p method is presented with promoting XCLS++. According to evaluates, will be seen which the XML documents clustered with more accuracy by new method