بهبود کارایی الگوریتمهای یادگیری ماشین با استفاده از روشهای رگرسیون تاوانیده
نام نخستين پديدآور
زری فرهادی
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
ریاضی،آمار و علوم کامپیوتر
تاریخ نشرو بخش و غیره
۱۴۰۲
مشخصات ظاهری
نام خاص و کميت اثر
۱۱۸ص.
مواد همراه اثر
سی دی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
دکتری
نظم درجات
آمار
زمان اعطا مدرک
۱۴۰۲/۰۶/۰۵
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
امروزه در مباحث مربوط به پیشبینی علاوه بر افزایش دقت الگوریتمهای موجود، کاهش بار محاسباتی نیز موضوع چالش برانگیزی است که توجهات بسیاری را به خود معطوف کرده است. از آنجایی که الگوریتمهای پایهی موجود، در این مورد کارایی و دقت کافی ندارند، برای حل این مسأله از ترکیب الگوریتمهای یادگیری ماشین و روشهای آماری استفاده کردهایم.در این رساله به منظور بهبود کارایی الگوریتمهای یادگیری ماشین سه رویکرد ترکیبی پیشنهاد شده است. در رویکرد اول، از ترکیب جنگل تصادفی و روشهای رگرسیون تاوانیده برای کاهش تعداد درختان جنگل تصادفی استفاده میشود. این کار با کاهش خودکار درختان به کمک روشهای تاوانیده و تجمیع درختان باقیمانده، به کاهش بار محاسباتی کمک میکند.رویکرد دوم، بر بهبود دقت مدل با خوشهبندی دادههای ورودی، شناسایی زیرمجموعههای همگن از دادهها، تخصیص آنها به گروههای مشابه و کاهش تعداد درختان جنگل تصادفی در داخل خوشهها تمرکز دارد. به این صورت که در داخل هر خوشه، از جنگل تصادفی به عنوان پیشبینیکننده استفاده میشود. در نهایت، با کاهش تعداد درختان در درون هر خوشه با استفاده از روشهای تاوانیده و در مجموع کل خوشهها، خطای مدل و بار محاسباتی کاهش یافته و عملکرد مدل بهبود پیدا میکند.در ادامه، رویکرد سومی پیشنهاد میشود که از الگوریتمها و ساختارهای بهروز برای پیشبینی عمیقتر و دقیقتر استفاده میکند. در این رویکرد از ترکیب الگوریتم یادگیری عمیق، روشهای تاوانیده و روشهای یادگیری جمعی استفاده میشود. رگرسیونهای عمیق وظیفهی استخراج روابط بین ویژگیها و پیشبینی را به عنوان یادگیرنده بر عهده دارند. روشهای رگرسیون تاوانیده عمل کاهش تعداد پیشبینیکنندهها و روشهای جمعی عمل تجمیع یادگیرندههای باقیمانده را انجام میدهند. در نهایت، رویکردهای پیشنهادی با دیگر مدلهای مبنا براساس مطالعات شبیهسازی و سه مجموعه دادهی واقعی مورد ارزیابی قرار میگیرند. نتایج حاصل نشان میدهند که رویکردهای پیشنهادی، عملکرد بهتر و کارایی بیشتری نسبت به روشهای موجود دارند.
متن يادداشت
Abstract: Nowadays, in addition to increasing the accuracy of existent algorithms, the reduction of computational time is a challenging issue that has attracted much attention in prediction topics. Since in this case study, the existent base algorithms do not have enough efficiency and accuracy, we use a combination of machine learning algorithms and statistical methods to solve this problem.In this thesis, in order to improve the efficiency of machine learning algorithms, three combined approaches are proposed. In the first approach, the combination of Random Forest and penalized regression methods are used to reduce the number of trees. This technique automatically reduces the trees using penalized methods and aggregates the remaining trees, thereby reducing the computational load.The second approach focuses on improving the model's accuracy by clustering of input data, identifying homogeneous subsets of data, assigning them to similar groups, and reducing the number of Random Forest trees within each cluster. In this way, within each cluster, Random Forest is used as predictor. Finally, by reducing the number of trees within each cluster and total clusters, the model error and computational load are reduced and the performance of model is improved.Continuing, a third approach is proposed that uses state-of-the-art algorithms and structures for deeper and more accurate prediction. In this approach, the combination of deep learning algorithm, penalized regression methods and ensemble learning methods are used. Deep regressions extract relationships between features and make prediction as learner. The penalized regression methods reduce the number of predictors, while ensemble methods aggregate the remaining learners. Finally, the proposed approaches are evaluated with other base models based on simulation study and three real datasets. The results show that the proposed approaches have better and efficient performance than the existing methods.
عنوانهای گونه گون دیگر
عنوان گونه گون
Improving the Efficirncy of Machine Learning Algorithms by Penalized Regression Methods
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )