Feature Selection for IoT, based on Dragonfly Algorithm
Dissertation
Peshrow Mohammed
Faculty of Electrical and Computer Engineering
1400
65p.
cd
Master's
Electrical and Computer Engineering
1400/06/31
Internet of Things (IoT) can be combined with machine learning in order to provide intelligent applications. Furthermore, IoT expands these advantages and technologies to the industry. Machine learning systems provide accurate predictions using data and automated learning mechanisms. How learning systems are predicted depends entirely on the efficient selection of features. Feature selection is one of the most important and challenging tasks in statistical modelling and machine learning. The irrelevant and redundant features in high-dimensional data not only result in high computational complexity but also seriously reduce the accuracy and efficiency of classification methods. Meanwhile, high-dimensional data may result in the curse of dimensionality. To cope with these problems, dimensionality reduction methods are used to analyse relevance and redundancy in IoT big data and then preserve relevant features and remove as many irrelevant and redundant features as possible. These methods can reduce the computational cost, strengthen the learning model, and avoid overfitting problems in the processing of big data in IoT. Dragonfly Algorithm (DA) is a good and advanced meta-heuristic that shows superior performance in dealing with various optimization issues, including feature selection. In this research, we use tanh as transfer function for Dragonfly and finally use simulated annealing to get best subset of features. The results of the proposed method are compared with the methods based on the filter (like MRMR and relief) as well as the simple binary dragonfly algorithm, which shows the superiority of the results of the proposed method
اینترنت اشیا را می توان با یادگیری ماشین ترکیب کرد تا برنامه های هوشمندانه ای را ارائه دهد. علاوه بر این، اینترنت اشیا این مزایا و فناوری ها را به صنعت گسترش می دهد. سیستم های یادگیری ماشین با استفاده از داده ها و مکانیسم های یادگیری خودکار پیش بینی های دقیق را ارائه می دهند. نحوه پیش بینی سیستم های یادگیری کاملاً به انتخاب کارآمد ویژگی ها بستگی دارد. انتخاب ویژگی ها یکی از مهمترین و چالش برانگیزترین وظایف در مدل سازی آماری و یادگیری ماشین است. ویژگی های بی ربط و زاید در داده های با ابعاد بالا نه تنها منجر به پیچیدگی محاسباتی بالا می شود بلکه به طور جدی دقت و کارایی روش های طبقه بندی را کاهش می دهد. در همین حال ، داده های با ابعاد بالا ممکن است منجر به لعن بعد شود. برای کنار آمدن با این مشکلات ، از روش های کاهش بعد برای تجزیه و تحلیل ارتباط و افزونگی در داده های بزرگ اینترنت اشیا و سپس حفظ ویژگی های مربوطه و حذف هر چه بیشتر ویژگی های بی ربط و زائد استفاده می شود. این روش ها می توانند هزینه محاسباتی را کاهش دهند ، مدل یادگیری را تقویت کنند و از مشکلات نصب بیش از حد در پردازش داده های بزرگ در اینترنت اشیا جلوگیری کنند. الگوریتم سنجاقک یک الگوریتم فرا ابتکاری خوب و پیشرفته است که عملکرد عالی را در برخورد با مسائل مختلف بهینه سازی ، از جمله انتخاب ویژگی نشان می دهد. در این تحقیق ، ما از tanh به عنوان تابع انتقال استفاده می کنیم و در نهایت از شبیه سازی تبرید فلزات برای بدست آوردن بهترین زیر مجموعه ویژگی ها استفاده می کنیم. نتایج روش پیشنهادی با روشهای مبتنی بر فیلتر مانند (MRMR و relief) و همچنین الگوریتم ساده باینری سنجاقک مقایسه شد که نشان دهنده برتری نتایج روش پیشنهادی است
ارائه روش انتخاب ویژگی در اینترنت اشیا بر اساس الگوریتم سنجاقک
Internet of Things, Feature selection, Dragonfly algorithm (DA), K nearest neighbor (KNN), Support Vector Machine (SVM).
اینترنت اشیا، الگوریتمهای انتخاب ویژگی، الگوریتم بهینه سازی سنجاقک، الگوریتم k نزدیک ترین همسایه و ماشین بردار پشتیبان