بهینه سازی پارامترهای دینامیکی ربات متحرک برای یادگیری دنبال کردن هدف در زمان کمتر
Optimization of dynamic parameters of mobile robot for learning of target tracking in less time
/سمیرا عبهری
: فناوریهای نوین
، ۱۳۹۷
، راشدی
چاپی - الکترونیکی
کارشناسی ارشد
مهندسی مکاترونیک
۱۳۹۷/۱۱/۰۷
تبریز
در این پایانصنامه بهمنظور یادگیری دنبال کردن هدف در زمان کمتر، پارامترهای دینامیکی ربات متحرک دارای دو چرخ با استفاده از الگوریتم ژنتیک بهینهصسازی شدند .برای شبیهصسازی یادگیری مصنوعی بهصورت تقویتی در ربات نیز از شبکهصهای عصبی اسپایکینگ استفاده شد و در طی فرآیند یادگیری ارتباط نرونصهای سنسوری، نرونصهای موتوری و دو چرخ ربات در صورتی که عمل انجامشده درست باشد، پاداش گرفته و تقویت شد .روش یادگیری هبین و پلاستیسیته وابسته به زمان جرقه (STDP) برای الگوی یادگیری به کار گرفته شد .همچنین بهمنظور بررسی بهینهصسازی و نیز یادگیری، یک تابع ارزیابی بهعنوان معیار بررسی این دو موضوع به کار گرفته شد .در مورد یادگیری، هدف تقویت اتصالات غیرمستقیم در ربات یعنی اتصال نرونصهای سنسوری راست به نرونصهای موتوری چپ و اتصال نروصنصهای سنسوری چپ به نرونصهای موتوری راست) اتصالات غیرهمنام (بود .بنابراین طبق معیار در نظر گرفتهشده هرچه اختلاف تفاضلات) اختلاف اتصالات مستقیم و غیرمستقیم و درواقع مقدار این معیار (بیشتر بود، یادگیری بهتر اتفاق میصافتاد .همچنین در مورد بهینهصسازی پارامترهای دینامیکی، ابتدا تعدادی پارامتر دینامیکی برای ربات در نظر گرفته شد و شایستگی هریک از پارامترها با استفاده از تابع ارزیابی بررسی شد .بر طبق الگوریتم ژنتیک، پارامترصهایی که با آنصها ربات یاد میصگرفت در زمان کمتری به هدف برسد، تعدادشان در جمعیت رفتهصرفته افزایش می-یافت و تعداد پارامترصهایی با شایستگی کمتر رفتهصرفته کاهش میصیافت و بهاینترتیب جمعیت اولیه بهبود میصیافت .درنهایت نتیجه چنین شد که ربات با جرمی برابر(kg) ۵ ، شعاع چرخ برابر ۰.۲ متر، نصف فاصله بین دو چرخ ربات برابر۰.۱۴(m) ، ممان اینرسی بدنه ربات برابر ۰.۵ (kgm۲) و ممان اینرسی هر یک از چرخصها برابر ۰.۵ (kgm۲) ازلحاظ دینامیکی بهینه میصباشد و در زمان کمتری به هدف میصرسد
In this thesis in order to learn how to pursue the goal in less time, the dynamic parameters of the wheeled mobile robot are optimized, using genetic algorithm. The spiking artificial neural network is used to simulate artificial learning in the form of reinforcement, and during the learning process, the communication between the sensor neurons, the motor neurons and the two wheels of the robot will be rewarded and strengthened if the action is done correctly. The Hebbian learning method and spike timing dependent plasticity (STDP) is used for learning method. In order to optimization and also the learning, a fitness function is used to examine these two issues. The target in the learning is strengthening cross connections in the robot namely the connection of right sensor neurons to left motor neurons and the connection of left sensor neurons to right motor neurons (non-homonym connections). So as the considered criterion, the more the amount of this criterion (the difference between the direct and cross connections) is, the better learning will be happen. Also, in order to optimize the dynamic parameters, at first, several dynamic parameters are considered for the robot and the fitness of each parameter is examined by the fitness function. According to the genetic algorithm, the number of parameters learned by the robot for reaching the goal in less time with using them are increased in the population and the number of parameters with less fitness are decreased and thus the primary population is improved. The final result is that the robot with the mass of 5 (Kg), half of the distance between the two wheels of the robot of 0.14 (m), the moment of inertia of the robots body of 0.5 (Kgm2) and the moment of inertia of each wheel of the robot of 0.5 (Kgm2) is dynamically optimized and so and the robot with that dynamic parameters could learn to reach the goal in less time
Optimization of dynamic parameters of mobile robot for learning of target tracking in less time