بهبود عملکرد یادگیری تقویتی در سیستمهای چندعاملی رقابتی به کمک تٲثیر گرفتن از شرایط محیطی
تهران
۰۹ ص.
امین نیکانجام
کارشناسی ارشد
صنعتی خواجه نصیر الدین طوسی
۱۳۹۵
هوش مصنوعی
سیستمهای چندعاملی، به سیستمهای توزیعشدهای اطلاق میشود که دارای تعدادی بازیگر یا عامل مستقل هستند. این عاملها برای رسیدن به یک یا چند هدف مشخص باهم همکاری میکنند یا به رقابت با یکدیگر میپردازند. رایجترین روش استفادهشده در زمینه یادگیری سیستمهای چندعاملی، یادگیری تقویتی است. یکی از چالشهای مهم در یادگیری تقویتی وجود شرایط محیطی گمراهکننده است که میتواند باعث افت کارایی عامل شده و همگرایی آن را تحت تٲثیر قرار دهد. در این پایاننامه ابتدا حالتی را معرفی میکنیم که محیط رقابتی، شرایط مخرب و گمراهکنندهای را روی عامل یادگیر اعمال میکند که موجب افت کارایی عامل میشود. در محیط رقابتی، این شرایط تنها روی عامل مهمان اثر میگذارد و تٲثیری روی عامل رقیب یا میزبان ندارد. شرایط محیطی را با استفاده از شکلدهی پاداش به عامل مهمان اعمال کردیم. سپس روشی را پیشنهاد میکنیم که با استفاده از آن، عامل این شرایط را شناسایی میکند و در ادامه روند یادگیری خود، اثرپذیری از این شرایط را کمتر میکند. این روش بر اساس مدلسازی رفتار عامل میزبان است. نتایج بهدستآمده نشان میدهد که روش پیشنهادی عملکرد عامل را در محیطهایی که شرایط مخرب برای عامل مهمان وجود دارد به نسبت حالت عادی که عامل مهمان از روش پیشنهادی استفاده نمیکند بهبود یافته است.