یادگیری تقویتی چندعاملی براساس به اشتراکگذاری وزندار تجارب بهصورت تقاضامحور
عنوان اصلي به زبان ديگر
Multi-Agent Reinforcement Learning Based on On-Demand Weighted Experience Sharing
نام نخستين پديدآور
/رویا قاسمزاده
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: مهندسی برق و کامپیوتر
تاریخ نشرو بخش و غیره
، ۱۳۹۷
نام توليد کننده
، افشار
مشخصات ظاهری
نام خاص و کميت اثر
۶۸ص
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی - الکترونیکی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
ارشد
نظم درجات
مهندسی کامپیوتر گرایش هوش مصنوعی
زمان اعطا مدرک
۱۳۹۷/۰۶/۲۰
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
.Multi-agent systems are distributed systems of independent actors called agents. These systems are able to solve problems that single-agent systems are not capable of. Multi-agent reinforcement learning enables multi-agent systems to learn how to act in a complex environment without prior knowledge. One of the problems in multi-agent reinforcement learning systems is the possibility of improving learning process through agent's interactions. Sharing instantaneous information, sharing episodes and sharing learned policies are some methods of interactions among agents. In this thesis we propose a method for sharing learned policies in simultaneously learning agents that use reinforcement learning, more specifically Q-learning. Whenever an agent wants to choose an action, in case of not having enough experience, asks other agents to share their Q-values in that state. other agents in case of having more experience compared to requesting agent, send a list of Q-values of all possible actions in that state along with their confidence of that values to requesting agent. The requesting agent computes the weighted average of received values and updates its Q-table. Then chooses an action based on its action selection policy
عنوان اصلی به زبان دیگر
عنوان اصلي به زبان ديگر
Multi-Agent Reinforcement Learning Based on On-Demand Weighted Experience Sharing
موضوع (اسم عام یاعبارت اسمی عام)
موضوع مستند نشده
spets rewef ni edosipe hcae evlos nac ,egareva no ,dohtem desoporp ,sedosipe gninrael gniruD .retsaf hcum etats taht sehcaer dohtem desoporp tub ecnamrofrep ralimis ot egrevnoc yllanif smhtirogla htoB .gninrael etarelecca dna ecneirepxe s'rehto hcae esu nac stnega edosipe gninael emos retfa tub ,gninrael tnemecrofnier tnega-elgnis ot ralimis skrow dohtem desoporp ruo sedosipe gninrael reilrae ni taht wohs stluser latnemirepxE
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )