تخصیص منابع در شبکههای دسترسی چندگانه غیر متعامد اینترنت اشیاء باند باریک به کمک یادگیری ماشین
سید مهدی حسینی
برق و کامپیوتر
۱۴۰۱
۸۵ص.
سی دی
کارشناسی ارشد
مهندسی برق مخابرات سیستم
۱۴۰۱/۱۱/۱۹
اینترنت اشیاء باند باریک (NB-IoT) یک فنّاوری بیسیم هست که توسط پروژه مشارکت نسل سوم (3GPP) برای پشتیبانی از ارتباطات از نوع ماشین (MTC) در شبکه¬های سلولی استانداردشده است. NB-IoT ارتباطات انرژی کارآمد با پوشش گسترده در یک پهنای باند باریک برابر 180 کیلوهرتز برای دستگاه¬های ارتباطات از نوع ماشین (MTCD) فراهم می¬آورد. روش دسترسی (NOMA) یک فن مناسب برای MTC در شبکه¬های سلولی نسل آینده است که ارتباطات عظیم و همچنین گذردهی بالا را با به اشتراکگذاری یک زیر کانال بین چندین دستگاه MTCD فراهم می-آورد. دسترسی چندگانه غیرمتعامد دامنه توان (PD-NOMA) فراسو از کدگذاری برهم¬نهی در سمت دستگاه¬¬ها و از الگوریتم لغو تداخل پی¬درپی (SIC) در سمت ایستگاه پایه (eNB) استفاده می-کند. کارایی NOMA به شدت به چگونگی اختصاص زیر کانال و تخصیص توان وابسته هست. از آنجایی که دستگاه¬های MTCD نیاز به عمر باطری طولانی دارند، بیشینه کردن کارایی انرژی (EE) با تخصیص بهینه توان و اختصاص زیر کانال یک مساله اصلی برای بهبود کارایی در شبکه ارتباطات از نوع ماشین عظیم (mMTC) مبتنی بر NOMA است. به دلیل تداخل دستگاه¬ها با بهره کانال پایین¬تر در دیکدکردن سیگنال¬های دستگاه¬ها با بهره کانال بالاتر حل چنین مساله¬ای پیچیده است. ما مساله بیشینه کردن EE را با تخصیص بهینه توان و زیر کانال با در نظر گرفتن الزامات کیفیت سرویس (QoS) و حداکثر توان ارسالی فرموله می-کنیم. این مساله یک مساله چندجمله¬ای غیرقطعی سخت (NP-hard) است. این مساله را به دو زیر مساله تخصیص توان و اختصاص زیر کانال تقسیم می¬کنیم. به دلیل پیچیدگی برای یافتن یک جواب بهینه برای مساله اختصاص زیر کانال، در ابتدا این مساله را به شکل یک فرایند تصمیم مارکوف (MDP) قطعی مدل می¬کنیم. از آنجایی که روش¬های یادگیری تقویتی برای حل مساله MDP بسیار مناسب هستند، در ابتدا از یک الگوریتم یادگیری تقویتی به نام یادگیری Q عمیق (DQN) برای نگاشت دستگاه¬ها به زیرکانال-ها استفاده می¬کنیم. نگاشت دستگاه¬ها به زیرکانال¬ها به صورت متوالی انجام می¬شود و تا نگاشت آخرین دستگاه ادامه می¬یابد. با افزایش تعداد دستگاه¬ها روش DQN نمی¬تواند عملکرد مناسبی داشته باشد، بنابراین ما از یک روش یادگیری تقویتی دیگر نیز به نام MUZERO برای اختصاص زیرکانال¬ها به دستگاه¬ها استفاده می¬کنیم. این روش یک روش یادگیری تقویتی مبتنی بر مدل است که توسط “deepmind” برای حل مسائل پیچیده MDP توسعه داده شده است. بعد از اختصاص زیرکانال¬ها به دستگاه¬ها، از یک روش تخصیص بهینه توان برای بیشینه¬کردن EE در هر زیر کانال استفاده می¬کنیم. نتایج بدست آمده نشان می¬دهد که روش MUZERO عملکرد بهتری نسبت به روش DQN در اختصاص زیرکانال¬ها دارد.
دNarrowband Internet of Things (NB-IoT) is a wireless technology that has been standardized by the Third Generation Partnership Project (3GPP) to support machine type communication (MTC) in cellular networks. NB-IoT provides energy-efficient communications with wide coverage in a narrow bandwidth of 180 kHz for machine-type communication devices (MTCD). The non-orthogonal multiple access scheme (NOMA) is a suitable technique for MTC in next-generation cellular networks, which provides massive communications as well as high throughput by sharing a subchannel between multiple MTCD devices. Power domain non-orthogonal multiple access (PD-NOMA) uses superposition coding on the device side and sequential interference cancellation (SIC) algorithm on the base station (eNB) side. The efficiency of NOMA is profoundly dependent on the subchannel allocation and power allocation. Since MTCD devices require long battery life, maximizing energy efficiency (EE) with optimal power allocation and subchannel allocation is a major issue to improve performance in NOMA-based massive machine type communication (mMTC) network. Due to the interference of devices with lower channel gain in decoding the signals of devices with higher channel gain, solving such a problem is complicated. We formulate the EE maximization problem with optimal power and subchannel allocation considering the requirements of quality of service (QoS) and maximum transmitted power. This problem is an non-deterministic polynomial time problem (NP-hard). We divide this problem into two sub-problems: power allocation and sub-channel allocation. Due to the complexity of finding an optimal solution for the subchannel assignment problem, we first model this problem in the form of a deterministic Markov Decision Process (MDP). Since reinforcement learning methods are very suitable for solving the MDP problem, we first use a reinforcement learning algorithm called deep Q learning (DQN) to map devices to subchannels. Devices are mapped to subchannels sequentially and continue until the last device is mapped. With the increase in the number of devices, the DQN method cannot perform properly, so we use another reinforcement learning method called MUZERO to assign subchannels to the devices. This method is a model-based reinforcement learning method developed by "deepmind" to solve complex MDP problems. After assigning subchannels to devices, we use an optimal power allocation method to maximize EE in each subchannel. The obtained results show that the MUZERO method has a better performance than the DQN method in allocating subchannels.
NOMA-aided Narrowband Internet of Things (NB-IoT) Resource Allocation using Machine Learning