موازی سازی حلقه های تودرتوی ترتیبی چند بعدی در سامانه های توزیع شده
نام نخستين پديدآور
/ابراهیم زارع زفره
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: علوم ریاضی
تاریخ نشرو بخش و غیره
، ۱۳۹۵
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
علوم کامپیوتر
زمان اعطا مدرک
۱۳۹۵/۱۱/۱۲
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
باپیشرفت علم، مسائل پیچیده ای در حوزه های علوم و مهندس از جمله هواشناس، پردازش تصویر/سینال، تحقیقات دارویی و غیره مطرح م شود که نیازمند پردازش سریع حجم زیادی از محاسبات روی داده های فراوان هستند .در این کاربردهای علم، حلقه ها مهمترین بخش برنامه و بزرگترین منبع موازی سازی است به طوری که بیشترین زمان اجرای کل برنامه صرف اجرای حلقه ها م شود .بنابراین اجرای برنامه های کاربردی شامل حلقه های تودرتو در ی زمان معقول و برآورده ساختن نیازمندهای روبه افزون آن، اغلب مستلزم استفاده از منابع محاسبات با کارآیی بالا و روش های موازی سازی و بهینه سازی حلقه است .سامانه های محاسبات توزیع شده ی جایزین مناسب و ارزان تر برای کامپیوترهای موازی در مقایسه با ابررایانه ها م باشد .هدف از این رساله، موازی سازی حلقه های تودرتوی ترتیبی چند بعدی در سامانه های توزیع شده به منظور تسریع زمان اجرا است .برای این منظور، سه راه کار برای موازی سازی حلقه های تودرتوی ترتیبی در سامانه های توزیع شده ارائه گردید .در این سه راه کار، با آگاه از ویژگ های سخت افزاری سامانه ی توزیع شده، ابتدا توان محاسبات گره های پردازش محاسبه شده است .سپس فضای تکرار حلقه ی تودرتو و فضای داده به کاش های هم شل و با اندازه های متفاوت براساس وابستگ های داده ای و توان محاسبات گره ها افراز گردیده است .در ادامه مدل نظری برای برآورد زمان اجرا با در نظر گرفتن وابستگ های بین کاش ها، جریان اجرای موازی کاش ها، هزینه محاسبات کاش و هزینه ارتباطات کاش ارائه شده است .در نهایت، بهترین اندازه کاش تعیین گردیده به طوری که محلیت داده بهبود یافته، ارتباطات کاهش پیدا کرده و تعادل بار بین گره ها فراهم شده و در نتیجه، زمان اجرای موازی کمینه گردیده است .راه کارهای پیشنهادی از طریق آزمایش های گسترده ای در چندین سامانه ی توزیع شده ی همن و ناهمن مورد ارزیابی قرار گرفته است .نتایج حاصل از آزمایش ها، تسریع زمان اجرای راه کارهای پیشنهادی را به خوبی نشان م دهد
متن يادداشت
With the development of science and technology, complex problems raised in science and engineering fields including meteorology, image processing, signal processing, pharmaceutical research, etc. These problems require to perform fast processing of large volumes of computation on data. Loops are important part and largest source of parallelism in scientific applications and are typically the most time-consuming part of these applications. Therefore, running applications including nested loops in a time-efficient manner and meet the ever increasing needs of scientific applications oen require the use of high performance computing resources along with parallelism and loop optimization techniques. Distributed computing systems is a viable alternative and cheaper for parallel computers compared to supercomputers. The aim of this thesis is the parallelization of multi-dimensional serial nested loops in distributed systems to accelerate execution time. To do so, three approaches are proposed for parallelizing of nested loops with/without dependence on distributed systems. In these approaches, the computational power of processing nodes are estimated with awareness of the hardware specifications of distributed systems. Then, the iteration space of the nested loop and data space are partitioned into tiles of the same shape but different sizes according to the data dependencies and computational power of processing nodes. Following, by taking into account the dependencies between the tiles, the parallel execution flow of tiles and the computation communication cost of tile, a theoretical model was developed to estimate the parallel execution time. Finally, the optimal tile size is determined so that it increases the data locality, decreases communication between processing nodes and improves load balancing, and as a results on reducing the parallel execution time. The proposed approaches have been evaluated through extensive testings on multiple homogeneous and heterogeneous distributed systems. Experimental results demonstrate the speedup of execution time of our proposed approaches
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )