ترافیک شهری در حال حاضر یک مشکل مهم برای اکثر شهرهای متوسط و بزرگ است .برای کاهش مشکلات ناشی از تراکم ترافیک، دستگاههای حملونقل هوشمند (ITS) در سراسر جهان گسترش مییابند .تشخیص خودکار حادثه، خطوط خیابان، سرعت وسایل نقلیه و ...ازجمله کاربردهای نظارت هوشمند هستند .برای انجام عملیات نظارتی روشهای مختلفی ازجمله شناسایی لبهها، تفاضل پسزمینه، شار نوری، آستانهسازی، شبکههای عصبی و ...وجود دارد .همچنین یادگیری ماشین، بهویژه یادگیری عمیق پیشرفتهای قابلتوجهی در سالهای اخیر داشته است .مدلهای مختلفی برای یادگیری عمیق وجود دارد .معمولترین آنها خود رمزنگار پشتهای، شبکه باور عمیق، شبکههای کانولوشنی و شبکههای بازگشتی .شبکههای عصبی مبتنی بر منطقه که در سالهای اخیر توجه بیشتری به خود جلب کردهاند، از شبکههای کانولوشنی برای تشخیص اشیا استفاده میکنند .در این پایاننامه هدف تشخیص خودرو پارک شده در منطقه ممنوعه است .توقف خودرو بهصورت پارک ممنوع نوعی ناهنجاری محسوب میشود، زیرا که موجب افزایش تراکم ترافیک میگردد .همچنین معماریهایی مانندFCN- R،CNN - Faster Rو SSD با شبکههای استخراجکننده ویژگی متفاوتی، با یکدیگر مورد مقایسه قرار گرفتند .معیار مقایسه این شبکهها دقت تشخیص، سرعت و میزان حافظه موردنیاز بود .معماریCNN - FasterRبه دلیل داشتن دقت، سرعت و میزان حافظه قابلقبول، انتخاب شد .بنابراین تصاویری از خودروها و تابلوهای توقف ممنوع در جهات و شرایط روشنایی مختلف در سطح شهر تهیه شد .پس از انجام عملیات پیشپردازشی و تهیه جعبههای حقیقی اشیا، تصاویر به شبکه تغذیه میشوند .شبکه روی هر دو سختافزار CPU با مشخصات Intel CORE i۷ به مدت سه روز و GPU با مشخصات GEFORCE GTX ۹۶۰M به مدت شش ساعت آموزش داده شد .با مقایسه این دو سختافزار با یکدیگر، سختافزار GPU انتخاب شد و با دقت ۲۱/۹۷ درصد خودروهای پارک شده تشخیص داده شدند .همچنین با استفاده از روش تفاضل پسزمینه، خودروهای ساکن و پسزمینه تشخیص داده میشود .درنهایت باهدف به اینکه در آینده شبکه کانولوشنی به دلیل انجام محاسبات سنگین روی سختافزار FPGA پیادهسازی شود، نمونهای از کانولوشن دوبعدی تصویر در سختافزار FPGA پیادهسازی شد
Abstract: Urban traffic is a major problem in medium and large cities. Intelligent transport devices (ITS) are expanding around the world to reduce traffic congestion problems. Accident detection, street lines, vehicle speeds, and etc., including intelligent surveillance applications. Various methods, such as edge detection, background difference, optical flow, thresholding, neural networks, and etc. are available for surveillance control. Machine learning, especially deep learning, has made remarkable progress in recent years. There are several models for deep learning. The most common ones are the stacked autoencoders, the deep belief networks, the convolution network, and the recurrent networks that other models combine with these architectures. The purpose of this thesis is to detect a parked vehicle in a prohibited area. That stopping a car as a prohibited park is an anomaly because it increases traffic congestion. For this purpose, architectures such as R-FCN, Faster R-CNN and SSD were compared with each other with different attribute extraction networks. The comparison criterion for these networks was the accuracy of detection, speed and memory requirements. The Faster R-CNN architecture was chosen for its precision, speed and memory. For this purpose, images of vehicles and prohibited stop signs were made in different directions and lighting conditions in the city. The images are fed to the network after preprocessing operations and the production of ground-truth bounding boxes. The network was trained on both CPU hardware with the Intel CORE i7 for three days and the GPU with GEFORCE GTX 960M specs for six hours. By comparing these two hardware together, GPU hardware was selected and accurately detected 97/21 of the parked cars. Also, using the background subtraction method, we identify static and background cars. Eventually, we implemented a two-dimensional convolutional on FPGA hardware with the goal in the future of implementing a convolutional network due to heavy calculations on FPGA hardware.