پیش بینی آلاینده های هوای شهر تبریز با استفاده از یادگیری عمیق
محمدامین اسگندر واعظی
عمران
۱۳۹۹
۱۰۰ص.
سی دی
کارشناسی ارشد
عمران گرايش محیط زیست
۱۳۹۹/۱۱/۳۰
کنترل مناسب آلودگی هوا با توجه به این فرض که هوا یک مقوله عمومی است، ضروری است. نگرانی عمومی راجع به آلودگی هوا باعث شده این مسأله بیش از پیش مورد توجه قرار گیرد. شهر تبریز یکی از بزرگترین و پرجمعیت ترین شهرهای ایران است که به دلیل جمعیت زیاد و ترافیک¬های شدید تحت تاثير آلودگی شدید هوا قرار دارد. آلودگی هوای شهر تبریز گاهی از حد استاندارد هم بالاتر می¬رود و در بعضی موارد باعث تعطیلی کامل شهر می¬شود. از طرفی پیش بینی آلودگی هوا برای آگاهی عمومی می¬تواند نقش مهمی در کنترل آلودگی هوا داشته باشد. مدلسازی آلاینده¬های هوا، اغلب از سه دسته داده استفاده می-شود که عبارتند از: الف) داده¬های کیفی آلودگی هوا (شامل خود آلاینده¬ی مورد نظر در گذشته)، ب) داده¬های هواشناسی (شامل دما، باد و رطوبت) و ج) داده¬های منبع آلودگی ترافیکی (شامل تعداد خودرو و تعداد مسافرت روزانه، تعداد صنایع و ...). ایستگاه¬های هواشناسی شهر تبریز در مناطق ۷ گانه¬ی آبرسان، باغشمال، بهداشت، راه آهن، راسته کوچه، حکیم نظامی و کوجووار می¬باشند که داده¬های مورد استفاده در این تحقیق، میانگین داده¬های این ۷ ایستگاه بوده است. در این تحقیق نیز از سری زمانی دما، سرعت باد، رطوبت، داده¬های آلاینده¬ها و داده¬های منبع آلودگی ترافیکی بعنوان ورودی استفاده شد. بجای داده¬های ترافیکی که به صورت دقیق در دسترس نبودند، وارد کردن روز و ساعت به مساله که به خودی خود ساعات آلودهتر و روزهای آلودهتر هفته را مشخص می¬نماید، استفاده شد. به ساعت¬های وارد شده، «شاخص ساعت روزانه» و به روزهای وارد شده، «شاخص روز هفتگی» اطلاق گردیده است. همچنین شاخص دیگری با عنوان «شاخص ماهانه» برای بسته¬بندی (Batch Size) تعیین گردید تا به وسیله¬ی آن، بتوان بسته¬های متنوعی (بسته¬های هفتگی، ماهانه، فصلی و سالانه و هر نوع دیگر روزانه) را تشکیل داد. داده¬های تحقیق برای 5 سال از سال 1394 تا سال 1398 بوده است. در نهایت بسته¬ی ماهانه نسبت به همه¬ی بسته¬های دیگر (هفتگی، فصلی و سالانه) نتایج بهتری ارائه نموده است. دلیل این نتایج برتر، این است که آلاینده¬ها بصورت ماهانه دارای تغییرات اساسی و باثبات هستند که مدل می¬تواند نتایج بهتری بدست آورد در حالیکه در مدلسازی هفتگی، این تغییرات اساسی اتفاق نمی¬افتد و مدل کارایی لازم را ندارد و همچنین در مدلسازی در بازه¬ی زمانی فصلی و سالانه نیز نوسانات زیاد و بدون ثبات است که باعث ایجاد خطا در مدلسازی شده و همین امر باعث می¬شود که کیفیت نتایج مدلسازی کاهش یابد. نتایج بدست آمده از LSTM حدود 25 درصد از نتایج FFNN (شبکه عصبی مصنوعی کلاسیک) بهتر بوده است.
AbstractProper control of air pollution is essential given the assumption that air is a public category. Public concern about air pollution has made this issue even more important. The city of Tabriz is one of the largest and most populous cities in Iran, which is affected by severe air pollution due to its large population and heavy traffic. Air pollution in Tabriz sometimes exceeds the standard and in some cases causes a complete closure of the city. On the other hand, forecasting air pollution for public awareness can play an important role in controlling air pollution. Modeling of air pollutants, three categories of data are often used, which are: a) qualitative data on air pollution (including the pollutant itself in the past), b) meteorological data (including temperature, wind speed and humidity) and c) traffic pollution source data (including number of cars and number of daily trips, number of industries, etc.). The meteorological stations of Tabriz are located in the seven regions of Abersan, Baghshamal, Behdasht, Railway, Raste Koocheh, Hakim Nezami and Kojovar. The data used in this research was the average of the data of these 7 stations. In this study, time series of temperature, wind speed, humidity, pollutant data and traffic pollution source data were used as input. Instead of traffic data that was not accurately available, the use of day and hour was used to identify the most polluted hours and days of the week. The hours entered are referred to as the "Daily Hour Index" and the days entered are referred to as the "Weekly day Index". Also, another index called "Monthly index" was determined for packing (Batch Size) so that it can form various packages (weekly, monthly, seasonal and annual packages and any other type of daily). The research data was for 5 years from 1394 to 1398. Finally, the monthly package has better results than all other packages (weekly, seasonal and annual). The reason for these superior results is that the pollutants have fundamental and stable changes on a monthly basis, which the model can achieve better results, while in weekly modeling, these fundamental changes do not occur and the model does not have the necessary efficiency. Modeling in seasonal and annual time period is also high and unstable fluctuations that cause modeling errors and this causes the quality of modeling results to decrease. The results obtained from LSTM were about 25% better than the results of FFNN (classical artificial neural network).
Prediction of Air Contaminants of Tabriz City using Deep Learning (LSTM)