تشخیص دستگاهها و آوازهای ایرانی با استفاده از شبکههای عصبی کانولوشنی و یادگیری عمیق در موسیقی سنتی ایران
Recognition of Iranian Dastgh and vz using convolutional neural networks and deep learning in Iranian traditional music
/محمد حاجیدیزجی
: مهندسی برق و کامپیوتر
، ۱۳۹۸
، عباسپور
۹۴ص
چاپی
کارشناسی ارشد
مهندسی کامپیوتر گرایش هوش مصنوعی
۱۳۹۸/۱۱/۱۹
تبریز
موسیقی اصیل ایرانی مجموعه ویژگیهای خاصی دارد که باعث شده است از موسیقیهای دیگر ملل متمایز بشود .مهمترین شاخصه آن وجود چندین دستگاه و آواز است که هر کدام حالات و گامهای مخصوص به خود را دارند .دستهبندی موسیقی براساس سبک، یکی از چالشهای مورد بحث در حوزه بازیابی اطلاعات موسیقی است .در این پژوهش، مجموعهدادهای شامل تمامی دستگاهها و آوازهای ایرانی با استفاده از انواع سازهای ایرانی مانند سنتور، تار، سهتار، کمانچه، عود و غیره به صورت تکنوازی و همنوازی، گردآوری شده است .دو راهکار برای عملیات پیشپردازش) استخراج ویژگی (نمونهها در نظر گرفتیم :اولی به کمک روشهای استخراج ویژگی سنتی مثل امافسیسی و مل اسپکتروگرام و دومی استفاده از سیگنال خام و انجام عملیات قطعهبندی روی آنها .سپس با بهرهگیری از یادگیری عمیق و شبکههای عصبی کانولوشنی یک بعدی و دو بعدی توانستیم دستگاه و آوازهای ایرانی را با حداکثر درستی ممکن با دقت ۰.۸۶ تشخیص دهیم .در خلال این عملیات، چگونگی تاثیر کاهش نرخ داده روی نتیجه به دست آمده مورد ارزیابی قرار گرفت و همچنین نشان دادیم که عملکرد سیگنال خام در نگهداری اطلاعات مفید و یادگیری خودکار ویژگی با استفاده از یادگیری عمیق بهتر از روش استخراج ویژگی است
frequency spectrogram. And seond, the use of raw signal and segment operations on them. Then, using deep learning with 1D and 2D convolutional neural networks, the Iranian Dastgh and vz were identified with as much as possible accuracy of 86 . During this operation, the effect of sample rate reduction on the results was evaluated and it was shown that the raw signal performance in retaining useful information and automatic feature learning by deep learning is better than the feature extraction method.-frequency cepstral coefficient (MFCC) and Mel-Original Iranian music has a unique set of features that makes it distinguished from other nations' music. The most distinctive feature is the presence of several Dastgh and vz, each with its own moods and scales. Classifying music by genre is one of the challenges in the field of music information retrieval (MIR). In the present paper, a dataset containing all Iranian Dastgh and vz has been collected by soloing and accompanying using a variety of Iranian instruments such as Santour, Tar, Settar, Kamanche, Oud, and so on. Two approaches were considered in preprocessing data: First using traditional feature extraction techniques such as Mel
Recognition of Iranian Dastgh and vz using convolutional neural networks and deep learning in Iranian traditional music