جداسازی سیگنال صحبت بر پایه ICA برای بهبود کیفیت گفتار
نام نخستين پديدآور
/معصومه حسام
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
تبریز:دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر ،گروه مخابرات
مشخصات ظاهری
نام خاص و کميت اثر
۱۲۱ص
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی برق - مخابرات
زمان اعطا مدرک
۱۳۸۹/۰۴/۲۵
کسي که مدرک را اعطا کرده
تبریز:دانشگاه تبریز، دانشکده مهندسی برق و کامپیوتر ،گروه مخابرات
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
جداسازی کور منبع برای مخلوط های کانولوتیو صوتی را می توان بصورت بهینه در حوزه فرکانس انجام داد .مزیت این روش) حوزه فرکانس (در آن است که الگوریتم ICA ساده شده و آن را میصتوان در هر فرکانس بطور جداگانه اجراء کرد .همچنین، هر الگوریتم ICA لحظه ای با مقدار مختلط) ورودی(، همانند Infomax را می توان در این روش بکار بست .اما، انتخاب اندازه گام در الگوریتم Infomax باعث ایجاد یک رقابت بین پایداری و سرعت همگرائی گردد .اگر اندازه گام کوچک انتخاب شود، سرعت همگرایی کاهش می یابد و اگر بزرگ انتخاب شود، ممکن است باعث ناپایداری الگوریتم شود .در بخش نخست این پایان نامه، روشی بر پایه تکنیک PSO برای تعیین اندازه بهینه گام در الگوریتم Infomax پیشنهاد می شود .بخش دوم پایان نامه به مسئله جایگشت در حوزه فرکانس برای جداسازی کور منبع مرتبط می شود .این بدان معنی است که ما باید جابجائی در هر فرکانس را به نحوی انجام دهیم تا هر سیگنال جدا شده در حوزه زمان شامل مولفه های فرکانسی مربوط به خود باشد .به طور کلی دو تکنیک برای حل مسئله جایگشت وجود دارد .یک دسته از روش ها بر پایه تخمین جهت دریافت منابع می باشند .ایراد اصلی این روش ها آن است که جهت دریافت منابع به دقت قابل تخمین نیست .یک دسته دیگر از روش ها از همبستگی بین فرکانسی سیگنال های جداسازی شده استفاده می کنند .در یک روش کلاسیک از ضریب همبستگی دامنه مؤلفه های فرکانسی سیگنال های جداسازی شده برای تعیین میزان وابستگی استفاده می کنند .اخیرا از نسبت توان مؤلفه های فرکانسی سیگنال های جداسازی شده به عنوان معیاری برای تعیین میزان وابستگی استفاده شده که عملکرد بهتری نسبت به معیار دامنه دارد .در این پایان نامه روشی جدید برای حل مسئله جایگشت پیشنهاد می شود که از ماکسیمم کردن همبستگی بین نسبت توان مؤلفه های فرکانسی در هر فرکانس با میانگین نسبت توانص مؤلفه های فرکانسی در فرکانس های قبلی استفاده می شوند .در این روش فرض می کنیم که ضرایب همبستگی نسبت توان مؤلفه های سیگنال های جداسازی شده برای هر دو فرکانس اگر از یک منبع باشند مقدار زیادی است حتی اگر فرکانس ها در مجاورت هم نباشند .با توجه به این ویژگی، محدوده فرکانسی برای تعیین میزان وابستگی، به تمام فرکانس های قبل از آن گسترش می یابد .بنابراین روش پیشنهادی بر پایه اطلاعات محلی نبوده و مسئله انتشار خطا در محاسبه ماتریس های جایگشت رخ نمی دهد
متن يادداشت
Abstract: Blind source separation (BSS) for convolutive mixtures of speech can be efficiently solved in frequency domain. The merit of this approach is that the ICA algorithm becomes simple and can be performed separately at each frequency. Also, any complex-valued instantaneous ICA algorithm such as Infomax can be employed within this approach. However, the choice of step size in Informax results in a competition between stability and speed of convergence. If step size is chosen small, the speed of convergence will be decreased, and if it is taken in the interval of large values, it can result in non-stable behavior of the algorithm. In the first part of this thesis, a particle swarm optimization (PSO)-based technique is proposed to estimate an optimal step size for the Infomax algorithm. The second part of the thesis concerns with the permutation problem in frequency-domain BSS. This means that we need to align the permutation in each frequency bin so that a separated signal in time domain contains frequency components from the same source signal. There are mainly two strategies to solve the permutation problem. The first is based on the direction of arrival (DOA) estimation, in which the positions of original sources are estimated. The main drawback of this strategy, however, is that the source positions can not be estimated accurately. Another strategy employs the dependency of separated signals across bin frequencies. Conventionally, the correlation coefficient of separated signal envelopes are utilized to measure the dependency of bin-wise separated signals. Recently, the power ratios of separated signals have been introduced to measure this dependency clearly. In this thesis, a novel method is proposed, in which bin-wise separated signals are grouped together by maximizing the correlation of power-ratio measure of each bin frequency with the average of its previous bin frequencies. Here, it is assumed that the correlation coefficient of power ratios of bin-wise separated signal is high for each pair of frequencies, even if the frequencies are not close together. Based on this assumption, the frequency range for calculating correlation is extended to all previous frequencies, in which the permutation has been solved. In this way, the proposed method is not based on local information and does not have the drawback that mistakes in permutation computation are propagated at each bin frequency
موضوع (اسم عام یاعبارت اسمی عام)
موضوع مستند نشده
Blind Source Separation
موضوع مستند نشده
Array Signal Processing
موضوع مستند نشده
Convolutive Mixture
موضوع مستند نشده
Room Impulse Responce
موضوع مستند نشده
Independent Component Analysis
موضوع مستند نشده
Permutation Problem
موضوع مستند نشده
DOA
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )