بهبود کیفیت گفتار بر پایه روشهای زیرفضائی با استفاده از تکنیکهای حذف نویز ادراکی
/ساناز قائمی سردرودی
تبریز : دانشگاه تبریز ، دانشکدة مهندسی برق و کامپیوتر ،گروه مخابرات
۱۴۲ص
چاپی
کارشناسی ارشد
مهندسی برق - مخابرات-سیستم
۱۳۸۹/۱۰/۲۷
تبریز : دانشگاه تبریز ، دانشکدة مهندسی برق و کامپیوتر ،گروه مخابرات
بهبود کیفیت سیگنال گفتار(speech enhancement) ، نقش مهمی در سیستمهای مخابراتی صوتی ایفا میکند .تکنیکهای بهبود کیفیت سیگنال گفتار برای سمعکها و وسایلی که در محیطهای سیار استفاده میشوند، مانند تلفنهای موبایل و Hands free کاربرد زیادی دارند .روشهای زیادی برای کاهش اثر نویز در سیگنالهای صوتی ارائه شده است .از این میان میتوان به روشهای مبتنی بر تفریق طیفی، فیلتر وفقی، فیلتر وینر و تبدیل موجک اشاره نمود .همچنین تکنیکهای متفاوتی جهت کاهش اثر نویز با استفاده از روشهای غیر خطی نیز وجود دارد .در میان روشهای ذکرشده جهت کاهش اثر نویز، میتوان از تکنیک تجزیه به مقادیر منفرد (Singular Value Decomposition; SVD) در راستای بهبود کیفیت سیگنالها از جمله سیگنال گفتار سخن گفت .روشهای بهبود کیفیت گفتار در کنار حذف نویز از سیگنال گفتار باعث ایجاد اغتشاش و اعوجاج میشوند .اعوجاج واغتشاش با اعمال فیلتر نرمکننده طیف سیگنال گفتار بهبود یافته، کاهش مییابد، که این فیلتر از مشخصات سیستم شنوایی انسان کمک میگیرد .در این پایاننامه ابتدا روشهای زیرفضای سیگنال ادراکی موجود را بررسی کرده و سپس الگوریتمهای جدید زیرفضای سیگنال ادراکی به نامهایPCRITQSVD (Perceptual Constrained Rank Independent Truncated Quotient SVD) ، PCMRITQSVD (Perceptual Constrained Modified RITQSVD) وParticle Swarm Optimization) -PSO (PCMRITQSVD- PCMRITQSVDپیشنهاد میشوند .کارایی روشهای زیرفضای سیگنال ادراکی جدید در مقایسه با روشهای سنتی بهبود کیفیت سیگنال گفتار، بهبود داده میشود .معیارهای ارزیابی مختلفی بالا بودن کارایی این روش ها را نسبت به روشهای قبلی نشان میدهند
Voice quality and intelligibility are always important for communication systems. In order to obtain near-transparent speech communications, speech enhancement techniques have been employed to improve the quality and intelligibility of the noise corrupted speech performance.In this thesis we focus on the signal subspace approach (SSA) for speech enhancement. This technique is based on the decomposition of the noisy signal vector space into two orthogonal subspaces called the noise subspace and the signal subspace.In the SSA, enhancement is obtained by removing the noise subspace as a first step. Then the clean speech is recovered in the remaining signal subspace by optimally weighting the signal coefficients in this subspace. The different SSA methods vary according to the weighting scheme used.All processes very often produce some unnatural residual noise in the enhanced speech, the so-called musical noise, due to the inevitable random tone peaks generated in the time-frequency spectrogram. Previous studies have pointed out that this perceivable residual noise can be effectively alleviated by considering the masking effect in human auditory system, i.e., the residual noise will not be perceived if it is under the masking thresholds in human auditory functions.Also, for improving the efficiency of these algorithms, novel perceptually constrained subspace methods such as PCRITQSVD and PCMRITQSVD are proposed. PCMRITQSVD is the modified version of PCRITQSVD. The other proposed method, PCMRITQSVD-PSO, is used for dual-channel speech enhancement. PCMRITQSVD-PSO estimates the noise by Particle Swarm Optimization algorithm instead of Voice Activity Detector procedure