پنهان سازی اطلاعات درون سیگنال صحبت با استفاده از نمایش زمان- فرکانس
First Statement of Responsibility
/نادر طالاری
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
تبریز: دانشگاه تبریز ،دانشکده مهندسی برق و کامپیوتر
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۱۰۲ص
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی برق - مخابرات سیستم
Date of degree
۱۳۸۹/۱۱/۲۵
Body granting the degree
تبریز: دانشگاه تبریز ،دانشکده مهندسی برق و کامپیوتر
SUMMARY OR ABSTRACT
Text of Note
پیشرفتهای اخیر در اینترنت و تکنولوژی محصولات چند رسانهای دیجیتال، این امکان را داده است که سیگنالهای دیجیتالی) صدا، تصویر و ویدئو (به آسانی به مناطق مختلف، توزیع و انتقال یابند .این سهولت در انتقال، اجازه میدهد که کپیهای غیرمجاز از محصولات چند رسانهای، توزیع و بخش شوند .به همین علت حفاظت از حق کپی محصولات دیجیتالی به یک بحث مهم در جهان تبدیل شده است .دیجیتال واترمارکینگ توجه بسیار زیادی را برای حل این مشکل، به خود اختصاص داده است .واترمارکینگ صدا، پروسهای است که درآن اطلاعاتی، در داخل سیگنال صوت پنهان میشود .این اطلاعات پنهان شده برای کاربردهای مختلفی، از سیگنال صحبت استخراج میشوند .چند نمونه ازاین کاربردها شامل :حفاظت از حق کپی، تصدیق، اثرانگشت و نظارت بر پخش دادهها میباشند .به طور کلی یک سیستم واترمارک صدا، باید نیازهای زیر را برآورده کند:۱- شفافیت :شفافیت بدین معنا است که کیفیت سیگنال صحبت، بعد از اضافه کردن اطلاعات واترمارک در سیگنال، به مانند حالت اولیه باقی بماند و یا اطلاعات اضافه شده در سیگنال میزبان، غیرقابل شنیدن باشد .برطبق پیشنهاد فدراسیون بینالمللی صنعت گرامافون (IFPI) برای آنکه شفافیت برقرار باشد، نسبت سیگنال به نویز (SNR) سیگنال واترمارک شده، باید بیش از dB۲۰ باشد.۲- مقاوم بودن :مقاوم بودن بدین معنا است که بتوانیم اطلاعات واترمارک را، بعد از انجام پردازشهایی مانند اضافه کردن نویز و فیلترینگ و ... بر روی سیگنال واترمارک شده، استخراج کرد. ۳- ظرفیت :ظرفیت، مقدار اطلاعاتی است که میتوان در سیگنال میزبان پنهان کرد بدون آنکه شفافیت از بین رود .برای سیگنال صحبت ظرفیت به تعداد اطلاعات واترمارکی گفته میشود که در واحد زمان سیگنال صحبت قرار میگیرد و با بیت بر ثانیه (bps) اندازهگیری میشود .بین این سه نیاز مصامحه وجود دارد، به عنوان مثال افزایش ظرفیت، باعث کاهش شفافیت و کاهش مقاوم بودن، در برابر پردازشها میشود .در این پایان نامه روشی برای واترمارکینگ صحبت بر اساس یافتن بهترین پایه در تبدیل ویولت بستهای ارائه شده است که ضرایب تبدیل کسینوسی گسسته سیگنال واترمارک، در میان ضرایب بهترین پایهی تبدیل ویولت بستهای سیگنال صحبت قرار گرفته میشود .به منظور یافتن بهترین پایه در تبدیل ویولت بستهای سیگنال میزبان، از مقایسه ضرایب تخمین چند جملهای خطی تبدیل ویولت بستهای سیگنال میزبان و ضرایب تخمین چند جملهای خطی تبدیل کسینوسی گسسته سیگنال واترمارک، استفاده شده است .این روش در عین داشتن ظرفیت نسبتا بالا از مقاومت بسیار بالا و شفافیت قابل قبولی برخوردار است .برای استخراج اطلاعات واترمارک به سیگنال اصلی صحبت نیازی نیست
Text of Note
Recent advances in Internet and digital multimedia technology have allowed transmission and distribution of digital multimedia (audio, image and video) easily and efficiently to distant places. However, this convenience allows unauthorized copying and distribution of multimedia data. Copyright protection of digital data has become an important issue. Digital watermarking technology has received great deal of attention to solve this problem. Digital watermarking is a process of embedding watermark data into the audio signal. This embedded data can later be detected or extracted from the audio signal for various applications. There are several applications of audio watermarking including copyright protection, copy protection, content authentication, fingerprinting and broadcast monitoring. In general, an effective audio watermarking scheme must satisfy the following basic requirements: (i) Imperceptibility: The quality of the audio should be retained after adding the watermark. Imperceptibility can be evaluated using both objective and subjective measures. According to IFPI (International Federation of the Phonographic Industry) recommendations, A watermarked audio signal should maintain more than 20 dB SNR. (ii) Security: Watermarked signals should not reveal any clues about the watermarks in them. Also, the security of the watermarking procedure must depend on secret keys, but not on the secrecy of the watermarking algorithm. (iii) Robustness: Ability to extract a watermark from a watermarked audio signal after various signal processing attacks. (iv) Payload: The amount of data that can be embedded into the host audio signal without losing imperceptibility. For audio signals, data payload refers to the number of watermark data bits that may be reliably embedded within a host signal per unit of time, usually measured using bits per second (bps). There should be more than 20 bps data payload.In this thesis a method for speech watermarking which is based on best basis in wavelet packet proposed. DCT coefficients of watermark signal will be replaced by best basis coefficients of wavelet packet of speech signal. In order to figure out best basis in wavelet packet of host signal, we will use comparison between coefficient of the nth order polynomial that best fits the coefficients of wavelet packet of host signal in the least square sense and coefficients of the nth order polynomial that best fits the coefficients of DCT of watermark signal in the least square sense. Although this method has a relatively high capacity, it has very high robustness and acceptable transparency. For extracting information of watermarking, there is no requirement for host signal