پیشبینی نواحی تنظیمی ژنی با استفاده از پردازش سیگنال
General Material Designation
[پایاننامه]
Parallel Title Proper
Prediction of Gene Regulatory Regions Using Signal Processing
First Statement of Responsibility
/فائقه گلابی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: مهندسی پزشکی
Date of Publication, Distribution, etc.
، ۱۳۹۸
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۱۱۲ص.
Other Physical Details
:
GENERAL NOTES
Text of Note
زبان: فارسی
Text of Note
زبان چکیده: فارسی
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی
NOTES PERTAINING TO PHYSICAL DESCRIPTION
Text of Note
مصور، جدول، نمودار
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
دکتری
Discipline of degree
مهندسی پزشکی- بیوالکتریک
Date of degree
۱۳۹۸/۱۰/۰۱
Body granting the degree
صنعتی سهند
SUMMARY OR ABSTRACT
Text of Note
با افزایش سریع حجم دادههای ژنومیک، مطالعه بر روی اجزاء سازنده ژنوم از جمله نواحی تنظیمی ژنی نیازمند ابزار و الگوریتمهای کامپیوتری جدید است .یکی از اجزاء مهم تنظیمی رایبوسویچ است که با اتصال به مولکول هدف خود موجب تغییر ساختار ثانویه در آن ناحیه از RNA شده و در نتیجه عمل تنظیمی موردنظر( مثل توقف عمل نسخهبرداری یا ترجمه) انجام میگیرد .هدف اصلی در این رساله، طراحی یک الگوریتم مناسب برای شناسایی و طبقهبندی نواحی تنظیمی ژنی بهخصوص رایبوسویچها از طریق جستجوی ویژگیهای خاص در نواحی از پیش شناخته شده بوده است .بر این اساس، پس از مقدمهای بر مباحث زیستی، ساختارهای ژنی و برخی مطالعات پیشین در زمینه نواحی تنظیمی ژنی، الگوریتمی برای شناسایی بلوکهای اختصاصی طراحی و معرفی میگردد که میتواند بدون استفاده از روشهای گرامری یا مبتنی بر تطابق، بلوکهای اختصاصی پرتکرار را در خانوادههای رایبوسویچ شناسایی نماید .در ادامه، یک روش پیشنهادی برای استخراج ویژگی با استفاده از موقعیت مکانی بلوکها (BLBFE) بر روی توالیهای رایبوسویچ، برای طبقهبندی رایبوسویچها معرفی شده و عملکرد آن با استفاده از ۵ نوع طبقهبند مختلف مورد بررسی قرار میگیرد .مقادیر مناسب نرخ طبقهبندی صحیح(CCR) ، بههمراه دقت، حساسیت، تشخیص وscore - fبالای طبقهبندیهای انجام گرفته با استفاده از روش پیشنهادیBLBFE ، توانایی و قابلیت الگوریتمهای پیشنهادی مبتنی بر شناسایی بلوکهای اختصاصی و بهرهگیری از موقعیت مکانی این بلوکها بهعنوان ویژگی برای شناسایی و طبقهبندی ۵ خانواده رایبوسویچ بررسی شده را مورد تأیید قرار میدهد .بهمنظور توجیه و اثبات کامل عملکرد الگوریتم طراحی شده برای یافتن بلوکها و روش پیشنهادی استخراج ویژگی، مطالعه در سه شاخه دیگر ادامه مییابد .ابتدا برای اثبات کارآیی دو الگوریتم پیشنهادی در خانوادههای دیگر رایبوسویچ بهغیر از ۵ خانواده مورد بررسی اولیه، هفت خانواده دیگر از رایبوسویچها مورد بررسی قرار میگیرند که در نتیجه، روش استخراج ویژگی BLBFE با میانگین CCR برابر با ۸۷/۸۷ ، عملکرد مناسبی در طبقهبندی رایبوسویچها نشان می دهد .در شاخه دوم مطالعات تکمیلی، عملکرد روش پیشنهادی BLBFE با ۷ روش استخراج ویژگی دیگر مورد مقایسه قرار میگیرد .روش BLBFE با میانگین CCR برابر با ۸۹/۴۵ بهترین عملکرد را در طبقهبندی رایبوسویچها در مقایسه با روشهای دیگر استخراج ویژگی نشان میدهد .در شاخه سوم مطالعات تکمیلی، عملکرد روش استخراج ویژگی پیشنهادی در طبقهبندی اعضای جدید full از خانوادههای رایبوسویچ مورد بررسی قرار میگیرد .در این قسمت نیز روش پیشنهادی BLBFE با میانگین CCR برابر با ۹۰/۸ بهترین عملکرد را برای طبقهبندی دادهها در میان ۸ روش استخراج ویژگی مورد مطالعه نشان میدهد .با در نظر گرفتن تمام مطالعات، میتوان نتیجه گرفت که الگوریتم بلوکیاب طراحی شده میتواند بیشتر بلوکهای اختصاصی مربوط به خانوادههای رایبوسویچ را بدون نیاز به روشهای مبتنی بر تطابق، شناسایی و تعیین نماید .علاوه بر این، بهرهگیری از روش استخراج ویژگی پیشنهادی BLBFE که موقعیت مکانی بلوکهای اختصاصی بر روی توالیها را بهعنوان ویژگی بهکار میبرد، به خودی خود و نیز در مقایسه با روشهای استخراج ویژگی دیگر، عملکرد بهتری در طبقهبندی رایبوسویچها ارائه میدهد .این عملکرد در همراهی با طبقهبند PNN باز هم بهتر میشود .با توجه به کارآیی الگوریتم بلوکیاب و روش استخراج ویژگی پیشنهادی، نتیجهگیری میشود که روش پیشنهادی BLBFE با تکیه بر بلوکهای اختصاصی شناسایی شده با استفاده از الگوریتم بلوکیاب، یک استراتژی امیدوار کننده برای طبقهبندی رایبوسویچها است.
Text of Note
As the volume of genomic data is growing rapidly, studies on genomic components, especially genomic regulatory regions, require new computer tools and algorithms. One of the important regulatory components is the riboswitch, which by binding to its target molecule, the secondary structure in that region of the RNA is altered resulting in the desired regulatory action (such as stopping transcription or translation). The main purpose of this thesis was to design an appropriate algorithm for identifying and classifying gene regulatory regions, especially riboswitches, by searching for specific features in previously known regions. Accordingly, after introducing biological topics, gene structures and some previous studies on gene regulatory regions, an algorithm for identifying specific blocks in the riboswitch families has been designed and introduced that can be used without grammatical or alignment-based methods. In the following, a new strategy for feature extraction based on the location of the detected blocks, called Block Location-Based Feature Extraction; BLBFE, was proposed for the classification of riboswitches and its performance using 5 different classifiers was investigated. The CCR, accuracy, sensitivity, specificity and f-score measures for the classifiers using the proposed BLBFE method, were calculated which approved the performance of the proposed feature extraction method. In order to fully justify the performance of the algorithm designed to find the blocks and the proposed method of block location based feature extraction (BLBFE), the study continued in three other branches. Initially, to test the effectiveness of the two proposed algorithms in other families of riboswitches apart from the initial 5 families, seven other families of riboswitches were examined. It was shown applying the BLBFE feature extraction method resulted in a good performance with an average correct classification rate (CCR) of 87.87 . In the second part of the further studies, the performance of the proposed BLBFE method was compared to seven other methods of feature extraction. The BLBFE method with an average CCR of 89.45 performed the best in the riboswitch classification compared to other methods of feature extraction. In the third branch of the complementary studies, the performance of the proposed feature extraction method was evaluated in the classification of new full members of riboswitch families. In this section, once more, the proposed BLBFE method with average CCR of 90.8 showed the best performance for classification among the 8 studied feature extraction methods. Considering all the results, it can be concluded that the designed block finding algorithm can identify most of the specific blocks related to the riboswitch families without the need for alignment-based methods. In addition, utilizing the proposed BLBFE feature extraction method, which uses the location of detected blocks on the sequences as features, in itself and in comparison to other feature extraction methods, offers a very good performance in riboswitch classification and this performance is further improved when accompanied with the PNN classifier. Given the performance of the block finding algorithm and the proposed feature extraction method, it is concluded that the proposed BLBFE method, relying on family-specific blocks identified by the block finding algorithm, is a promising strategy for the classification of riboswitches.
ba
PARALLEL TITLE PROPER
Parallel Title
Prediction of Gene Regulatory Regions Using Signal Processing
TOPICAL NAME USED AS SUBJECT
نواحی تنظیمی ژنی
پردازش سیگنال
RNAی غیررمزکننده
رایبوسویچ
بلوکهای نوکلئوتیدی
الگوریتم بلوکیاب
استخراج ویژگی بر مبنای موقعیت مکانی بلوکها
طبقهبندی دادهها
UNCONTROLLED SUBJECT TERMS
Subject Term
Gene regulatory regions, signal processing, ncRNA, riboswitch, sequential