طبقهبندی دادههای DNA ریزآرایه با استفاده از شبکههای عصبی
General Material Designation
[پایاننامه]
First Statement of Responsibility
/مهسا جروقی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: مهندسی برق
Date of Publication, Distribution, etc.
، ۱۳۹۲
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۹۴ ص
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی - الکترونیکی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی برق
Body granting the degree
صنعتی سهند
SUMMARY OR ABSTRACT
Text of Note
سرطان به عنوان یک بیماری بیولوژی سیستماتیک شناخته شده است .از آنجایی که درمان بیماران مبتلا به سرطان اغلب اثر بخش نیست، دانشمندان معتقدند تشخیص زود هنگام سرطان در درمان آن بسیار موثر خواهد بود .استفاده از تکنیکهای سنتی شناسایی بافتهای سرطان مانند تصویربرداری X-ray اغلب کار دشواری است .در ده سال اخیر با ظهور و گسترش فناوری ریزآرایه و پروفایل بیان ژن محققان، علوم کامپیوتری مختلفی را برای شناسایی زود هنگام سرطان به کار بستهاند .ویژگی اصلی دادههای ریزآرایه تعداد زیاد ژنها(ویژگیها) و تعداد کم نمونههاست .از آنجایی که بسیاری از روشهای بازشناسی الگو برای مقابله با تعداد زیاد ویژگیها طراحی نشده است، لذا ترکیب آنها با روشهای انتخاب ویژگی در مسائل با بعد بالا امری مهم و ضروری است .بنابراین دادههای ریزآرایه باید قبل از طبقهبندی از طریق روشهای انتخاب ژن پیشپردازش و ژنهای فاقد اطلاعات آنها دور ریخته شوند. مراحل کلی انتخاب ژن و طبقهبندی دادههای ریزآرایه را میتوان در ۴ مرحله، پیش پردازش دادهها، پیش انتخاب ژنهای مهم و حذف ژنهای نامربوط، انتخاب زیر مجموعه ژن حاوی اطلاعات و طبقهبندی دادههای ریزآرایه بیان کرد .به دلیل تغییرات زیاد دادههای ریزآرایه، نیاز است پیش از اعمال الگوریتمهای انتخاب ویژگی و طبقهبندی داده مورد استفاده پیشپردازش شود .از آنجاییکه دادههای ریزآرایه دارای هزاران ژن هستند و همه ژنها در بروز سرطان نقشی ندارند و ژنهای اضافی محسوب میشوند، لذا جستجو برای یافتن زیر مجموعه ژنهای مطلوب در کل فضای ویژگی امری زمانبر و دارای محاسبات فشرده و سنگین است .به همین دلیل قبل از جستجو برای انتخاب ویژگیهای مطلوب، از روشهای پیش انتخاب ویژگی استفاده میشود . در این پژوهش از پنج پایگاه داده ریزآرایه استفاده شده است .این پایگاههای داده عبارتند از سرطان خون، پروستات، ریه، روده بزرگ و سرطان سینه .در این پژوهش برای انتخاب زیر مجموعه ژنهای حاوی اطلاعات از دو الگوریتم BPSO و الگوریتم SFFS ، و همچنین برای طبقهبندی دادهها از ۴ طبقهبند PNN ،BLDA ،MLP ، KNN استفاده شده است .نتایج حاصل از ترکیب دو الگوریتم انتخاب ژن و ۴ طبقهبند فوق نشان داده است که ترکیب ۴ طبقهبند مطرح شده و الگوریتم انتخاب ژن BPSO در اغلب دادهها دارای دقت بیشتری از ترکیب طبقهبندها با الگوریتم SFFS است .همچنین ترکیب طبقهبندها با الگوریتم BPSO زمان محاسبات کمتری از ترکیب با الگوریتم SFFS دارد .با مقایسه میانگین دقت طبقهبندها بر روی کل دادهها، نشان داده شده است که دقت طبقهبندهای PNN و KNN تقریبا با هم برابر و بیشتر از دقت طبقهبندهای MLP و BLDA است
TOPICAL NAME USED AS SUBJECT
انتخاب ژن
SFFS
BPSO
بیان ژن
فناوری ریزآرایه
PERSONAL NAME - PRIMARY RESPONSIBILITY
جروقی، مهسا
PERSONAL NAME - SECONDARY RESPONSIBILITY
شمسی، موسی، استاد راهنما
صداقی، محمدحسین، استاد راهنما
ابراهیمنژاد، حسین، استاد مشاور
ORIGINATING SOURCE
Country
ایران
Date of Transaction
20230807
LOCATION AND CALL NUMBER
Call Number
برق،۱۰۲۱۲،۱۳۹۲
ELECTRONIC LOCATION AND ACCESS
Host name
یاههداد یدنبهقبط DNA یبصع یاههکبش زا هدافتسا اب هیارآزیر.pdf