شناسایی gene-signature در دادههای توالییابی ریبونوکلوئیک اسید بیماری اماس با استفاده از الگوریتمهای خوشهبندی
[طرحهای تحقیقاتی و پروژهها]
اکبر بیگلریان
عنایتالله بخشی، کلثوم اینانلو، طیبه کنارنگی
علوم توان بخشی و سلامت اجتماعیUniversity of Social Welfare and Rehabilitation
۱۴۰۰
پیوست
مالتیپل اسکلروزیس یا اماس یک بیماری عصبی فلج کننده مغز و نخاع است. در بیماری اماس سیستم ایمنی بدن به غلاف محافظ (میلین) بافت عصبی حمله کرده و موجب اختلال در ارتباط بین مغز و دیگر مناطق بدن میشود؛ در نهایت این بیماری منجر به تخریب موقت ویا آسیب دائمی به اعصاب میشود. تاکنون درمان قطعی برای این بیماری پیدا نشده است. توالییابی RNA تکنولوژی است که با بهرهگیری از توالییابی نسل بعدی برای بهدست آوردن تصویری کلی از حضور و مقدار ریبونوکلوئیک اسید از ژنوم در یک بازه زمانی خاص استفاده میکند. روشهای بسیار متعددی برای تحلیل اینگونه دادهها مورد استفاده قرار میگیرند، اما یکی از مهمترین و پرکاربردترین روشهای تحلیل دادهها که در زمره روشهای اکتشافی است استفاده از تحلیل خوشهای است. امضای ژن یک گروه واحد یا ترکیبی از ژنها در یک سلول با الگوی منحصر به فرد بیان ژن است که برای تشخیص بیماریها مانند سرطان، برنامهریزی درمان، تعیین نحوه عملکرد خوب درمان و پیش آگهی استفاده شود. در این مطالعه از الگوریتم بهینهسازی پارتو برای یافتن خوشه امضای ژنی در دادههای اماس استفاده شد. درنهایت نه ژن برای ارزیابی پیشآگهی بیماری اماس در این مطالعه معرفی شد. بیش از ۹۰ درصد ژنهای معرفی شده بهعنوان امضای ژنی از مهمترین ژنهای درگیر در بیماری اماس میباشند که تنها با بررسی این ژنها میتوان فرد مبتلا به اماس را در مراحل اولیه بیماری تشخیص داد. همچنین بررسی عملکرد این ژنها میتواند منجر به تولید دارویی مفید برای درمان اماس شود.کلمات کلیدی: خوشهبندی، بهینهسازی، الگوریتم بهینهسازی پارتو، بیان ژن، اماس، RNA-seq
Multiple sclerosis, or MS, is a neurological disease that paralyzes the brain and spinal cord. In MS, the immune system attacks the protective sheath (myelin) of nerve tissue, disrupting communication between the brain and other parts of the body; Eventually the disease leads to temporary damage or permanent damage to the nerves. No definitive cure for this disease has been found so far. RNA sequencing is a technology that uses next-generation sequencing to obtain an overview of the presence and amount of ribonucleic acid in the genome over a period of time. There are many methods used to analyze such data, but one of the most important and widely used methods of data analysis, which is one of the exploratory methods, is the use of cluster analysis. Gene signature is a single group or combination of genes in a cell with a unique pattern of gene expression that can be used to diagnose diseases such as cancer, plan treatment, determine how well treatment works, and prognosis. In this study, Pareto optimization algorithm was used to find gene signature clusters in MS data. Finally, nine genes were introduced in this study to evaluate the prognosis of MS. More than 90% of the genes introduced as gene signatures are among the most important genes involved in MS, and only by examining these genes can a person with MS be diagnosed in the early stages of the disease. Also, the study of the function of these genes can lead to the production of a drug useful in the treatment of MSKeywords: Clustering, Optimization, Pareto Optimization Algorithm, Gene Expression, Ms, RNA-seq
Identification of Gene Signature in RNA-Seq MS Data Using Clustering Algorithms