آنالیز و بررسی بیوانفورماتیکی توالی ژن های کودینگ و غیرکودینگ موثر بر سرطان پستان انسانی
پریسا دهقانزاده
علوم طبیعی
۱۴۰۱
۸۰ص.
سی دی
کارشناسی ارشد
علوم جانوری
۱۴۰۱/۰۸/۰۲
سرطان پستان یکی از سرطان¬های شایع در میان زنان می¬باشد. در ایجاد سرطان پستان هر دو عامل محیطی و ژنتیکی دخالت دارند که از جمله عوامل محیطی می¬توان به جنسیت، رژیم غذایی و ... اشاره کرد. همچنین از عوامل ژنتیکی می توان به RNA های غیرکدکننده بلند (lncRNA) که گروه جدیدی از ژن¬های شناخته شده در ژنوم انسان است و در تنظیم فرایند¬های متنوع زیستی دخالت دارند، اشاره کرد. در سال¬های اخیر مطالعه بر روی lncRNA و نقش آن¬ها در انواع بیماری¬ها و سرطان مورد توجه پژوهشگران قرارگرفته است. شناسایی ژن¬های کدکننده مشترک در میان نمونه¬های مختلف و همچنین تعیین lncRNAاز اهمیت ویژه ای در مطالعه انواع سرطان¬ها از جمله سرطان پستان برخوردار است. بنابراین در این پایان نامه مطالعات در دو فاز مختلف طراحی و انجام شده است. در فاز اول "شناسایی ژن¬های کدکننده" و در فاز دوم "شناسایی lncRNA" مشترک در چهار نمونه از تومورهای پستانی شامل Nonmalignant، Luminal، Basal و Claudin-Low (به ترتیب تومورهای کنترل خوش خیم، بدخیم غیرمهاجم، بدخیم مهاجم و بدخیم فوق مهاجم) که احتمالا در بروز سرطان پستان دخالت دارند مورد مطالعه قرار گرفت. بدین منظور ابتدا داده¬های RNA-seq از پایگاه داده NCBI با کد GSE=48213 گردآوری شد. در ادامه با استفاده از آنالیزها و بررسی¬های بیوانفورماتیکی شامل Hisat2, Stringtie, Cuffdiff ، تعداد 30 ژن بعنوان "ژن-های کدکننده مشترک" بین نمونه¬های مذکورشناسایی و معرفی شد. بررسی¬ها نشان داد که ژن¬های معرفی شده علاوه بر سرطان پستان در انواع سرطان¬های دیگر از جمله معده، تخمدان، مثانه، روده بزرگ، تیروئید و پانکراس دخالت دارند. از میان ژن¬های شناسایی شده دو ژن GYG2 و GRB7 در نمونه¬های Non-malignant و Claudin-low به ترتیب دارای بیان بیشتر و کمتر می¬باشند. این رفتار را می¬توان برای ژن¬های FN1 و ZFP28 کاملا بصورت معکوس در هر دو نمونه های مذکور مشاهده کرد. در فاز دوم مطالعه با استفاده از آنالیزهای بیوانفورماتیکی و نرم افزارهای مختلف تعداد 66 ژن lncRNA نیز کشف شدند که احتمالا بروز سرطان پستان را تنظیم می¬کنند. از میان 66 ژن lncRNA کشف شده تعداد 8 ژن با ضریب همبستگی بالای 80 درصد دارای ارتباط معنی دار با بیان ژن¬های کدکننده مجاور نشان دادند. همچنین با مطالعه و مقایسه تحقیقات قبلی مشخص شد که تعدادی از این ژن¬های کدکننده مجاور مثل EVL، SDC1 و TPST1 علاوه برسرطان پستان در سرطان¬های دیگر نیز ایفای نقش می¬کنند. طبق نتایج به دست آمده می¬توان نتیجه گرفت که مطالعات بیوانفورماتیکی lncRNA ها و ژن¬های کدکننده می¬تواند دریچه جدیدی در زمینه شناسایی ژن¬های احتمالی شروع و پیشرفت سرطان ایجاد کند که ژن¬های معرفی شده کاندیدای مناسبی برای مطالعات آزمایشگاهی و تحقیقاتی در نظر گرفته شود.
Breast cancer is one of the most common cancers among women. Both environmental and genetic factors are involved in the development of breast cancer, which include gender, diet, etc. Also, among the genetic factors, we can mention long non-coding RNAs (lncRNAs), which are a new group of genes known in the human genome and are involved in the regulation of various biological processes. In recent years, the study of lncRNA and their role in all kinds of diseases and cancer has attracted the attention of researchers. Identification of common coding genes among different samples as well as determination of lncRNA is crucial in the study of different types of cancers, including breast cancer. Herein, the studies have been designed and carried out in two different phases. In the first phase "Identification of coding genes" and in the second phase "Identification of common lncRNA" in four samples of breast tumors including Nonmalignant, Luminal, Basal and Claudin-Low (benign, non-invasive malignant, invasive and ultra-invasive malignant tumors, respectively) were studied and analyzed. For this aim, RNA-seq data was first collected from the NCBI database with code GSE=48213. We have used different bioinformatics analyzes methods such as applying Hisat2, Stringtie, Cuffdiff for finding and identification a number of 30 genes as "common coding genes" among the mentioned samples. Investigations showed that the introduced genes, in addition to breast cancer, are involved in other types of cancer such as stomach, ovary, bladder, colon, thyroid and pancreas. Among the identified genes, GYG2 and GRB7 are more and less expressed in non-malignant and claudin-low samples, respectively. This behavior can be observed for FN1 and ZFP28 genes completely in reverse in both mentioned samples. In the second phase of the study, using bioinformatics analyzes and different software, a number of 66 lncRNA genes were discovered, which probably regulate the incidence of breast cancer. Among the discovered 66 lncRNA genes, 8 genes showed a correlation coefficient above 80% with the expression of neighbor coding genes. Also, it was found that some of these neighbor coding genes such as EVL, SDC1 and TPST1 play a role in other cancers in addition to breast cancer. According to the obtained results, it can be concluded that the introduced genes are suitable candidates for additional experimental research studies. Finally, bioinformatic studies of both lncRNAs and coding genes can provide a promising new perspective in identifying putative genes for cancer initiation and progression.
Analyses and investigation of coding and non-coding effective genes controlling human breast cancer