تجزیه و تحلیل مقایسه ای ترانسکریپتوم بافت چربی در دو نوع از نژادهای دنبه دار و بدون دنبه ایرانی با استفاده از تکنیک RNA-seq
ثنا فرهادی
کشاورزی
۱۳۹۹
۱۸۴ص
سی دی
دکتری
علوم دامی گرایش ژنتیک و اصلاح نژاد دام
۱۳۹۹/۱۱/۲۸
چکیده:چربی دنبه بر کیفیت لاشه تأثیر می¬گذارد و میزان آن در بین نژادهای مختلف گوسفند متفاوت است. نژاد قزل (دنبه¬دار) و نژاد زل (دم دار) دو نژاد ایرانی با الگوی متفاوت برای ذخیره¬سازی چربی هستند. هدف از مطالعه حاضر بررسی بیان ژن¬های مرتبط با متابولیسم چربی در بافت دنبه به منظور درک بهتر مکانیسم مولکولی ذخیره چربی در نژادهای دنبه¬دار و دم دار است. مطالعه¬ی حاضر در سه بخش صورت گرفت. بخش اول مقایسه¬ی ترانسکریپتوم بافت چربی دنبه در دو نژاد دنبه¬دار قزل و دم دار زل انجام شد در بخش دوم مقایسه¬ی بافت چربی زیر جلدی و بافت دنبه و تفاوت آنها در دو نژاد مورد بررسی قرار گرفت و در بخش سوم متاآنالیز داده¬های حاصل از مطالعه¬ی حاضر با داده¬های سه مطالعه¬ی دیگر انجام شد. در بخش اول که قسمت اصلی تحقیق حاضر بود از 8 بره نر 6 ماهه استفاده شد. نتایج تعیین ¬توالی با استفاده از تکنیک توالی¬یابی RNA و انجام روش¬های بیوانفورماتیکی ژن¬های دارای تفاوت بیان (DEGs) در دو نژاد شناسایی شد پس از آن هستی شناسی (GO)، تجزیه و تحلیل غنی¬سازی مسیرهای متابولیکی (KEGG)، طبقه¬بندی ساختاری پروتئین¬ها و تجزیه و تحلیل شبکه¬ها و ماژول¬های ژنی (PPI) مورد بررسی قرار گرفت. همچنین در بخش دوم مطالعه همه مراحل ذکر شده برای شناسایی ژن¬های دارای تفاوت بیان برای بافت چربی زیر جلدی و دنبه نیز طی شد و در بخش سوم از مطالعه¬ی حاضر با توجه به اینکه تمام ژن¬های عملکردی در رسوب چربی به طور جامع شناسایی نشده¬اند لذا با استفاده از روش متاآنالیز داده¬های خام سه مطالعه مرتبط با تحقیق حاضر که مبتنی بر روشRNA-Seq بودند دانلود و آنالیز شدند تا با توجه به تعمیم¬پذیری و قدرت آماری روش متآنالیز نتایج حاصل از تجزیه و تحلیل مطالعات منفرد را افزایش دهیم. سپس جهت تایید نتایج متاآنالیز از روش یادگیری ماشین استفاده شد. بنابراین این اولین تجزیه و تحلیل مقایسه¬¬ای از الگوی بیان ژن بافت چربی دنبه در دو نژاد گوسفند دنبه¬دار و دم دار با استفاده از هر دو روش متاآنالیز و یادگیری ماشین است. نتایج حاصل از بررسی تفاوت بیان در بخش اول مطالعه نشان داد که برخی از-DEG ها، مانندLIPG ، SAA1، SOCS3، HIF-1α و خصوصاً IL-6 ارتباط تنگاتنگی با متابولیسم لیپیدها داشتند. همچنین طبقه¬بندی ساختاری پروتئین¬ها مشخص کرد کهDEG های بیش بیان عمدتًا به دسته¬ی انتقال¬دهنده¬ها تعلق داشتند که بیشتر آنها متعلق به خانواده های SLC بوده و DEGهای کم بیان در نژاد زل نیز اغلب متعلق به کلاس فاکتورهای رونویسی بودند که نقش مهمی در واکنش لیپولیز دارند. همچنین تجزیه و تحلیل شبکه¬ی ژنی نشان داد که IL-6 ژن¬ مرکزی یا هاب برای شبکه¬ی ترسیم شده توسط ژن¬های افزاینده¬ی بیان است که نقش مهمی در لیپولیز چربی بافت دنبه در نژاد دم دار زل از طریق مسیرهای مختلف مانند "مسیرهای سیگنالینگ TNF " و "سیگنالینگ MAPK " داشت. این ژن همچنین تعامل قوی با سایر¬DEG های افزاینده¬ی بیان داشته و با توجه به نقش مهم این ژن در لیپولیز چربی ممکن است باعث تجزیه سریع سلول¬های چربی شود. نتایج حاصل از بخش دوم مطالعه نشان داد که برخی از DEG های بسیار بیان شده مانندCAV1، ALB و SOCS3از نزدیک با متابولیسم چربی در ارتباط هستند ولی اهمیت ژن SOCS3 در لیپولیز بافت چربی زیرجلدی بیشتر از سایر DEG¬ها بود. نتایج بخش متاآنالیز چهار مجموعه داده از بین 14154 ژن دارای تفاوت بیان 1149 متا ژن را با استفاده از روش فیشر نشان داد. جالب اینجاست که شش متا ژن از جملهCNBD1 ،GRIN2A ،MYOM2 ،SHC3 ، TLR9 و PLCG2 در هیچ یک از مطالعات فردی معنی¬دار نبودند که نشان دهنده¬ی قدرت آماری بالاتر متاآنالیز است. علاوه بر این نتایج یادگیری ماشین نشان داد که متا ژن¬های PDE6B و POSTN ژن¬های قابل¬توجه با وزن بالاتر از 0.8 بودند که وزن بیشتری حتی نسبت به نوع نژاد کسب کردند. به دنبال دو ژن مذکور، متا ژن¬های AADACL2، CCDC153، SLC22A14، GSDMA،PPP1R3C ، CA6،PON3 و SLC47A2 با الگوریتم¬های وزن دهی (AW) بالاتر از 0.7 تأیید شدند که همگی با متابولیسم چربی در ارتباط بودند. جالب اینجاست که روش فیشر استفاده شده در تکنیک متاآنالیز نیز این دو متا ژن را جزء نه ژن مشترک بین تمام مطالعات معرفی کرد. از بین مدل¬های درخت تصمیم (DT) دو مدل یادگیری عمیق با پارامترMaxout و مدل Naive Bayes مدل¬های با کارایی بالا برای تشخیص متا ژن¬های POSTN و PDE6B با بالاترین رتبه بعنوان نشانگرهای زیستی برای متابولیسم چربی (با دقت متوسط 86٪) هستند. بنابراین ترکیبی از رویه¬ی متاآنالیز و رویکرد یادگیری ماشین رمزگشایی ژن¬های اصلی رسوب چربی را افزایش می¬دهد که به نوبه خود به استراتژی پرورش حیوانات در زمینه¬ی بهینه¬سازی اندازه¬ی دنبه در نژادهای دنبه¬دار کمک می¬کند.
Abstract:Tail fat content affects meat quality and varies significantly among different breeds of sheep. Ghezel (fat-tailed) and Zel (thin-tailed) are two important Iranian local sheep breeds with different patterns of fat storage. The current study presents the transcriptome characterization of tail fat using RNA-sequencing in order to get a better comprehension of the molecular mechanism of lipid storage in the two mentioned sheep breeds. The present study was conducted in three parts. The first part was to compare the transcript of tail fat tissue in two breeds fat- and thin-tailed sheep breeds. In the second part, the comparison of subcutaneous fat tissue and tail tissue and their differences between the two breeds were examined. In the third part, meta-analysis of the data from the present study was performed with the data of the other three studies. In the first part, which was the main section of the present study, eight 6-month-old male lambs were used. The results of sequencing were analyzed with bioinformatics methods, including differentially expressed genes (DEGs) identification, functional enrichment analysis, structural classification of proteins, protein–protein interaction (PPI), network and module analyses. Also, in the second part of the study, all the mentioned steps were performed to identify the DEGs for subcutaneous and tail tissue. In the third section of the present study, considering that all functional genes in fat deposition have not been comprehensively identified. Therefore, using the meta-analysis method, the raw data based on the RNA-Seq method of three studies related to the present study were downloaded and analyzed to increase the results of the analysis of individual studies due to the generalizability and statistical power of the meta-analysis method. Then machine learning method was used to confirm the results of meta-analysis. Therefore, this is the first comparative analysis of the expression pattern of tail fat gene in fat-and thin-tailed sheep breeds using meta-analysis and machine learning methods. Some of the DEGs, such as LIPG, SAA1, SOCS3, HIF-1α, and especially IL-6 had a close association with lipid metabolism. The structural classification of proteins showed that major down-regulated DEGs in Zel (thin-tailed) breed were classified under transporter class that most of them belonged to the SLC families. In addition, DEGs under transcription factors class with important role in lipolysis were up-regulated in the Zel (thin-tailed) breed. Also, network analysis revealed that IL-6 was hub gene for up-regulated PPI networks, and this gene seems to play an important role in lipolysis of tail fat in thin-tailed sheep breeds via various pathways such as TNF signaling and MAPK signaling pathways. The results of the second part of the study showed that some of the highly expressed DEGs, such as CAV1, ALB and SOCS3, were closely associated with lipid metabolism. However, SOCS3 gene was more important in subcutaneous adipose tissue lipolysis than other DEGs. The results of the meta-analysis of four data sets revealed that 14154 DEGs in all four individual studies. In addition, 1149 (528 up-regulated and 621 down-regulated) meta-genes were significantly differentially expressed. Interestingly, six meta-genes including CNBD1, GRIN2A, MYOM2, SHC3, TLR9 and PLCG2 were significant in neither of the individual studies, indicating a higher statistical power of meta-analysis. Furthermore, the results of machine learning were revealed that PDE6B and POSTN genes were the substantial genes assigned weight higher than 0.8 that gained more weight than even breed type; followed by AADACL2, CCDC153, SLC22A14, GSDMA, PPP1R3C, CA6, PON3 and SLC47A2 were confirmed by higher than 0.7 by attribute weighting (AW) algorithms which were associated with lipid metabolism. Interestingly, Fisher's method identified the aforementioned meta genes as nine common genes between studies. Among the decision tree (DT) models, two deep learning models with the Maxout parameter and Naive Bayes model were the high-performance models for detecting meta-genes as bio-signature and certified that some of the top-ranked genes (ie PDE6B and POSTN) are biomarkers for fat metabolism (with an average accuracy of 86%). Therefore, the combination of meta-analysis and machine learning approaches may increase the chance of deciphering key genes of fat deposition that, in turn, help the animal breeding strategies to optimize the tail size of fat-tailed breeds.
Comparative transcriptome analysis of adipose tissue in Iranian fat- and thin-tailed sheep breeds using RNA-seq techniques