ارزیابی معماری ژنومی صفات گسسته با جانهی دادههای ژنومی گوسفند توسط روشهای آستانهای بیزی و یادگیری ماشین
عنوان اصلي به زبان ديگر
Evaluating genomic architecture of discrete traits with sheep genomic data imputation by threshold Bayesian and machine learning methods
نام نخستين پديدآور
/سعادت صادقی
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: کشاورزی
تاریخ نشرو بخش و غیره
، ۱۳۹۶
نام توليد کننده
، میرزائی
مشخصات ظاهری
نام خاص و کميت اثر
۱۱۹ص
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی - الکترونیکی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
دکتری
نظم درجات
علوم دام گرایش اصلاح نژاد دام
زمان اعطا مدرک
۱۳۹۶/۱۱/۱۸
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
گزینش ژنومی یک روش امیدبخش برای کشف رموز ژنتیکی صفات پیچیده گسسته از جمله مقاومت به بیماری بهمنظور بهبود رشد ژنتیکی و صحت پیشبینی ارزشهای اصلاحی ژنومی در اصلاح دام میباشد .بهعلت ناخوانا بودن نسبتی از ژنوتیپها، پیشبینی دقیق صحت پیشبینی ارزشهای اصلاحی ژنومی نیازمند برآورد این نشانگرها از طریق جانهی میصباشد .در نتیجه هدف این تحقیق ۱) برآورد صحت جانهی و عوامل موثر برآن و ۲) ارزیابی صحت پیشبینی ارزشهای اصلاحی ژنومی مدلصهای بیز آستانهای و جنگل تصادفی برای معماری های مختلف ژنتیکی در صفات آستانهای میباشد .در فاز اول، داده های ژنومی از طریق نرم افزار QMSim برای صفات گسسته دودویی با سطوح متفاوت وراثتپذیری (۱/۰ و۳/۰) ، سطوح مختلف) LD کم و زیاد (و تراکمهای متفاوت جایگاهصهای صفات کمی (۸۱ و ۸۱۰) و نشانگر (K۱۰ و K۵۰) به تعداد کروموزم ۲۷ جفت کروموزم شبیهسازی شدند .در فاز دوم، بعد از شبیهسازی جمعیتصها، بطور تصادفی اقدام به حذف ۹۰ نشانگرها نموده و در مرحله بعد از طریق نرم افزار Flmpute اقدام به جانهی و پیشبینی نقاط گم شده و توسعهی این تراشههای از تراکم کم به تراکم بالا نموده و صحت جانهی مورد ارزیابی قرار گرفت .فاز سوم، دادهای اصلی و جانهی شده با استفاده از روشهای آستانهای بیزی (Threshold Bayes A و Bayesian Threshold LASSO) و جنگل تصادفی (Random Forest) از روشصهای یادگیری ماشینی جهت ارزیابی صحت مدلها استفاده شدند .نتایح نشان داد که با افزایش سطح LD و تراکم نشانگری صحت جانهی بهبود میصیابد .در ژنوتیپهای جانهی شده دامنه صحت جانهی در یادگیری ماشینی۵۱۲/۰) - (۱۶۴/۰نسبت به بیزی آستانهای۴۶۹/۰) - A (۲۸۳/۰و لاسو۵۰۴/۰) - (۲۷۲/۰بیشتر بود .استفاده از دادههای جانهی شده در مقایسه با دادههای اصلی، صحت پیشبینی ارزشهای اصلاحی ژنومی را به میزان) /۰۲۷۳ با دامنه۰۳۶/۰) - ۰۲۴/۰کاهش داد .در مقایسه با مدلهای بیز آستانهای، اثر افزایش تراکم نشانگری بر صحت ارزیابی ژنومی در روش یادگیری ماشینی مشهودتر بود .با وجود صحت بالای مدلصهای بیز A و لاسو در سطوح مختلف LD و وراثتپذیری، روش یادگیری ماشینی حساسیت بیشتری به تغییرات این دو عامل داشت .در تراکم نشانگری بالا، افزایش تعداد QTL منجر به بیشترین برآورد صحت پیشبینی ارزشهای اصلاحی ژنومی در روش یادگیری ماشینی شد .بطورکلی صحت ارزیابی ژنومی در مدلصهای بیز آستانهای A و لاسو بیشتر از روش یادگیری ماشینی بود، با این حال نوع معماری صفات گسسته تعیین کنندهی بهترین مدل ارزیابی صحت ژنومی بود
متن يادداشت
Genomic selection is a promising challenge for discovering genetic variants influencing complex traits which are recorded in a discrete for improving resistance to diseases, the genetic gain and prediction accuracy in livestock. Since a proportion of genotypes are generally uncalled, therefore, prediction of genomic accuracy requires imputation of missing genotypes. The objectives of this study were (1) to quantify imputation accuracy and to assess the factors affecting it; and (2) to evaluate the accuracy of threshold Bayes A (TBA), Bayesian threshold LASSO (BTL) and random forest (RF) algorithms to analyze discrete traits. Genomic data were simulated to reflect variations in heritability (h2 = 0.30 and 0.10), number of QTL (QTL=81 and 810), number of SNP (10K and 50K) and linkage disequilibrium (LD=low and high) for 27 chromosomes. For real condition simulating, we randomly masked markers with 90 missing rate for each scenario; afterwards, hidden markers were imputed using FImpute software. The accuracy of imputation was improved with increasing level of LD and markers density. In imputed genotypes, a wide range of accuracy was observed for RF (0.164-0.512) compared to TBA (0.283-0.469) and BTL (0.272-0.504). Comparing to original genotypes, using imputed genotypes decreased the average accuracy of genomic prediction about 0.0273 (range of 0.024 to 0.036). Comparing to Bayesian threshold, using RF was improved rapidly accuracy of genomic prediction with increase in the marker density. Despite the higher accuracy of BTL and TBA at different levels of LD and heritability, the increase in accuracy was greater for RF. The increase in QTL numbers was associated with growth of prediction accuracy for medium-density panel, and this increase was more pronounced for RF. Generally, prediction accuracy for BTL and TBA had more precise than RF. Furthermore, the best method for prediction of genomic accuracy depends on genomic architecture of population
عنوان اصلی به زبان دیگر
عنوان اصلي به زبان ديگر
Evaluating genomic architecture of discrete traits with sheep genomic data imputation by threshold Bayesian and machine learning methods
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )