آزمون برابری میانگینهای دو جامعه با بعد بالا با استفاده از زیرفضاهای تصادفی و کاربردهای آن در دادههای ژنتیک
Parallel Title Proper
Testing for means equality of two high dimensional populations using random subspaces methodology and its applications in genetics data
First Statement of Responsibility
/لیلا مرادی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: علوم ریاضی
Date of Publication, Distribution, etc.
، ۱۳۹۸
Name of Manufacturer
، راشدی
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
۹۹ص
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی - الکترونیکی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
آمار گرایش آمار ریاضی
Date of degree
۱۳۹۸/۱۱/۱۶
Body granting the degree
تبریز
SUMMARY OR ABSTRACT
Text of Note
مسألهی آزمون اینکه آیا میانگین دو جامعهی وابسته و نه مستقل از دادههای بیان ژن با بعد بالا با هم برابرند یا نه، یک مسألهی رایج در علم ژنتیک است .در اینجا منظور از دادههای با بعد بالا دادههایی هستند که در آن بعد از اندازهی نمونه به مراتب بزرگتر است .اکثر آزمونهای با بعد بالا برای تساوی میانگینهای دو جامعه بر اساس برآوردگرهایی از اثر ماتریس کوواریانس میباشد که در آنها فرض وابستگی بین متغیرها نادیده گرفته میشود .در قالب این پایاننامه آزمونی بر اساس زیرفضاهای تصادفی با توان بالاتر نسبت به روشهای موجود برای متغیرهای وابسته پیشنهاد میشود .این آزمون تحت تبدیلات خطی از توزیعهای حاشیهای ناوردا است .به منظور انجام آزمون، پی-مقدارها به کمک روش جایگشت به دست میآیند .نقطه قوت این آزمون این است که هیچ ساختار خاصی بر روی ماتریس کوواریانس و یا فرضی بر نرمال بودن دادهها در آن اعمال نمیشود .برای بررسی عملکرد آزمون پیشنهادی با یک مطالعهی شبیهسازی نشان داده میشود که آزمون معرفی شده به مراتب توان بالاتری نسبت به آزمونهای رقیب در مسألهی برابری میانگینها دارد .کاربردهای عملی از قابل استفاده بودن آزمون بر دادههای واقعی نیز ارائه شدهاست
Text of Note
A common problem in genetics is that of testing whether a set of highly dependent gene expressions dier between two populations, typically in a high-dimensional setting where the data dimension is larger than the sample size. Most high-dimensional tests for the equality of two mean vectors rely on naive diagonal or trace estimators of the covariance matrix, ignoring dependences between variables. A test using random subspaces is proposed, which oers higher power when the variables are dependent and is invariant under linear transformations of the marginal distributions. The p-values for the test are obtained using permutations. The test does not rely on assumptions about normality or the structure of the covariance matrix. It is shown by simulation that the new test has higher power than competing tests in realistic settings motivated by microarray gene expression data. Computational aspects of high-dimensional permutation tests are also discussed and an efcient R implementation of the proposed test is provided
PARALLEL TITLE PROPER
Parallel Title
Testing for means equality of two high dimensional populations using random subspaces methodology and its applications in genetics data