آزمون پرتوان در داده هایی با ابعاد بالا بر اساس رهیافت تصویر سازی تصادفی و کاربردهای آن
Powerful Test in High Dimensional Data Using random Projection Methodology and its Applications A
/تینارشیدجعفری
: علوم ریاضی
، ۱۳۹۹
، راشدی
۱۰۷ص
چاپی - الکترونیکی
کارشناسی ارشد
آمار گرایش آمار ریاضی
۱۳۹۹/۱۱/۰۸
تبریز
با پیشرفت سریع روش های نوین جمع آوری اطلاعات، نیاز به استفاده از تکنی های جدید برای تحلیل داده هایی با ابعاد بالاتر بیشتر شده است .زمان که تعداد متغیر ها(P ( نسبت به اندازه نمونه )(n بسیار بالا و یا نزدی به آن است، آزمون های آماری کلاسی قابل استفاده نیستند .بنابراین به دلیل از دست دادن دقت توان، بعض استنباط های آماری عملا کاربردی ندارند .در این پایان نامه آماره آزمون جدیدی، با استفاده از تلفیق نگاشت تصادف و آماره ت دوکلاسی برای داده های با ابعاد بالا(P n ( برای آزمون میانگین دو جامعه نرمالP متغیره معرف م کنیم .برای این کار، تابع توان مجانبی برای آزمون معرف شده ارائه و سپس شرایط مناسب برای پرتوان بودن روش معرف شده نسبت به آزمون های معمول و رایج را مورد مطالعه قرار م دهیم .سپس با استفاده از منحن هایROC به دست آمده از داده های شبیه سازی شده عملرد آزمون معرف شده در مقابل سایر آزمون ها را مورد مقایسه قرار م دهیم .در نهایت کاربردی از روش ارائه شده بر مجموعه داده های واقع را نشان م دهیم
We consider the hypothesis testing problem of detecting a shift between the means of two multivariate normal distributions in the high-dimensional setting, allowing for the data dimension p to exceed the sample size n . Specifically, we propose a new test statistic for the two-sample test of means that integrates a random projection with the classical Hotteling T 2 statistic. Working under a high-dimensional framework with (p, n) , we first derive an asymptotic power function for our test, and then provide suffcient conditions for it to achieve greater power than other state-of-the-art tests. Using ROC curves generated from synthetic data, we demonstrate superior performance against competing tests in the parameter regimes anticipated by our theoretical results. Lastly, we illustrate an advantage of our proccedures false positive rate with comparisons on high-dimensional gene expression data
Powerful Test in High Dimensional Data Using random Projection Methodology and its Applications A