کاربرد روش درستنمایی جزئی وزنی در برآورد مدل پواسن با صفر بریده شده در داده های پزشکی
[پایان نامه]
Application of weighted partial likelihood approach for zero-truncated Poisson model in medical data
دانشگاه علوم توان بخشی و سلامت اجتماعیUniversity of Rehabilitation Sciences and Social Health
۱۴۰۰
۷۸ص.
پیوست
19
01
۱۴۰۰/۱۱/۱۱
مقدمه و هدف: در طیف وسیعی از پژوهش ها، متغیر پاسخ از نوع شمارشی است. هر گاه متغیر شمارشی با صفر بریده شده و دارای توزیع پواسن باشد از رگرسیون پواسن با صفر بریده شده(ZTP ) با استفاده از رویکرد درستنمایی ماکزیمم(ML ) یا درستنمایی جزئی(PL ) جهت مدل بندی آن استفاده می شود. اما ضرایب برآورد شده با استفاده از این رویکردها برای برآورد اثرات کلی عوامل خطر نامناسب اند یا محدویت و معایبی وجود دارد. برای حل این مشکل آماردانان، رگرسیون پواسن با صفر بریده شده با استفاده از رویکرد درستنمایی جزئی وزنی(ZTP-WPL ) را پیشنهاد نمودند. هدف مطالعه حاضر، کاربرد این مدل در تحلیل اثرات کلی عوامل خطر موثر بر تعداد روز های بستری(NHD ) بیماران مبتلا کووید-19 است.مواد و روش ها: در مطالعه حاضر، داده تمام بیماران بستری مبتلا به کووید-19 از 1 اسفند 1398 تا 31 خرداد 1399 در چهار بیمارستان وابسته به دانشگاه علوم پزشکی قم مورد بررسی قرار گرفت(البته به جزء موارد فوت شده). 2044 نمونه جمع آوری و داده های مربوط به آنان برای ارزیابی رویکرد درستنمایی جزئی وزنی با در نظر گرفتن تعداد روز های بستری بعنوان متغیر پاسخ تحلیل گردید. متغیر پاسخ، شاخص تعداد روزهای بستری(NHD) بود. سه مدل پواسن با استفاده از رویکرد درستنمایی ماکزیمم، رگرسیون پواسن با صفر بریده شده با استفاده از رویکرد درستنمایی ماکزیمم و رگرسیون پواسن با صفر بریده شده با استفاده از رویکرد درستنمایی جزئی وزنی(ZTP-WPL) برای مدل بندی استفاده و انتخاب بهترین مدل بر اساس حداقل مقدار مقیاس باقی مانده پیرسون(DSR ) و تابع نمره دیوید-سباستیانی(DS ) انجام شد. به منظور تجزیه و تحلیل داده ها از نرم افزار R نسخه ی 4.0.5 استفاده و سطح معناداری 0.05 در نظر گرفته شد.یافته ها: در مدل رگرسیون ZTP-WPL، NHD بیماران مبتلا به کووید-19 با جنسیت(0.015p-v=)، سن(0.001>p-v)، بیماری زمینه ای 1(0.001p-v=), بیماری زمینه ای 2(0.001>p-v)، میزان تنفس(001/0p-v=) و زمان ابتلا(040.p-v=) ارتباط آماری معنی داری داشت. مقدار خطای مقیاس باقی مانده پیرسون و تابع نمره دیوید-سباستیانی در مدل رگرسیون ZTP-WPL کمتر از دو مدل دیگر بودند.نتیجه گیری: نتایج نشان داد که مدل رگرسیون ZTP-WPL علاوه بر بررسی اثرات کلی، برازش بهتری نسبت به مدل P-MLE و ZTP-MLE دارد و می تواند جایگزینی مناسب برای آنها باشد.واژگان کلیدی: درستنمایی جزئی، درستنمایی جزئی وزنی، توزیع پواسن، کووید-19، تعداد روز های بستری، داده شمارشی
Introduction and Aim: In a wide range of studies, the response variable is a count type. If the count variable has zero-truncated and has a Poisson distribution, then a zero-truncated Poisson (ZTP) regression is used to model it with the maximum likelihood (MLE) or partial likelihood (PL) approach. However, the coefficients estimated using these approaches to estimate the overall effects of risk factors are inadequate or there are limitations and disadvantages. For solving this problem, the statisticians proposed a weighted partial likelihood approach for zero-truncated Poisson (WPL-ZTP) regression. The purpose of this study is to use this model in analyzing the overall effects of risk factors affecting on length of Number of Hospitalization Days(NHD) with Covid 19.Materials and Methods: In the present study, the data of all patients hospitalized with Covid-19 from February 20, 2020 to June 20, 2020 in four hospitals affiliated to Qom University of Medical Sciences were examined (except for the deceased). 2044 samples were collected and their data were analyzed to evaluate the partial weighted likelihood approach by considering the number of hospitalization days as the response variable. the response variable was the number of hospitalization days (NHD). Three model P-ML, ZTP-ML and Poisson regression with zero cut using the weighted partial likelihood approach (ZTP-WPL) to model the use and select the best model The Pearson minimum residual scale (DSR) and the David Sebastian (DS) score function were performed. In order to analyze the data, R software version 4.0.5 was used and a significance level of 0.05 was considered.Results: In ZTP-WPL regression model, NHD of patients with Covid-19 with sex (p-v = 0.015), age (p-v <0.001), underlying disease 1 (p-v = 0.001), underlying disease 2 (p-v <0.001) ), Respiration rate (p-v = 0.001) and infection time (p-v = 0.40) had a statistically significant relationship. Pearson residual scale error and David-Sebastian's score function in ZTP-WPL regression model were less than the other two models.Conclusion: The results showed that the ZTP-WPL regression model has a better fit than P-MLE and ZTP-MLE in addition to overall effects and can be a suitable alternative for them.Keywords: Partial likelihood, Partial weight likelihood, Poisson distribution, Covid-19, Number of hospitalization days, Count data