کاربرد مدل رگرسیون دوجمله ای منفی حاشیه ای شده با انباشتگی صفر در تحلیل داده های پزشکی
[پایاننامه]
Application of Marginalized Zero Inflated Negative Binomial Regression Model in Analysis of Medical Data
علوم بهزیستی و توانبخشیUniversity of Social Welfare and Rehabilitation Sciences)۹
، ۱۳۹۷
ه،۷۸ص.
پیوست
چاپی
کارشناسی ارشد
آمار زیستی Biostatistics
۱۳۹۷/۰۷/۲۴
علوم بهزیستی و توانبخشیUniversity of Social Welfare and Rehabilitation Sciences)۹
مقدمه و هدف :در طیف وسیعی از پژوهش ها، متغیر پاسخ از نوع شمارشی است .هرگاه متغیر شمارشی از صفر فراوان برخوردار بوده و دارای بیش پراکنش نسبت به توزیع پواسن باشد از رگرسیون دوجمله ای منفی با انباشتگی صفر (ZINB)جهت مدل بندی آن استفاده می شود .اما ضرایب این مدل برای برآورد اثرات کلی عوامل خطر نامناسب اند .برای حل این مشکل آماردانان، رگرسیون دوجمله ای منفی حاشیه ای شده با انباشتگی صفر (MZINB) را پیشنهاد نمودند .هدف مطالعه حاضر، کاربرد این مدل در تحلیل اثرات کلی عوامل خطر موثر بر شاخص پوسیدگی دندان های دائمی (DMFT)است .مواد و روشها :داده های مورد استفاده در این پژوهش متعلق به یک مطالعه مقطعی بر روی ۷۶۴ دانش آموز ۱۲ تا ۱۵ ساله شهرستان پاکدشت و پیشوا در سال ۱۳۹۶ است .متغیر پیامد، شاخص DMFT بود .سه مدل،ZINB ، MZINB و رگرسیون دوجمله ای منفی حاشیه ای شده با انباشتگی صفر پارامتر مشترکMZINB) - (SPبرای مدل بندی استفاده و انتخاب بهترین مدل بر اساس حداقل بودن مقدار آکائیک انجام شد .به منظور تجزیه و تحلیل داده ها از نرم افزار SAS نسخهی ۴.۹ استفاده و نتایج در سطح معنی داری ۰/۰۵ گزارش گردید .یافتهها :در مدل رگرسیونMZINB- SP، شاخص DMFT با دختر بودن(۱/۰۱-۱/۳۴:CI۱۸،/۱)=IRR، تعداد دفعات مراجعه به دندانپزشک( ۱/۱۲-۱/۲۸:CI۲۰،/۱)=IRR، تعداد دفعات مسواک زدن( ۰/۸۴-۰/۹۸:CI۹۱،/۰)=IRR، تعداد دفعات استفاده از نخ دندان( ۱/۰۴-۱/۱۹:CI۱۱،/۱) =IRRو سطح تحصیلات مادر( ۰/۷۹-۰/۹۹:CI۸۹،/۰ ) =IRRارتباط آماری معنی داری داشت .فاصله اطمینانها، خطای معیارها و همچنین مقدار آکائیک در مدل رگرسیونMZINB - SPکمتر از دو مدل دیگر بودند .نتیجهگیری :نتایج نشان داد که مدل رگرسیونMZINB - SPعلاوه بر بررسی اثرات کلی، برازش بهتری نسبت به مدل ZINB و MZINB دارد و می تواند جایگزینی مناسب برای آنها باشد .واژگان کلیدی :اثرات کلی، بیش پراکنش، پوسیدگی دندان، داده شمارشی، رگرسیون دوجمله ای منفی حاشیه ای شده با انباشتگی صفر
Introduction and Aim: In a wide range of studies, the response variable is a count type. If the count variable has excess zero and it has a greater dispersion than Poisson's distribution, then a Zero-Inflated Negative Binomial (ZINB) regressionis is used to model it. But the coefficients of this model are inappropriate for estimating the overall effects of risk factors. For solving this problem, the statisticians proposed a Marginalized Zero-Inflated Negative Binomial (MZINB) regression. The purpose of this study is to use this model in analyzing the overall effects of risk factors on permanent dental caries (DMFT) index. Materials and Methods: The data used in this study belong to a cross-sectional study on 764 students aged 12-15 years old in Pakdasht and Peshawar county in 1396. The outcome variable was DMFT index. Three models, ZINB, MZINB and Shared-Parameters Marginalized Zero-Inflated Negative Binomial (SP-MZINB) were used to model and selection of the best model based on the minimum amount of Akaike. SAS software version 9.4 was used to analyze the data and the results were reported at a significant level of 0.05. Findings: In the SP-MZINB regression model, being a girl (IRR=1.18,CI:1.01-1.34), frquency of dental visits (IRR=1.20,CI:1.12-1.28), tooth brushing frequency (IRR=0.91,CI:0.84-0.98), flossing frequency(IRR=1.11,CI:1.04-1.19) and level of motherss education (IRR=0.89,CI:0.79-0.99) had a statistically significant relationship with the DMFT index. The confidence intervals, standard errors, as well as the amount of Akaike in the SP-MZINB regression model were less than the other two models. Conclusion: The results showed that SP-MZINB regression model has a better fit than ZINB and MZINB in addition to overall effects and can be a suitable alternative for them. Key words: Count Data, Dental Caries, Marginalized Zero-Inflated Negative Binomial Regression, Overall Effects, Overdispersion.
ba
Application of Marginalized Zero Inflated Negative Binomial Regression Model in Analysis of Medical Data