کاربرد مدل رگرسیون وایبل انباشته در صفر با رویکرد بیزی در تحلیل داده های طولی دارای چولگی
[پایان نامه]
Application of Zero-Inflated Weibull Regression Model with Bayesian Approach in the Analysis of Skewed Longitudinal Data
مرجان عباسی دخت رفسنجانی
علوم توان بخشی و سلامت اجتماعیUniversity of Social Walfare and Rehabilitation
۱۴۰۲
۱۲۰ص.
پیوست
19
01
۱۴۰۱/۱۱/۱۹
مقدمه و هدف: داده های شمارشی طولی با صفرهای اضافی اغلب در مطالعات بالینی و علوم سلامت ایجاد می شوند. از آنجا که توزیع وایبل گسسته انباشته در صفر، نسبت به بیش پراکنش، چولگی زیاد و انباشتگی در صفر استوار است، هدف مطالعه حاضر، کاربرد مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر با رویکرد بیزی در تحلیل داده¬های طولی مصرف سیگار جهت شناسایی عوامل مرتبط با تعداد نخ سیگار روزانه مصرفی بزرگسالان سیگاری جامعه شهری تهران است.مواد و روش¬ها : داده های مطالعه توصیفی¬- تحلیلی حاضر، برگرفته از مطالعه قند و لیپید تهران می-باشد. در مجموع تعداد 786 فرد بزرگسال تهرانی سیگاری طی چهار دوره متوالی از سال 1384 تا 1396 مورد ارزیابی قرار گرفتند. در یک تحلیل مقدماتی مدل های رگرسیون دوجمله ای منفی، دوجمله ای منفی انباشته در صفر به داده های هر دوره پیگیری مطالعه برازش داده شد و مدل ها بر اساس مقدار مجموع خطاهای استاندارد برازش خوبی به داده ها نداشتند. تجزیه و تحلیل داده های طولی براساس مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر بیزی با به¬کارگیری برنامه JAGS (Just Another Gibbs Sampler) نسخه¬ی 4.3.0 تحت نرم افزار R نسخه 3.5.1 صورت گرفت. همچنین از الگوریتم نمونه گیری گیبز روش مونت کارلوی زنجیر مارکوفی برای برآورد پارامترهای مدل استفاده شد. مدل اثرات آمیخته دوجمله ای منفی انباشته در صفر نیز به عنوان یک مدل رقابتی با مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر بیزی انتخاب شد.یافته¬ها: در ابتدای این مطالعه، میانگین سن افراد تحت بررسی 68/12±35/40 سال و تعداد 643 نفر (8/%81) از آن¬ها مرد بودند؛ همچنین 7/52% سیگاری روزانه، 6/15% سیگاری تفننی و 7/31% غیرسیگاری بودند که در طول مطالعه سیگاری شدند. براساس مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر با رویکرد بیزی، متغیرهای سن، جنسیت (مرد نسبت به زن)، وضعیت تأهل (مطلقه/ ¬بیوه نسبت به مجرد) روی تعداد نخ سیگار مصرفی روزانه (شدت مصرف سیگار) بزرگسالان سیگاری اثر افزایشی و متغیرهای تحصیلات (فوق لیسانس و بالاتر نسبت به بی سواد)، وضعیت شغلی (دانشجو، خانه دار، بیکار دارای درآمد نسبت به بیکار)، مقررات ممنوعیت مصرف سیگار در محل کار یا تحصیل(بله نسبت به خیر)، داشتن سابقه بیماری قلبی و عروقی زودرس در خویشاوندان مرد اثر کاهشی داشتند. با توجه به عدم محاسبه آماره ارزیابی مانند DIC در این مطالعه، مقایسه مدل ها براساس مجموع خطاهای استاندارد ضرایب صورت گرفت و بر این اساس، مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر با رویکرد بیزی نسبت به مدل اثرات آمیخته دوجمله ای منفی انباشته در صفر برازش بهتری داشت.نتیجه¬گیری: نتایج مطالعه نشان داد که مدل رگرسیون اثرات آمیخته وایبل گسسته انباشته در صفر با رویکرد بیزی برای تحلیل داده¬های شمارشی طولی انباشته در صفر و بیش پراکنده و یا بسیار چوله برازش خوبی دارد و می تواند جایگزین مناسبی برای مدل اثرات امیخته دوجمله ای منفی انباشته در صفر باشد.واژگان کلیدی: رویکرد بیزی، وایبل گسسته، صفر انباشته، مدل¬های شمارشی، طولی، مصرف سیگار
Introduction and Aim: Longitudinal count data with excess zeros are often generated in clinical and health science studies.Given that, zero inflated discrete Weibull (ZIDW) distribution is robust to overdispersion, high skewness, and zero inflation; The purpose of this study is to use mixed effects ZIDW regression model with Bayesian approach in analysis the longitudinal smoking data to identify the factors related to the number of cigarettes smoked per day (intensity of smoking) among adult smokers in Tehran.Materials and Methods: The data used in descriptive-analytical study was drawn from the Tehran Lipid and Glucose Study (TLGS). A total of 786 adult smokers from Tehran were evaluated during four consecutive follow-ups from 2005 to 2016. In a preliminary analysis, negative binomial, zero inflated negative binomial, regression models were fitted to the data of each follow-up of the study, and according to the sum of the standard errors of the models, they did not fit the data well. Longitudinal data analysis was based on the Bayesian mixed effects zero inflated discrete Weibull regression model (ZIDW) using JAGS (Just Another Gibbs Sampler) version 4.3.0 under R software version 3.5.1. The MCMC Gibbs sampling algorithm was used to draw samples from the joint posterior distribution of the model parameters. The mixed effects zero inflated negative binomial regression model was also considered as a competitive model with the ZIDW model.Findings: The mean age of the participants at baseline was 40.35 ± 12.68 years, and 643 (81.8%) of them were men. Based on the Bayesian mixed effects ZIDW model, variables age, gender (male vs. female), marital status (Divorced/Widowed vs. single) had an additive effect and variables education level (Master and higher vs. illiterate), employment status (Student vs. unemployed), (Housewife vs. unemployed), (Unemployed with income vs. unemployed), implementation of smoking prohibition regulations (Yes vs. No), history of cardiovascular disease in male relatives (Yes vs. No) had a decreasing effect on smoking intensity of adult smokers. Due to the non-calculation of evaluation statistics such as DIC in this study, the comparison of models was based on the sum of the standard errors of the coefficients and based on this, the Bayesian mixed effects zero inflated discrete Weibull model had a better fit than the mixed effects zero inflated negative binomial model.Conclusion: The results of the study showed that the Bayesian mixed effects ZIDW regression model for the analysis of zero inflated and overdispersed or highly skewed longitudinal count data has a good fit and can be a suitable alternative to the mixed effects zero inflated negative binomial model.Keywords: Bayesian approach, discrete Weibull, zero inflation, count regression model, longitudinal, Smoking.