استفاده از رگرسیون دو حالتی در تحلیل داده های دارای خطای طبقه بندی
[طرحهای تحقیقاتی و پروژهها]
عنايت¬اله بخــشي
علوم توان بخشی و سلامت اجتماعیUniversity of Social Walfare and Rehabilitation
۱۳۹۷
هدف از این مطالعه، تعین عوامل موثر بر شانس ابتلا به دیابت با استفاده از رگرسیون لجستیک در داده های با خطای طبقه بندی می باشد. روش بررسي: از داده های 819 نفر از شرکت کنندگان در طرح غربالگری دیابت در مرکز بهداشت زاهدان سال 1393 استفاده شد.ارتباط متغیرهای سن، فشارخون و چاقی با ابتلا به دیابت و با در نظر گرفتن خطای طبقه بندی سنجیده شد.نتایج به صورت نسبتهای شانس و فواصل اطمینان 95 درصد ارائه شدند. انالیزها توسط نرم افزار SAS صورت گرفت.يافته ها: نتایج نشان می دهد با افزایش هر سال سن افراد، شانس ابتلا به دیابت در افراد 4 درصد افزایش می یابد به عبارتی (0R=1.04, 95% CI: 1.02-1.06).همچنین شانس ابتلا به دیابت در افرادی که دارای فشار خون بالاهستند، تقریبا سه برابر افرادی است که فشار خون پایین دارند (0R=3.06, 95% CI: 1.80-5.21). همچنین نتایج این مطالعه، شانس ابتلا به دیابت در افراد چاق را دو برابر افراد غیر چاق تخمین زدند. (0R=1.99, 95% CI: 1.26-3.15)واژه هاي كليدي: چاقی، خطای طبقه بندی، نسبت شانس
Objectives: The analysis of Categorical data in statistics and medical sciences is very important. If the binary response variable to be misclassified, the results of fitting the model, will lead to bias when estimating adjusted odds ratios. The purpose of this study was to use a method to detect and correct misclassification error in response variable type 2 diabetes mellitus (T2DM) using binary logistic regression. Methods: Data from the Diabetes Screening test in the Health Center of Zahedan city were considered in this investigation. It included 819 Iranian adults with a binary response variable (T2DM). By using a new method the misclassification parameters and the estimated parameters in logistic regression are validated. Statistical analysis was performed using SAS and values of p<0.05 were considered statistically significant. Results are presented as odds ratio (OR) and 95% confidence intervals. Results: Increasing age (OR=1.04, 95% CI: 1.02-1.06), hypertension (OR=3.06, 95% CI: 1.80-5.21) and obesity (OR=1.99, 95% CI: 1.26-3.15) all increased the odds of T2DM. Discussion: The method provided adjusting for bias due to misclassification in logistic regression, and using it recommended.Keywords: logistic regression, misclassification, odds ratio
Binary regression with a misclassified response variable in diabetes data