یک مدلگرافیکی تخمین ژست بدن روی تصاویر دو بعدی به روش یادگیری عمیق
نام نخستين پديدآور
/صمد نجفی
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
: پردیس بین المللی ارس
تاریخ نشرو بخش و غیره
، ۱۳۹۵
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی نرم افزار گرایش نرمافزار
زمان اعطا مدرک
۱۳۹۵/۱۱/۱۹
کسي که مدرک را اعطا کرده
تبریز
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
ما روشی برای تخمین بندبند ژست بدن از روی تصاویر دو بعدی رنگی ارائه کردیم که بر مبنای مدلهای گرافیکی و روش یادگیری عمیق است .اسکلت بدن به صورت ساختار درختی G=(V,E)تعریف شده که V مجموعه تمام قطعات بدن مثل سر، بازوها، سینه و پاها است E مجموعه یالهای درخت است که فاصله بین هر دو قطعه) روابط فضایی دوبهدو (را نشان میدهد .اسکلت بدن شامل ۱۴ مفصل و ۱۰ قطعه است که برای حصول نتیجه بهتر نقطعه وسط هر قطعه نشانه گذاری شد تا تعداد قطعههای بدن به ۲۶ قطعه در مجموعه داده LSP و ۱۸ قطعه در مجموعه داده FLIC افزایش یابد .از اندازهی تصویر محلی جهت آشکارسازی قطعهها و روابط فضایی بین آنها استفاده شد .با به کارگیری یک مدل مخلوط قطعهی، برای هر یک از قطعهها تعداد K نمونه تعریف شد و با استفاده از الگوریتمMeans - Kقطعهها خوشهبندی شد تا تعداد K خوشه به دست آید .برای آموزش شبکه کانولوش عمیق به جای خود تصویر از تکههای تصویر محلی به عنوان مثالهای آموزش و تکه تصاویر پسزمینه به عنوان مثالهای منفی استفاده شد که با لحاظ نمودن فاکتور K تعداد مثالهای آموزش افزایش یافت .جهت پیشگویی حضور قطعههای بدن و روابط فضایی بین آنها در تکههای تصویر، از یک شبکه کانولوشن عمیق جهت یادگیری توزیع احتمال شرطی استفاده شد در نتیجه تکه تصاویر برچسب گذاری شدند .ماشین بردار پشتیبان ساخت یافته جهت آموزش پارامترهای وزنی مدل گرافیکی و دسته بندی مورد استفاده قرار گرفت .از این رو مدل ما قابلیت بازنمایی مدلهای گرافیکی را با کارآیی و توانمندی احتمالاتی شبکههای کانولوشن عمیق ترکیب کرده است .نتایج حاصل از آزمایشها روی LSP براساس معیار" درصد قطعات شناسایی شده صحیح PCP) )" ۷۶.۵و روی FLIC ۹۱.۹ است و براساس معیار" درصد مفصلهای آشکارسازی شدهی صحیح "(PDJ) روی LSP ۸۷.۲و روی FLIC ۹۸.۵ است که در مقایسه با مدلهای معرفی شده در رتبه سوم قرار گرفته ولی در مقایسه با مدلهای معرفی شده تا سال ۲۰۱۵ بهترین عملکرد را دارا است
متن يادداشت
We present a novel method for estimating articulated human pose from a two dimention images based on a graphical models and deep learning way We represent human pose by a graphical model G =(V; E) where the nodes V specify the positions of the parts (or joints) and the edges E indicates which parts are spatially related.. More precisely, we specify a graphical model for human pose which exploits the fact the local image measurements canbe used both to detect parts (or joints) and also to predict the spatial relationships between them (Image Dependent Pairwise Relations). These spatial relationships are represented by a mixture model. We use K-means in our experiments by setting K = Tij to do the clustering. The weight parameters of different terms in the model are trained using Structured Supported Vector Machine (S-SVM). In summary, our model combines the representational flexibility of graphical models, including the ability to represent spatial relationships, with the data driven power of DCNNs. Our method outperforms the state of the art methods on the LSP and FLIC Datasets compared with methods present before 2015 and thired ranked in all methods The results of our method on the LSP based on the criterion " Percentage of Correct Parts (PCP) " is76.5 and on the FLIC is 91.9. based on the criterion " Percentage of Detected Joints (PDJ)" is on LSP 87.2 and the FLIC 98.5
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )