یک مدلگرافیکی تخمین ژست بدن روی تصاویر دو بعدی به روش یادگیری عمیق
First Statement of Responsibility
/صمد نجفی
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
: پردیس بین المللی ارس
Date of Publication, Distribution, etc.
، ۱۳۹۵
NOTES PERTAINING TO PUBLICATION, DISTRIBUTION, ETC.
Text of Note
چاپی
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
کارشناسی ارشد
Discipline of degree
مهندسی نرم افزار گرایش نرمافزار
Date of degree
۱۳۹۵/۱۱/۱۹
Body granting the degree
تبریز
SUMMARY OR ABSTRACT
Text of Note
ما روشی برای تخمین بندبند ژست بدن از روی تصاویر دو بعدی رنگی ارائه کردیم که بر مبنای مدلهای گرافیکی و روش یادگیری عمیق است .اسکلت بدن به صورت ساختار درختی G=(V,E)تعریف شده که V مجموعه تمام قطعات بدن مثل سر، بازوها، سینه و پاها است E مجموعه یالهای درخت است که فاصله بین هر دو قطعه) روابط فضایی دوبهدو (را نشان میدهد .اسکلت بدن شامل ۱۴ مفصل و ۱۰ قطعه است که برای حصول نتیجه بهتر نقطعه وسط هر قطعه نشانه گذاری شد تا تعداد قطعههای بدن به ۲۶ قطعه در مجموعه داده LSP و ۱۸ قطعه در مجموعه داده FLIC افزایش یابد .از اندازهی تصویر محلی جهت آشکارسازی قطعهها و روابط فضایی بین آنها استفاده شد .با به کارگیری یک مدل مخلوط قطعهی، برای هر یک از قطعهها تعداد K نمونه تعریف شد و با استفاده از الگوریتمMeans - Kقطعهها خوشهبندی شد تا تعداد K خوشه به دست آید .برای آموزش شبکه کانولوش عمیق به جای خود تصویر از تکههای تصویر محلی به عنوان مثالهای آموزش و تکه تصاویر پسزمینه به عنوان مثالهای منفی استفاده شد که با لحاظ نمودن فاکتور K تعداد مثالهای آموزش افزایش یافت .جهت پیشگویی حضور قطعههای بدن و روابط فضایی بین آنها در تکههای تصویر، از یک شبکه کانولوشن عمیق جهت یادگیری توزیع احتمال شرطی استفاده شد در نتیجه تکه تصاویر برچسب گذاری شدند .ماشین بردار پشتیبان ساخت یافته جهت آموزش پارامترهای وزنی مدل گرافیکی و دسته بندی مورد استفاده قرار گرفت .از این رو مدل ما قابلیت بازنمایی مدلهای گرافیکی را با کارآیی و توانمندی احتمالاتی شبکههای کانولوشن عمیق ترکیب کرده است .نتایج حاصل از آزمایشها روی LSP براساس معیار" درصد قطعات شناسایی شده صحیح PCP) )" ۷۶.۵و روی FLIC ۹۱.۹ است و براساس معیار" درصد مفصلهای آشکارسازی شدهی صحیح "(PDJ) روی LSP ۸۷.۲و روی FLIC ۹۸.۵ است که در مقایسه با مدلهای معرفی شده در رتبه سوم قرار گرفته ولی در مقایسه با مدلهای معرفی شده تا سال ۲۰۱۵ بهترین عملکرد را دارا است
Text of Note
We present a novel method for estimating articulated human pose from a two dimention images based on a graphical models and deep learning way We represent human pose by a graphical model G =(V; E) where the nodes V specify the positions of the parts (or joints) and the edges E indicates which parts are spatially related.. More precisely, we specify a graphical model for human pose which exploits the fact the local image measurements canbe used both to detect parts (or joints) and also to predict the spatial relationships between them (Image Dependent Pairwise Relations). These spatial relationships are represented by a mixture model. We use K-means in our experiments by setting K = Tij to do the clustering. The weight parameters of different terms in the model are trained using Structured Supported Vector Machine (S-SVM). In summary, our model combines the representational flexibility of graphical models, including the ability to represent spatial relationships, with the data driven power of DCNNs. Our method outperforms the state of the art methods on the LSP and FLIC Datasets compared with methods present before 2015 and thired ranked in all methods The results of our method on the LSP based on the criterion " Percentage of Correct Parts (PCP) " is76.5 and on the FLIC is 91.9. based on the criterion " Percentage of Detected Joints (PDJ)" is on LSP 87.2 and the FLIC 98.5