استخراج ویژگی و خوشه بندی زیر کلمات چاپی فارسی به منظور کاهش دامنه جستجو در بازشناسی
نام عام مواد
[پایاننامه]
نام نخستين پديدآور
/صمد قنبری
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
دانشگاه صنعتی سهند
تاریخ نشرو بخش و غیره
، ۱۳۸۹
مشخصات ظاهری
نام خاص و کميت اثر
۱۰۹ ص.
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
چاپی - الکترونیکی
یادداشتهای مربوط به کتابنامه ، واژه نامه و نمایه های داخل اثر
متن يادداشت
کتابنامه در آخر پایان نامه
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
کارشناسی ارشد
نظم درجات
مهندسی برق
کسي که مدرک را اعطا کرده
دانشگاه صنعتی سهند
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
بازشناسی نوری حروف در زبان فارسی میتواند بر حسب شکل کلی زیرکلمات، بر حسب جداسازی حروف تشکیل دهنده و یا ترکیبی از اینها انجام پذیرد .در این پایاننامه یک خوشهبندی سلسله مراتبی دو سطحی برای کاهش دامنه جستجوی پایگاه داد زیرکلمات فارسی انجام گرفته است .در سطح اول از خوشهبندی، از بردار ویژگی حروف شاخص استفاده شده است که توسط این بردار ویژگی استخراجی، زیرکلمات فارسی از لحاظ حروف شاخص آغازین و انتهایی و همچنین تعداد بالا روندهها به ۲۰ خوشه ممکن دسته بندی شدهاند. سطح دوم از خوشهبندی سلسله مراتبی به چند روش انجام پذیرفته است .در روش اول، بردارهای ویژگی بوسیله تبدیل موجک دابیشز استخراج شده و ابعاد آنها توسط آنالیز جزء اصلی کاهش پیدا کرد .بردارهای ویژگی بدست آمده توسط روشk -میانگین خوشهبندی شدند .تعداد خوشههای بهینه ابتدا توسط چند روش سنجش اعتبار خوشههامورد ارزیابی قرار گرفته و در انتها بوسیله یک رابط پیشنهادی، محاسبه شدند .زیرکلمه ورودی بعد از استخراج بردارهای ویژگی بیان شده و طی مراحل خوشهبندی توسط معیار ماهالانوبیس به ۶ خوشه نزدیکتر اختصاص مییابد .در روش بعدی بردارهای ویژگی بدست آمده از تبدیل موجک توسط شبکههای عصبی خودسازمان، خوشهبندی شدند که با در نظر گرفتن تعداد ۳۰۰ مرحله برای آموزش، خوشههای قابل قبولی تولید شدند .لازم به ذکر است که تعداد خوشههای بهینه نیز در این مرحله توسط معیار سنجش اعتبار پیشنهادی مورد ارزیابی قرار گرفتند .روش دیگری که در خوشهبندی سلسله مراتبی سطح دوم انجام گرفته است، استفاده از بردار ویژگی مکان مشخصه بود .ویژگیهای استخراج شده به وسیله الگوریتمk-میانگین و با توجه به معیار اعتبار، خوشهبندی شدند که این روش در مقایسه با روش قبلی حجم محاسبه بیشتری داشت. روش بعدی که برای خوشهبندی سطح دوم مورد استفاده قرار گرفت، استفاده از ناحیههای بزرگ ایجاد شده توسط مقادیر مکان مشخصه و تولید بردار کد ۲۵۶ بعدی بود که در این روش بدلیل تولید خوشهها بوسیله بردار کد، نسبت به روش قبلی سرعت خوشهبندی بالاتری داشته و همچنین حساسیت به فونت در این روش کمتر بود.
اصطلاحهای موضوعی کنترل نشده
اصطلاح موضوعی
شکل کلی زیر - کلمات
اصطلاح موضوعی
خوشهبندی
اصطلاح موضوعی
سنجش اعتبار خوشهها
اصطلاح موضوعی
استخراج ویژگیهای حروف شاخص
اصطلاح موضوعی
ویژگیهای مکان مشخصه
اصطلاح موضوعی
تبدیل موجک
اصطلاح موضوعی
الگوریتم k - میانگین
اصطلاح موضوعی
شبکههای عصبی خود سازمان
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )
مستند نام اشخاص تاييد نشده
قنبری، صمد
نام شخص - ( مسئولیت معنوی درجه دوم )
مستند نام اشخاص تاييد نشده
ابرهیمی، افشین، استاد راهنما
مبدا اصلی
کشور
ایران
تاريخ عمليات
20230805
شماره دستیابی
شماره بازیابی
برق،۱۰۰۹۲،۱۳۸۹
دسترسی و محل الکترونیکی
نام ميزبان
یسانشزاب رد وجتسج هنماد شهاک روظنم هب یسراف یپاچ تاملک ریز یدنب هشوخ و یگژیو جارختسا.pdf