An Automatic Similarity Detection Engine Between Sacred Texts Using Text Mining and Similarity Measures
نام عام مواد
[Thesis]
نام نخستين پديدآور
Salha Hassan Muhammed Qahl
نام ساير پديدآوران
Fokoue, Ernest
وضعیت نشر و پخش و غیره
نام ناشر، پخش کننده و غيره
Rochester Institute of Technology
تاریخ نشرو بخش و غیره
2014
مشخصات ظاهری
نام خاص و کميت اثر
104
يادداشت کلی
متن يادداشت
Committee members: Chen, Linlin; Parody, Robert
یادداشتهای مربوط به نشر، بخش و غیره
متن يادداشت
Place of publication: United States, Ann Arbor; ISBN=978-1-321-40085-4
یادداشتهای مربوط به پایان نامه ها
جزئيات پايان نامه و نوع درجه آن
M.S.
نظم درجات
Applied Statistics
کسي که مدرک را اعطا کرده
Rochester Institute of Technology
امتياز متن
2014
یادداشتهای مربوط به خلاصه یا چکیده
متن يادداشت
Is there any similarity between the contexts of the Holy Bible and the Holy Quran, and can this be proven mathematically? The purpose of this research is using the Bible and the Quran as our corpus, we explore the performance of various feature extraction and machine learning techniques. The unstructured nature of text data adds an extra layer of complexity in the feature extraction task, and the inherently sparse nature of the corresponding data matrices makes text mining a distinctly difficult task. Among other things, We assess the difference between domain-based syntactic feature extraction and domain-free feature extraction, and then use a variety of similarity measures like Euclidean, Hillinger, Manhattan, cosine, Bhattacharyya, symmetries kullback-leibler, Jensen Shannon, probabilistic chi-square and clark. For a similarity to identify similarities and differences between sacred texts.
موضوع (اسم عام یاعبارت اسمی عام)
موضوع مستند نشده
Mathematics; Statistics; Computer science
اصطلاحهای موضوعی کنترل نشده
اصطلاح موضوعی
Pure sciences;Applied sciences;Data mining;Machine learning;Sacred texts;Similarity measures
نام شخص به منزله سر شناسه - (مسئولیت معنوی درجه اول )