Türkçe Metinlerde sözlük tabanlı yaklaşımla Duygu Analizi Ve görselleştirme
[Thesis]
Chawai, Abdoulaye Issa Baban
Demir, Önder
Marmara Universitesi (Turkey)
2019
78
Master's
Marmara Universitesi (Turkey)
2019
Metin madenciliği (TM) yaklaşımları, yapılandırılmamış metinden otomatik olarak faydalı bilgilerin çıkarılmasını kolaylaştırmak için önem kazanmaktadır. Bu amaçla kullanılan metin madenciliği yöntemleri ile büyük miktardaki metin verileri, kısa zamanda ve yüksek performans ile analiz edilebilmektedir. Bu çalışmanın temel amacı, kelime sıklığı, bilgi çıkarma, sınıflandırma, makine öğrenmesi, veri işleme ve çıkarma gibi araçlarla Türkçe metinlerinin işlenmesi ve görselleştirilmesidir. Metin madenciliği alanlarından biri olan duygu analizi veya fikir madenciliği, görüşler, tutumlar ve duygular gibi öznel bilgilerin algılanmasını otomatikleştirmek için kullanılmaktadır. Bu tezde sunulan çalışmada, tweet, roman, müşteri yorumları gibi Türkçe metinlerin analizine ihtiyaç duyulduğu durumlarda kullanılabilecek yeni bir araç önerilmektedir. Geliştirilen uygulama esas olarak duygu analizi yaparken "kelime düzeyinde" çalışmaktadır. Buna ek olarak, duygu analizinde kullanılan sözlük sıfatlar, isimler, fiiller, zarflar, ön ekler, son ekler tğrğnde kelimeler içermektedir. Kullanılan birinci sözlük 5.000 kelime, ikinci sözlük 25.000 kelime ve üçüncü için de yaklaşık 25.000 kelime içermektedir. Tez üç bölümden oluşmaktadır.: Bölüm 1'de Tezin genel girişinde sırasıyla metin madenciliğine ve duygu analizine özgü tanımlar verilmiştir, ardında tez çalışmanın amacı ve önemi hakkında daha fazla bilgi paylaşmıştır. Son olarak metin madenciliği ile ilgili alanlardan ve çalışmalardan bahsedilmiştir. Bölüm 2'de ise kullanılan materyal ve yöntemlerden bahsedilmiştir. Bu bölümde belge korpusunun nasıl temsil edildiği, kullanılan sınıflandırma teknikleri, duygu analizi yöntemleri, tez çalışmasında kullanılan sözlükler ve genel sistem mimarisi açıklanmaktadır. Bölüm 3'te ise geliştirilen duygu analizi sistemine ait sonuçlar ve önerileri içermektedir Anahtar Kelimeler: Metin madenciliği, duygu analizi, metin sınıflandırması, makine öğrenmesi.