Metin Madenciliği Yöntemleri Ile E-ticaret Markalarına Yönelik Sosyal Medya Yorumlarının Analizi
General Material Designation
[Thesis]
First Statement of Responsibility
Işık, Nurfer
Subsequent Statement of Responsibility
Çakır, Özgür
.PUBLICATION, DISTRIBUTION, ETC
Name of Publisher, Distributor, etc.
Marmara Universitesi (Turkey)
Date of Publication, Distribution, etc.
2019
PHYSICAL DESCRIPTION
Specific Material Designation and Extent of Item
92
DISSERTATION (THESIS) NOTE
Dissertation or thesis details and type of degree
Master's
Body granting the degree
Marmara Universitesi (Turkey)
Text preceding or following the note
2019
SUMMARY OR ABSTRACT
Text of Note
Metin verilerinden anlam çıkarılması adına yapılan analizler teknolojik gelişmeler ile hızla değişebilmektedir. Müşterilerin satın aldıkları ürün/hizmetler hakkında yazdıkları geri bildirimlerin ve sosyal medya platformlarında yazdıkları mesajların/yorumların içerdiği duygunun araştırılabilir ve yorumlanabilir oluşu bu metin verilerine anlam katmaktadır. Bu metin verilerinin analiz edilmesi ile elde edilen bilgileri işletmelerin kullanması ise işletmelere değer katmaktadır. Bu tez çalışmasında, makine öğrenmesi tekniklerinden denetimli öğrenme yaklaşımı kullanılarak sosyal medya yorumlarının duygu analizi yapılmıştır. Denetimli öğrenme sınıflandırma algoritmalarından Naive Bayes, Sıralı Minimal Optimizasyon(SMO), k-en yakın komşu (kNN=IBk) algoritmaları kullanılmıştır. Bazı e-ticaret firmalarına, ürünlerine/hizmetlerine yönelik yapılan yorumlardan oluşturulan veri kümesi Twitter platformu kullanılarak elde edilmiştir. Sosyal medya yorumları olumlu, olumsuz, nötr olarak el yordamı ile etiketlenerek üç sınıfta toplanmıştır. Bu çalışmada 'sınıflardaki veri dağılımının' ve 'öznitelik seçiminin' sınıflandırma üzerindeki etkileri incelenmiştir. Bu incelemeler Weka 3.8 yazılımında yer alan Naive Bayes (NB), Sıralı Minimal Optimizasyon (SMO) ve 1-en yakın komşu (IB1) sınıflandırma algoritmaları kullanılarak ve 16 farklı model oluşturularak yapılmıştır. Elde edilen deneysel sonuçlarda dengesiz veri kümesinin, dengeli veri kümesine göre daha iyi performans sağladığı gözlemlenmiştir. Ayrıca veri kümelerinde öznitelik seçimi yapıldığı durumlarda da veri kümelerinin daha iyi performans sağladığı gözlemlenmiştir. En iyi performansı gösteren sınıflandırma algoritması ise dengesiz veri kümesi üzerinde öznitelik seçimi yapıldığında ortalama %93,52 sınıflandırma doğruluğu ile kNN olmuştur.