Ayvaz, S., Yıldırım, S., & Salman, Y. B. Türkçe Duygu Kütüphanesi Geliştirme: Sosyal Medya Verileriyle Duygu Analizi Çalışması. Avrupa Bilim ve Teknoloji Dergisi, (16), 51-60.
Not: Gramer hataları var. -da ayrı!
Henüz oldukça taze olan bu makaleyi de Serkan Ayvaz’ın diğer makalesiyle aynı günde okuma imkanı buldum. Makale hem Türkçe içinde bir duygu analizi kütüphanesi oluşturma yönündeki çabaları vererek bizi genel bağlamdan haberdar ediyor hem de daha önce yapılan çalışmaları daha ileri bir seviyeye taşıyor.
Özetle: Duygu analizlerinde kullanmak üzere eskiden kullanılanlardan da faydalanılarak yeni bir Türkçe Duygu Kütüphanesi oluşturulmuştur. Daha sonrasında bu yeni kütüphane mevsimlere ve bir televizyon programına ilişkin tweetler baz alınarak denenmiştir.
Yazar Türkçe tweetlerin kullanılmasında türkçe kelimelerin ingilizce klavye ile yazılması, bazı kelimelerin kelime sınırından dolayı eksik harflerle yazılması, Türkçenin kullanımının daha esnek olması sebebiyle zorluklar yaşandığını ifade etmektedir. Çalışmada da bu sorunların bir kısmını aşmak için çeşitli yöntemler denenmiştir.
Çalışmada TDK sözlüğü, daha önceden duygu analizi yapmak amacıyla oluşturulmuş olan sözlükler, emojilileri tasnif eden sözlük, kütüphanede bulunmayan duygu taşıyan kelimeler ve İngilizce klavye kullanılması sonucunda ortaya çıkan Türkçe karaktersiz Türkçe kelimeler kullanılarak sözlük zenginleştirilmiştir.
Duygu yoğunluğu yüksek kelimelerde farklı bir puanlandırma sistemi kullanılıp sözlükteki kelimeler iki yüksek lisans öğrencisi tarafından puanlanmış ve sonrasında da ekip tarafından bu puanlamalar tekrar kontrol edilmiştir.
Tweetlerin çekilmesi, tasfiyesi, düzenlenmesi için C#NET ve Python kullanılmıştır.
Sonuçta ilgili sözlüğün mikroblog gönderilerindeki duyguları tespitte önemli ölçüde başarılı olduğu tespit edilmiştir.