Türk sosyal medyası için duygu analizi: Twitter üzerinden bir durum çalışması
Loading...
Date
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Duygu Analizi bir yazarın ya da konuşmacının karşısındaki kişiye vermek istediği duyguyu pozitif, negatif ya da nötr cinsinden çözümlemeye çalışır. Çözümlenmeye çalışılan duygu, yazarın ya da konuşmacının yazılı metnini otomatik olarak sınıflandırdıktan sonra oluşur. İnternet ile birlikte sosyal medya sitelerinin aktif bir şekilde kullanılması sonucu, kişiler bir markaya, bir kişiye, bir siyasi partiye, bir ülkeye vb. karşı olan düşüncelerini kolayca ifade edebiliyor duruma gelmiştir. Böylece, yazarlar, sanatçılar, ürün sahipleri, parti yöneticileri sosyal medyada kendileri yada ürünleri hakkında neler konuşuluyor kolayca öğrenebilme fırsatı yakalamışlardır. Dolayısıyla, bu kadar aktif kullanılan ve günlük büyük miktarda veri oluşan bir platformda verilerin elle işlenmesi imkânsıza yakın bir hale gelmiştir ve duygu sınıflandırmasının önemi artmıştır. Son yıllarda İngilizce üzerinde yapılmış birçok başarılı çalışma vardır. Bu çalışmalarda, İngilizcenin gramer yapısına göre çıkarılmış duygu kutbunu belirleyen birçok kelime ve söz dizimi mevcuttur. Aynı şekilde, bu çalışmaların performansını test etmek için veri kümeleri de mevcuttur. Ancak, yapmış olduğumuz araştırma Türkçe üzerine yapılan çalışmaların İngilizce üzerine yapılan çalışmalara göre düşük bir performansa sahip olduğunu göstermektedir. Bunun sebebi Türkçe'den İngilizce'ye çevirilen veri kümeleri ve Türkçe gramer yapısının göz ardı edilmesi olabilir. Biz bu çalışmada, bir takım ek çalışmalar sonucu ortaya çıkardığımız Türkçe duygu kutbu kelimelerini kullanarak ve Türk dil bilimci ile çalışarak gramer yapısına uygun yeni bir yöntem geliştirdik. Twitter API ile anlık topladığımız veriyi bu yöntem ile analiz ediyoruz.
Sentiment Analysis tries to resolve the sense which a writer or a speaker wants to give to the people as positive, negative or neutral. The attempts to resolve emotions occur after automatically classifying the written text of the author or speaker. By means of using internet and other social media actively, people easily imply their attitude and emotion towards an item, a person, a political party, a country or a brand name. In this way, writers, artists, brand owners, political party directors have an opportunity to know what is going around about themselves or their brands easily. Such a platform that has highly active usage and huge amount of data daily makes nearly impossible to process by hand so emotional classification becomes important. In recent years, there have been many successful studies for the English language. In these studies, there were many words and word groups which set emotion polarities that stem from the English grammar structure. Correspondingly, there are datasets which are used to test performance of those studies. But, our study notes that studies done for Turkish have lower performance compared to the studies for English. There are various reasons for this such as the translation of datasets from English to Turkish and ignoring special grammar structures in Turkish. In this thesis, by using newly constructed Turkish emotional polarity words, we try to develop a best fitting methodology for Turkish grammar with the help of a Turkish linguist. We collect instant data by Twitter API and perform the analysis with this new methodology.
Sentiment Analysis tries to resolve the sense which a writer or a speaker wants to give to the people as positive, negative or neutral. The attempts to resolve emotions occur after automatically classifying the written text of the author or speaker. By means of using internet and other social media actively, people easily imply their attitude and emotion towards an item, a person, a political party, a country or a brand name. In this way, writers, artists, brand owners, political party directors have an opportunity to know what is going around about themselves or their brands easily. Such a platform that has highly active usage and huge amount of data daily makes nearly impossible to process by hand so emotional classification becomes important. In recent years, there have been many successful studies for the English language. In these studies, there were many words and word groups which set emotion polarities that stem from the English grammar structure. Correspondingly, there are datasets which are used to test performance of those studies. But, our study notes that studies done for Turkish have lower performance compared to the studies for English. There are various reasons for this such as the translation of datasets from English to Turkish and ignoring special grammar structures in Turkish. In this thesis, by using newly constructed Turkish emotional polarity words, we try to develop a best fitting methodology for Turkish grammar with the help of a Turkish linguist. We collect instant data by Twitter API and perform the analysis with this new methodology.
Description
Keywords
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Turkish CoHE Thesis Center URL
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
0
End Page
68