Karakaya, ZiyaYazıcı, AliKarakaya, ZiyaGebreyesus, Yasmın TesfaldetComputer Engineering2024-07-072024-07-072018https://hdl.handle.net/20.500.14411/4724Duygu Analizi, sosyal medya gönderileri gibi metin içeriğinin polaritesini tespit etme ve sınıflandırma görevidir. Twitter için duyarlılık analizi, çalışmaların açık veri setlerini kullanarak yürütüldüğü akademik çevrelerde popüler bir konu olmuştur. Mevcut son teknoloji ürünü sonuçlar, Destek Vektör Makineleri (SVM) gibi klasik Makine Öğrenme sınıflandırıcıları ve Sinir Ağları, yani Derin Öğrenme modelleri gibi son gelişmeler dahil olmak üzere çok çeşitli tekniklerle sağlanmıştır. Bu tezde, Büyük Veri çerçevelerini kullanarak Sosyal Medya için büyük ölçekli Duygu Analizi çalıştık. Motivasyonumuz, büyük veri kriterlerinin sınıflandırıcıların performansı üzerindeki etkisini araştıran çalışmaların çok az olduğu gözleminden kaynaklanmaktadır. Amaç, sadece son teknoloji ürünü sonuçlardan daha iyi performans gösteren bir model oluşturmak değil, gerçek zamanlı ve yüksek hacimli veri akışları altında çeşitli sınıflandırıcı algoritmalarını incelemektir. Bu amaçla, büyük veri çerçeveleri olan ve içermeyen çeşitli Duygu Analizi Modelleri uygularız ve büyük veri yapılarını kullanarak performans faydalarını veya kayıplarını karşılaştırırız. Özellikle iki deneme senaryosu oluşturduk. Her iki senaryoda, aynı veri kümesini kullanıyoruz, ilgili sınıflandırıcılar için mümkün olan en iyi sonuçları elde etmek için uygun veri ön işlemlerini ve özellik mühendisliği tekniklerini uyguluyoruz. Anahtar Kelimeler: Algı Analizi, Büyük Veri, Spark, Spark ML, Twitter, Derin Öğrenme, TwitterSentiment Analysis is the task of detecting and classifying the polarity of textual content, such as social media posts. Sentiment analysis for Twitter has been a popular topic in academia whereby studies are being conducted using openly available datasets. The state-of-the-art results are achieved by a wide range of techniques, including classical Machine Learning classifiers such as Support Vector Machines (SVM) and the recent advancements in Neural Networks, namely, Deep Learning models. In this thesis, we study large scale Sentiment Analysis for Social Media using Big Data frameworks. Our motivation comes from the observation that there is a dearth of studies exploring the impact of the big-data criteria on the performance of classifiers. The goal is not to simply achieve best accuracy, but rather to study the behavior of classic classifier algorithms when incorporated with big data frameworks. To this end, we implement various Sentiment Analysis models with and without big data frameworks and compare the performance benefits and trade-offs. We report on several classification evaluation metrics and additionally keep track of computation time to observe the advantages of using big data frameworks (Apache Spark) based models. Particularly, we set two experimental scenarios using same dataset and feature engineering techniques with the only difference being the big-data framework.enBilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolComputer Engineering and Computer Science and ControlKıvılcımSparkSosyal medyada duygu analizi : Karşılaştırmalı bir çalışmaSentiment analysis in social media: A comparative studyMaster Thesis522746068