Sosyal medyada duygu analizi : Karşılaştırmalı bir çalışma

Loading...
Thumbnail Image

Date

2018

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Organizational Unit
Computer Engineering
(1998)
The Atılım University Department of Computer Engineering was founded in 1998. The department curriculum is prepared in a way that meets the demands for knowledge and skills after graduation, and is subject to periodical reviews and updates in line with international standards. Our Department offers education in many fields of expertise, such as software development, hardware systems, data structures, computer networks, artificial intelligence, machine learning, image processing, natural language processing, object based design, information security, and cloud computing. The education offered by our department is based on practical approaches, with modern laboratories, projects and internship programs. The undergraduate program at our department was accredited in 2014 by the Association of Evaluation and Accreditation of Engineering Programs (MÜDEK) and was granted the label EUR-ACE, valid through Europe. In addition to the undergraduate program, our department offers thesis or non-thesis graduate degree programs (MS).

Journal Issue

Abstract

Duygu Analizi, sosyal medya gönderileri gibi metin içeriğinin polaritesini tespit etme ve sınıflandırma görevidir. Twitter için duyarlılık analizi, çalışmaların açık veri setlerini kullanarak yürütüldüğü akademik çevrelerde popüler bir konu olmuştur. Mevcut son teknoloji ürünü sonuçlar, Destek Vektör Makineleri (SVM) gibi klasik Makine Öğrenme sınıflandırıcıları ve Sinir Ağları, yani Derin Öğrenme modelleri gibi son gelişmeler dahil olmak üzere çok çeşitli tekniklerle sağlanmıştır. Bu tezde, Büyük Veri çerçevelerini kullanarak Sosyal Medya için büyük ölçekli Duygu Analizi çalıştık. Motivasyonumuz, büyük veri kriterlerinin sınıflandırıcıların performansı üzerindeki etkisini araştıran çalışmaların çok az olduğu gözleminden kaynaklanmaktadır. Amaç, sadece son teknoloji ürünü sonuçlardan daha iyi performans gösteren bir model oluşturmak değil, gerçek zamanlı ve yüksek hacimli veri akışları altında çeşitli sınıflandırıcı algoritmalarını incelemektir. Bu amaçla, büyük veri çerçeveleri olan ve içermeyen çeşitli Duygu Analizi Modelleri uygularız ve büyük veri yapılarını kullanarak performans faydalarını veya kayıplarını karşılaştırırız. Özellikle iki deneme senaryosu oluşturduk. Her iki senaryoda, aynı veri kümesini kullanıyoruz, ilgili sınıflandırıcılar için mümkün olan en iyi sonuçları elde etmek için uygun veri ön işlemlerini ve özellik mühendisliği tekniklerini uyguluyoruz. Anahtar Kelimeler: Algı Analizi, Büyük Veri, Spark, Spark ML, Twitter, Derin Öğrenme, Twitter
Sentiment Analysis is the task of detecting and classifying the polarity of textual content, such as social media posts. Sentiment analysis for Twitter has been a popular topic in academia whereby studies are being conducted using openly available datasets. The state-of-the-art results are achieved by a wide range of techniques, including classical Machine Learning classifiers such as Support Vector Machines (SVM) and the recent advancements in Neural Networks, namely, Deep Learning models. In this thesis, we study large scale Sentiment Analysis for Social Media using Big Data frameworks. Our motivation comes from the observation that there is a dearth of studies exploring the impact of the big-data criteria on the performance of classifiers. The goal is not to simply achieve best accuracy, but rather to study the behavior of classic classifier algorithms when incorporated with big data frameworks. To this end, we implement various Sentiment Analysis models with and without big data frameworks and compare the performance benefits and trade-offs. We report on several classification evaluation metrics and additionally keep track of computation time to observe the advantages of using big data frameworks (Apache Spark) based models. Particularly, we set two experimental scenarios using same dataset and feature engineering techniques with the only difference being the big-data framework.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, Kıvılcım, Spark

Turkish CoHE Thesis Center URL

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

0

End Page

68