Öğrenci Performansının Öngörülmesi için Tahmin Algoritmalarının Karşılaştırılması

Loading...
Thumbnail Image

Date

2018

Journal Title

Journal ISSN

Volume Title

Publisher

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Bu tez, Atılım Üniversitesi Bilgi Sistemlerinde barındırılan öğrenci bilgilerinin oluşturduğu veri kümelerini kullanarak altı farklı makine öğrenmesi algoritmalarının öğrenci performansı tahminine uygulanmasını incelemektedir. Bu öğrenme algoritmaları şu dört ölçü kullanılarak karşılaştırılmıştır: Doğruluk, Kesinlik, Geri Çağırma ve F-ölçüsü. Çalışmada aynı anda çok sayıda ders başarısı tahmininin, kullanılan sınıflandırıcıların performansıyla doğrudan veya ters orantılı olup olmadığına da bakılmıştır. Ayrıca; veri ön işlemenin yanı sıra, Korelasyon temelli Özellik Seçimi (CFS)'nin öğrenme algoritmaları üzerindeki etkilerinin ölçümü gerçekleştirilmiştir. Kullanılan algoritmalar şunlardır: Naif Bayes, Lojistik Regresyon, Çok Katmanlı Perceptron, SMO (Destek Vektör Makineleri), IBk (K-En Yakın Komşu) ve J48 (C4.5 Karar Ağacı). Naïve Bayes ve IBk, karşılaştırılan algoritmalar arasında en iyi sonuçlar vermiştir. Sonuçlar, birlikte tahmin edilen derslerin sayısı arttıkça tahmin performansının azaldığını da göstermektedir. Veri ön işleme ve CFS'nin, genellikle makine öğrenimi algoritmalarının performansını artırdığı görülmüştür.
This thesis investigates the application of six machine learning algorithms to student performance prediction, using datasets made up of only students information available at the Atilim University administrative systems. In addition, these learning algorithms were compared using four measures: Accuracy, Precision, Recall and F-measure. The study also investigates whether the number of courses predicted together is directly or inversely proportional to the performance of the classifiers used. A measure of the effects of data preprocessing as well as Correlation based Feature Selection (CFS) on the learning algorithms was also conducted, respectively. The algorithms used are: Naive Bayes, Logistic Regression, Multilayer Perceptron, SMO (based on Support Vector Machines), IBk (K-Nearest Neighbor) and J48 (C4.5 Decision Tree). Naïve Bayes and IBk proved to be the best among the compared algorithms. The results also show that as the number of courses being predicted together increases, the prediction performance decreases. Data preprocessing and CFS are also found to generally improve the performance of the machine learning algorithms.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

0

End Page

95

Collections

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

2

ZERO HUNGER
ZERO HUNGER Logo

3

GOOD HEALTH AND WELL-BEING
GOOD HEALTH AND WELL-BEING Logo

5

GENDER EQUALITY
GENDER EQUALITY Logo

6

CLEAN WATER AND SANITATION
CLEAN WATER AND SANITATION Logo

11

SUSTAINABLE CITIES AND COMMUNITIES
SUSTAINABLE CITIES AND COMMUNITIES Logo

14

LIFE BELOW WATER
LIFE BELOW WATER Logo

15

LIFE ON LAND
LIFE ON LAND Logo

16

PEACE, JUSTICE AND STRONG INSTITUTIONS
PEACE, JUSTICE AND STRONG INSTITUTIONS Logo

17

PARTNERSHIPS FOR THE GOALS
PARTNERSHIPS FOR THE GOALS Logo