Tf-ıdf ve Pagerank Algoritmaları Kullanılarak Türkçe için Text Özetleme

dc.contributor.advisorTurhan, Çiğdem
dc.contributor.authorAkülker, Emre
dc.contributor.authorTurhan, Çiğdem
dc.contributor.authorTurhan, Çiğdem
dc.contributor.otherSoftware Engineering
dc.contributor.otherSoftware Engineering
dc.date.accessioned2024-07-07T12:50:20Z
dc.date.available2024-07-07T12:50:20Z
dc.date.issued2019
dc.departmentFen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
dc.description.abstractBilgi teknolojileri ve İnternet altyapısının gelişmesi ile birlikte kullanıcıların bilgiye ulaşması çok daha hızlı ve basit bir hale gelmiştir. Ancak, bu gelişmelerin bir başka sonucu da bilgi fazlalığına neden olması ve bunun sonucu olarak istenilen başlık altındaki bilgiye ulaşmanın gün be gün daha da zor bir hale gelmesidir. Otomatik Doküman Özetleme ile birlikte dokümanların içerisindeki ana bilginin korunması sağlanarak kullanıcıya istediği bilgiyi sağlamasına yardım edilmektedir. Bu tez, istatistiksel tabanlı TF-IDF algoritması ve TF-IDF ile grafik tabanlı PageRank algoritmasının birleşimi ile geliştirilen tekli otomatik doküman özetleme sisteminin sunumunu kapsar. Bu çalışma kullanılan algoritmaların Türkçe için uygulanabilirliği ve etkisinin ortaya çıkarımının gösterimini amaçlamaktadır. Ayrıca birbirinden ayrı olarak geliştirilen TF-IDF ve TF-IDF ile PageRank (hibrid) uygulamaları birbirleri ile kesinlik, hassasiyet ve F-puanı olarak karşılaştırılmıştır.
dc.description.abstractThe improvements on the information technologies and the Internet infrastructure have enabled the users to reach information in an easier and faster manner. However, another consequence of the improvements is the information overload. To reach the required information about a specific topic has become more difficult day by day. Automatic text summarization helps to solve the problem by minimizing the document size while keeping its core information required by the user. This thesis presents an extractive single document automatic text summarization system for Turkish, which implements the statistical-based TF-IDF algorithm as well as a hybrid approach which is a combination of TF-IDF with the graph-based PageRank algorithm. The study aims to reveal the usability and the effectiveness of these algorithms for Turkish documents. Moreover, TF-IDF and TF-IDF with PageRank (Hybrid) systems have been evaluated and compared with each other using the co-selection evaluation techniques precision, recall and F-score.en
dc.identifier.endpage129
dc.identifier.startpage0
dc.identifier.urihttps://hdl.handle.net/20.500.14411/5562
dc.identifier.yoktezid544361
dc.institutionauthorTurhan, Çiğdem
dc.language.isoen
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleTf-ıdf ve Pagerank Algoritmaları Kullanılarak Türkçe için Text Özetleme
dc.titleExtractive Text Summarization for Turkish Using Tf-Idf and Pagerank Algorithmsen_US
dc.typeMaster Thesis
dspace.entity.typePublication
relation.isAuthorOfPublicationdf768b22-7cc0-4650-882f-5af552c7a5f2
relation.isAuthorOfPublicationdf768b22-7cc0-4650-882f-5af552c7a5f2
relation.isAuthorOfPublicationdf768b22-7cc0-4650-882f-5af552c7a5f2
relation.isAuthorOfPublication.latestForDiscoverydf768b22-7cc0-4650-882f-5af552c7a5f2
relation.isOrgUnitOfPublicationd86bbe4b-0f69-4303-a6de-c7ec0c515da5
relation.isOrgUnitOfPublicationd86bbe4b-0f69-4303-a6de-c7ec0c515da5
relation.isOrgUnitOfPublication.latestForDiscoveryd86bbe4b-0f69-4303-a6de-c7ec0c515da5

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
544361 Extractive text summarization for Turkish using TF-IDF and pagerank algorithms.pdf
Size:
2.89 MB
Format:
Adobe Portable Document Format