Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama

Shaıkh, Noman Ahmed

Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama

dc.contributor.advisor	Sezen, Arda
dc.contributor.author	Shaıkh, Noman Ahmed
dc.date.accessioned	2024-12-05T20:52:35Z
dc.date.available	2024-12-05T20:52:35Z
dc.date.issued	2024
dc.department	Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı / Bilgisayar Bilimleri Bilim Dalı
dc.description.abstract	Kod hata ayıklama ve analizi zorlu bir görevdir. Özellikle otomatik olmayan hata yerelleştirme görevi kaynak tüketir ve hatanın kök nedenini belirlemek için önemli bir çaba gerektirir. Bu tezde, büyük dil modellerini kullanarak testsiz, otomatik satır seviyesi hata yerelleştirme incelenmiştir. Çalışmada, çift yönlü dikkat tabanlı mekanizma ve kod-anlama için önceden eğitilmiş büyük dil modelleri kullanıldı. Aynı zamanda büyük dil modellerinde girilen kodun satır seviyesi hatalılık puanlarını çıktı olarak vermesi için adaptör ayarlaması yapılmıştır. Ortaya çıkan model FLICoder olarak adlandırıldı. Farklı ayarlarla birden çok FLICoder modeli eğitildi ve mimarisinin çeşitli yönlerinin genel performans üzerindeki etkisi incelendi. FLICoder modeli ayrıca temel LLM tabanlı hata yerelleştirme çözümü ile karşılaştırılmış olup, FLICoder modelinin %25 - %52 iyileştirme gösterdiği tespit edilmiştir.
dc.description.abstract	Code debugging and analysis is a challenging task. Specially the task of manual fault localization (FL) is resource-consuming and requires significant effort to identify the root cause of the fault. In this thesis, test-free, automatic line-level fault localization using large language models is explored. Different bidirectional attention-based code-understanding pre-trained large language models (CLMs) are used and adapter tuning is performed to fine-tune the CLM to output line-level faultiness scores of the input code. The resulting model is called FLICoder. Multiple FLICoder models with different settings are trained and the impact of various aspects of its architecture on its overall performance is investigated. The FLICoder model is also compared with the baseline LLM-based FL solution. The baseline is outperformed by FLICoder by 25% - 52%.	en_US
dc.identifier.endpage	91
dc.identifier.uri	https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5
dc.identifier.uri	https://hdl.handle.net/20.500.14411/10359
dc.identifier.yoktez	https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5
dc.identifier.yoktezid	894418
dc.identifier.yoktezid	894418
dc.language.iso	en
dc.subject	Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subject	Computer Engineering and Computer Science and Control	en_US
dc.title	Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama
dc.title	Analysis and Debugging of Code Samples Using Large Language Models	en_US
dc.type	Master Thesis
dspace.entity.type	Publication

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 894418.pdf
Size:: 2.06 MB
Format:: Adobe Portable Document Format

Download

Collections

Master Tezler