Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama

dc.contributor.advisor Sezen, Arda
dc.contributor.author Shaıkh, Noman Ahmed
dc.date.accessioned 2024-12-05T20:52:35Z
dc.date.available 2024-12-05T20:52:35Z
dc.date.issued 2024
dc.department Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı / Bilgisayar Bilimleri Bilim Dalı
dc.description.abstract Kod hata ayıklama ve analizi zorlu bir görevdir. Özellikle otomatik olmayan hata yerelleştirme görevi kaynak tüketir ve hatanın kök nedenini belirlemek için önemli bir çaba gerektirir. Bu tezde, büyük dil modellerini kullanarak testsiz, otomatik satır seviyesi hata yerelleştirme incelenmiştir. Çalışmada, çift yönlü dikkat tabanlı mekanizma ve kod-anlama için önceden eğitilmiş büyük dil modelleri kullanıldı. Aynı zamanda büyük dil modellerinde girilen kodun satır seviyesi hatalılık puanlarını çıktı olarak vermesi için adaptör ayarlaması yapılmıştır. Ortaya çıkan model FLICoder olarak adlandırıldı. Farklı ayarlarla birden çok FLICoder modeli eğitildi ve mimarisinin çeşitli yönlerinin genel performans üzerindeki etkisi incelendi. FLICoder modeli ayrıca temel LLM tabanlı hata yerelleştirme çözümü ile karşılaştırılmış olup, FLICoder modelinin %25 - %52 iyileştirme gösterdiği tespit edilmiştir.
dc.description.abstract Code debugging and analysis is a challenging task. Specially the task of manual fault localization (FL) is resource-consuming and requires significant effort to identify the root cause of the fault. In this thesis, test-free, automatic line-level fault localization using large language models is explored. Different bidirectional attention-based code-understanding pre-trained large language models (CLMs) are used and adapter tuning is performed to fine-tune the CLM to output line-level faultiness scores of the input code. The resulting model is called FLICoder. Multiple FLICoder models with different settings are trained and the impact of various aspects of its architecture on its overall performance is investigated. The FLICoder model is also compared with the baseline LLM-based FL solution. The baseline is outperformed by FLICoder by 25% - 52%. en_US
dc.identifier.endpage 91
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5
dc.identifier.uri https://hdl.handle.net/20.500.14411/10359
dc.identifier.yoktez https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5
dc.identifier.yoktezid 894418
dc.identifier.yoktezid 894418
dc.language.iso en
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subject Computer Engineering and Computer Science and Control en_US
dc.title Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama
dc.title Analysis and Debugging of Code Samples Using Large Language Models en_US
dc.type Master Thesis
dspace.entity.type Publication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
894418.pdf
Size:
2.06 MB
Format:
Adobe Portable Document Format

Collections