Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama
dc.contributor.advisor | Sezen, Arda | |
dc.contributor.author | Shaıkh, Noman Ahmed | |
dc.date.accessioned | 2024-12-05T20:52:35Z | |
dc.date.available | 2024-12-05T20:52:35Z | |
dc.date.issued | 2024 | |
dc.department | Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı / Bilgisayar Bilimleri Bilim Dalı | |
dc.description.abstract | Kod hata ayıklama ve analizi zorlu bir görevdir. Özellikle otomatik olmayan hata yerelleştirme görevi kaynak tüketir ve hatanın kök nedenini belirlemek için önemli bir çaba gerektirir. Bu tezde, büyük dil modellerini kullanarak testsiz, otomatik satır seviyesi hata yerelleştirme incelenmiştir. Çalışmada, çift yönlü dikkat tabanlı mekanizma ve kod-anlama için önceden eğitilmiş büyük dil modelleri kullanıldı. Aynı zamanda büyük dil modellerinde girilen kodun satır seviyesi hatalılık puanlarını çıktı olarak vermesi için adaptör ayarlaması yapılmıştır. Ortaya çıkan model FLICoder olarak adlandırıldı. Farklı ayarlarla birden çok FLICoder modeli eğitildi ve mimarisinin çeşitli yönlerinin genel performans üzerindeki etkisi incelendi. FLICoder modeli ayrıca temel LLM tabanlı hata yerelleştirme çözümü ile karşılaştırılmış olup, FLICoder modelinin %25 - %52 iyileştirme gösterdiği tespit edilmiştir. | |
dc.description.abstract | Code debugging and analysis is a challenging task. Specially the task of manual fault localization (FL) is resource-consuming and requires significant effort to identify the root cause of the fault. In this thesis, test-free, automatic line-level fault localization using large language models is explored. Different bidirectional attention-based code-understanding pre-trained large language models (CLMs) are used and adapter tuning is performed to fine-tune the CLM to output line-level faultiness scores of the input code. The resulting model is called FLICoder. Multiple FLICoder models with different settings are trained and the impact of various aspects of its architecture on its overall performance is investigated. The FLICoder model is also compared with the baseline LLM-based FL solution. The baseline is outperformed by FLICoder by 25% - 52%. | en_US |
dc.identifier.endpage | 91 | |
dc.identifier.uri | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5 | |
dc.identifier.uri | https://hdl.handle.net/20.500.14411/10359 | |
dc.identifier.yoktez | https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5 | |
dc.identifier.yoktezid | 894418 | |
dc.language.iso | en | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama | |
dc.title | Analysis and Debugging of Code Samples Using Large Language Models | en_US |
dc.type | Master Thesis |