Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama

dc.contributor.advisor Sezen, Arda
dc.contributor.author Shaıkh, Noman Ahmed
dc.contributor.other Computer Engineering
dc.contributor.other 06. School Of Engineering
dc.contributor.other 01. Atılım University
dc.date.accessioned 2024-12-05T20:52:35Z
dc.date.available 2024-12-05T20:52:35Z
dc.date.issued 2024
dc.description.abstract Kod hata ayıklama ve analizi zorlu bir görevdir. Özellikle otomatik olmayan hata yerelleştirme görevi kaynak tüketir ve hatanın kök nedenini belirlemek için önemli bir çaba gerektirir. Bu tezde, büyük dil modellerini kullanarak testsiz, otomatik satır seviyesi hata yerelleştirme incelenmiştir. Çalışmada, çift yönlü dikkat tabanlı mekanizma ve kod-anlama için önceden eğitilmiş büyük dil modelleri kullanıldı. Aynı zamanda büyük dil modellerinde girilen kodun satır seviyesi hatalılık puanlarını çıktı olarak vermesi için adaptör ayarlaması yapılmıştır. Ortaya çıkan model FLICoder olarak adlandırıldı. Farklı ayarlarla birden çok FLICoder modeli eğitildi ve mimarisinin çeşitli yönlerinin genel performans üzerindeki etkisi incelendi. FLICoder modeli ayrıca temel LLM tabanlı hata yerelleştirme çözümü ile karşılaştırılmış olup, FLICoder modelinin %25 - %52 iyileştirme gösterdiği tespit edilmiştir.
dc.description.abstract Code debugging and analysis is a challenging task. Specially the task of manual fault localization (FL) is resource-consuming and requires significant effort to identify the root cause of the fault. In this thesis, test-free, automatic line-level fault localization using large language models is explored. Different bidirectional attention-based code-understanding pre-trained large language models (CLMs) are used and adapter tuning is performed to fine-tune the CLM to output line-level faultiness scores of the input code. The resulting model is called FLICoder. Multiple FLICoder models with different settings are trained and the impact of various aspects of its architecture on its overall performance is investigated. The FLICoder model is also compared with the baseline LLM-based FL solution. The baseline is outperformed by FLICoder by 25% - 52%. en_US
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=UjlM15wKZGQW6TLC0pvCt5daZ1RHJSyUxrrdWmgLq84lTQTjdkFTpiXsTRFdQqW5
dc.identifier.uri https://hdl.handle.net/20.500.14411/10359
dc.language.iso en
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subject Computer Engineering and Computer Science and Control en_US
dc.title Büyük Dil Modellerini Kullanarak Kod Örneklerinin Analizi ve Hata Ayıklama
dc.title Analysis and Debugging of Code Samples Using Large Language Models en_US
dc.type Master Thesis
dspace.entity.type Publication
gdc.author.institutional Sezen, Arda
gdc.coar.type text::thesis::master thesis
gdc.description.department Fen Bilimleri Enstitüsü / Bilgisayar Bilimleri Ana Bilim Dalı / Bilgisayar Bilimleri Bilim Dalı
gdc.description.endpage 91
gdc.identifier.yoktezid 894418
gdc.identifier.yoktezid 894418
relation.isAuthorOfPublication 367853fe-83ca-445e-a3be-00c62fcb4e35
relation.isAuthorOfPublication.latestForDiscovery 367853fe-83ca-445e-a3be-00c62fcb4e35
relation.isOrgUnitOfPublication e0809e2c-77a7-4f04-9cb0-4bccec9395fa
relation.isOrgUnitOfPublication 4abda634-67fd-417f-bee6-59c29fc99997
relation.isOrgUnitOfPublication 50be38c5-40c4-4d5f-b8e6-463e9514c6dd
relation.isOrgUnitOfPublication.latestForDiscovery e0809e2c-77a7-4f04-9cb0-4bccec9395fa

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
894418.pdf
Size:
2.06 MB
Format:
Adobe Portable Document Format

Collections