Yazıcı, AliKaralar, Melis Tuğba2026-01-052026-01-052025https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=CtwiQkYvArAb95Ufpfs_vtz-QvitdbeuD22K5m_snE8ZrlAqX-oarGAWoyNtfK_lhttps://hdl.handle.net/20.500.14411/11081Yapay zekâdaki son gelişmeler, Büyük Dil Modelleri'nin (BDM'ler) yazılım gereksinimi üretimi gibi karmaşık görevlerde kullanılmasını mümkün kılmıştır. Bu tez, yapılandırılmış istem kalıplarının, ChatGPT, Gemini, DeepSeek, Claude ve Qwen olmak üzere beş önde gelen LLM tarafından üretilen gereksinimlerin kalitesi üzerindeki etkisini incelemektedir. Değerlendirme; belirsizlik, tamlık, anlamsal benzerlik, okunabilirlik ve metinsel karmaşıklık gibi temel ölçütlere dayanmaktadır. Sonuçlar, yapılandırılmış istemlerin özellikle ChatGPT ve Gemini gibi modellerde çıktı kalitesini önemli ölçüde artırdığını göstermektedir. Qwen, yapılandırılmış istemler olmadan da güçlü bir performans sergilerken; DeepSeek, anlamsal tutarlılığı korumak için bu tür istemlere ihtiyaç duymakta, ancak okunabilirlik açısından yapılandırılmamış istemlerle daha iyi sonuçlar vermektedir. Öte yandan Claude, genel olarak en zayıf performansı göstermektedir. Bulgular, istem mühendisliğinin etkinliğini ve LLM'lerin yapılandırılmış girdilere olan farklı duyarlılıklarını ortaya koymaktadır.Recent advances in artificial intelligence have enabled the application of LargeLanguage Models (LLMs) to complex tasks such as software requirements generation.This thesis explores the impact of structured prompt patterns on the quality ofrequirements produced by five leading LLMs: ChatGPT, Gemini, DeepSeek, Claude,and Qwen. The evaluation is based on key criteria including ambiguity, completeness,semantic similarity, readability, and textual complexity. Results show that structuredprompts significantly improve output quality for models like ChatGPT and Gemini.Qwen shows robust performance even without prompt structuring, whereas DeepSeekrequires prompt guidance to maintain semantic consistency but performs better inreadability without it. Claude, by contrast, delivers the weakest performance overall.The findings highlight both the effectiveness of prompt engineering and the varyingsensitivity of LLMs to structured input.enBilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolComputer Engineering and Computer Science and ControlKullanıcı Hikayelerinden Gereksinimlerin Oluşturulması İçin Büyük Dil Modellerinin KullanımıUse of Large Language Models for the Generation of Requirements from User StoriesMaster Thesis