Kullanıcı Hikayelerinden Gereksinimlerin Oluşturulması İçin Büyük Dil Modellerinin Kullanımı
No Thumbnail Available
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Yapay zekâdaki son gelişmeler, Büyük Dil Modelleri'nin (BDM'ler) yazılım gereksinimi üretimi gibi karmaşık görevlerde kullanılmasını mümkün kılmıştır. Bu tez, yapılandırılmış istem kalıplarının, ChatGPT, Gemini, DeepSeek, Claude ve Qwen olmak üzere beş önde gelen LLM tarafından üretilen gereksinimlerin kalitesi üzerindeki etkisini incelemektedir. Değerlendirme; belirsizlik, tamlık, anlamsal benzerlik, okunabilirlik ve metinsel karmaşıklık gibi temel ölçütlere dayanmaktadır. Sonuçlar, yapılandırılmış istemlerin özellikle ChatGPT ve Gemini gibi modellerde çıktı kalitesini önemli ölçüde artırdığını göstermektedir. Qwen, yapılandırılmış istemler olmadan da güçlü bir performans sergilerken; DeepSeek, anlamsal tutarlılığı korumak için bu tür istemlere ihtiyaç duymakta, ancak okunabilirlik açısından yapılandırılmamış istemlerle daha iyi sonuçlar vermektedir. Öte yandan Claude, genel olarak en zayıf performansı göstermektedir. Bulgular, istem mühendisliğinin etkinliğini ve LLM'lerin yapılandırılmış girdilere olan farklı duyarlılıklarını ortaya koymaktadır.
Recent advances in artificial intelligence have enabled the application of LargeLanguage Models (LLMs) to complex tasks such as software requirements generation.This thesis explores the impact of structured prompt patterns on the quality ofrequirements produced by five leading LLMs: ChatGPT, Gemini, DeepSeek, Claude,and Qwen. The evaluation is based on key criteria including ambiguity, completeness,semantic similarity, readability, and textual complexity. Results show that structuredprompts significantly improve output quality for models like ChatGPT and Gemini.Qwen shows robust performance even without prompt structuring, whereas DeepSeekrequires prompt guidance to maintain semantic consistency but performs better inreadability without it. Claude, by contrast, delivers the weakest performance overall.The findings highlight both the effectiveness of prompt engineering and the varyingsensitivity of LLMs to structured input.
Recent advances in artificial intelligence have enabled the application of LargeLanguage Models (LLMs) to complex tasks such as software requirements generation.This thesis explores the impact of structured prompt patterns on the quality ofrequirements produced by five leading LLMs: ChatGPT, Gemini, DeepSeek, Claude,and Qwen. The evaluation is based on key criteria including ambiguity, completeness,semantic similarity, readability, and textual complexity. Results show that structuredprompts significantly improve output quality for models like ChatGPT and Gemini.Qwen shows robust performance even without prompt structuring, whereas DeepSeekrequires prompt guidance to maintain semantic consistency but performs better inreadability without it. Claude, by contrast, delivers the weakest performance overall.The findings highlight both the effectiveness of prompt engineering and the varyingsensitivity of LLMs to structured input.
Description
Keywords
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Turkish CoHE Thesis Center URL
Fields of Science
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
452
Collections
Google Scholar™
Sustainable Development Goals
3
GOOD HEALTH AND WELL-BEING

4
QUALITY EDUCATION

5
GENDER EQUALITY

7
AFFORDABLE AND CLEAN ENERGY

9
INDUSTRY, INNOVATION AND INFRASTRUCTURE

11
SUSTAINABLE CITIES AND COMMUNITIES

14
LIFE BELOW WATER

16
PEACE, JUSTICE AND STRONG INSTITUTIONS
