Kullanıcı Hikayelerinden Gereksinimlerin Oluşturulması İçin Büyük Dil Modellerinin Kullanımı

Loading...
Publication Logo

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Yapay zekâdaki son gelişmeler, Büyük Dil Modelleri'nin (BDM'ler) yazılım gereksinimi üretimi gibi karmaşık görevlerde kullanılmasını mümkün kılmıştır. Bu tez, yapılandırılmış istem kalıplarının, ChatGPT, Gemini, DeepSeek, Claude ve Qwen olmak üzere beş önde gelen LLM tarafından üretilen gereksinimlerin kalitesi üzerindeki etkisini incelemektedir. Değerlendirme; belirsizlik, tamlık, anlamsal benzerlik, okunabilirlik ve metinsel karmaşıklık gibi temel ölçütlere dayanmaktadır. Sonuçlar, yapılandırılmış istemlerin özellikle ChatGPT ve Gemini gibi modellerde çıktı kalitesini önemli ölçüde artırdığını göstermektedir. Qwen, yapılandırılmış istemler olmadan da güçlü bir performans sergilerken; DeepSeek, anlamsal tutarlılığı korumak için bu tür istemlere ihtiyaç duymakta, ancak okunabilirlik açısından yapılandırılmamış istemlerle daha iyi sonuçlar vermektedir. Öte yandan Claude, genel olarak en zayıf performansı göstermektedir. Bulgular, istem mühendisliğinin etkinliğini ve LLM'lerin yapılandırılmış girdilere olan farklı duyarlılıklarını ortaya koymaktadır.
Recent advances in artificial intelligence have enabled the application of LargeLanguage Models (LLMs) to complex tasks such as software requirements generation.This thesis explores the impact of structured prompt patterns on the quality ofrequirements produced by five leading LLMs: ChatGPT, Gemini, DeepSeek, Claude,and Qwen. The evaluation is based on key criteria including ambiguity, completeness,semantic similarity, readability, and textual complexity. Results show that structuredprompts significantly improve output quality for models like ChatGPT and Gemini.Qwen shows robust performance even without prompt structuring, whereas DeepSeekrequires prompt guidance to maintain semantic consistency but performs better inreadability without it. Claude, by contrast, delivers the weakest performance overall.The findings highlight both the effectiveness of prompt engineering and the varyingsensitivity of LLMs to structured input.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

452

Collections

Page Views

2

checked on Feb 09, 2026

Downloads

12

checked on Feb 09, 2026

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

SDG data could not be loaded because of an error. Please refresh the page or try again later.