Kullanıcı Hikayelerinden Gereksinimlerin Oluşturulması İçin Büyük Dil Modellerinin Kullanımı

No Thumbnail Available

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Yapay zekâdaki son gelişmeler, Büyük Dil Modelleri'nin (BDM'ler) yazılım gereksinimi üretimi gibi karmaşık görevlerde kullanılmasını mümkün kılmıştır. Bu tez, yapılandırılmış istem kalıplarının, ChatGPT, Gemini, DeepSeek, Claude ve Qwen olmak üzere beş önde gelen LLM tarafından üretilen gereksinimlerin kalitesi üzerindeki etkisini incelemektedir. Değerlendirme; belirsizlik, tamlık, anlamsal benzerlik, okunabilirlik ve metinsel karmaşıklık gibi temel ölçütlere dayanmaktadır. Sonuçlar, yapılandırılmış istemlerin özellikle ChatGPT ve Gemini gibi modellerde çıktı kalitesini önemli ölçüde artırdığını göstermektedir. Qwen, yapılandırılmış istemler olmadan da güçlü bir performans sergilerken; DeepSeek, anlamsal tutarlılığı korumak için bu tür istemlere ihtiyaç duymakta, ancak okunabilirlik açısından yapılandırılmamış istemlerle daha iyi sonuçlar vermektedir. Öte yandan Claude, genel olarak en zayıf performansı göstermektedir. Bulgular, istem mühendisliğinin etkinliğini ve LLM'lerin yapılandırılmış girdilere olan farklı duyarlılıklarını ortaya koymaktadır.
Recent advances in artificial intelligence have enabled the application of LargeLanguage Models (LLMs) to complex tasks such as software requirements generation.This thesis explores the impact of structured prompt patterns on the quality ofrequirements produced by five leading LLMs: ChatGPT, Gemini, DeepSeek, Claude,and Qwen. The evaluation is based on key criteria including ambiguity, completeness,semantic similarity, readability, and textual complexity. Results show that structuredprompts significantly improve output quality for models like ChatGPT and Gemini.Qwen shows robust performance even without prompt structuring, whereas DeepSeekrequires prompt guidance to maintain semantic consistency but performs better inreadability without it. Claude, by contrast, delivers the weakest performance overall.The findings highlight both the effectiveness of prompt engineering and the varyingsensitivity of LLMs to structured input.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

End Page

452

Collections

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

3

GOOD HEALTH AND WELL-BEING
GOOD HEALTH AND WELL-BEING Logo

4

QUALITY EDUCATION
QUALITY EDUCATION Logo

5

GENDER EQUALITY
GENDER EQUALITY Logo

7

AFFORDABLE AND CLEAN ENERGY
AFFORDABLE AND CLEAN ENERGY Logo

9

INDUSTRY, INNOVATION AND INFRASTRUCTURE
INDUSTRY, INNOVATION AND INFRASTRUCTURE Logo

11

SUSTAINABLE CITIES AND COMMUNITIES
SUSTAINABLE CITIES AND COMMUNITIES Logo

14

LIFE BELOW WATER
LIFE BELOW WATER Logo

16

PEACE, JUSTICE AND STRONG INSTITUTIONS
PEACE, JUSTICE AND STRONG INSTITUTIONS Logo