Search Results

Now showing 1 - 8 of 8
  • Master Thesis
    Soyutlayıcı Özetlemek, Benzerlik, Gereklilik, ve Kabul Edilebilirliği Kullanan Kapsamlı Değerlendirme Metriği
    (2023) Al-brıman, Mohammed Khalıd Hılmı; Yıldız, Beytullah
    Uzun metinlerden otomatik olarak anlamlı özetler üretmek, birçok alanda büyük önem taşımaktadır. Transformer modeli gibi yeni sinir ağı mimarilerinin ortaya çıkması, kaliteli özetler üretebilen çok sayıda büyük dil modellerinin gelişmesine neden olmuştur. Fakat, özetleme modellerinin ürettiği özetler, önemli bir sorunu beraberinde getirmektedir. Özetleme modellerinin kalitesini ölçen, ROUGE gibi, standart otomatik değerlendirme metrikleri, kapsamlı bir değerlendirme yapmakta eksik kalmaktadır. Bu çalışmada, modeller tarafından üretilen ve insanlar tarafından yazılan örnek özetleri kullanan, SEAScore adlı yeni bir model tabanlı metrik sunuyoruz. Bu metrik, semantik benzerlik, doğal dil çıkarımı ve dilsel kabul edilebilirlik gibi çeşitli Doğal Dil İşleme yöntemlerini kullanır. Geliştirdiğimiz SEAScore metriği, daha önce eğitilmiş dil modelleri tarafından çıkarılan özellikleri kullanarak, özetleme modellerinin kalitelerini ölçen bir puan üretir. Bu tezde, üç tane özetleme modeli kullanarak yeni metriğimizin kalitesini ölçen deneyler yaptık. Deneysel sonuçlara göre, geliştirdiğimiz SEAScore metriği, bilinen standart metriklerine göre, insan tarafından üretilen değerlendirme puanları ile daha yüksek korelasyon sergileyerek başarılı sonuçlar sunmuştur.
  • Master Thesis
    Reklam Tıklama Tahmini için Takviyeli Öğrenme
    (2023) Haıder, Umaır; Yıldız, Beytullah
    Çevrimiçi reklamcılıkta kritik öneme sahip tıklama oranı (CTR) tahmini için geleneksel yöntemler, kullanıcı tercihlerinin dinamikliği ve reklamların alakasını kapsamada zorlanırken, yeni stratejilerin keşfini başarılı olanlarla dengeli bir şekilde sağlayan Thompson Örnekleme gibi takviyeli öğrenme (RL) algoritmaları, etkili bir çözüm sunar. Bu araştırmada, gerçek dünya reklam izlenimleri ve tıklamalarını simüle etmek için özel bir OpenAI Gym ortamını ve kullanıcı tercihlerinin ve reklamların alakasının sürekli değişimini ele alan dinamik CTR'yi tahmin etmek için bir Thompson Örnekleme uygulamasını içeren yeni bir RL tabanlı yaklaşım sunuyoruz. Bulgular, Thompson Örnekleme'nin CTR tahmininde, diğer RL stratejilerinden yaklaşık \%10 daha yüksek bir güven seviyesi ile, üstün bir performans sergilediğini ve bu sayede çevrimiçi reklam seçim süreçlerinin önemli ölçüde gelişebileceğini, böylece daha yüksek CTR'ler ve potansiyel olarak reklam yayıncıları için artan gelir sağlayabileceğini öne sürüyor.
  • Master Thesis
    Saldırı Tespiti için Takviyeli Öğrenme
    (2021) Saad, Ahmed Mohamed Saad Emam; Yıldız, Beytullah
    Bulut bilişim, web servisleri ve Nesnelerin İnterneti sistemleri gibi ağ tabanlı teknolojiler, esneklikleri ve üstünlükleri nedeniyle yaygın olarak kullanılmaktadır. Öte yandan, ağ tabanlı teknolojilerin katlanarak büyümesi, ağ güvenliği sorunlarının büyüklüğünü artırmaktadır. İzinsiz giriş, ağ tabanlı teknolojilerin güvenliğinin önemli bir parçasıdır. Sağlam bir saldırı tespit sistemi uygulamak, izinsiz giriş sorununu çözmek ve ağ tabanlı teknolojilerin ve hizmetlerin güvenli bir şekilde sunulmasını sağlamak için çok önemlidir. Bu tezde, izinsiz girişleri tespit etmek ve ağ uygulamalarını daha güvenli, güvenilir ve verimli hale getirmek için pekiştirmeli öğrenmeyi kullanan yeni bir yaklaşım öneriyoruz. Takviye öğrenme yaklaşımı olarak, ağ trafiği saldırılarını taklit eden ve öğrenme sürecine rehberlik eden, özel olarak uyarlanmış bir Gym ortamının yanında kullanılan derin Q-öğrenme kullanılmaktadır. Uzun-Kısa Süreli Bellek kullanan denetimli bir derin öğrenme çözümü, karşılaştırma için temel yaklaşım alarak uygulanmıştır. NSL-KDD veri kümesi, takviye öğrenme ortamını oluşturmak için kullanılmakta olup temel modeli eğitmek ve değerlendirmek için de kullanılır. Önerilen pekiştirmeli öğrenme yaklaşımının performans sonuçları, temel modele ve literatürdeki diğer çözümlere göre büyük bir üstünlük göstermektedir.
  • Master Thesis
    Soyutlayıcı Metin Özetlemesi Derin Öğrenme Kullanarak
    (2021) Abbas, Hanan Wahhab Abbas; Yıldız, Beytullah
    Özetleri otomatik olarak üretme yeteneği, çeşitli alanlarda verimliliğin yanı sıra bilginin yayılmasını ve elde tutulmasını iyileştirmeye yardımcı olabilir. Özetleme, soyutlamacı ve çıkarıcı olmak üzere temelde iki yaklaşım vardır. Ana fikirleri yakalamak için kaynak metnin kısa bir özetini oluşturma süreci olduğu için soyutlayıcı yaklaşım daha başarılı kabul edilir. Bu yaklaşımda, kaynak metinden oluşturulan özetler, orijinal metinde yer almayan yeni ifadeler ve cümleler içerebilir. Dikkate dayalı Tekrarlayan Sinir Ağları kodlayıcı-kod çözücü modellerinin kullanımı, özetleme ve makine çevirisi dahil olmak üzere dille ilgili çeşitli görevler için popüler olmuştur. Son zamanlarda, makine çevirisi alanında, Transformer modelinin Tekrarlayan Sinir Ağları tabanlı modelden üstün olduğu kanıtlanmıştır. Bu tezde, metin özetleme için geliştiril-miş bir kodlayıcı-kod çözücü Transformer modeli öneriyoruz. Temel model olarak, soyutlayıcı metin özetleme görevi için bir Tekrarlayan Sinir Ağları modelini olan Dikkatli Uzun Kısa Süreli Bellek kullandık. Bu çalışmanın değerlendirilmesi, ROUGE puanı kullanılarak otomatik olarak yapılmıştır. Deneysel sonuçlar, Transformer modelinin daha iyi bir özet ve daha yüksek bir ROUGE puanı sağladığını göstermektedir.
  • Master Thesis
    İhracat Miktarlarının Gelişmiş Zaman Serisi Tahmini İçin Transformatör Modellerinden Yararlanma
    (2024) Coşkun, Çağrı; Yıldız, Beytullah; Yazıcı, Ali
    Forecasting export amounts is crucial for small and medium-sized enterprises (SMEs) to remain competitive in global markets. Traditional machine learning methods often struggle with the complexities of multiple multivariate time-series analysis, where financial data is recorded annually for each company, showing irregular fluctuations and long-term dependencies. Address these challenges, we introduce a Transformer based approach for forecasting export amounts using annually repeated financial data. The Transformer model, with its advanced attention mechanisms, outperformed Random Forest and Long Short-Term Memory (LSTM) models on our dataset, which spans nine years for each enterprise. When the number of time points in the dataset was reduced, the Transformer model exhibited a significant drop in performance. However, its performance increased notably with the use of an extended time series, clearly showing that successful and impactful results require sufficiently long, feature rich time series, enhanced by effective feature engineering. These findings indicate that Transformer models can significantly improve the accuracy of forecasting complex time series based on financial data and offer valuable insights for SMEs and policymakers.
  • Master Thesis
    Alımla Zenginleştirişmiş Üretı̇mı̇n Gelı̇ştı̇rı̇lmesı̇: Gelı̇şmı̇ş Dı̇l Modelı̇ Yanıtları İçı̇n Belge Ayrımlarının ve Parametrelerı̇n Optı̇mı̇ze Edı̇lmesı̇
    (2024) Çelik, Cabir; Yıldız, Beytullah
    Doğal Dil İşleme (NLP) alanındaki son gelişmeler, özellikle de çeşitli alanlarda güçlü uygulamalar sunan Büyük Dil Modellerinin (LLM) ortaya çıkmasıyla oldukça heyecan vericidir. Bu tez, sağlık alanında etkili bir asistan oluşturmada LLM'leri desteklemek için Alımla-Zeninleştrilmiş Üretim (RAG) çerçevesinde bir iyileştirme sunmaktadır. Sağlıkla ilgili belge analizinde RAG süreçlerini geliştirmek için cümle duyarlı algoritmalarla döküman bölmeye odaklanılmaktadır. Araştırmada, seçilmiş kitaplardan oluşan bir veri kümesi kullanarak RAG'de cümle duyarlı döküman bölmelerin etkinliğini incelemektedir. Bu belgeler, derin öğrenme modelleri veya geleneksel karakter tabanlı bölme yöntemleri kullanılarak bölünmekte ve bir vektör veritabanında saklanmaktadır. Test için seçilen sorular Bölme Uzunluğu, Top K ve Pencere Boyutu gibi parametreler kullanılarak veritabanında sorgulandı ve benzer bölümler getirildi. Benzerlik puanları hesaplanarak en alakalı bölünmeler belirlenir. Sonuçlar, cümle duyarlı bölmenin geleneksel karakter tabanlı bölmeden daha iyi performans gösterdiğini ve Bölme Uzunluğu, Top K ve Pencere Boyutu gibi parametrelerin RAG performansını önemli ölçüde artırdığını göstermektedir
  • Master Thesis
    İhracat Miktarlarının Gelişmiş Zaman Serisi Tahmini için Transformatör Modellerinden Yararlanma
    (2024) Coşkun, Çağrı; Yıldız, Beytullah; Yazıcı, Ali
    İhracat miktarlarının tahmin edilmesi, küçük ve orta ölçekli işletmelerin (KOBİ'ler) küresel pazarlarda rekabetçi kalabilmesi için çok önemlidir. Geleneksel makine öğrenimi yöntemleri, finansal verilerin her şirket için yıllık olarak kaydedildiği, düzensiz dalgalanmalar ve uzun vadeli bağımlılıklar sergileyen çok değişkenli çoklu zaman serisi analizinin karmaşıklıklarıyla başa çıkmakta genellikle zorluk yaşar. Bu zorlukların üstesinden gelmek için, yıllık tekrar eden finansal verileri kullanarak ihracat miktarlarını tahmin etmek amacıyla Transformatör tabanlı bir yaklaşım sunuyoruz. Gelişmiş dikkat mekanizmalarına sahip Transformatör modeli, her bir işletmenin dokuz yıllık verisini içeren veri setimizde Rastgele Orman (Random Forest) ve Uzun Kısa Dönemli Bellek (LSTM) modellerinden daha iyi performans göstermiştir. Veri setindeki zaman noktalarının sayısı azaltıldığında Transformatör modelinde önemli bir performans düşüşü gözlemlenmiştir. Bununla beraber, genişletilmiş bir zaman serisi kullanıldığında performansının önemli ölçüde artması, başarılı ve etkili sonuçlar elde etmek için yeterince uzun, özellik açısından zengin zaman serilerine ve etkili özellik mühendisliğine ihtiyaç duyulduğunu açıkça göstermiştir.
  • Master Thesis
    Alımla Zenginleştirilmiş Üretimin Geliştirilmesi: Gelişmiş Dil Modeli Yanıtları İçin Belge Ayrımlarının ve Parametrelerin Optimize Edilmesi
    (2024) Çelik, Cabir; Yıldız, Beytullah
    Recent developments in Natural Language Processing (NLP) are very exciting, especially with the advent of Large Language Models (LLMs), which offer powerful applications in various domains. This thesis presents an enhancement of the Retrieval-Augmented Generation (RAG) framework to support LLMs in creating an effective health-related assistant. The focus is on sentence-aware splitting algorithms to improve RAG processes in healthcare document analysis. The research investigates the effectiveness of sentence-aware splitting in RAG using a dataset of questions and books. These documents are split into different lengths based on sentence awareness, using either deep learning models or traditional character-based methods, and stored in a vector database. For testing, questions are selected and relevant splits are retrieved from the database using parameters such as Split Length, Top K, and Window Size. Similarity scores are calculated to identify the most relevant splits. The results show that sentence-aware splitting outperforms traditional character-based splitting and that parameters such as Split Length, Top K, and Window Size significantly improve RAG performance.