Search Results

Now showing 1 - 2 of 2
  • Master Thesis
    Frekans Alanında Görüntü Sınıflandırma için Konvolüsyonel Sinir Ağlarının Uygulanması
    (2024) Dağı, Göktuğ Erdem; Gökçay, Erhan; Tora, Hakan
    Bu tezde, Evrişimsel Sinir Ağları (CNN'ler) son yıllarda çeşitli görüntü işleme ve bilgisayarlı görme görevlerinde dikkate değer başarılar elde etmiştir. Geleneksel CNN'ler doğrudan uzaysal alan görüntüleri üzerinde çalışır. Bununla birlikte, Hızlı Fourier Dönüşümü (FFT) yoluyla elde edilen görüntülerin frekans alanı gösterimi, piksel değerlerinin ilişkisizleştirilmesi ve hesaplama karmaşıklığında potansiyel azalma gibi benzersiz avantajlar sunar. Bu tez, görüntü sınıflandırmasını ve tanıma doğruluğunu artırmak için FFT ile dönüştürülmüş görüntülerin CNN algoritmalarına girdi olarak kullanılmasının etkilerini araştırmayı amaçlamaktadır. Araştırma, FFT'nin teorik temellerinin ve özelliklerinin kapsamlı bir incelemesiyle başlıyor. Daha sonra CNN'ler için ön işleme ardışık düzenlerinde FFT'nin entegrasyonunu araştırıyor. Giriş görüntülerini uzamsal alandan frekans alanına dönüştürerek, CNN'lerin en önemli frekans bileşenlerine odaklanarak daha verimli öğrenebileceğini, dolayısıyla yakınsama oranlarını ve genel performansı potansiyel olarak iyileştirebileceğini varsayıyoruz. Bunun etkinliğini değerlendirmek için CIFAR-10 (Kanada İleri Araştırma Enstitüsü), MNIST (Modifiye Ulusal Standartlar ve Teknoloji Enstitüsü)-Digits ve MNIST-Fashion dahil olmak üzere çeşitli kıyaslama veri setleri kullanılarak deneyler gerçekleştirildi. yaklaşmak. FFT ile dönüştürülmüş görüntüler çeşitli CNN mimarilerine beslendi ve sonuçlar, geleneksel uzaysal alan girdileri kullanılarak elde edilenlerle karşılaştırıldı. Sınıflandırma doğruluğu, eğitim süresi ve hesaplamalı kaynak kullanımı gibi ölçümler titizlikle analiz edildi. Sonuçlar, FFT tabanlı ön işlemenin, özellikle veri kümelerinin yüksek frekanslı gürültü veya gereksiz bilgi içerdiği senaryolarda, sınıflandırma doğruluğunda iyileştirmelere yol açabileceğini göstermektedir. Ancak faydaların farklı veri kümeleri ve ağ mimarileri arasında farklılık göstermesi, FFT ön işlemenin etkililiğinin bağlama bağlı olabileceğini düşündürmektedir. Sonuç olarak bu tez, FFT ön işlemesinin CNN iş akışlarına dahil edilmesinin görüntü işleme görevlerini geliştirme konusunda umut vaat ettiğini göstermektedir. Bulgular, hem uzaysal hem de frekans alanı bilgisinden yararlanan hibrit modellerin geliştirilmesi ve FFT tabanlı tekniklerin diğer sinir ağı türlerine ve makine öğrenimi algoritmalarına uygulanması da dahil olmak üzere gelecekteki araştırmalar için yollar önermektedir. Bu çalışma, bilgisayarlı görme alanını geliştirmek için frekans alanı analizinin derin öğrenme metodolojileriyle nasıl sinerjik olarak entegre edilebileceğinin daha geniş bir şekilde anlaşılmasına katkıda bulunmaktadır.
  • Master Thesis
    Doku ve Şekil Bazlı Özellikler Kullanarak Yüz İfadesi Tanımlama
    (2016) Gül, Nuray; Tora, Hakan
    Son zamanlarda, yüz ifadesi tanıma sistemleri (YİT), insan-makine etkileşimi uygulamaları (İME) için önemli bir role sahip olmuştur. Mevcut olan birçok sistemde, bir his tanımlanırken ya tüm yüze ait özellikler ya da yüzün bazı bölgelerine ait özellikler birleştirilerek kullanılmıştır. Bu çalışma ise her duygu tanımlanırken sadece bir uygun bölgenin kullanılmasını önermektedir ve böylece bu bölgelerin ayrı ayrı hisler üzerindeki etkilerinin ne olduğunu göstermeyi amaçlamaktadır. Sunulan tasarımda, Şaşkın ve Mutlu hislerinin ağız bölgesinin şekil özellikleri kullanılarak, diğer taraftan Korku, Öfke ve İğrenme hislerinin göz bölgesinin doku özellikleri kullanılarak tanımlanması hedeflenmiştir. Bu sebeple Fourier Tanımlayıcıları (FT) ve Yerel İkili Örüntüler (YİÖ) özellik vectörleri olarak çıkarılmış ve bu özellikler Yapay Sinir Ağları (YSA) kullanılarak sınıflandırılmıştır. Sistem, genişletilmiş Cohn-Kanade Veritabanı (CK+) üzerinde eğitilmiş ve tüm sistem için yaklaşık %88,9 başarım oranı elde edilmiştir.