GCRIS :: Search

Search Results

Now showing 1 - 7 of 7

Citation - Scopus: 2
Detecting Errors in Automatic Image Captioning by Deep Learning;
(Institute of Electrical and Electronics Engineers Inc., 2021) Karakaya,M.
Automatic tagging of images is an important researcli topic in tlie field of image processing. Anotlier area similar to this is the automatic generation of picture captions. In this study, a deep learning model that automatically tags the pictures is used to detect errors in image captions. As a result of the initial experiments, it is observed that the proposed system can find up to 80% of the errors in the image captions. © 2021 IEEE
Citation - WoS: 5
Citation - Scopus: 8
Research on Pcb Defect Detection Using Artificial Intelligence: a Systematic Mapping Study
(Springer Heidelberg, 2024) Ural, Dogan Irmak; Sezen, Arda
SMT (Surface Mount Technology) has been the backbone of PCB (Printed Circuit Board) production for the last couple of decades. Even though the speed and accuracy of SMT have been drastically improved in the last decade, errors during production are still a very valid problem for the PCB industry. With the exponential rise of Artificial Intelligence in the last decade, the SMT industry was one of the most eager industries to use this new technology to detect possible defects during production. Lately, traditional image processing techniques started to lag behind methods such as machine learning and deep learning when the discussion came to the need of high accuracy. In this paper, we screen academic libraries to understand which of the latest methods and techniques are used in the domain and to deduce a general process for detecting defects in PCBs. During the research we have investigated research questions related to state-of-the-art methods, highly mentioned datasets, and sought after PCB defects. All findings and answers are mapped to be able to understand where this pursuit might point towards. From a total of 270 papers, 90 of them were addressed in detail and 78 papers were chosen for this systematic mapping.
Görüntü Bölütlemede Filtreleme ve Örnekleme Önişleme Adımlarının İncelenmesi
(2013) Çamalan, Seda; Koyuncu, Murat
Bir resimden anlamsal veri çıkarımı için bir işlemler serisi uygulanır ve bu işlerden biri de görüntü segmentasyonudur. Görüntü segmentasyonu, görüntüyü her bir parça renk ve desen gibi benzer parçalar olacak şekilde küçük parçalara (segmentlere) ayırır. Bu tezde, önişlem yöntemlerinin resim segmentasyonu üzerine etkileri farklı açılardan incelenmiştir. İlk olarak, ön işlem metotlarından biri olan Peer Group Filtering görüntüler üzerine uygulanmış ve görüntü segmentasyonu üzerine etkileri incelenmiştir. Peer Group Filtering algoritması resimdeki gürültüleri yok etmek ve resimdeki renk değişikliklerini düzeltmek için kullanılmaktadır. İkinci olarak, diğer bir görüntü segmentasyonu ön işlemi olan Lloyd?s örnekleme algoritması uygulanmış ve görüntü segmentasyonuna katkısı incelenmiştir. Llody?s örnekleme algoritması görüntüdeki renk sayısını azaltılmaktadır. Son olarak, iki farklı segmentasyon algoritması (fast scanning ve JSEG algoritması) ön işlemden geçmiş görüntüler kullanılarak karşılaştırılmıştır. Çalışmada, doğal ve sentetik görüntüler deneysel olarak test edilmiştir. Sonuçlar açıkça gösteriyor ki, Peer Group Filtering ön işleminden sonra, segmentasyon başarısı artmış, segmentasyon çalışma süresi azalmıştır. Diğer taraftan, örneklemeyle ilgili deney sonuçlarına göre Lloyd?s örnekleme algoritmasından yararlanmakta örnekleme seviyesi seçimi çok önemlidir. Eğer doğru örnekleme seviyesi seçilirse, örnekleme segmentasyon işlemine yardımcı olmaktadır.
Frekans Alanında Görüntü Sınıflandırma için Konvolüsyonel Sinir Ağlarının Uygulanması
(2024) Dağı, Göktuğ Erdem; Gökçay, Erhan; Tora, Hakan
Bu tezde, Evrişimsel Sinir Ağları (CNN'ler) son yıllarda çeşitli görüntü işleme ve bilgisayarlı görme görevlerinde dikkate değer başarılar elde etmiştir. Geleneksel CNN'ler doğrudan uzaysal alan görüntüleri üzerinde çalışır. Bununla birlikte, Hızlı Fourier Dönüşümü (FFT) yoluyla elde edilen görüntülerin frekans alanı gösterimi, piksel değerlerinin ilişkisizleştirilmesi ve hesaplama karmaşıklığında potansiyel azalma gibi benzersiz avantajlar sunar. Bu tez, görüntü sınıflandırmasını ve tanıma doğruluğunu artırmak için FFT ile dönüştürülmüş görüntülerin CNN algoritmalarına girdi olarak kullanılmasının etkilerini araştırmayı amaçlamaktadır. Araştırma, FFT'nin teorik temellerinin ve özelliklerinin kapsamlı bir incelemesiyle başlıyor. Daha sonra CNN'ler için ön işleme ardışık düzenlerinde FFT'nin entegrasyonunu araştırıyor. Giriş görüntülerini uzamsal alandan frekans alanına dönüştürerek, CNN'lerin en önemli frekans bileşenlerine odaklanarak daha verimli öğrenebileceğini, dolayısıyla yakınsama oranlarını ve genel performansı potansiyel olarak iyileştirebileceğini varsayıyoruz. Bunun etkinliğini değerlendirmek için CIFAR-10 (Kanada İleri Araştırma Enstitüsü), MNIST (Modifiye Ulusal Standartlar ve Teknoloji Enstitüsü)-Digits ve MNIST-Fashion dahil olmak üzere çeşitli kıyaslama veri setleri kullanılarak deneyler gerçekleştirildi. yaklaşmak. FFT ile dönüştürülmüş görüntüler çeşitli CNN mimarilerine beslendi ve sonuçlar, geleneksel uzaysal alan girdileri kullanılarak elde edilenlerle karşılaştırıldı. Sınıflandırma doğruluğu, eğitim süresi ve hesaplamalı kaynak kullanımı gibi ölçümler titizlikle analiz edildi. Sonuçlar, FFT tabanlı ön işlemenin, özellikle veri kümelerinin yüksek frekanslı gürültü veya gereksiz bilgi içerdiği senaryolarda, sınıflandırma doğruluğunda iyileştirmelere yol açabileceğini göstermektedir. Ancak faydaların farklı veri kümeleri ve ağ mimarileri arasında farklılık göstermesi, FFT ön işlemenin etkililiğinin bağlama bağlı olabileceğini düşündürmektedir. Sonuç olarak bu tez, FFT ön işlemesinin CNN iş akışlarına dahil edilmesinin görüntü işleme görevlerini geliştirme konusunda umut vaat ettiğini göstermektedir. Bulgular, hem uzaysal hem de frekans alanı bilgisinden yararlanan hibrit modellerin geliştirilmesi ve FFT tabanlı tekniklerin diğer sinir ağı türlerine ve makine öğrenimi algoritmalarına uygulanması da dahil olmak üzere gelecekteki araştırmalar için yollar önermektedir. Bu çalışma, bilgisayarlı görme alanını geliştirmek için frekans alanı analizinin derin öğrenme metodolojileriyle nasıl sinerjik olarak entegre edilebileceğinin daha geniş bir şekilde anlaşılmasına katkıda bulunmaktadır.
Kolektif Derin Öğrenme ve Transfer Öğrenme Yoluyla Mahsul ve Meyve Sınıflandırması
(2023) Daşkın, Zeynep Dilan; Khan, Muhammad Umer
Son yıllarda yapılan teknolojik gelişmeler, tarım sektörünü hızlı bir şekilde yeniden şekillendirerek, daha önce kullanılmakta olan geleneksel metotlarda devrim yaratıyor ve insanlık için daha sürdürülebilir ve üretken bir geleceğin yolunu açıyor. Tarım sektörü, makine öğrenmesi, sensor ve mekanizmaları kullanarak otomatikleşirken, aynı zamanda verimlilik artımı, kaynak yönetimi ve mahsul sağlığı açısından da köklü bir değişim yaşıyor. Bu tez çalışmasında, son teknoloji makine öğrenimi tabanlı görüntü işleme teknikleri ve algoritmaları kapsamlı bir şekilde araştırılmış ve analiz edilmiştir. Amaç, çeşitli mahsulleri, meyveleri ve sebzeleri doğru bir şekilde tespit eden, tanımlayan ve sınıflandıran sağlam metodolojiler geliştirmektir. Nihai hedef, gelişen tarımsal otomasyon endüstrisine önemli ölçüde katkıda bulunmak, süreçleri kolaylaştırmak ve tarım sektöründe verimliliği arttırmaktır. Gerçek yaşam koşullarına en yakın sonuçları elde etmek için, yazarların kendi oluşturduğu mahsul veri kümeleri bu araştırma boyunca önerilen algoritmalara entegre edilmiş ve kullanılmıştır. Bu çalışma sırasında kullanılan mevcut Evrişimsel Sinir Ağları algoritmaları AlexNet, GoogleNet, InceptionV3, SqueezeNet, DenseNet ve VGG-16'dır. Bu çalışmada, doğruluk, kayıp, F1-skoru, tahmin, kesinlik ve duyarlılık olmak üzere genel değerlendirme metriklerinin performansını yükseltmek için çeşitli gelişmiş algoritmalar araştırılmış ve incelenmiştir. Özellikle, tarımsal otomasyon sisteminin etkinliğini ve güvenilirliğini arttırmayı amaçlayan Kolektif Öğrenme ve Öğrenme Aktarımı adlı iki metot tanıtılmış ve kapsamlı bir şekilde analiz edilmiştir. Çalışmanın sonuçları, önerilen algoritmaların tarım endüstrisinde son derece etkili olduğunu ve istenen sonuçları benzersiz bir doğruluk ve hassasiyetle sunma yeteneklerini kanıtlamaktadır. Bu sonuçlar, bu algoritmaların operasyonel verimliliği önemli ölçüde arttırma, kaynak tahsisini optimize etme ve gelecek için tarımsal otomasyonda sürdürülebilir uygulamaları teşvik etme gibi potansiyellerini de göstermekte ve teyit etmektedir.
Citation - WoS: 85
Citation - Scopus: 133
Detecting Cassava Mosaic Disease Using a Deep Residual Convolutional Neural Network With Distinct Block Processing
(Peerj inc, 2021) Oyewola, David Opeoluwa; Dada, Emmanuel Gbenga; Misra, Sanjay; Damasevicius, Robertas
For people in developing countries, cassava is a major source of calories and carbohydrates. However, Cassava Mosaic Disease (CMD) has become a major cause of concern among farmers in sub-Saharan Africa countries, which rely on cassava for both business and local consumption. The article proposes a novel deep residual convolution neural network (DRNN) for CMD detection in cassava leaf images. With the aid of distinct block processing, we can counterbalance the imbalanced image dataset of the cassava diseases and increase the number of images available for training and testing. Moreover, we adjust low contrast using Gamma correction and decorrelation stretching to enhance the color separation of an image with significant band-to-band correlation. Experimental results demonstrate that using a balanced dataset of images increases the accuracy of classification. The proposed DRNN model outperforms the plain convolutional neural network (PCNN) by a significant margin of 9.25% on the Cassava Disease Dataset from Kaggle.
Derin Öğrenme ve Anlamsal Ağ Teknolojilerini Kullanarak Görüntü Açıklaması
(2021) Sezen, Arda; Turhan, Çiğdem; Şengül, Gökhan
Bu tezde, görüntü açıklama alanında görüntü tanımı çıkarımını içeren bilişsel görev için hibrit bir çözüm önerilmektedir. Sinir Ağları ile ilgili önceki çalışmalar çoğunlukla doğru etiketleri seçmeye ve/veya bir resmi tasvir etmek için ilgili etiketlerin sayısını artırmaya odaklandı. Ancak, bir resmi tanımlamak için bir dizi ilgili etiket oluşturmak ve bu resmi cümleler yoluyla tasvir etmek yapısal, sözdizimsel ve anlamsal olarak tamamen farklı olgulardır. Bu çalışmada spor alanındaki görüntülerin kontrollü bir ortamda doğal dil tanımlarını oluşturan bir çerçeve sunulmaktadır. Yaklaşımımız, görüntülerin cümle açıklamalarını oluşturmak için Yapay Zeka ve Ontolojilerden yararlanmaktadır. Geliştirilen çerçeve, derin öğrenme modellerinin ve ontoloji sınıflarının örneklerinden türetilen hizalı açıklama sonuçlarının yeni bir kombinasyonunu sunmaktadır.

Filters

Settings

Sort By

Results per page

Search Results