Browsing by Author "Uslu, İbrahim Baran"
Now showing 1 - 11 of 11
- Results Per Page
- Sort Options
Article Citation - WoS: 0Citation - Scopus: 0Can Computers Read a Text With Stress?(Ahmet Yesevi Univ, 2013) Uslu, I. Baran; Demir, Nurettin; Ilk, H. Gokhan; Yilmaz, A. Egemen; Department of Electrical & Electronics EngineeringToday prosodic elements such as stress, intonation and melody can be examined through computer-assisted techniques. The identification and analysis of acoustic qualities provide significant clues as to the suprasegmental aspects of speech. In this study a system was designed to enable speech synthesis using a Turkish text. This synthesizer was used to analyze the melodic sructures of selected sentences. Any speech synthesized by a computer needs to be equipped with a melodic model so that it will sound natural to the ear. Within the context of this study a melodic model was also suggested, and the elements of this model were analyzed and discussed in terms of the rules of linguistics.Conference Object Citation - Scopus: 0A Data Collection System Design for Hand Gestures(Institute of Electrical and Electronics Engineers Inc., 2021) Akan,E.; Akagunduz,E.; Uslu,I.B.; Department of Electrical & Electronics EngineeringIn this study, we aim at designing a smart glove, which consists of different inertial sensors and an EMG sensor and developing a human-machine interaction application by pre-processing and fusing these different sensory data. We also aim at providing solutions in cases where image processing-based approaches are inefficient. In the proposed smart glove, the quaternion-based orientation data to be produced by the magnetometer and gyroscope together, the acceleration data to be generated by the accelerometer, and the analog data generated by the EMG sensor are collected and then prepared for use by different applications. © 2021 IEEE.Master Thesis El Hareketleri için Bir Veri Toplama Sistemi Tasarımı(2019) Akan, Erhan; Uslu, İbrahim Baran; Akagündüz, Erdem; Department of Electrical & Electronics EngineeringBu çalışmada, bir akıllı eldiven tasarımının yapılması, eldiven üzerindeki farklı ataletsel sensörler ve EMG sensörden veri toplanması, bu verilerin ön işlemeye tabi tutulması ve bu farklı sensör verilerinin kaynaştırılması yoluyla bir insan-makine etkileşimi uygulamasının geliştirilmesi amaçlanmaktadır. Böylelikle görüntü işleme temelli yaklaşımların kusurlu olduğu noktalarda çözümler sunulması hedeflenmektedir. Akıllı eldivende, manyetometre ve jiroskop tarafından üretilecek olan dördey bazlı oryantasyon verileri ile ivmeölçer tarafından üretilecek olan ivme verilerinin ve EMG Sensor tarafından üretilen analog verilerin, toplanması ve daha sonradan farklı uygulamalarca kullanılmasına hazırlık konusunda bir çalışma yapılmıştır.Article Eye Movement Controlled Peripherals for the Handicapped-Paralyzed People and Als Patients(2017) Uslu, İbrahim Baran; Arı, Fikret; Sümer, Emre; Türker, Mustafa; Department of Electrical & Electronics EngineeringControlling some devices in their daily life for the handicapped-paralyzed people and ALS (Amyotrophic Lateral Sclerosis) patients is an important challenge. In this study, a wearable system, called SmartEyes, is developed. The system is controlled by the eye movements of the user. With the help of this system, two groups of facilities are provided. The first is: communicating with predefined voiced messages, valuable especially for people who are unable to talk, and the second is: controlling some peripherals which are in the range around the user. The novelty of the developed system is that it navigates among the menus by means of the eye movements with the help of synthesized voice messages and without a need to sit across a monitor. In the control part, both the infrared (IR) and radio frequency (RF) wireless technologies were employed. The details of the peripheral control operations, namely: controlling the desk light, rolling curtain, TV, air conditioner and the sickbed, are explained in detail. The test results show that the system works quite satisfactorily in tracing and implementing the commands given by the user’s pupil gaze directions. We found that the overall satisfaction is quite high by yielding a total average survey score of 4.7 out of 5. We believe that the developed system offers a practical and efficient solution for making the lives of handicapped-paralyzed people and ALS patients easier. We carry on improving the skills of our SmartEyes systemMaster Thesis Gezgin İletişim Sistemlerinde Konuşma Kodlama Teknikleri(2017) Abulgasem, Saleh; Uslu, İbrahim Baran; Department of Electrical & Electronics EngineeringBu çalışmada, Doğrusal Öngörümlü Kodlama-10 (Linear Predictive Coding – LPC-10), Kod Uyarımlı Doğrusal Öngörüm (Code Excited Linear Prediction - CELP) ve Sentez ile Analiz (Analysis by Synthesis - AbS) konuşma kodlama yöntemleri, ses kalitesi, bit oran ve karmaşıklık açısından karşılaştırılmaktadır. Konuşma kalitesi açısından başarım karşılaştırması öznel dinleme testleriyle, yani MOS (Ortalama Görüş Skoru) testi ile yapılmıştır. Tüm benzetimler Matlab programında gerçekleştirilmiştir. Testlerde kullanılan konuşma sinyalleri temizdir (herhangi bir arkaplan gürültüsü içermemektedir). Sonuçlar göstermektedir ki, ses kalitesi açısından yöntemler içerisinde en başarılısı CELP yöntemidir. Diğer yandan; bit oranı ve işlem süresi (karmaşıklık) açısından LPC-10 yöntemi en iyi sonuçları vermektedir.Master Thesis Hava Trafik Kontrolörlerinin Stres Seviyelerinin Makine Öğrenme Teknikleriyle Algılanması(2020) Yılmaz, Evrim; Uslu, İbrahim Baran; Turhan, Uğur; Department of Electrical & Electronics EngineeringHava Trafik Kontrolünde olduğu gibi, iletişimin çoğunlukla ses üzerinden sağlandığı ve yoğun stresin iş kalitesini ve dolayısıyla da insan hayatını doğrudan etkileyebildiği koşullarda, stresin tespitinin makinalarla doğru bir şekilde anlaşılması, istenmeyen durumlar için önleyici tedbirler alınabilmesine olanak tanıyacaktır. Bu tez kapsamında, ses üzerinden özellikle mesleki stres altında olduğu düşünülen Hava Trafik Kontrolörlerinin, stres seviyelerinin ölçülmesi amaçlandı. Bu amaçla tez için benzersiz bir veri seti oluşturulup ses özellikleri çıkarıldı ve yapay sinir ağları ile farklı stres düzeylerinin algılanması için sınıflandırma çalışmaları gerçekleştirildi. Yapılan testler sonucunda 26 özellik seçilerek yapılan testlerde ortalama başarım, yapay sinir ağları kullanıldığında %31.2, destek vektör makinaları kullanıldığında ise %25.9'dır.Article Implementation of Turkish Text-To Synthesis on a Voice Synthesizer Card With Prosodic Features(2017) Tora, Hakan; Uslu, İbrahim Baran; Karamehmet, Timur; Department of Electrical & Electronics Engineering; Airframe and Powerplant MaintenanceThis study is on hardware implementation of the Turkish text-to-speech (TTS) synthesis with a voice synthesizer card. Here, a fully functional TTS system, capable of synthesizing every Turkish text, including abbreviations, numbers, etc. is designed and implemented. The system is additionally enriched by applying some prosodic attributes for more intelligible and natural speech production. A set of rules required for proper pronunciation and stress patterns are precisely defined in a lexicon utilized for synthesizing Turkish speech. Performance of the developed system is assessed by the Mean Opinion Score (MOS) test. An average score of 3.29 out of 5 is achieved.It indicates that the proposed synthesizer can be successfully integrated to many practical Turkish TTS applications.Article Citation - WoS: 0Citation - Scopus: 0A Rule Based Prosody Model for Turkish Text-To Synthesis(Univ Osijek, Tech Fac, 2013) Uslu, Ibrahim Baran; Ilk, Hakki Gokhan; Yilmaz, Asim Egemen; Department of Electrical & Electronics Engineering; Department of Electrical & Electronics EngineeringThis paper presents our novel prosody model in a Turkish text-to-speech synthesis (TTS) system. After developing a TTS system driven by parametric features consisting of duration, pitch and energy modifications, we try to figure out some prosody rules in order to increase the naturalness of our synthesizer. Since the inflected verbs in Turkish can be stand-alone sentences with the suffixes they take, we build a perceptual prosody model by defining rules on the stress patterns of verb inflections. Affirmative, negative and interrogative (both positive and negative) forms of many verbs were examined in a systematic way. Not only verbs, but in the same way, some phrases were examined for obtaining a proper prosody. According to the results of listening tests, the defined rules based on duration, pitch and energy modification weights, result in perceptually better speech synthesis, namely about 1,78/5,0 improvement in average in the CMOS (Comparative Mean Opinion Score) test. This improvement shows the success of our novel prosody model.Master Thesis Ses Kaynak Ayrıştırmasında Bağımsız Bileşen Analizi Yönteminin İncelenmesi(2022) Güler, Elif Ezgi; Uslu, İbrahim Baran; Department of Electrical & Electronics EngineeringÇalışmada, Ses kaynağı ayrıştırmada Bağımsız Bileşen Analizi metodu incelenmiştir. Bu yöntem, karışım sinyallerinde gözlenen kaynakların bilinmediği bir tür kör kaynak ayırma yöntemidir. Bilinmeyen bir karıştırma matrisi tarafından karıştırılan bağımsız sinyalleri çıkararak bir kokteyl partisi problemini çözmeye çalışıyoruz. ICA algoritmasının Gradient Ascent (ICA-GA), fastICA ve Kernel-ICA gibi bazı alt türleri vardır. Bu çalışmada ICA-GA algoritması üzerinde çalışıyoruz. Bu amaçla iki veya üç ses kaynağının birbirine karıştırıldığı farklı senaryolar incelenmiştir. Yapılan bazı testlerde ses ve gürültü sinyallerini net bir şekilde birbirinden ayırdık. Diğer testlerde ses sinyalleri ayrıldı. Deneylerde ղ (adım-boyutu) ve maksimum iterasyon sayısı parametreleri üzerinde duruldu, ayrıca parametrelerin ICA-GA algoritmasının performansı üzerindeki değeri de incelenmiştir. Kör kaynak ayırmada ICA yönteminin oldukça başarılı olduğunu elde ettik. Maksimum iterasyon parametresinin değerinin tek başına arttırılmasının performans için yeterli bir parametre olmadığı sonucuna varılmıştır. Çünkü maksimum iterasyon sayısı arttıkça algoritmanın çalışma süresi de arttığından geçen süre optimum değerde değildir. Tek başına adım büyüklüğü parametresinin değerini artırmanın algoritmanın performansı üzerinde maksimum yineleme parametresinin değerini tek başına artırmaya göre daha başarılı sonuçlar verdiğini söyleyebiliriz. Çalışma, her bir kaynak sinyalinin ve her bir çıkış sinyalinin korelasyon değerlerini kullanarak, ICA'nın çıkış sinyallerinin sırası hakkındaki belirsizliğine bir çözüm önermektedir.Master Thesis Türkçe ve İngilizce Arasında Nöral Makine Tercümesi(2021) Musa, Muhammad Amır; Uslu, İbrahim Baran; Department of Electrical & Electronics EngineeringMakine Öğreniminin doğru anlaşılması, Yapay Zeka için temel bir temel ve çok bilinen bir başlıktır. . Tüm dünyadaki dil engellerini ortadan kaldırmak için çok iyi bilinen bir araçtır. Bu tezde, Türkçe ve İngilizce arasındaki çeviri için bir Nöral model kurulmuş ve MATLAB'de gerçekleştirilmiş ve kendiliğinden bir deney gerçekleştirilmiştir.Deneyen nesnel ve öznel değerlendirmesi yapılmış ve elde edilen sonuçlar, sonuçlarin ve elde elde etmek için yan yana tutulmuştur. MATLAB kullanılarak dizelerin Türkçeden İngilizceye çeviri süreler elde edilmiş ve tez çalışmasında alıntılanmıştır tutulmuştur. Üç tür Sinir ağı için Matematikse modelleme gerçekleştirilmiştir ve öteleme tahmini, stokastik süreçler ve olasılıksal yöntemler kullanılarak yapılmıştırArticle Yalıtık Sözcüklü Bir Türkçe Konuşma Tanıma Sisteminin Yapay Veri Artırımı ile Tasarımı ve Gerçekleştirimi(2020) Uslu, İbrahim Baran; Tora, Hakan; Sümer, Emre; Türker, Mustafa; Department of Electrical & Electronics Engineering; Airframe and Powerplant MaintenanceBu çalışmada toplamda doksan iki adet sesli komuttan oluşan bir yalıtık sözcüklü Türkçe konuşmatanıma sistemi tasarlanmış ve gerçekleştirilmiştir. Sistem, destek vektör makinesi (SVM) tabanlı olup,eğitimde kullanılan veri kümesi kaydedilen konuşmaların yapay olarak çeşitlendirilip artırılmasıyla eldeedilmiştir. Farklı yapay veri oranlarının tanıma başarımı üzerindeki etkisi incelenmiştir. Akustik öznitelikolarak, mel frekansı kepstral katsayıları (MFCC) kullanılmıştır. Ayrıca, ses aktivitesi tespitinin ve MFCCkatsayılarının tanıma başarımına etkileri de irdelenmiştir. Sonuçta doksan iki yalıtık komut için ortalama%92.6’lık doğrulukla çalışan bir konuşma tanıma sistemi geliştirilmiştir