Platformdan bağımsız bir otomatik konuşma tanıma sisteminin tasarlanması ve uygulanması

Research Projects

Organizational Units

Organizational Unit
Department of Mechatronics Engineering
Our purpose in the program is to educate our students for contributing to universal knowledge by doing research on contemporary mechatronics engineering problems and provide them with design, production and publication skills. To reach this goal our post graduate students are offered courses in various areas of mechatronics engineering, encouraged to do research to develop their expertise and their creative side, as well as develop analysis and design skills.

Journal Issue

Abstract

Bu tez içerisinde, 50 kelime ile sınırlı bir ayrık kelimeli hece tabanlı konuşma tanıma sistemi tasarlanmış ve test edilmiştir. Türkçenin sondan eklemeli yapısından dolayı kelime tabanlı bir yaklaşımın konuşma tanıma performansı üzerinde negatif etkisi olacaktır. Bu sebepten ötürü fonem tabanlı yapılar konuşma tanıma içinde geniş biçimde kullanılmaktadır ancak fonemlerin küçük boyutları onların tanınmasını zorlaştırmaktadır. Bu nedenle, bu tezde hece tabanlı bir yaklaşımın takip edilmesine karar verilmiştir.Bu tez kapsamında bir hece tespit etme algoritması tasarlanmıştır. Mel Frekansı Kepstral Katsayıları özellik çıkarmak üzere seçilmiştir ve Yapay Sinir Ağları hecelerin sınıflandırılmasında kullanılmıştır. Son olarak, Yapay Sinir Ağlarının sonuçları hece tabanlı sistem için tasarlanan dil modeli içerisinde işlenmiştir.Tasarlanan sistem 5 farklı kişiden 50 kelime için alınan 10 örnekle eğitilmiş ve test edilmiştir. Sistem yaklaşık %85 konuşma tanıma performansı göstermiştir. Ayrıca sistem eğitilmemiş bir konuşmacı tarafından da test edilmiş ve %75 konuşma tanıma performansı elde edilmiştir.
In this thesis, an isolated word syllable based speech recognition system is designed and tested. The system is limited to 50 words in Turkish language. Because of the agglutinative nature of the Turkish language, a word based approach in speech recognition has a negative impact on system performance. For this reason, phoneme based structures are widely used in speech recognition but small unit size of phonemes introduces difficulty to their recognition. Hence it is decided to follow a syllable based approach in this thesis.In the scope of this study a syllable detection algorithm is designed. Mel Frequency Cepstral Coefficients are selected to extract features of the speech signal and Artificial Neural Networks are used to classify syllables. Finally, the results of the Artificial Neural Networks are processed in a language model which is designed for this syllable based system.The designed system is trained and tested with 10 samples of 5 different users for 50 different Turkish words. The system showed approximately 85% performance in recognition of speech. Moreover the system is tested for an untrained user and approximately 75% performance in recognition of speech is obtained.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering, Mekatronik Mühendisliği, Mechatronics Engineering

Turkish CoHE Thesis Center URL

Citation

WoS Q

Scopus Q

Source

Volume

Issue

Start Page

0

End Page

76