Platformdan Bağımsız Bir Otomatik Konuşma Tanıma Sisteminin Tasarlanması ve Uygulanması

dc.contributor.advisorErden, Abdulkadir
dc.contributor.advisorTora, Hakan
dc.contributor.authorUrgun, Doğan
dc.contributor.otherDepartment of Mechatronics Engineering
dc.date.accessioned2024-07-07T12:42:06Z
dc.date.available2024-07-07T12:42:06Z
dc.date.issued2012
dc.departmentFen Bilimleri Enstitüsü / Mekatronik Mühendisliği Ana Bilim Dalı
dc.description.abstractBu tez içerisinde, 50 kelime ile sınırlı bir ayrık kelimeli hece tabanlı konuşma tanıma sistemi tasarlanmış ve test edilmiştir. Türkçenin sondan eklemeli yapısından dolayı kelime tabanlı bir yaklaşımın konuşma tanıma performansı üzerinde negatif etkisi olacaktır. Bu sebepten ötürü fonem tabanlı yapılar konuşma tanıma içinde geniş biçimde kullanılmaktadır ancak fonemlerin küçük boyutları onların tanınmasını zorlaştırmaktadır. Bu nedenle, bu tezde hece tabanlı bir yaklaşımın takip edilmesine karar verilmiştir.Bu tez kapsamında bir hece tespit etme algoritması tasarlanmıştır. Mel Frekansı Kepstral Katsayıları özellik çıkarmak üzere seçilmiştir ve Yapay Sinir Ağları hecelerin sınıflandırılmasında kullanılmıştır. Son olarak, Yapay Sinir Ağlarının sonuçları hece tabanlı sistem için tasarlanan dil modeli içerisinde işlenmiştir.Tasarlanan sistem 5 farklı kişiden 50 kelime için alınan 10 örnekle eğitilmiş ve test edilmiştir. Sistem yaklaşık %85 konuşma tanıma performansı göstermiştir. Ayrıca sistem eğitilmemiş bir konuşmacı tarafından da test edilmiş ve %75 konuşma tanıma performansı elde edilmiştir.
dc.description.abstractIn this thesis, an isolated word syllable based speech recognition system is designed and tested. The system is limited to 50 words in Turkish language. Because of the agglutinative nature of the Turkish language, a word based approach in speech recognition has a negative impact on system performance. For this reason, phoneme based structures are widely used in speech recognition but small unit size of phonemes introduces difficulty to their recognition. Hence it is decided to follow a syllable based approach in this thesis.In the scope of this study a syllable detection algorithm is designed. Mel Frequency Cepstral Coefficients are selected to extract features of the speech signal and Artificial Neural Networks are used to classify syllables. Finally, the results of the Artificial Neural Networks are processed in a language model which is designed for this syllable based system.The designed system is trained and tested with 10 samples of 5 different users for 50 different Turkish words. The system showed approximately 85% performance in recognition of speech. Moreover the system is tested for an untrained user and approximately 75% performance in recognition of speech is obtained.en
dc.identifier.endpage76
dc.identifier.startpage0
dc.identifier.urihttps://hdl.handle.net/20.500.14411/4574
dc.identifier.yoktezid354499
dc.institutionauthorUrgun, Doğan
dc.institutionauthorErden, Abdulkadir
dc.language.isoen
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
dc.subjectElektrik ve Elektronik Mühendisliği
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectElectrical and Electronics Engineeringen_US
dc.subjectMekatronik Mühendisliği
dc.subjectMechatronics Engineeringen_US
dc.titlePlatformdan Bağımsız Bir Otomatik Konuşma Tanıma Sisteminin Tasarlanması ve Uygulanması
dc.titleDesign and Implementation of a Platform Independent Automatic Speech Recognition Systemen_US
dc.typeMaster Thesis
dspace.entity.typePublication
relation.isAuthorOfPublication80dd46f2-3782-4bd8-b89c-d176ac997cf4
relation.isAuthorOfPublicationb1d347a1-acc1-40d8-a952-d0431244966a
relation.isAuthorOfPublication.latestForDiscovery80dd46f2-3782-4bd8-b89c-d176ac997cf4
relation.isOrgUnitOfPublicatione2a6d0b1-378e-4532-82b1-d17cabc56744
relation.isOrgUnitOfPublication.latestForDiscoverye2a6d0b1-378e-4532-82b1-d17cabc56744

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
354499 Design and implementation of a platform independent automatic speech recognition system.pdf
Size:
1.12 MB
Format:
Adobe Portable Document Format