Hoparlör Bağımsız İzolasyonlu Rakam Tanıma

dc.contributor.advisor Tora, Hakan
dc.contributor.author Hamıd, Mohammed Saeed
dc.contributor.other Airframe and Powerplant Maintenance
dc.contributor.other 13. School of Civil Aviation (4-Year)
dc.contributor.other 01. Atılım University
dc.date.accessioned 2024-07-07T12:49:20Z
dc.date.available 2024-07-07T12:49:20Z
dc.date.issued 2020
dc.description.abstract Çeşitli konuşma sinyali işleme uygulamalarında VAD, bir ses akışını konuşma etkinliği ve konuşmanın olmadığı zaman aralıklarını içeren zaman aralıklarına bölmek için önemli bir karakter sunar. Bu araştırmada, izole kelime tanıma ile ilgili yeni bir yaklaşım sunduk. İlk aşamada, ses etkinliği algılama (VAD) problem kırma penceresi, Bohman işlevi ve Bartlett-Hann işlevi için üç işlev uygulanmıştır. Hem Bohman fonksiyonu hem de Bartlett-Hann fonksiyonu VAD problemi için önceki çalışmalarda uygulanmamıştır. Öte yandan, perde, MFCC'ler ve enerji, özellik çıkarma teknikleri olarak uygulanır ve bu iki yöntemin yeni yaklaşımlar olduğu SOFTMAX ile birleştirilir. Pitch tabanlı SOFTMAX, SOFTMAX'a bağlanan ve yedi kelimeye göre sınıflandırılan ve% 85 doğrulukla özelliklerle çıkarılan olağanüstü sonuçlar sundu. Ayrıca enerji, özellik çıkarma ve SOFTMAX'a bağlanan bu fonksiyonun çıktısı olarak da uygulanır. Bu çerçeve, yalnızca kullanıcının giriş verilerini kolayca değiştirdiği çeşitli yalıtılmış kelime tanıma işlemlerine kolayca uygulanabilir. Bu çalışmadaki ana katkı, SOFTMAX'ı çeşitli özellik çıkarma teknikleriyle birleştirmiştir. SOFTMAX, (0,1) arasındaki etiketlere girdi özelliklerini analiz eden ve sınıflandırma veya regresyon sorunları için son katman fonksiyonu olarak çeşitli derin öğrenme tekniklerinde kullanılan trend olasılık fonksiyonudur. Elde edilen sonuçlar, özellik çıkarma için uygulanan sesli sinyal işleme teknikleri ile birleştirilmiş çeşitli makine öğrenme ve derin öğrenme teknikleri uygulanarak bu alanda sunulan çeşitli çalışmalarla karşılaştırılmıştır.
dc.description.abstract In several speech signal processing applications, VAD presents an important character for splitting an audio stream into time intervals that include speech activity and time intervals where speech is absent. In this research, we presented new approach dealing with isolated word recognition. In the first stage, three functions applied for voice activity detection (VAD) problem hamming window, Bohman function, and Bartlett-Hann function. The both Bohman function and Bartlett-Hann function are not applied in previous studies for VAD problem. On the other hand, pitch, MFCCs, and energy applied as feature extraction techniques and combined with SOFTMAX which these two methods are new approaches. The Pitch based SOFTMAX presented remarkable results which extracted features by pitch wired to SOFTMAX and classified to seven words and presented 85% accuracy. Furthermore, energy also applied as feature extraction and the output of this function wired to the SOFTMAX. This framework easily can applied to the various isolated word recognition which only the user modified the input data easily. The main contribution in this study, combine SOFTMAX with several feature extraction techniques. The SOFTMAX is trend probability function which analysis input features to the labels between (0,1) and used in several deep learning techniques as last layer function for classification or regression issues. The obtained results compared with several studies presented in this field by applying several machine learning and deep learning techniques combined with audio signal processing techniques that's applied for feature extraction. en
dc.identifier.uri https://hdl.handle.net/20.500.14411/5397
dc.language.iso en
dc.subject Elektrik ve Elektronik Mühendisliği
dc.subject Electrical and Electronics Engineering en_US
dc.title Hoparlör Bağımsız İzolasyonlu Rakam Tanıma
dc.title Speaker Independent Isolated Digit Recognition en_US
dc.type Master Thesis
dspace.entity.type Publication
gdc.author.institutional Tora, Hakan
gdc.coar.type text::thesis::master thesis
gdc.description.department Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
gdc.description.endpage 94
gdc.description.startpage 0
gdc.identifier.yoktezid 667414
relation.isAuthorOfPublication 3b369df4-6f40-4e7f-9021-94de8b562a0d
relation.isAuthorOfPublication.latestForDiscovery 3b369df4-6f40-4e7f-9021-94de8b562a0d
relation.isOrgUnitOfPublication 0ad0b148-c2aa-44e7-8f0a-53ab5c8406d5
relation.isOrgUnitOfPublication e28bb977-cadc-4429-b547-973b099c3ce8
relation.isOrgUnitOfPublication 50be38c5-40c4-4d5f-b8e6-463e9514c6dd
relation.isOrgUnitOfPublication.latestForDiscovery 0ad0b148-c2aa-44e7-8f0a-53ab5c8406d5

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
667414 Speaker independent isolated digit recognition.pdf
Size:
5.27 MB
Format:
Adobe Portable Document Format

Collections