Hoparlör Bağımsız İzolasyonlu Rakam Tanıma

Hamıd, Mohammed Saeed

Hoparlör Bağımsız İzolasyonlu Rakam Tanıma

dc.contributor.advisor	Tora, Hakan
dc.contributor.author	Hamıd, Mohammed Saeed
dc.date.accessioned	2024-07-07T12:49:20Z
dc.date.available	2024-07-07T12:49:20Z
dc.date.issued	2020
dc.description.abstract	Çeşitli konuşma sinyali işleme uygulamalarında VAD, bir ses akışını konuşma etkinliği ve konuşmanın olmadığı zaman aralıklarını içeren zaman aralıklarına bölmek için önemli bir karakter sunar. Bu araştırmada, izole kelime tanıma ile ilgili yeni bir yaklaşım sunduk. İlk aşamada, ses etkinliği algılama (VAD) problem kırma penceresi, Bohman işlevi ve Bartlett-Hann işlevi için üç işlev uygulanmıştır. Hem Bohman fonksiyonu hem de Bartlett-Hann fonksiyonu VAD problemi için önceki çalışmalarda uygulanmamıştır. Öte yandan, perde, MFCC'ler ve enerji, özellik çıkarma teknikleri olarak uygulanır ve bu iki yöntemin yeni yaklaşımlar olduğu SOFTMAX ile birleştirilir. Pitch tabanlı SOFTMAX, SOFTMAX'a bağlanan ve yedi kelimeye göre sınıflandırılan ve% 85 doğrulukla özelliklerle çıkarılan olağanüstü sonuçlar sundu. Ayrıca enerji, özellik çıkarma ve SOFTMAX'a bağlanan bu fonksiyonun çıktısı olarak da uygulanır. Bu çerçeve, yalnızca kullanıcının giriş verilerini kolayca değiştirdiği çeşitli yalıtılmış kelime tanıma işlemlerine kolayca uygulanabilir. Bu çalışmadaki ana katkı, SOFTMAX'ı çeşitli özellik çıkarma teknikleriyle birleştirmiştir. SOFTMAX, (0,1) arasındaki etiketlere girdi özelliklerini analiz eden ve sınıflandırma veya regresyon sorunları için son katman fonksiyonu olarak çeşitli derin öğrenme tekniklerinde kullanılan trend olasılık fonksiyonudur. Elde edilen sonuçlar, özellik çıkarma için uygulanan sesli sinyal işleme teknikleri ile birleştirilmiş çeşitli makine öğrenme ve derin öğrenme teknikleri uygulanarak bu alanda sunulan çeşitli çalışmalarla karşılaştırılmıştır.
dc.description.abstract	In several speech signal processing applications, VAD presents an important character for splitting an audio stream into time intervals that include speech activity and time intervals where speech is absent. In this research, we presented new approach dealing with isolated word recognition. In the first stage, three functions applied for voice activity detection (VAD) problem hamming window, Bohman function, and Bartlett-Hann function. The both Bohman function and Bartlett-Hann function are not applied in previous studies for VAD problem. On the other hand, pitch, MFCCs, and energy applied as feature extraction techniques and combined with SOFTMAX which these two methods are new approaches. The Pitch based SOFTMAX presented remarkable results which extracted features by pitch wired to SOFTMAX and classified to seven words and presented 85% accuracy. Furthermore, energy also applied as feature extraction and the output of this function wired to the SOFTMAX. This framework easily can applied to the various isolated word recognition which only the user modified the input data easily. The main contribution in this study, combine SOFTMAX with several feature extraction techniques. The SOFTMAX is trend probability function which analysis input features to the labels between (0,1) and used in several deep learning techniques as last layer function for classification or regression issues. The obtained results compared with several studies presented in this field by applying several machine learning and deep learning techniques combined with audio signal processing techniques that's applied for feature extraction.	en
dc.identifier.uri	https://hdl.handle.net/20.500.14411/5397
dc.language.iso	en
dc.subject	Elektrik ve Elektronik Mühendisliği
dc.subject	Electrical and Electronics Engineering	en_US
dc.title	Hoparlör Bağımsız İzolasyonlu Rakam Tanıma
dc.title	Speaker Independent Isolated Digit Recognition	en_US
dc.type	Master Thesis
dspace.entity.type	Publication
gdc.coar.type	text::thesis::master thesis
gdc.description.department	Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
gdc.description.endpage	94
gdc.description.startpage	0
gdc.identifier.yoktezid	667414
gdc.virtual.author	Tora, Hakan
relation.isAuthorOfPublication	3b369df4-6f40-4e7f-9021-94de8b562a0d
relation.isAuthorOfPublication.latestForDiscovery	3b369df4-6f40-4e7f-9021-94de8b562a0d
relation.isOrgUnitOfPublication	0ad0b148-c2aa-44e7-8f0a-53ab5c8406d5
relation.isOrgUnitOfPublication	e28bb977-cadc-4429-b547-973b099c3ce8
relation.isOrgUnitOfPublication	50be38c5-40c4-4d5f-b8e6-463e9514c6dd
relation.isOrgUnitOfPublication.latestForDiscovery	0ad0b148-c2aa-44e7-8f0a-53ab5c8406d5

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 667414 Speaker independent isolated digit recognition.pdf
Size:: 5.27 MB
Format:: Adobe Portable Document Format

Download

Collections

Master Tezler