AN OPTIMIZED TEXT-INDEPENDENT SPEAKER RECOGNITION SYSTEM USING FEED FORWARD NEURAL NETWORK

ELTANASHI, SAEEDA M.S.

DSpace Home
→
LİSANSÜSTÜ EĞİTİM ENSTİTÜSÜ
→
Lisansüstü Eğitim Enstitüsü Yüksek LisansTezleri
→
View Item

dc.contributor.author	ELTANASHI, SAEEDA M.S.
dc.date.accessioned	2020-08-18T11:15:24Z
dc.date.available	2020-08-18T11:15:24Z
dc.date.issued	2020-08-14
dc.identifier.uri	http://acikerisim.karabuk.edu.tr:8080/xmlui/handle/123456789/878
dc.description.abstract	ABSTRACT Speaker Recognition Process is susceptible for a several challenges which are critical to speaker modelling. The main obstacle in speaker identification is the nature of voice signals. Such signals are termed by their randomness nature which can be caused by the time-varying nature of speech electric properties. The spectral information of speech varies overtime; therefore, it is difficult to rely only on the spectral domain in order to model a system for speaker recognition. In text-independent speaker recognition; frequency component analysis used to recognize the speakers. As voice signals are time-variant signal, the frequency spectrum information is changing by time. In this study, Mel Frequency Cepstral Coefficient (MFCC) alongside Fundamental Frequency are implemented to propose text-independent speaker recognition system approximation. In addition, Feed Forward Neural Network (FFNN) is applied for speaker prediction purpose. To further improve the performance, particle Swarm optimization algorithm was integrated by Freezing-FFNN. The simulation has shown that newly proposed technique, namely PSO-FFNN has achieved accuracy by 83,4 % and reduced the Mean Square Error significantly. ÖZET Konuşmacı Tanıma Süreci, konuşmacı modellemesi için kritik olan çeşitli zorluklara sahiptir. Konuşmacı tanımlamasındaki ana engel, ses sinyallerinin doğasıdır. Bu tür sinyaller, konuşmanın elektrik özelliklerinin zamanla değişen doğasından kaynaklanabilecek rastgele olma doğası ile adlandırılır. Konuşmanın spektral bilgisi fazla zamana göre değişir; bu nedenle, hoparlör tanıma sürecinde bir sistemi modellemek için sadece spektral alana güvenmek zordur. Metinden bağımsız konuşmacı tanımada; hoparlörleri tanımak için frekans bileşen analizi kullanılır. Ses sinyalleri zamanla değişen sinyal olduğundan frekans spektrumu bilgisi de zamanla değişir. Bu çalışmada, metinden bağımsız hoparlör tanıma sistemi yaklaşımı önermek için Temel Frekans ile birlikte Mel Frekans Cepstral Katsayısı (MFCC) uygulanmıştır. Ayrıca, hoparlör tahmini amacıyla Feed Forward Sinir Ağı (FFNN) uygulanmıştır. Performansı daha da artırmak için, Parçacık Sürüsü optimizasyonu algoritması Freezing-FFNN ile entegre edilmiştir. Yeni önerilen tekniği simülasyon sonuçları yani PSO-FFNN'nin% 83,4 oranında doğruluk elde ettiğini ve Ortalama Kare Hatasını önemli ölçüde azalttığını göstermiştir.	en_EN
dc.language.iso	en	en_EN
dc.subject	Tahmin, FFNN, konuşmacı tanıma, parçacık sürü optimizasyonu, optimizasyon, MFCC, tepe frekansı.	en_EN
dc.subject	Prediction, FFNN, speaker recognition, particle swarm optimization, MFCC, pitch frequency.	en_EN
dc.title	AN OPTIMIZED TEXT-INDEPENDENT SPEAKER RECOGNITION SYSTEM USING FEED FORWARD NEURAL NETWORK	en_EN
dc.title.alternative	OPTİMİZE EDİLMİŞ İLERİ YAPAY SİNİR AĞI KULLANILAN METİNDEN BAĞIMSIZ KONUŞMACI ANIMA SİSTEMİ	en_EN
dc.type	Thesis	en_EN