Karabuk University

AN OPTIMIZED TEXT-INDEPENDENT SPEAKER RECOGNITION SYSTEM USING FEED FORWARD NEURAL NETWORK

Show simple item record

dc.contributor.author ELTANASHI, SAEEDA M.S.
dc.date.accessioned 2020-08-18T11:15:24Z
dc.date.available 2020-08-18T11:15:24Z
dc.date.issued 2020-08-14
dc.identifier.uri http://acikerisim.karabuk.edu.tr:8080/xmlui/handle/123456789/878
dc.description.abstract ABSTRACT Speaker Recognition Process is susceptible for a several challenges which are critical to speaker modelling. The main obstacle in speaker identification is the nature of voice signals. Such signals are termed by their randomness nature which can be caused by the time-varying nature of speech electric properties. The spectral information of speech varies overtime; therefore, it is difficult to rely only on the spectral domain in order to model a system for speaker recognition. In text-independent speaker recognition; frequency component analysis used to recognize the speakers. As voice signals are time-variant signal, the frequency spectrum information is changing by time. In this study, Mel Frequency Cepstral Coefficient (MFCC) alongside Fundamental Frequency are implemented to propose text-independent speaker recognition system approximation. In addition, Feed Forward Neural Network (FFNN) is applied for speaker prediction purpose. To further improve the performance, particle Swarm optimization algorithm was integrated by Freezing-FFNN. The simulation has shown that newly proposed technique, namely PSO-FFNN has achieved accuracy by 83,4 % and reduced the Mean Square Error significantly. ÖZET Konuşmacı Tanıma Süreci, konuşmacı modellemesi için kritik olan çeşitli zorluklara sahiptir. Konuşmacı tanımlamasındaki ana engel, ses sinyallerinin doğasıdır. Bu tür sinyaller, konuşmanın elektrik özelliklerinin zamanla değişen doğasından kaynaklanabilecek rastgele olma doğası ile adlandırılır. Konuşmanın spektral bilgisi fazla zamana göre değişir; bu nedenle, hoparlör tanıma sürecinde bir sistemi modellemek için sadece spektral alana güvenmek zordur. Metinden bağımsız konuşmacı tanımada; hoparlörleri tanımak için frekans bileşen analizi kullanılır. Ses sinyalleri zamanla değişen sinyal olduğundan frekans spektrumu bilgisi de zamanla değişir. Bu çalışmada, metinden bağımsız hoparlör tanıma sistemi yaklaşımı önermek için Temel Frekans ile birlikte Mel Frekans Cepstral Katsayısı (MFCC) uygulanmıştır. Ayrıca, hoparlör tahmini amacıyla Feed Forward Sinir Ağı (FFNN) uygulanmıştır. Performansı daha da artırmak için, Parçacık Sürüsü optimizasyonu algoritması Freezing-FFNN ile entegre edilmiştir. Yeni önerilen tekniği simülasyon sonuçları yani PSO-FFNN'nin% 83,4 oranında doğruluk elde ettiğini ve Ortalama Kare Hatasını önemli ölçüde azalttığını göstermiştir. en_EN
dc.language.iso en en_EN
dc.subject Tahmin, FFNN, konuşmacı tanıma, parçacık sürü optimizasyonu, optimizasyon, MFCC, tepe frekansı. en_EN
dc.subject Prediction, FFNN, speaker recognition, particle swarm optimization, MFCC, pitch frequency. en_EN
dc.title AN OPTIMIZED TEXT-INDEPENDENT SPEAKER RECOGNITION SYSTEM USING FEED FORWARD NEURAL NETWORK en_EN
dc.title.alternative OPTİMİZE EDİLMİŞ İLERİ YAPAY SİNİR AĞI KULLANILAN METİNDEN BAĞIMSIZ KONUŞMACI ANIMA SİSTEMİ en_EN
dc.type Thesis en_EN


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account