Publication: Konuşmacı Tanımada Makine Öğrenmesi Tekniklerinin Kullanımı
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Abstract
Bir konuşma yapıldığında iletilen, yalnızca konuşmacının ağzından çıkan anlamlı kelimeler bütününden oluşmuş bir mesaj değildir. Ses, konuşmacının yaş, cinsiyet, boy, kilo, ırk, fiziksel ve zihinsel özelliklerinden izler taşır. Bu özelliklerin otomatik tahmini çağrı merkezleri, e-ticaret ile meşgul kurumlar ve adli makamlar başta olmak üzere önemli uygulama alanlarına sahiptir. Bu tez çalışması kapsamında, otomatik konuşmacı tanıma çalışmalarında kullanılması amacı ile yeni bir veri seti oluşturulmuştur. TIMIT veri seti ve tez kapsamında oluşturulan veri seti üzerinde derin öğrenme ağının da dahil edildiği bir dizi yapay zeka tekniği ile konuşmacıların cinsiyet, yaş, boy ve kilolarının tahmini sağlanmıştır.
Whenever an utterance is spoken, convoyed is not only a message that composed etirely meaningfull words from speaker's mouth. The voice tracks the age, gender, height, weight, race, physical and mental characteristics of the speaker. Automatic prediction of these characteristics have important application areas, including call centers, e-commerce-busy agencies and judicial authorities. Within the scope of this thesis study, a new data set was created with the aim of being used in automatic speaker recognition studies. Speakers' sex, age, height and weight estimation is provided by a set of machine learning techniques included deep neural network on the TIMIT data set and the data set created within the thesis.
Whenever an utterance is spoken, convoyed is not only a message that composed etirely meaningfull words from speaker's mouth. The voice tracks the age, gender, height, weight, race, physical and mental characteristics of the speaker. Automatic prediction of these characteristics have important application areas, including call centers, e-commerce-busy agencies and judicial authorities. Within the scope of this thesis study, a new data set was created with the aim of being used in automatic speaker recognition studies. Speakers' sex, age, height and weight estimation is provided by a set of machine learning techniques included deep neural network on the TIMIT data set and the data set created within the thesis.
Description
Tez (yüksek lisans) -- Ondokuz Mayıs Üniversitesi, 2017
Libra Kayıt No: 118171
Libra Kayıt No: 118171
Citation
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
76
