cover

Invariant Features and Enhanced Speaker Normalization for Automatic Speech Recognition

Florian Müller
ISBN 978-3-8325-3319-9
247 Seiten, Erscheinungsjahr: 2013
Preis: 40.50 EUR

Stichworte/keywords: Spracherkennung, invariante Merkmalextraktion, Normalisierung

Automatic speech recognition systems have to handle various kinds of variabilities sufficiently well in order to achieve high recognition rates in practice. One of the variabilities that has a major impact on the performance is the vocal tract length of the speakers. Normalization of the features and adaptation of the acoustic models are commonly used methods in speech recognition systems. In contrast to that, a third approach follows the idea of extracting features with transforms that are invariant to vocal tract lengths changes.

This work presents several approaches for extracting invariant features for automatic speech recognition systems. The robustness of these features under various training-test conditions is evaluated and it is described how the robustness of the features to noise can be increased. Furthermore, it is shown how the spectral effects due to different vocal tract lengths can be estimated with a registration method and how this can be used for speaker normalization.

Exemplar(e)

Dieses Buch ist auch als eBook (PDF) erhätlich. Sie können es entweder als reines eBook herunterladen oder in Kombination mit dem gedruckten Buch (eBundle) erwerben. Der Erwerb beider Optionen wird über PayPal abgerechnet - zur Nutzung muss aber kein PayPal-Account angelegt werden.

Mit dem Erwerb des eBooks bzw. eBundles akzeptieren Sie unsere Lizenzbedingungen für eBooks.

eBook:    36.00 EUR ->

eBundle: 48.00 EUR ->
innerhalb Deutschlands (versandkostenfrei):          
außerhalb Deutschlands (Versandkosten: 4 EUR):

Bei Interesse an Multiuser- oder Campus-Lizenzen (MyLibrary) füllen Sie bitte das Formular aus oder schreiben Sie eine email an order@logos-verlag.de


Wollen auch Sie Ihre Dissertation veröffentlichen?