MENÜ MENÜ  

cover

Fusion von Klassifikationssystemen für die automatische Sprechererkennung

Heinz Hertlein

ISBN 978-3-8325-2525-5
286 pages, year of publication: 2010
price: 41.00 €
Fusion von Klassifikationssystemen für die automatische Sprechererkennung
Aufgrund ihres individuellen, charakteristischen Klangs stellt die menschliche Stimme ein biometrisches Merkmal dar, das zum Beispiel für Anwendungen der Authentifizierung genutzt wird. Ziel der vorliegenden Arbeit ist die Untersuchung, Optimierung und Weiterentwicklung von Mustererkennungsalgorithmen für unterschiedliche Varianten und Anwendungsgebiete der biometrischen Klassifikation von Sprechern.

Anhand von Experimenten auf Sprachstichproben werden cepstrale Merkmale, die auch im Bereich der automatischen Spracherkennung von wesentlicher Bedeutung sind, hinsichtlich sprecherspezifischer Eigenschaften einerseits und der Abhängigkeit vom Inhalt der Äußerungen andererseits analysiert. Es wird gezeigt, dass hier insbesondere der Einfluss der cepstralen Dimension relevant ist. Klassifikationsverfahren wie Vektorquantisierung und Gaußsche Mischverteilungen mit Weltmodellen werden an unterschiedliche Einsatzszenarien angepasst. Mit der Zeitverzerrung zur Optimierung des mittleren Merkmalsabstands wird eine Verbesserung der aus der Literatur bekannten dynamischen Zeitverzerrung vorgeschlagen, wobei im Detail auf eine effiziente Implementierung eingegangen und die Steigerung der Erkennungsrate experimentell nachgewiesen wird.

Zur weiteren Verbesserung der Erkennungsgenauigkeit werden unterschiedliche Varianten von Fusionssystemen entworfen und experimentell untersucht. Diese Varianten basieren auf komplementären Algorithmen einerseits und der Realisierung unabhängiger Subsysteme mittels einer Segmentierung der Sensordaten andererseits. Eine allgemeine Beschreibung dieser Methoden auch unabhängig von der Aufgabenstellung der Sprechererkennung erleichtert die Übertragung auf andere Probleme der Musterklassifikation.

Keywords:
  • Mustererkennung
  • Biometrie
  • Sprachverarbeitung
  • Dynamische Zeitverzerrung
  • Cepstrale Merkmale

BUYING OPTIONS

41.00 €
in stock
cover cover cover cover cover cover cover cover cover