Anhand von Experimenten auf Sprachstichproben werden cepstrale Merkmale, die auch im Bereich der automatischen Spracherkennung von wesentlicher Bedeutung sind, hinsichtlich sprecherspezifischer Eigenschaften einerseits und der Abhängigkeit vom Inhalt der Äußerungen andererseits analysiert. Es wird gezeigt, dass hier insbesondere der Einfluss der cepstralen Dimension relevant ist. Klassifikationsverfahren wie Vektorquantisierung und Gaußsche Mischverteilungen mit Weltmodellen werden an unterschiedliche Einsatzszenarien angepasst. Mit der Zeitverzerrung zur Optimierung des mittleren Merkmalsabstands wird eine Verbesserung der aus der Literatur bekannten dynamischen Zeitverzerrung vorgeschlagen, wobei im Detail auf eine effiziente Implementierung eingegangen und die Steigerung der Erkennungsrate experimentell nachgewiesen wird.
Zur weiteren Verbesserung der Erkennungsgenauigkeit werden unterschiedliche Varianten von Fusionssystemen entworfen und experimentell untersucht. Diese Varianten basieren auf komplementären Algorithmen einerseits und der Realisierung unabhängiger Subsysteme mittels einer Segmentierung der Sensordaten andererseits. Eine allgemeine Beschreibung dieser Methoden auch unabhängig von der Aufgabenstellung der Sprechererkennung erleichtert die Übertragung auf andere Probleme der Musterklassifikation.
41.00 € | ||
in stock |