www.wikidata.de-de.nina.az
Dynamische Zeitnormierung engl dynamic time warping bezeichnet einen Algorithmus der Wertefolgen unterschiedlicher Lange aufeinander abbildet 1 Inhaltsverzeichnis 1 Anwendung 2 Algorithmus 3 Siehe auch 4 Einzelnachweise 5 LiteraturAnwendung BearbeitenEin prominentes Anwendungsbeispiel ist die Spracherkennung das Erkennen von Sprechmerkmalen beim Diktieren Hier sollen durch den Vergleich mit gespeicherten Sprachmustern einzelne Worter aus einem gesprochenen Text erkannt werden Ein Problem besteht darin dass die Worter oft unterschiedlich ausgesprochen werden Vor allem Vokale werden oft langer oder kurzer gesprochen als es im gespeicherten Sprachmuster der Fall ist das Wort heben zum Beispiel kann einmal mit kurzem e und ein anderes mal wie heeeben ausgesprochen werden Fur einen erfolgreichen Mustervergleich sollte das Wort also entsprechend gedehnt bzw gestaucht werden jedoch nicht gleichmassig sondern vor allem an den Vokalen die langer bzw kurzer gesprochen wurden In geringerem Masse gilt dies ubrigens auch fur Konsonanten auch konnen bestimmte Laute komplett verschluckt werden Der Dynamic time warping Algorithmus leistet diese adaptive Zeitnormierung 1 2 Weitere Anwendungsbereiche des dynamic time warping sind z B Gestenerkennung in der Bildbearbeitung oder Messungen bei korreliertem Rauschen in der Physik 3 Algorithmus Bearbeiten nbsp nbsp Der Algorithmus findet z B bei der Spracherkennung Anwendung Ein gesprochenes Sprachsignal soll mit einer Menge existierender Schablonen engl Templates abgeglichen werden um das gesprochene Wort wiedererkennen zu konnen und beispielsweise auf einem Mobiltelefon eine entsprechende Aktion auszufuhren Sprachsignale werden dabei ublicherweise als spektrale bzw cepstrale Wertetupel abgespeichert die mit weiteren Stimminformationen wie Intensitat usw als Merkmalsvektoren erganzt sind Mit Hilfe einer Gewichtungsfunktion fur die einzelnen Parameter jedes Wertetupels kann ein Differenzmass zwischen zwei beliebigen Werten der beiden Signale aufgestellt werden Kostenfunktion beispielsweise eine normalisierte euklidische Distanz oder die Mahalanobis Distanz 4 Der Algorithmus sucht nun den kostengunstigsten Weg vom Anfang zum Ende beider Signale uber die aufgespannte Matrix der paarweise vorliegenden Kosten aller Punkte beider Signale Dies geschieht mit Hilfe der dynamischen Programmierung effizient Den tatsachlichen Pfad also das Warping erhalt man durch das sogenannte Backtracking nach dem ersten Durchlauf des Algorithmus Fur die reine Kostenbestimmung also die Templateauswahl reicht allerdings der einfache Durchlauf ohne Backtracking Das Backtracking ermoglicht hierbei also eine genaue Abbildung jedes Punktes des kurzeren Signales auf einen oder mehrere Punkte des langeren Signales und stellt damit die ungefahre Zeitverzerrung dar Aufgrund algorithmischer Probleme bei der Extraktion von Sprachsignalparametern Oktavfehler Stimmaktivierungsfehler etc muss der optimale Pfad durch die Signaldifferenzmatrix nicht unbedingt der tatsachlichen Zeitverzerrung entsprechen Siehe auch BearbeitenHidden Markov Model Mustererkennung Dynamische ProgrammierungEinzelnachweise Bearbeiten a b DTW oder dynamic time warping www inf fu berlin de abgerufen am 8 April 2009 Wendemuth Andreas Grundlagen der stochastischen Sprachverarbeitung S 137 Wendemuth Andreas Grundlagen der stochastischen Sprachverarbeitung S 133 Black A W P Taylor 1997a Automatically clustering similar units for unit selection in speech synthesis In Proc Eurospeech 97 Literatur BearbeitenGrundlagen der stochastischen Sprachverarbeitung von Andreas Wendemuth als Google Book Abgerufen von https de wikipedia org w index php title Dynamic Time Warping amp oldid 230464388