www.wikidata.de-de.nina.az
Bei Time Warp Edit Distance TWED handelt es sich um ein Abstandsmass zwischen diskreten Zeitreihen Im Vergleich zu anderen Abstandsmassen z B DTW LCS ist TWED eine Metrik Die in den gemessenen Zeitreihen vorliegenden Datenpunkte mussen ausserdem nicht notwendigerweise mit derselben Frequenz abgetastet sein also nicht zwingend zu aquidistanten Abtastzeitpunkten vorliegen was bei anderen Abstandsmassen jedoch implizit angenommen wird Der TWED Algorithmus wurde im Februar 2009 von P F Marteau veroffentlicht Ein typisches Problem bei der Verarbeitung von Zeitreihen ist die Bestimmung der Ahnlichkeit von Zeitreihen zueinander beispielsweise im Rahmen des Clusterings oder der Klassifikation Ahnliche Zeitreihen konnen durch den Menschen bereits per Anschauung erkannt werden Der Mensch erkennt beispielsweise dass zwei Zeitreihen die er miteinander vergleicht beliebig ahnlich sein konnen selbst wenn diese gestaucht zeitlich versetzt oder ahnlich einfach erkennbare Unterschiede aufweisen Als Beispiel fur ahnliche Zeitreihen die bezuglich der Zeitachse gegeneinander verschoben sind betrachte man zwei Fussganger Beide Fussganger legen dieselbe Strecke zuruck und haben die gleiche Geschwindigkeit Ein Fussganger startet jedoch spater als der andere Wahrend beide diese Strecke zurucklegen soll an jeweils denselben Wegpunkten der Wert der Hohenmeter u N N an dem sich die Fussganger befinden gemessen werden Nachdem beide die Strecke zuruckgelegt haben konnen die gemessenen Werte der Hohenmeter gegen einen Zeitstrahl abgetragen werden damit entstehen zwei Zeitreihen Die Zeitreihe des spater gestarteten Fussganger ist gegenuber der Zeitreihe des anderen Fussgangers verschoben Als Beispiel fur ahnliche Zeitreihen von denen eine im Vergleich zur anderen gestreckt bzw die andere im Vergleich zur einen gestaucht ist betrachte man einen Fussganger und einen Radfahrer Beide legen dieselbe Strecke zuruck wobei sich der Radfahrer schneller als der Fussganger bewegt Wahrend beide diese Strecke zurucklegen wird an jeweils denselben Wegpunkten der Wert der Hohenmeter u N N an dem sich Fussganger bzw Radfahrer befinden gemessen Nachdem beide die Strecke zuruckgelegt haben konnen die gemessenen Werte der Hohenmeter gegen einen Zeitstrahl abgetragen werden damit entstehen zwei Zeitreihen wobei die Zeitreihe des Fussgangers gegenuber der Zeitreihe des Radfahrers gestaucht ist Weitere Beispiele fur Zeitreihen die sich abgesehen vom Zeitbezug ahneln konnen sind beispielsweise Druckverlaufe bei der Aufzeichnung des Schreibdrucks wenn ein beliebiges aber festes Wort geschrieben wird Der Schreibende kann hierbei unterschiedlich zugig schreiben die Charakteristik seiner Handschrift bleibt effektiv aber die gleiche Die geschriebenen Worter sind damit zwar ahnlich aber bezogen auf den Schreibdruck zeitlich verzerrt Anwendungsbeispiele finden sich hierfur unter anderem im Bereich der Biometrie mittels sog Unterschriftenpads Ein menschlicher Betrachter wurde eine grosse Ahnlichkeit zwischen Zeitreihen sehr wahrscheinlich erkennen ein Rechner jedoch nicht unmittelbar Ein Rechner ist zur Abstandsbestimmung und damit zur Aussage uber eine Ahnlichkeit wobei wenig Abstand mit hoher Ahnlichkeit einhergeht auf ein Abstandsmass angewiesen Dieses Abstandsmass kann dabei starr oder elastisch sein Ein starres Abstandsmass wie beispielsweise der euklidische Abstand oder der Manhattan Abstand konnte die Unterschiede zwischen Zeitreihen die sich nur aus Streckung oder Verschiebung bezuglich der Zeitachse ergeben nicht unberucksichtigt lassen damit ist gemeint dass entlang eines Zeitstrahls Datenpunkte der jeweiligen Zeitreihe zu jedem Zeitpunkt einen Datenpunkt zum selben Zeitpunkt in der jeweils anderen Zeitreihe zur Abstandsberechnung voraussetzen Sollte eine der Zeitreihen gestaucht sein sind diese starre Abstandsmasse zur Abstandsberechnung ungeeignet Aus diesem Grund existieren elastische Abstandsmasse wie beispielsweise TWED Informell beschrieben loscht TWED Datenpunkte aus einer der Zeitreihen um sie abschnittsweise der jeweils anderen anzugleichen Je hoher die Kosten fur das Loschen oder je weiter entfernt vermeintlich passende Datenpunkte gemessen entlang der Zeitachse sind desto unahnlicher sind die Zeitreihen Wahrend zur Angleichung unterschiedlich langer Zeitreihen entlang des Zeitstrahls auch Techniken wie Re Sampling genutzt werden konnen entfallt dieser zusatzliche Arbeitsaufwand bei der Nutzung elastischer Abstandsmasse Inhaltsverzeichnis 1 TWED und andere Abstandsmasse 2 Erweiterungen und Anwendungen von TWED 2 1 GTWED Kernel 2 2 Medizinische Anwendungen 3 Definition Pseudocode Implementierung in unterschiedlichen Programmiersprachen 3 1 Definition 3 2 Implementierung in C 3 3 Implementierung in Matlab 4 Literatur 5 EinzelnachweiseTWED und andere Abstandsmasse BearbeitenTWED nutzt Bestandteile beziehungsweise Konzepte die sich so oder ahnlich in anderen Abstandsmassen vor allem in der Levenshtein Distanz die jedoch nicht primar fur die Ahnlichkeitsmessung von Zeitreihen gedacht ist wiederfinden Uber die Levenshtein Distanz hat TWED auch Ahnlichkeiten zu DTW Erweiterungen und Anwendungen von TWED BearbeitenGTWED Kernel Bearbeiten Gaussian TWED ist auch wenn der Name es anders vermuten lasst keine Erweiterung der TWED sondern GTWED ist eine Anwendung von TWED als Abstandsmass in Support Vector Machines Hier wird das im Gausskernel haufig verwendete euklidische Abstandsmass durch TWED ersetzt 1 Medizinische Anwendungen Bearbeiten Es existieren Arbeiten in denen vorgestellt wird wie TWED zum Vergleich von durch Pulsmessung aufgezeichneten Zeitreihen verwendet werden kann 2 Definition Pseudocode Implementierung in unterschiedlichen Programmiersprachen BearbeitenDefinition Bearbeiten d l n A 1 p B 1 q M i n d l n A 1 p 1 B 1 q G a p L L o s c h e n i n A d l n A 1 p 1 B 1 q 1 G a p b q U b e r e i n s t i m m u n g d l n A 1 p B 1 q 1 G L b q L o s c h e n i n B displaystyle delta lambda nu A 1 p B 1 q Min begin cases delta lambda nu A 1 p 1 B 1 q Gamma a p to Lambda amp rm L ddot o schen in A delta lambda nu A 1 p 1 B 1 q 1 Gamma a p to b q amp rm ddot U bereinstimmung delta lambda nu A 1 p B 1 q 1 Gamma Lambda to b q amp rm L ddot o schen in B end cases nbsp wobeiG a p L d L P a p a p 1 n t a p t a p 1 l displaystyle Gamma alpha p to Lambda d LP a p a p 1 nu cdot t a p t a p 1 lambda nbsp G a p b q d L P a p b q d L P a p 1 b q 1 n t a p t b q t a p 1 t b q 1 displaystyle Gamma alpha p to b q d LP a p b q d LP a p 1 b q 1 nu cdot t a p t b q t a p 1 t b q 1 nbsp G L b q d L P b p b p 1 n t b q t b q 1 l displaystyle Gamma Lambda to b q d LP b p b p 1 nu cdot t b q t b q 1 lambda nbsp Wobei die Rekursion d l n displaystyle delta lambda nu nbsp wie folgt initialisiert wird d l n A 1 0 B 1 0 0 displaystyle delta lambda nu A 1 0 B 1 0 0 nbsp d l n A 1 0 B 1 j f u r j 1 displaystyle delta lambda nu A 1 0 B 1 j infty rm f ddot u r j geq 1 nbsp d l n A 1 i B 1 0 f u r i 1 displaystyle delta lambda nu A 1 i B 1 0 infty rm f ddot u r i geq 1 nbsp mit a 0 b 0 0 displaystyle a 0 b 0 0 nbsp nach Konvention Implementierung in C Bearbeiten Eine Implementierung des TWED Algorithmus in der Programmiersprache C kann von der Homepage des Autors heruntergeladen werden 3 Implementierung in Matlab Bearbeiten TWED Algorithmus function distance DP twed A timeSA B timeSB lambda nu distance DP TWED A timeSA B timeSB lambda nu Berechne Time Warp Edit Distance TWED fur die Zeitreihen A und B A Werte der Zeitreihe A e g 10 2 30 4 timeSA Zeitstempel der Werte von Zeitreihe A e g 1 4 B Werte der Zeitreihe B timeSB Zeitstempel der Werte von Zeitreihe B lambda Bestrafung fur Abstande bei Loschoperationen nu Bestimmt die Elastizitat nu gt 0 erforderlich fur Distanzmass Uberprufe ob fur jeden Zeitpunkt ein Zeitstempel existiert if length A length timeSA warning Die Lange von A ist ungleich der Lange timeSA return end if length B length timeSB warning Die Lange von B ist ungleich der Lange timeSB return end if nu lt 0 warning nu ist negativ return end Padding hinzufugen Matlab unterstutzt keine 0 Indizierung A 0 A timeSA 0 timeSA B 0 B timeSB 0 timeSB Dieser Algorithmus verwendet dynamische Programmierung DP zeros length A length B Initialisiere die DP Matrix setze die erste Zeile und Spalte auf unendlich DP 1 inf DP 1 inf DP 1 1 0 Die Lange der Zeitreihe A n length timeSA Die Lange der Zeitreihe B m length timeSB Berechnung der minimalen Kosten for i 2 n for j 2 m cost Dlp A i B j Berechnen und Zwischenspeichern der Kosten der verschiedenen Operationen C ones 3 1 inf Loschen in A C 1 DP i 1 j Dlp A i 1 A i nu timeSA i timeSA i 1 lambda Loschen in B C 2 DP i j 1 Dlp B j 1 B j nu timeSB j timeSB j 1 lambda Belassen von Datenpunkten in beiden Zeitreihen C 3 DP i 1 j 1 Dlp A i B j Dlp A i 1 B j 1 nu abs timeSA i timeSB j abs timeSA i 1 timeSB j 1 Wahle die Operation mit den minimalen Kosten und aktualisiere die DP Matrix DP i j min C end end Die Distanz die Kosten zur Anpassung der Zeitreihen aneinander befindet sich im hochsten Matrixelement von DP distance DP n m Funktion zur Berechnung des Euklidischen Abstands function cost Dlp A B cost sqrt sum A B 2 2 end end Backtracking um den kostengunstigsten Pfad zuruckzuverfolgen function path backtracking DP path BACKTRACKING DP Berechnung des kostengunstigsten Pfades DP DP Matrix aus der TWED Funktion x size DP i x 1 j x 2 In path werden die Indizes des Pfades in umgekehrter Reihenfolge gespeichert path ones i j 2 Inf steps 1 while i 1 j 1 path steps i j C ones 3 1 inf Belassen von Datenpunkten in beiden Zeitreihen C 1 DP i 1 j 1 Loschen in A C 2 DP i 1 j Loschen in B C 3 DP i j 1 Berechnung des Indexes mit den geringsten Kosten idx min C switch idx case 1 Belassen von Datenpunkten in beiden Zeitreihen i i 1 j j 1 case 2 Loschen in A i i 1 j j case 3 Loschen in B i i j j 1 end steps steps 1 end path steps i j Der Pfad wurde in umgekehrter Reihenfolge berechnet deswegen muss er umgedreht werden path path 1 steps path path end 1 1 endLiteratur BearbeitenP F Marteau Time Warp Edit Distance with Stiffness Adjustment for Time Series Matching In IEEE Transactions on Pattern Analysis and Machine Intelligence Band 31 Nr 2 Februar 2009 S 306 318 doi 10 1109 TPAMI 2008 76 Einzelnachweise Bearbeiten Dongyu Zhang Time Series Classification Using Support Vector Machine with Gaussian Elastic Metric Kernel In Pattern Recognition ICPR 2010 20th International Conference on August 2010 S 29 32 doi 10 1109 ICPR 2010 16 Lei Liu Wangmeng Zuo Dongyu Zhang Naimin Li Hongzhi Zhang Classification of Wrist Pulse Blood Flow Signal Using Time Warp Edit Distance In ICMB 2010 LNCS 6165 S 137 144 doi 10 1007 978 3 642 13923 9 14 P F Marteau Homepage auf den Servern des IRISA Abgerufen am 26 August 2014 Abgerufen von https de wikipedia org w index php title Time Warp Edit Distance amp oldid 209329122