www.wikidata.de-de.nina.az
Das Trend Saison Modell ist der traditionelle Ansatz der Zeitreihenanalyse Die Modellierung erfolgt mit Hilfe eines mathematischen Modells das folgende Komponenten umfasst eine Trendkomponente eine Saisonkomponente und eine Rauschkomponente Fehlt z B die Saisonkomponente so spricht man auch nur von einem Trendmodell Inhaltsverzeichnis 1 Modellaufbau 1 1 Beispiel 2 Trendschatzung 2 1 Lineares oder polynomiales Trendmodell 2 2 Exponentielles Modell 2 3 Gleitende Durchschnitte 3 Saisonschatzung 3 1 Additive Saisonschwankung 3 2 Multiplikative Saisonschwankung 4 Gute eines Trend Saison Modells 5 LiteraturModellaufbau BearbeitenWenn x t displaystyle x t nbsp die beobachtete Zeitreihe ist dann wird zunachst ein Trend m t displaystyle mu t nbsp geschatzt Moglich sind lineare polynomiale oder exponentielle Trends aber auch gleitende Durchschnitte Aus den Residuen x t m t displaystyle x t mu t nbsp kann man eine additive oder multiplikative Saisonkomponente schatzen Dabei wird davon ausgegangen dass die Abweichungen der Trendfunktion von den beobachteten Werten einem saisonalen Muster unterliegen Beispiel Bearbeiten Die Grafik unten zeigt die Arbeitslosenzahlen in der Bundesrepublik Deutschland von Januar 2005 bis Dezember 2008 links oben und eine lineare Trendfunktion Rechts oben wird die Abweichung zwischen den beobachteten Arbeitslosenzahlen und den Schatzungen aus dem Trend gezeigt Man sieht dass im Fruhjahr jeden Jahres die Trendfunktion die Arbeitslosenzahlen unterschatzt und im Herbst uberschatzt gleiche Farbe gleicher Monat Die Grafik links unten zeigt die uber die Jahre gemittelte Abweichung fur jeden Monat Diese Abweichung wird fur den entsprechenden Monat zur Trendfunktion addiert Damit ergibt sich in der Grafik rechts unten das Trend Saison Modell rote Linie nbsp Linearer Trend mit additiver Saisonschwankung fur die Arbeitslosenzahlen in Deutschland 2005 2008 Trendschatzung Bearbeiten nbsp Verschiedene Trendmodelle fur die Arbeitslosenzahlen in Deutschland von 2005 2011Der Trend einer Zeitreihe gibt den globalen Verlauf einer Zeitreihe wieder Dafur werden verschiedene Regressionsansatze verwendet ein lineares oder polynomiales Modell m t b 0 b 1 t b 2 t 2 displaystyle mu t beta 0 beta 1 t beta 2 t 2 nbsp ein exponentielles Modell log m t b 0 b 1 log t m t exp b 0 t b 1 displaystyle log mu t beta 0 beta 1 log t Longleftrightarrow mu t exp beta 0 t beta 1 nbsp oder auch gleitende Durchschnitte mit einer entsprechend hohen Ordnung Lineares oder polynomiales Trendmodell Bearbeiten Im linearen oder polynomialen Trendmodell wird einfach eine lineare oder polynomiale Regression bzgl der Zeitvariablen durchgefuhrt um den Trend zu schatzen m t b 0 b 1 t b 2 t 2 displaystyle mu t beta 0 beta 1 t beta 2 t 2 nbsp Wahrend die geschatzten Werte b 0 displaystyle b 0 nbsp b 1 displaystyle b 1 nbsp davon abhangen wie die Zeit parametrisiert wird sind die geschatzten Trendwerte x t b 0 b 1 t b 2 t 2 displaystyle hat x t b 0 b 1 t b 2 t 2 nbsp unabhangig von der Parametrisierung Die folgende Tabelle zeigt zwei Parametrisierungen der Zeit fur ein lineares Trendmodell beim ersten Trendmodell entspricht Januar 2005 gleich t 1 displaystyle t 1 nbsp und Februar 2005 gleich t 2 displaystyle t 2 nbsp beim zweiten Trendmodell entspricht Januar 2005 gleich s 83 displaystyle s 83 nbsp und Februar 2005 gleich s 81 displaystyle s 81 nbsp Danach liegen die Werte fur t displaystyle t nbsp bzw s displaystyle s nbsp fur alle folgenden Monate fest Arbeitslose Lineares Trendmodell 1 Lineares Trendmodell 2Zeitpunkt in Mio t displaystyle t nbsp x t displaystyle hat x t nbsp s displaystyle s nbsp x s displaystyle hat x s nbsp Jan 2005 5 09 1 4 80 83 4 80Feb 2005 5 29 2 4 77 81 4 77Mrz 2005 5 27 3 4 75 79 4 75 Dez 2011 2 78 84 2 63 83 2 63Trendmodell x t 4 825 07 0 026 15 t displaystyle hat x t 4 82507 0 02615 cdot t nbsp x s 3 713 63 0 013 08 s displaystyle hat x s 3 71363 0 01308 cdot s nbsp Da bei den beiden Parametrisierungen die gleichen Schatzwerte herauskommen kann man irgendeine wahlen Die erste Parametrisierung erlaubt eine leichte Interpretation der Trendfunktion x t 4 825 07 0 026 15 t displaystyle hat x t 4 82507 0 02615 cdot t nbsp Ausgehend von einer Arbeitslosenzahl von 4 825 Mio im Dezember 2004 t 0 displaystyle t 0 nbsp fallt die Arbeitslosenzahl durchschnittlich um ca 26 150 Personen pro Monat bis Dezember 2011 Die zweite Parametrisierung ware nutzlich wenn man die Regressionskoeffizienten von Hand ausrechnen musste Dabei wird unter anderem das arithmetische Mittel s displaystyle bar s nbsp benotigt das sich hier zu s 0 displaystyle bar s 0 nbsp ergibt Des Weiteren sieht man dass im Durchschnitt 3 71363 Mio Menschen im Zeitraum Januar 2005 bis Dezember 2011 arbeitslos waren Bei den vorliegenden Daten ware jedoch eine lineare Trendfunktion ungeeignet da sie den globalen Verlauf der Zeitreihe nur schlecht wiedergibt Dies zeigt auch die vorhergehende Grafik Sie zeigt auch dass eine quadratische Trendfunktion besser ware x t 5 274 89 0 05753 t 0 000 37 t 2 displaystyle hat x t 5 27489 0 05753 cdot t 0 00037 cdot t 2 nbsp Exponentielles Modell Bearbeiten nbsp Anzahl der Telefone in den USA von 1891 bis 1979 mit einem linearen und einem exponentiellen TrendEin exponentielles Trendmodell kommt zum Einsatz wenn die Daten es nahelegen In der rechten Grafik sehen wir die Anzahl der Telefone in Tsd in den USA von 1891 bis 1979 sowie eine exponentielle und eine lineare Trendfunktion Offensichtlich beschreibt der exponentielle Trend die Daten besser als der lineare Trend Des Weiteren hat das exponentielle Trendmodell log m t b 0 b 1 log t displaystyle log mu t beta 0 beta 1 log t nbsp den Vorteil dass bei der Ruckrechnung sich ergibt m t exp b 0 t b 1 displaystyle mu t exp beta 0 t beta 1 nbsp Der geschatzte Wert x t exp b 0 t b 1 0 displaystyle hat x t exp b 0 t b 1 geq 0 nbsp fur jedes t gt 0 displaystyle t gt 0 nbsp Die Schatzung der Regressionskoeffizienten erfolgt durch Ruckfuhrung auf das lineare Modell d h sowohl t displaystyle t nbsp als auch x t displaystyle x t nbsp werden logarithmiert und dann b 0 displaystyle beta 0 nbsp und b 1 displaystyle beta 1 nbsp geschatzt Im Gegensatz zur linearen oder polynomialen Trendfunktion hangen sowohl die Werte der geschatzten Regressionskoeffizienten als auch der Schatzwerte x t displaystyle hat x t nbsp davon ab wie die Zeit parametrisiert wird In der Grafik entspricht das Jahr 1891 gleich t 1891 displaystyle t 1891 nbsp und das Jahr 1892 gleich t 1892 displaystyle t 1892 nbsp log x t 894 4 119 5 log t displaystyle log hat x t 894 4 119 5 cdot log t nbsp Gleitende Durchschnitte Bearbeiten Hauptartikel Gleitender Mittelwert Eine weitere Alternative zur Trendschatzung sind gleitende Durchschnitte mit genugend hoher Ordnung k displaystyle k nbsp Dabei wird an einer Stelle t displaystyle t nbsp der Wert x t displaystyle hat x t nbsp als Durchschnitt der Beobachtungswerte t k 1 2 t t k 1 2 displaystyle t k 1 2 ldots t ldots t k 1 2 nbsp berechnet Unterschieden werden muss die Berechnung fur gerade und ungerade Ordnungen x t 1 k s t k 1 2 t k 1 2 x s wenn k ungerade 1 2 k x t k 2 1 2 k x t k 2 1 k s t k 2 1 t k 2 1 x s wenn k gerade displaystyle hat x t begin cases displaystyle frac 1 k sum s t k 1 2 t k 1 2 x s amp text wenn k text ungerade displaystyle frac 1 2k x t k 2 frac 1 2k x t k 2 frac 1 k sum s t k 2 1 t k 2 1 x s amp text wenn k text gerade end cases nbsp Bei einer geraden Ordnung fliessen die Randpunkte x t k 2 displaystyle x t k 2 nbsp und x t k 2 displaystyle x t k 2 nbsp jeweils mit dem Gewicht 1 2 ein und alle Punkte zwischen ihnen mit dem Gewicht 1 Dies ist jedoch nur eine Moglichkeit gleitende Durchschnitte zu berechnen fur weitere siehe den Hauptartikel Gleitender Mittelwert nbsp Gleitende Durchschnitte verschiedener Ordnung zur Schatzung des Trends bei den Arbeitslosenzahlen in Deutschland von 2005 bis 2011Die gleitende Durchschnitte werfen jedoch drei Probleme auf Welche Ordnung sollte man fur die Trendschatzung wahlen Ist die Ordnung zu klein dann fangt der gleitende Durchschnitt unter Umstanden auch die Saisonalitat der Daten ein Ist die Ordnung zu gross dann passt sich der Trend nicht mehr so gut an die Daten an Die Grafik zeigt verschiedene Ordnungen Sieben entspricht einem Quartal vorher und nachher Dreizehn entspricht einem halben Jahr vorher und nachher und funfundzwanzig entspricht einem Jahr vorher und nachher An den Randern also Januar 2005 bzw Dezember 2011 in der nebenstehenden Grafik kann man keine Schatzwerte mehr berechnen da in dem Datensatz weder Werte vor dem Januar 2005 noch nach dem Dezember 2011 vorliegen Beim linearen polynomialen und exponentiellen Trendmodell kann man prinzipiell auch in die Zukunft extrapolieren Dies ist bei einem gleitenden Durchschnitt nicht moglich da dafur bereits die zukunftigen Werte bekannt sein mussten Er eignet sich also nur zur Beschreibung der Daten Der Vorteil der gleitenden Durchschnitte ist jedoch die bessere Anpassung an einen nicht linearen Trend in den Daten Saisonschatzung BearbeitenBei der Saisonschatzung geht man davon aus dass es eine Struktur in der Zeitreihe gibt die sich saisonal wiederholt Die Lange t displaystyle t nbsp einer Saison ist dabei vorab bekannt Bei den Arbeitslosenzahlen weiss man dass aufgrund der Witterungsbedingungen die Arbeitslosenzahlen zum Winter hin regelmassig ansteigen wahrend sie zum Sommer hin wieder fallen Es gibt also ein jahrliches Muster in den Daten Im Wesentlichen werden Saisonschwankungen entweder additiv oder multiplikativ modelliert x t ZRM x t s j wenn additive Saisonschwankung x t s j wenn multiplikative Saisonschwankung displaystyle hat x t text ZRM begin cases hat x t hat s j amp text wenn additive Saisonschwankung hat x t cdot hat s j amp text wenn multiplikative Saisonschwankung end cases nbsp Mit x t displaystyle hat x t nbsp der Wert aus einer Trendschatzung und j displaystyle j nbsp ein Index der sich in jeder Saison wiederholt Die folgende Tabelle zeigt die Werte der Arbeitslosenzahlen in Deutschland von Januar 2005 bis Dezember 2011 x t displaystyle x t nbsp eine Trendschatzung x t displaystyle hat x t nbsp mit einem gleitenden Durchschnitt der Ordnung 13 sowie die Abweichungen zwischen den Beobachtungswerten und der Trendschatzung fur ein additives bzw multiplikatives Saisonmodell Zeitpunkt Arbeitslose Trendschatzung Add Abweichung Mult Abweichung j displaystyle j nbsp in Mio Gl O mit k 13 displaystyle k 13 nbsp x t x t displaystyle x t hat x t nbsp x t x t displaystyle x t hat x t nbsp Jan 2005 5 09 1Feb 2005 5 29 2Mrz 2005 5 27 3Apr 2005 5 05 4Mai 2005 4 88 5Jun 2005 4 78 6Jul 2005 4 84 4 87 0 04 0 993 7Aug 2005 4 80 4 87 0 07 0 985 8Sep 2005 4 65 4 85 0 20 0 959 9Oct 2005 4 56 4 81 0 25 0 947 10Nov 2005 4 53 4 77 0 24 0 950 11Dez 2005 4 60 4 73 0 13 0 973 12Jan 2006 5 01 4 70 0 31 1 066 1Feb 2006 5 05 4 67 0 38 1 082 2Mrz 2006 4 98 4 62 0 35 1 077 3Apr 2006 4 79 4 58 0 21 1 046 4Mai 2006 4 54 4 54 0 00 1 000 5Jun 2006 4 40 4 50 0 10 0 978 6Jul 2006 4 39 4 47 0 08 0 981 7Aug 2006 4 37 4 41 0 04 0 991 8Sep 2006 4 24 4 34 0 10 0 977 9Oct 2006 4 08 4 26 0 17 0 959 10Nov 2006 4 00 4 18 0 19 0 955 11Dez 2006 4 01 4 12 0 11 0 974 12 Additive Saisonschwankung Bearbeiten Jedem Zeitpunkt t k T j displaystyle t k cdot T j nbsp einer Saison mit einer vorgegebenen Lange T displaystyle T nbsp wird ein Saisonindex j 1 T displaystyle j 1 T nbsp zugeordnet Dann wird die Differenz zwischen dem Beobachtungswert und dem geschatzten Trendwert gebildet s t x t x t displaystyle hat s t x t hat x t nbsp Danach werden fur ein fixes j displaystyle j nbsp alle Werte gemittelt s j 1 n j k 1 n j s k T j displaystyle hat s j frac 1 n j sum k 1 n j hat s k cdot T j nbsp In dem Arbeitslosenbeispiel T 12 displaystyle T 12 nbsp werden zunachst also alle Januarabweichungen gemittelt j 1 displaystyle j 1 nbsp s 1 0 31 Jan 2006 0 20 Jan 2007 0 29 Jan 2008 0 27 Jan 2009 0 25 Jan 2010 0 27 Jan 2011 6 0 23 displaystyle hat s 1 frac overbrace 0 31 text Jan 2006 overbrace 0 20 text Jan 2007 overbrace 0 29 text Jan 2008 overbrace 0 27 text Jan 2009 overbrace 0 25 text Jan 2010 overbrace 0 27 text Jan 2011 6 0 23 nbsp Dies wird fur alle Monate wiederholt bis Dezember j 12 displaystyle j 12 nbsp s 12 0 13 Dez 2005 0 11 Dez 2006 0 09 Dez 2007 0 19 Dez 2008 0 11 Dez 2009 0 08 Dez 2010 6 0 12 displaystyle hat s 12 frac overbrace 0 13 text Dez 2005 overbrace 0 11 text Dez 2006 overbrace 0 09 text Dez 2007 overbrace 0 19 text Dez 2008 overbrace 0 11 text Dez 2009 overbrace 0 08 text Dez 2010 6 0 12 nbsp Damit kann aus der Trendschatzung und den gemittelten Saisonabweichungen die endgultige Zeitreihenschatzung x t ZRM displaystyle hat x t text ZRM nbsp berechnet werden Zeitpunkt x t displaystyle x t nbsp x t displaystyle hat x t nbsp x t x t displaystyle x t hat x t nbsp j displaystyle j nbsp s j displaystyle hat s j nbsp x t ZRM displaystyle hat x t text ZRM nbsp Jan 2005 5 09 1 Dez 2005 4 60 4 73 0 13 12 0 12 4 61Jan 2006 5 01 4 70 0 31 1 0 23 4 93 Dez 2006 4 01 4 12 0 11 12 0 12 4 00Jan 2007 4 26 4 06 0 20 1 0 23 4 29 Multiplikative Saisonschwankung Bearbeiten Jedem Zeitpunkt t k T j displaystyle t k cdot T j nbsp einer Saison mit einer vorgegebenen Lange T displaystyle T nbsp wird ein Saisonindex j 1 T displaystyle j 1 T nbsp zugeordnet Dann wird der Quotient zwischen dem Beobachtungswert und dem geschatzten Trendwert gebildet s t x t x t displaystyle hat s t x t hat x t nbsp Danach werden fur ein fixes j displaystyle j nbsp alle Werte gemittelt s j 1 n j k 1 n j s k T j displaystyle hat s j frac 1 n j sum k 1 n j hat s k cdot T j nbsp In dem Arbeitslosenbeispiel T 12 displaystyle T 12 nbsp werden zunachst also alle Januarabweichungen gemittelt j 1 displaystyle j 1 nbsp s 1 1 066 Jan 2006 1 049 Jan 2007 1 056 Jan 2008 1 052 Jan 2009 1 073 Jan 2010 1 087 Jan 2011 6 1 064 displaystyle hat s 1 frac overbrace 1 066 text Jan 2006 overbrace 1 049 text Jan 2007 overbrace 1 056 text Jan 2008 overbrace 1 052 text Jan 2009 overbrace 1 073 text Jan 2010 overbrace 1 087 text Jan 2011 6 1 064 nbsp Dies wird fur alle Monate wiederholt bis Dezember j 12 displaystyle j 12 nbsp s 12 0 973 Dez 2005 0 974 Dez 2006 0 973 Dez 2007 0 942 Dez 2008 0 967 Dez 2009 0 973 Dez 2010 6 0 967 displaystyle hat s 12 frac overbrace 0 973 text Dez 2005 overbrace 0 974 text Dez 2006 overbrace 0 973 text Dez 2007 overbrace 0 942 text Dez 2008 overbrace 0 967 text Dez 2009 overbrace 0 973 text Dez 2010 6 0 967 nbsp Damit kann aus der Trendschatzung und den gemittelten Saisonabweichungen die endgultige Zeitreihenschatzung x t ZRM displaystyle hat x t text ZRM nbsp berechnet werden Zeitpunkt x t displaystyle x t nbsp x t displaystyle hat x t nbsp x t x t displaystyle x t hat x t nbsp j displaystyle j nbsp s j displaystyle hat s j nbsp x t ZRM displaystyle hat x t text ZRM nbsp Jan 2005 5 09 1 Dez 2005 4 60 4 73 0 973 12 0 967 4 58Jan 2006 5 01 4 70 1 066 1 1 063 5 00 Dez 2006 4 01 4 12 0 974 12 0 967 3 98Jan 2007 4 26 4 06 1 049 1 1 063 4 32 Gute eines Trend Saison Modells BearbeitenDa es verschiedene Moglichkeiten sowohl fur die Trendschatzung als auch fur die Saisonschatzung gibt stellt sich die Frage welches Modell das beste ist Da beide Modelle nicht linear sein konnen kann man nicht unbedingt zweistufig vorgehen d h erst das beste Trendmodell nehmen und danach das beste Saisonmodell auswahlen nur eine Kombination von Trend und Saisonschatzung sollte gepruft werden In Anlehnung an die lineare Regression wird ein Bestimmtheitsmass fur ein Trend Saison Modell definiert R ZRM 2 1 t x t x ZRM 2 t x t x 2 displaystyle R text ZRM 2 1 frac sum t x t hat x text ZRM 2 sum t x t bar x 2 nbsp mit x displaystyle bar x nbsp der Mittelwert aller x t displaystyle x t nbsp fur die eine Vorhersage gemacht wird In der Regel ist das Bestimmtheitsmass eines Trend Saison Modells deutlich grosser als in der linearen Regression Die folgende Tabelle zeigt fur die Arbeitslosendaten in Deutschland von Januar 2005 bis Dezember 2011 die Bestimmtheitsmasse fur verschiedene Trend bzw Trend Saison Modelle Trendmodell Linear Exponentiell Gl Durchschnitt k 13 displaystyle k 13 nbsp R ZRM 2 displaystyle R text ZRM 2 nbsp 0 817 0 765 0 917Saisonschwankung additiv multiplikativ additiv multiplikativ additiv multiplikativR ZRM 2 displaystyle R text ZRM 2 nbsp 0 868 0 870 0 791 0 767 0 993 0 994Die Grafik zeigt die neun Trend Saison Modelle Man sieht dass sowohl die blauen linearer Trend als auch die grunen Modelle exponentieller Trend nicht gut zu den Daten passen Die roten Modelle gleitende Durchschnitte passen am besten zu den Daten nbsp Verschiedene Trend Saison Modelle fur die Arbeitslosendaten in Deutschland von Januar 2005 bis Dezember 2011Literatur BearbeitenPeter P Eckstein Statistik fur Wirtschaftswissenschaftler Eine realdatenbasierte Einfuhrung mit SPSS 2 Auflage Gabler Verlag 2010 ISBN 978 3 8349 2345 5 Abgerufen von https de wikipedia org w index php title Trendmodell amp oldid 210377374