www.wikidata.de-de.nina.az
Die Zeitreihenanalyse befasst sich in der Statistik mit der inferenzstatistischen Analyse von Zeitreihen und der Vorhersage von Trends Trendextrapolation zu ihrer kunftigen Entwicklung Sie ist eine Spezialform der Regressionsanalyse Beispiel fur eine Zeitreihe Linearer mit Trend mit additivem Fehlerterm Inhaltsverzeichnis 1 Begriff der Zeitreihe 2 Zeitreihen Nahere Begriffsbestimmung Einteilung und Beispiele 3 Zeitreihenanalyse Uberblick 3 1 Identifikationsphase 3 2 Schatzphase 3 3 Diagnosephase 3 4 Einsatzphase 4 Methoden der Zeitreihenanalyse 4 1 Inferenzstatistische Analyse von Zeitreihen 4 2 Ordinale Zeitreihenanalyse 4 3 Neuronale Netze und die Verarbeitung von Zeitreihen 5 Siehe auch 6 Literatur 7 Software zur Durchfuhrung von Zeitreihenanalysen 8 Weblinks 9 EinzelnachweiseBegriff der Zeitreihe BearbeitenEine Zeitreihe ist eine zeitlich geordnete Folge meist aber keine Reihe im mathematischen Sinne von Zahlen oder Beobachtungen bei der sich die Anordnung der Merkmalsauspragungen zwingend aus dem Zeitablauf ergibt etwa Aktienkurse Borsenkurse allgemein Bevolkerungsentwicklung Preisindex Wahlabsichtsbefragungen Wetterdaten Zinsindex 1 Die einzelnen Zeitpunkte werden zu einer Menge von Beobachtungszeitpunkten T displaystyle T nbsp zusammengefasst bei der fur jeden Zeitpunkt t T displaystyle t in T nbsp genau eine Beobachtung vorliegt 2 Zeitreihen treten in allen Bereichen der Wissenschaft auf Zeitreihen Nahere Begriffsbestimmung Einteilung und Beispiele BearbeitenDer Begriff Zeitreihe setzt voraus dass Daten nicht kontinuierlich sondern diskret aber in endlichen zeitlichen Abstanden anfallen Aus einem zeitkontinuierlichen Messsignal oder der kontinuierlichen Aufzeichnung eines Messsignals zum Beispiel mit einem analogen t y Schreiber oder einem analogen Magnetbandgerat kann eine Zeitreihe durch Abtastung gewonnen werden Die Zeitpunkte denen Datenpunkte zugeordnet werden konnen aquidistant also in konstanten Abstanden beispielsweise alle 5 Sekunden in anderer Regelmassigkeit beispielsweise werktaglich oder unregelmassig angeordnet sein Ein Datenpunkt kann aus einer einzelnen Zahl skalare Werte univariate Zeitreihe oder aus einer Mehrzahl Tupel von Zahlenwerten vektorielle Werte multivariate Zeitreihe bestehen Jedoch mussen alle Datenpunkte in gleicher Weise aus Einzelwerten aufgebaut sein Typische Zeitreihen entstehen aus dem Zusammenwirken regelhafter und zufalliger Ursachen Die regelhaften Ursachen konnen periodisch saisonal variieren und oder langfristige Trends enthalten Zufallige Einflusse werden oft als Rauschen bezeichnet Gegeben sei ein T displaystyle T nbsp dimensionaler Vektor von Zufallsvariablen x 1 x 2 x T displaystyle x 1 x 2 dotsc x T nbsp mit einer zugehorigen multivariaten Verteilung Dies kann auch als eine Folge von Zufallsvariablen x t t 1 T displaystyle x t t 1 T nbsp oder als stochastischer Prozess aufgefasst werden Eine Stichprobe daraus ergibt als ein mogliches Ergebnis die T reellen Zahlen x 1 1 x 2 1 x T 1 displaystyle left x 1 1 x 2 1 dotsc x T 1 right nbsp Selbst bei unendlich langer Beobachtung ware x t 1 t 1 displaystyle left x t 1 right t 1 infty nbsp nur eine einzige Realisierung des stochastischen Prozesses Solch ein Prozess hat jedoch nicht nur eine Realisierung sondern im Allgemeinen beliebig viele mit gleichen statistischen Eigenschaften Eine Zeitreihe ist als eine Realisierung des datengenerierenden Prozesses definiert Statt stochastische Prozesse der Dimension T anhand ihrer T dimensionalen Verteilungsfunktion zu beschreiben kann man ihn durch die Momente erster und zweiter Ordnung erfassen also durch T displaystyle T nbsp Erwartungswerte E x i i 1 2 T displaystyle operatorname E x i quad i 1 2 dots T nbsp T displaystyle T nbsp Varianzen Var x i E x i E x i 2 i 1 2 T displaystyle operatorname Var x i operatorname E x i operatorname E x i 2 quad i 1 2 dotsc T nbsp T T 1 2 displaystyle frac T T 1 2 nbsp Kovarianzen Cov x i x j E x i E x i x j E x j i lt j displaystyle operatorname Cov x i x j operatorname E x i operatorname E x i x j operatorname E x j quad i lt j nbsp Man spricht auch von Autokovarianzen da es sich um Kovarianzen desselben Prozesses handelt Im Spezialfall der mehrdimensionalen Normalverteilung des stochastischen Prozesses gilt dass er durch die Momente erster und zweiter Ordnung eindeutig festgelegt ist Fur die statistische Inferenz mit Zeitreihen mussen Annahmen getroffen werden da in der Praxis meist nur eine Realisierung des die Zeitreihe generierenden Prozesses vorliegt Die Annahme der Ergodizitat bedeutet dass Stichprobenmomente die aus einer endlichen Zeitreihe gewonnen werden fur T displaystyle T rightarrow infty nbsp quasi gegen die Momente der Grundgesamtheit konvergieren Zeitreihen fallen in vielen Bereichen an in der Finanzmathematik und der Finanzwirtschaft Borsenkurse Liquiditatsentwicklungen in der Okonometrie Bruttosozialprodukt Arbeitslosenquote in der Biometrie EEG in der Meteorologie Temperatur Windrichtung und geschwindigkeit usw in der Fernerkundung Vegetationsentwicklung und Aspektfolge in der Polemologie Quantitative Kriegs und Friedensforschung Dyadische KonfliktanalysenEine besonders komplexe aber auch reichhaltige Datensituation liegt vor wenn man zeitabhangige Mikrodaten besitzt also Personen oder Haushaltsdaten fur verschiedene Zeitpunkte Hier spricht man allerdings nicht mehr von Zeitreihendaten sondern von Trend Panel oder Ereignisdaten je nach ihrer Zeitstruktur Zeitreihenanalyse Uberblick BearbeitenZiele der Zeitreihenanalyse konnen sein die kurzestmogliche Beschreibung einer historischen Zeitreihe die Vorhersage von kunftigen Zeitreihenwerten Prognose auf der Basis der Kenntnis ihrer bisherigen Werte Wettervorhersage die Erkennung von Veranderungen in Zeitreihen EEG oder EKG Monitoring in der Medizin bei chirurgischen Eingriffen Veranderung der globalen Vegetationsphanologie durch anthropogene Klimaanderungen die Eliminierung von seriellen oder saisonalen Abhangigkeiten oder Trends in Zeitreihen Saisonbereinigung um einfache Parameter wie Mittelwerte verlasslich zu schatzenDie Vorgehensweise im Rahmen der Zeitreihenanalyse lasst sich in folgende Arbeitsphasen einteilen Identifikationsphase Identifikation eines geeigneten Modells fur die Modellierung der Zeitreihe Schatzphase Schatzung von geeigneten Parametern fur das gewahlte Modell Diagnosephase Diagnose und Evaluierung des geschatzten Modells Einsatzphase Einsatz des geschatzten und als geeignet befundenen Modells insbesondere zu Prognosezwecken In den einzelnen Phasen ergeben sich Unterschiede je nachdem ob man lineare Modelle zur Zeitreihenanalyse Box Jenkins Methode Komponentenmodell oder nichtlineare Modelle zu Grunde legt Im Folgenden wird beispielhaft auf die Box Jenkins Methode eingegangen Identifikationsphase Bearbeiten An erster Stelle sollte die graphische Darstellung der empirischen Zeitreihenwerte stehen Dieses ist die einfachste und intuitivste Methode Im Rahmen der graphischen Analyse lassen sich erste Schlusse uber das Vorliegen von Trends Saisonalitaten Ausreissern Varianzinstationaritat sowie sonstiger Auffalligkeiten ziehen Stellt man einen stochastischen Trend Instationaritat fest entweder durch die graphische Analyse oder durch einen statistischen Test wie den erweiterter Dickey Fuller Test englisch augmented Dickey Fuller test kurz ADF test der spater durch eine Transformation der Zeitreihe Differenzieren bereinigt werden soll so bietet sich eine Varianzstabilisierung beispielsweise Box Cox Transformation an Die Varianzstabilisierung ist wichtig da nach dem Differenzieren einer Zeitreihe negative Werte in der transformierten Zeitreihe vorkommen konnen Bevor weitergearbeitet werden kann muss noch die grundsatzliche Frage geklart werden ob die Zeitreihe in einem deterministischen Modell Trendmodell oder einem stochastischen Modell abgebildet werden soll Diese beiden Alternativen implizieren unterschiedliche Methoden der Trendbereinigung siehe Trendbereinigende Fluktuationsanalyse Beim Trendmodell erfolgt die Bereinigung mittels einer Regressionsschatzung beim stochastischen Modell mittels Differenzenbildung Schatzphase Bearbeiten In der Schatzphase werden die Modellparameter und koeffizienten mit Hilfe unterschiedlicher Techniken geschatzt Fur das Trendmodell bietet sich die Kleinste Quadrate Schatzung fur die Modelle im Rahmen des Box Jenkins Ansatzes die Momentenmethode die nichtlineare Kleinste Quadrate Schatzung und die Maximum Likelihood Methode fur die Schatzung an Diagnosephase Bearbeiten In der Diagnosephase werden die Gute des Modells oder ggf mehrere ausgewahlte Modelle beurteilt Dabei bietet sich folgende Vorgehensweise an 1 Schritt Prufen ob die geschatzten Koeffizienten signifikant von Null verschieden sind Bei einzelnen Koeffizienten erfolgt dies mit Hilfe eines t Tests mehrere Koeffizienten zusammen werden mit einem F Test untersucht 2 Schritt Verfahrt man nach der Box Jenkins Methode so ist zu prufen inwieweit die empirischen Autokorrelationskoeffizienten mit denen ubereinstimmen die sich theoretisch aufgrund der vorher geschatzten Koeffizienten ergeben mussten Zusatzlich konnen die partiellen Autokorrelationskoeffizienten sowie das Spektrum analysiert werden 3 Schritt Schliesslich erfolgt eine sorgfaltige Analyse der Residuen Die Residuen sollten keine Struktur mehr aufweisen Dabei kann man die Zentriertheit der Residuen mit einem t Test kontrollieren Die Konstanz der Varianz kann visuell am Zeitreihengraphen oder durch Berechnung des Effekts verschiedener l Werte in einer Box Cox Transformation berechnet werden Um die Autokorrelationsfreiheit der Residuen zu prufen kann man jeden einzelnen Koeffizienten auf signifikanten Unterschied zu Null prufen oder die ersten n displaystyle n nbsp Koeffizienten gemeinsam auf Signifikanz zu Null testen Um Letzteres zu klaren kann auf die so genannten Portmanteau Tests zuruckgegriffen werden Hierfur bieten sich beispielsweise Informationskriterien an Einsatzphase Bearbeiten In der Einsatzphase gilt es aus der in der Identifikationsphase aufgestellten und als brauchbar befundenen Modellgleichung eine Vorhersagegleichung zu formulieren Dabei muss vorher ein Optimalitatskriterium festgelegt werden Dafur kann die minimale mittlere quadratische Abweichung englisch minimal mean squared error kurz MMSE genommen werden Methoden der Zeitreihenanalyse Bearbeiten nbsp Abbildung 1 Verfahren der ZeitreihenanalyseDie Verlaufsmuster von Zeitreihen konnen in verschiedene Komponenten zerlegt werden Komponentenzerlegung So gibt es systematische oder quasi systematische Komponenten Dazu gehoren die Trendkomponente als allgemeine Grundrichtung der Zeitreihe die Saisonkomponente als eine zyklische Bewegung innerhalb eines Jahres die Zykluskomponente bei okonomischen Zeitreihen auch Konjunktur genannt mit einer Periodenlange von mehr als einem Jahr sowie eine Kalenderkomponente die auf Kalenderunregelmassigkeiten zuruckzufuhren ist Als weitere Komponente tritt noch eine Rest oder irregulare Komponente auf Hierunter fallen Ausreisser und Strukturbruche die durch historische Ereignisse erklart werden konnen sowie Zufallsschwankungen deren Ursachen im Einzelnen nicht identifiziert werden konnen Die genannten Komponenten sind nicht direkt beobachtbar Sie entspringen vielmehr der menschlichen Vorstellung Somit stellt sich die Frage wie man diese Komponenten modelliert Traditionelle Ansatze betrachten Zufallsschwankungen als strukturneutral und fassen die systematischen Komponenten als deterministische Funktionen der Zeit auf Y t b 0 b 1 t Z t displaystyle Y t beta 0 beta 1 t Z t nbsp In neueren Ansatzen haben Zufallschwankungen eine dominierende Rolle bei der Modellierung der systematischen Komponente Damit wird die Zeitreihe durch einen stochastischen Prozess modelliert wie einen MA 1 Prozess Y t 8 1 Z t 1 Z t displaystyle Y t theta 1 Z t 1 Z t nbsp Dabei ist t displaystyle t nbsp der Zeitindex und Z t displaystyle Z t nbsp eine Zufallsvariable fur die die Eigenschaft weisses Rauschen angenommen werden kann Einen dazu kontraren Ansatz der Zeitreihenmodellierung stellt die Chaostheorie siehe dazu Dimensionalitat dar In der Zeitreihenanalyse stehen einige allgemeine mathematische Instrumente zur Verfugung wie Transformation Box Cox Transformation Aggregation Regression Filterung und gleitende Durchschnitte Im Folgenden wird davon ausgegangen dass die Zeitreihe als stochastischer Prozess modelliert werden kann Dieser Ansatz wird auch als Box Jenkins Methode bezeichnet Fur stochastische Prozesse gibt es weitere spezielle Methoden und Instrumente Hierzu zahlen die Analyse im Frequenzbereich Fourier Theorie und Spektralanalyse Autokovarianz und Autokorrelationsfunktion Partielle Autokorrelationsfunktion MA und AR Darstellung Inferenzstatistische Analyse von Zeitreihen Bearbeiten In der Inferenzstatistik schatzt man die Grosse der untersuchten Effekte auf der Basis von Stichproben Neben den schon genannten Verfahren bei denen man inferenzstatistisch dann die Fehler der gefundenen Ergebnisse abschatzt konnen komplexe Zeitreihen Modelle spezifiziert und geschatzt werden Dies wird vor allem in der Okonometrie fur okonomische Modelle genutzt Grundlage ist der Begriff des stochastischen Prozesses hier ist insbesondere die Gruppe der ARMA Prozesse zu erwahnen Ordinale Zeitreihenanalyse Bearbeiten Die ordinale Zeitreihenanalyse stellt ein relativ neues Verfahren zur qualitativen Untersuchung langer und komplexer Zeitreihen dar Anstatt der Werte einer Zeitreihe wird die Ordnungsrelation zwischen den Werten also das Auf und Ab beschrieben Dafur wird die Zeitreihe in ordinale Muster transformiert und anschliessend die Verteilung dieser Muster statistisch analysiert um so die Komplexitat beziehungsweise den Informationsgehalt der zugrundeliegenden Zeitreihe zu messen Ein bekannter Komplexitatsparameter ist die Permutationsentropie eingefuhrt im Jahr 2002 von Bandt und Pompe Neuronale Netze und die Verarbeitung von Zeitreihen Bearbeiten Beschaftigt man sich mit kunstlichen neuronalen Netzwerken erkennt man dass der Modellierungsprozess sehr ahnlich zum ARIMA Modell ist In der Regel ist nur die Terminologie verschieden Zur Prognose einer Zeitreihe mit einem Multilayer Perceptron legt man ein gleitendes Zeitfenster mit n Werten der Vergangenheit uber die Zeitreihe Die Trainingsaufgabe besteht darin aus n Werten in der Input Schicht auf den nachsten Wert zu schliessen Das Training erfolgt anhand der bekannten Werte deren Zukunft zu prognostizieren sozusagen aus sich selbst heraus In der Regel sind es aber aussere Einflusse aus einem chaotischen dynamischen System die den Verlauf einer Zeitreihe beobachtbare Werte des dynamischen Systems beeinflussen Um aussere Einflusse in das Modell mit einzubeziehen konnen zusatzliche Neuronen in die Inputschicht des Multilayer Perceptrons eingegeben werden Diese mussen ebenfalls in Form einer Zeitreihe vorliegen 3 Siehe auch BearbeitenZeitreihe der Niederschlagssummen in Deutschland seit 1881Literatur BearbeitenWalter Assenmacher Einfuhrung in die Okonometrie 6 Auflage Oldenbourg Munchen 2002 ISBN 3 486 25429 4 Walter Enders Applied Economic Time Series Wiley Hoboken 2003 ISBN 0 471 23065 0 James D Hamilton Time Series Analysis Princeton University Press Princeton 1994 ISBN 0 691 04289 6 Helmut Lutkepohl New Introduction to Multiple Time Series Analysis Springer Verlag Berlin 2005 ISBN 978 3 540 40172 8 P H Muller Hrsg Lexikon der Stochastik Wahrscheinlichkeitsrechnung und mathematische Statistik 5 Auflage Akademie Verlag Berlin 1991 ISBN 978 3 05 500608 1 Zeitreihenanalyse S 505 506 Klaus Neusser Zeitreihenanalyse in den Wirtschaftswissenschaften 3 Auflage Vieweg Teubner Wiesbaden 2011 ISBN 3 8348 1846 1 Horst Rinne Katja Specht Zeitreihen Statistische Modellierung Schatzung und Prognose Vahlen Munchen 2002 ISBN 3 8006 2877 5 Rainer Schlittgen Bernd Streitberg Zeitreihenanalyse 9 Auflage Oldenbourg Munchen 2001 ISBN 3 486 25725 0 Elmar Steurer Prognose von 15 Zeitreihen der DGOR mit Neuronalen Netzen In Operations Research Spektrum 18 2 S 117 125 doi 10 1007 BF01539737 Helmut Thome Zeitreihenanalyse Eine Einfuhrung fur Sozialwissenschaftler und Historiker Oldenbourg Munchen 2005 ISBN 3 486 57871 5 Ruey S Tsay Analysis of Financial Time Series Wiley Hoboken 2005 ISBN 0 471 69074 0 Software zur Durchfuhrung von Zeitreihenanalysen BearbeitenEine Zeitreihenanalyse kann unter anderem mit den freien Softwarepaketen R gretl OpenNN und RapidMiner durchgefuhrt werden Zu proprietaren Losungen gehoren die Softwarepakete BOARD Dataplore EViews Limdep RATS SPSS Stata SAS sowie WinRATS Weblinks BearbeitenOpen Source Buch A First Course on Time Series Analysis with SAS der Universitat WurzburgEinzelnachweise Bearbeiten Hans E Buschgen Das kleine Borsen Lexikon 2012 S 1176 Rainer Schlittgen Bernd Streitberg Zeitreihenanalyse Oldenbourg Verlag 2001 ISBN 978 3 486 71096 0 abgerufen uber De Gruyter Online S 1 Dieter Meiller Christian Schieder Applied Machine learning Predicting behaviour of industrial units from climate data In Abraham A P Roth J amp Peng G C Hrsg Multi Conference on Computer Science and Information Systems 2018 IADIS Press S 66 72 ISBN 978 989 8533 80 7Normdaten Sachbegriff GND 4067486 1 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Zeitreihenanalyse amp oldid 238067600