www.wikidata.de-de.nina.az
Lineare Paneldatenmodelle sind statistische Modelle die bei der Analyse von Paneldaten benutzt werden bei denen mehrere Individuen uber mehrere Zeitperioden beobachtet werden Paneldatenmodelle nutzen diese Panelstruktur aus und erlauben es unbeobachtete Heterogenitat der Individuen zu berucksichtigen Die beiden wichtigsten linearen Paneldatenmodelle sind das Paneldatenmodell mit festen Effekten 1 englisch fixed effects model und das Paneldatenmodell mit zufalligen Effekten 2 englisch random effects model Die beiden Modelle unterscheiden sich in den Annahmen die an den Fehlerterm des Modells gestellt werden und erlauben die Herleitung verschiedener Schatzer Anwendungsgebiete von linearen Paneldatenmodellen finden sich vor allem in der Empirischen Sozialforschung Welchen Einfluss hat Bildung auf das Einkommen einer Person Paneldaten und fur sie entwickelte Modelle werden zur Beantwortung solcher und anderer Fragen benutzt Inhaltsverzeichnis 1 Grundlagen 2 Beispiel 3 Modell mit zufalligen Effekten 3 1 Grundlagen 3 2 Schatzer im Modell mit zufalligen Effekten 3 2 1 Kleinste Quadrate Schatzung 3 2 2 Schatzer fur zufallige Effekte 3 2 3 Between Schatzer 3 3 Potentielle Probleme 4 Modell mit festen Effekten 4 1 Grundlagen 4 2 Schatzer im Modell mit festen Effekten 4 2 1 Schatzer fur feste Effekte Within Schatzer 4 2 2 Erste Differenzenschatzer 4 3 Potenzielle Probleme 5 Vergleich beider Modelle 6 Literatur 7 AnmerkungenGrundlagen BearbeitenBei der Auswertung statistischer Daten sollen aus einer endlichen Menge an Daten Aussagen uber die zugrundeliegende Verteilung von Merkmalen in einer Grundgesamtheit ermittelt werden Man versucht die unbekannten Parameter dieser Grundgesamtheit mit Hilfe von Schatzern zu ermitteln Eine typische Anwendung ist die Schatzung des Effekts einer Variablen x displaystyle x nbsp auf eine andere Variable y displaystyle y nbsp siehe auch Regressionsanalyse Ein Beispiel hierfur ware die in der Arbeitsokonomik relevante Frage nach dem Effekt von Bildung x displaystyle x nbsp auf das Einkommen einer Person y displaystyle y nbsp 3 Ein Schatzer ist eine Zufallsvariable was zu Unscharfe bei den ermittelten Parametern fuhrt siehe auch Verteilungsfunktion und Varianz Deswegen wird selbst im Idealfall der wahre Wert des unbekannten Parameters nicht erreicht sondern nur Naherungswerte Die Fahigkeit den wahren Wert zumindest im Erwartungswert zu erreichen Erwartungstreue oder fur grosse Stichproben gegen ihn zu konvergieren Konsistenz sowie die Varianz des Schatzers um den wahren Wert sind deswegen wichtige Eigenschaften eines Schatzers Die Methode der kleinsten Quadrate ist eine weit verbreitete Methode um Schatzer zu konstruieren die unter den Gauss Markow Annahmen konsistent und effizient sind Werden jedoch relevante Grossen nicht in die Regression mit aufgenommen so konnen Endogenitat Heteroskedastie und Autokorrelation entstehen wodurch die Kleinste Quadrate Schatzung ihre wunschenswerten Eigenschaften verliert und ineffizient oder sogar inkonsistent wird Durch die Nutzung von Paneldaten und Paneldatenmodellen konnen Schatzer hergeleitet werden die diese Probleme losen Eine typische Gleichung eines linearen Paneldatenmodelles fur ein Panel mit i 1 N displaystyle i 1 dotsc N nbsp Individuen und t 1 T displaystyle t 1 dotsc T nbsp Zeitperioden hat die Form y i t x i t b a i u i t displaystyle y it mathbf x it boldsymbol beta alpha i u it nbsp Dabei stellt y i t displaystyle y it nbsp die Auspragung der erklarten abhangigen Variable fur Individuum i displaystyle i nbsp und Zeitperiode t displaystyle t nbsp dar x displaystyle mathbf x nbsp ist ein Vektor der die Auspragungen der erklarenden unabhangigen Variablen enthalt Als Beispiel konnte y i t displaystyle y it nbsp das Einkommen einer Person i displaystyle i nbsp im Jahr t displaystyle t nbsp sein Variablen im Vektor x displaystyle x nbsp waren dann jene Faktoren die einen Einfluss auf das Einkommen einer Person haben wie Alter Arbeitserfahrung ob eine Person arbeitslos ist oder nicht Geschlecht Nationalitat oder die Anzahl besuchter Fortbildungsseminare Die im Vektor x displaystyle mathbf x nbsp zusammengefassten Variablen sind allesamt beobachtbar und stehen in dem Datensatz zur Verfugung Neben diesen Variablen gibt es jedoch noch weitere Faktoren die nicht oder nur sehr schwer beobachtet werden konnen und deswegen nicht im Datensatz zur Verfugung stehen Diese Faktoren werden durch die Terme a i displaystyle alpha i nbsp und u i t displaystyle u it nbsp reprasentiert u i t displaystyle u it nbsp stellt dabei einen Sammelterm fur all jene unbeobachteten Variablen dar die sich uber Zeit und Personen unterscheiden zum Beispiel die Gesundheit einer Person i displaystyle i nbsp im Jahr t displaystyle t nbsp a i displaystyle alpha i nbsp steht fur die unbeobachteten Variablen die sich zwischen Personen unterscheiden fur eine gegebene Person aber uber die Zeit konstant sind Beispiele hierfur waren die grundsatzlichen Wertvorstellungen einer Person oder ihre Intelligenz Fahigkeit Die Terme a i displaystyle alpha i nbsp sind unter anderem als unbeobachtete Heterogenitat latente Variable oder individuelle Heterogenitat bekannt 4 5 Alternativ zur obigen Schreibweise findet auch oft eine Matrizenschreibweise Anwendung bei der die einzelnen Gleichungen quasi ubereinander gestellt werden Dies ergibt dann das Modell Y X b a u displaystyle mathbf Y mathbf X boldsymbol beta boldsymbol alpha boldsymbol u nbsp Dabei ist Y displaystyle mathbf Y nbsp ein Vektor mit den N T displaystyle N cdot T nbsp Auspragungen der erklarten Variable X displaystyle mathbf X nbsp eine Matrix mit den N T displaystyle N cdot T nbsp Auspragungen der k displaystyle k nbsp erklarenden Variablen b displaystyle boldsymbol beta nbsp ist ein Vektor mit den k displaystyle k nbsp Koeffizienten der erklarenden Variablen und a displaystyle alpha nbsp und u displaystyle u nbsp sind Vektoren mit den N T displaystyle N cdot T nbsp Fehlertermen Die beiden wichtigsten linearen Paneldatenmodelle sind das Modell mit festen Effekten und das Modell mit zufalligen Effekten Der zentrale Unterschied zwischen diesen beiden Modellen ist welche Annahme an die Korrelation zwischen der individuellen Heterogenitat a i displaystyle alpha i nbsp und den beobachteten erklarenden Variablen getroffen wird Beispiel BearbeitenEin Beispiel fur die Anwendung von Modellen mit zufalligen und Modellen mit festen Effekten und ihren Schatzern findet man in der oben genannten Frage nach dem Einfluss von Bildung auf das Einkommen einer Person Wie oben erwahnt ware das jahrliche Einkommen einer Person die erklarte Variable erklarende Variablen waren zum einen die Bildung gemessen in Jahren oder in abgeschlossenen Klassen Kursen deren Effekt gemessen werden soll Daneben mussten noch alle Variablen in die Regression mit aufgenommen werden die sowohl mit dem Einkommen als auch mit der Bildung korreliert sind Exemplarisch waren hier das Alter die Berufserfahrung oder die Bildung der Eltern zu nennen Daneben ist es moglich dass andere relevante Faktoren zum Beispiel die Intelligenz die Gesundheit oder die Werthaltung einer Person nicht erfasst werden es wird also individuelle Heterogenitat bestehen Eine mogliche zu schatzende Gleichung ware E i n k o m m e n i t a i b J a h r e B i l d u n g i t x i t g u i t displaystyle mathtt Einkommen it alpha i boldsymbol beta mathtt JahreBildung it x it gamma u it nbsp wobei x displaystyle x nbsp einen Vektor mit zusatzlichen Kontrollvariablen wie Alter Erfahrung und ahnlichem darstellt Die Variable JahreBildung displaystyle operatorname JahreBildung nbsp umfasst dabei nicht nur die vor Berufsbeginn abgeschlossene Bildung sondern auch spater erworbene Abschlusse 6 a i displaystyle alpha i nbsp wird hierbei alle Effekte auffangen die bei einem Individuum uber die Zeit konstant sind aber nicht als Kontrollvariablen in die Regression mit aufgenommen werden konnen etwa weil sie nicht direkt beobachtbar sind Wie bereits erwahnt ist die Intelligenz der beobachteten Individuen ein Beispiel dafur Diese wird wahrscheinlich eine Auswirkung auf den Verdienst eines Individuums haben und wird daruber hinaus auch mit der Bildung korreliert sein Intelligenz kann aber nur schwer gemessen und folglich nur schwer als Kontrollvariable in die Regression mit aufgenommen werden Ahnliches gilt fur andere unbeobachtete aber relevante Variablen die gemeinsam die individuelle Heterogenitat bilden Die Korrelation zwischen dieser Heterogenitat und den erklarenden Variablen ist der zentrale Unterschied zwischen dem Modell mit zufalligen und dem mit festen Effekten Besteht keine solche Korrelation so wird das Modell mit zufalligen Effekten verwendet Das Modell mit festen Effekten kommt zum Einsatz wenn die individuelle Heterogenitat mit erklarenden Variablen korreliert ist Modell mit zufalligen Effekten BearbeitenGrundlagen Bearbeiten Das Modell mit zufalligen Effekten zur Abgrenzung manchmal auch Modell mit zufalligem Achsenabschnitt 7 genannt macht die Annahme dass die unbeobachtete Heterogenitat orthogonal zu den erklarenden Variablen steht d h nicht mit den erklarenden Variablen korreliert E a i x i t E a i 0 displaystyle operatorname E alpha i mid x it operatorname E alpha i 0 nbsp Daruber hinaus muss auch strikte Exogenitat des Fehlerterms angenommen werden E u i t x i t a i 0 t 1 T displaystyle operatorname E u it mid x it alpha i 0 quad t 1 dots T nbsp 8 Unter diesen Annahmen kann die individuelle Heterogenitat als ein weiterer Fehlerterm gesehen werden d h das zu schatzende Modell kann umgeschrieben werden als y i t x i t b z i g v i t displaystyle y it mathbf x it boldsymbol beta mathbf z i boldsymbol gamma v it nbsp mit v i t u i t a i displaystyle v it u it alpha i nbsp Aufgrund der obigen Annahmen ist dann E v i t x i 0 displaystyle operatorname E v it mid x i 0 nbsp fur t 1 T displaystyle t 1 ldots T nbsp 9 Das Modell mit zufalligen Effekten erfullt also die Anforderung dass der Fehlerterm der Regression und die erklarenden Variablen unkorreliert sind Aus diesem Grund wurde eine gewohnliche Kleinste Quadrate Schatzung zu konsistenten Schatzern fur b displaystyle boldsymbol beta nbsp fuhren Aufgrund der individuellen Heterogenitat erfullt das Modell mit zufalligen Effekten allerdings die Annahme der Unkorreliertheit der Fehlerterme nicht Selbst wenn E u i t 2 s u 2 displaystyle operatorname E u it 2 sigma u 2 nbsp und E a i 2 s a 2 displaystyle operatorname E alpha i 2 sigma alpha 2 nbsp Konstanten sind und die idiosynkratischen Fehlerterme unkorreliert sind E u i t u i s 0 displaystyle operatorname E u it cdot u is 0 nbsp t s displaystyle t neq s nbsp wird zwischen den zusammengesetzten Fehlertermen des gleichen Individuums fur verschiedene Zeitpunkte eine Korrelation bestehen E v i t v i s E u i t a i u i s a i E a i 2 s a 2 displaystyle operatorname E v it cdot v is operatorname E u it alpha i cdot u is alpha i operatorname E alpha i 2 sigma alpha 2 nbsp 10 Aus diesem Grund wird die Varianz Kovarianzmatrix eine N T N T displaystyle NT times NT nbsp Diagonalmatrix sein gegeben durch W W i 0 0 0 W i 0 0 0 W i displaystyle boldsymbol Omega begin pmatrix boldsymbol Omega i amp 0 amp cdots amp 0 0 amp boldsymbol Omega i amp ddots amp vdots vdots amp ddots amp ddots amp 0 0 amp cdots amp 0 amp boldsymbol Omega i end pmatrix nbsp wobei die einzelnen Diagonalelemente gegeben sind durch T T displaystyle T times T nbsp Matrizen W i s u 2 s a 2 s a 2 s a 2 s a 2 s u 2 s a 2 s a 2 s a 2 s a 2 s u 2 s a 2 displaystyle boldsymbol Omega i begin pmatrix sigma u 2 sigma alpha 2 amp sigma alpha 2 amp cdots amp sigma alpha 2 sigma alpha 2 amp sigma u 2 sigma alpha 2 amp ddots amp vdots vdots amp ddots amp ddots amp sigma alpha 2 sigma alpha 2 amp cdots amp sigma alpha 2 amp sigma u 2 sigma alpha 2 end pmatrix nbsp Die Matrix W displaystyle boldsymbol Omega nbsp ist also keine Diagonalmatrix sondern eine Blockdiagonalmatrix Die besondere Struktur mit nur zwei Parametern s u 2 displaystyle sigma u 2 nbsp und s a 2 displaystyle sigma alpha 2 nbsp wird auch als RE Struktur bezeichnet 11 Auf Basis dieses Modells konnen dann mehrere Schatzer hergeleitet werden die konsistent und gegebenenfalls auch effizient sind Schatzer im Modell mit zufalligen Effekten Bearbeiten Kleinste Quadrate Schatzung Bearbeiten Wie oben ausgefuhrt sind im Modell mit zufalligen Effekten der zusammengesetzte Fehlerterm und die erklarenden Variablen unkorreliert weswegen die Methode der Kleinsten Quadrate zu konsistenten Schatzungen fuhrt Im Zusammenhang mit Paneldaten wird die Kleinste Quadrate Schatzung engl ordinary least squares estimation kurz OLSE auch als gepoolte Kleinste Quadrate Schatzung engl pooled OLS bezeichnet weil die Paneldaten gepoolt uber beide Gruppen zusammengefasst werden d h die Zeitstruktur der Paneldaten ausser Acht gelassen und das Modell anhand der gepoolten Daten mit der Kleinste Quadrate Schatzung geschatzt wird 12 Eine Matrix mit der RE Struktur erfullt allerdings die fur den Satz von Gauss Markow zentrale Annahme der Unkorreliertheit der Fehlerterme nicht die eine diagonale Varianz Kovarianzmatrix mit konstantem Diagonalelement erfordert Die Kleinste Quadrate Schatzung ist im Modell mit zufalligen Effekten deswegen nicht notwendigerweise effizient Daruber hinaus sind die Kleinste Quadrate geschatzten Standardfehler nicht korrekt eben weil dabei die Korrelation uber Zeit ignoriert wird Fur Inferenz und Hypothesentests mussten die Standardfehler also angepasst werden 13 Schatzer fur zufallige Effekte Bearbeiten nbsp Vergleich der Kleinste Quadrate Schatzung rot mit dem Schatzer fur zufallige Effekte blau wenn die Annahmen des RE Modells erfullt sind Sowohl der Kleinste Quadrate Schatzer als auch der Schatzer fur zufallige Effekte sind um den wahren Parameterwert von 5 zentriert der Schatzer fur zufallige Effekte weist aber eine deutlich geringere Varianz auf Der Schatzer fur zufallige Effekte RE Schatzer schafft an dieser Stelle Abhilfe Konkret handelt es sich dabei um den auf das Modell mit zufalligen Effekten angewandten geschatzten verallgemeinerten KQ Schatzer kurz GVKQ Schatzer Angenommen die Varianz Kovarianzmatrix W displaystyle boldsymbol Omega nbsp ware bekannt Dann konnte das Modell transformiert werden indem es auf beiden Seiten mit W 1 2 displaystyle boldsymbol Omega 1 2 nbsp multipliziert wird W 1 2 y W 1 2 X b W 1 2 v displaystyle boldsymbol Omega 1 2 cdot mathbf y boldsymbol Omega 1 2 cdot mathbf X cdot boldsymbol beta boldsymbol Omega 1 2 cdot boldsymbol v nbsp Setzt man nun v W 1 2 v displaystyle boldsymbol tilde v boldsymbol Omega 1 2 cdot boldsymbol v nbsp dann ist die Varianz Kovarianzmatrix des Fehlerterms im solcherart transformierten Modell E v v X E W 1 2 v v W 1 2 X W 1 2 E v v X W 1 2 displaystyle operatorname E boldsymbol tilde v cdot boldsymbol tilde v mid mathbf X operatorname E boldsymbol Omega 1 2 cdot boldsymbol v cdot boldsymbol v cdot boldsymbol Omega 1 2 mid mathbf X boldsymbol Omega 1 2 cdot operatorname E boldsymbol v cdot boldsymbol v mid mathbf X cdot boldsymbol Omega 1 2 nbsp Da E v v X W displaystyle operatorname E boldsymbol v cdot boldsymbol v mid mathbf X boldsymbol Omega nbsp gilt gilt folglich E v v X W 1 2 W W 1 2 I displaystyle operatorname E boldsymbol tilde v cdot boldsymbol tilde v mid mathbf X boldsymbol Omega 1 2 cdot boldsymbol Omega cdot boldsymbol Omega 1 2 mathbf I nbsp Ware die Varianz Kovarianzmatrix also bekannt konnte das Modell durch sie so transformiert werden dass das transformierte Modell die Einheitsmatrix als Varianz Kovarianzmatrix hatte Diese Einheitsmatrix wurde die Annahmen des Satzes von Gauss Markow erfullen der Schatzer ware also effizient Dieses hypothetische Modell das sich nicht nur auf Modell mit zufalligen Effekten sondern auf alle linearen Modelle mit Heteroskedastie und Autokorrelation anwenden lasst ist als verallgemeinerte Kleinste Quadrate Schatzung kurz VKQ englisch Generalised Least Squares kurz GLS bekannt 14 Im Modell mit zufalligen Effekten ist die genaue Varianz Kovarianzmatrix allerdings unbekannt die VKQ Schatzung kann also nicht durchgefuhrt werden Stattdessen kann aber die sogenannte geschatzte verallgemeinerte Kleinste Quadrate Schatzung englisch Estimated Generalized Least Squares kurz EGLS angewandt werden eine zweistufige Prozedur 15 Hierbei wird das zugrundeliegende Modell zunachst mit einer Kleinste Quadrate Schatzung geschatzt die wie oben ausgefuhrt zu konsistenten Schatzern fuhrt Auf Basis dieser Kleinste Quadrate Schatzung und ihrer Residuen konnen dann konsistente Schatzer s u 2 displaystyle widehat sigma u 2 nbsp und s a 2 displaystyle widehat sigma alpha 2 nbsp berechnet 16 und mit ihnen eine geschatzte Varianz Kovarianzmatrix W displaystyle widehat boldsymbol Omega nbsp konstruiert werden W displaystyle widehat boldsymbol Omega nbsp wird dann benutzt um das zugrundeliegende Modell zu transformieren W 1 2 y W 1 2 X b W 1 2 v displaystyle widehat boldsymbol Omega 1 2 cdot mathbf y widehat boldsymbol Omega 1 2 cdot mathbf X cdot boldsymbol beta widehat boldsymbol Omega 1 2 cdot boldsymbol v nbsp Anschliessend wird dieses transformierte Modell wieder mit der Kleinste Quadrate Schatzung geschatzt woraus sich der GVKQ bzw Schatzer fur zufallige Effekte ergibt b R E X W 1 X 1 X W 1 y displaystyle widehat boldsymbol beta RE mathbf X widehat boldsymbol Omega 1 mathbf X 1 mathbf X widehat boldsymbol Omega 1 mathbf y nbsp 17 Der Schatzer fur zufallige Effekte als Mitglied der GVKQ Familie weist auch die gleichen wunschenswerten Eigenschaften wie andere GVKQ Schatzer auf Er ist asymptotisch aquivalent zum VKQ Schatzer und deswegen asymptotisch effizient 18 Zur einfachen Implementierung des Schatzer fur zufallige Effektes kann bei modernen Statistik Programmen auf bereits programmierte Routinen zuruckgegriffen werden Between Schatzer Bearbeiten Ein weiterer konsistenter Schatzer im Modell mit zufalligen Effekten ist der sogenannte Between Schatzer Dabei wird durch Bildung von Mittelwerten eine Art Querschnittsstruktur erzeugt y i a x i b a i a u i displaystyle overline y i alpha overline x i boldsymbol beta alpha i alpha overline u i nbsp wobei alle Mittelwerte uber die Zeit berechnet wurden also zum Beispiel y i 1 T t 1 T y i t displaystyle textstyle overline y i tfrac 1 T sum t 1 T y it nbsp Berechnet wird der Between Schatzer dann durch eine Kleinste Quadrate Schatzung des in Mittelwerten ausgedruckten Modelles Er ist konsistent falls x i displaystyle overline x i nbsp und der zusammengesetzte Fehlerterm a i a u i displaystyle alpha i alpha overline u i nbsp unkorreliert sind Im Modell mit zufalligen Effekten ist dies aufgrund der Orthogonalitatsannahme E a i x i E a i 0 displaystyle operatorname E alpha i mid x i operatorname E alpha i 0 nbsp der Fall und der Between Schatzer folglich konsistent 19 Potentielle Probleme Bearbeiten nbsp Vergleich des Schatzer fur feste Effekte mit dem Schatzer fur zufallige Effekte in einer Situation in der die erklarenden Variablen mit der individuellen Heterogenitat korreliert sind Nur der Schatzer fur feste Effekte ist um den wahren Parameterwert von 5 zentriert der Schatzer fur zufallige Effekte ist inkonsistent Die zentrale Annahme des Modells mit zufalligen Effekten ist dass die unbeobachtete individuelle Heterogenitat nicht mit den anderen erklarenden Variablen korreliert ist Falls jedoch E a i x i 0 displaystyle operatorname E alpha i mid x i neq 0 nbsp so ist das Modell mit zufalligen Effekten nicht anwendbar die zufalligen Effekte Kleinste Quadrate und Between Schatzer sind inkonsistent Modell mit festen Effekten BearbeitenGrundlagen Bearbeiten Das Modell mit festen Effekten auch Feste Effekte Modell kurz FE Modell und darauf aufbauende Schatzer ermoglichen es auch dann die Effekte der erklarenden Variablen konsistent zu schatzen wenn die individuelle zeitkonstante Heterogenitat mit den erklarenden Variablen korreliert ist Schatzer im Modell mit festen Effekten Bearbeiten Schatzer fur feste Effekte Within Schatzer Bearbeiten Die grundsatzliche Idee des Schatzers fur feste Effekte ist es die individuelle Heterogenitat durch eine geeignete Transformation der Schatzgleichung aus dieser zu entfernen Dabei wird zum einen die Panel bzw Mehrebenenstruktur der Daten ausgenutzt zum anderen die Annahme dass die individuelle Heterogenitat fix also eine fur jedes Individuum spezifische Konstante ist Das zugrundeliegende Modell sei wiederum y i t a i x i t b u i t displaystyle y it alpha i x it boldsymbol beta u it nbsp Weiterhin gelte die Annahme der strikten Exogenitat in Bezug auf u displaystyle u nbsp d h E u i t x i t a i 0 t 1 T displaystyle operatorname E u it mid x it alpha i 0 t 1 dots T nbsp Im Gegensatz zum Modell mit zufalligen Effekten kann jedoch E a i x i 0 displaystyle operatorname E alpha i mid x i neq 0 nbsp sein Trifft dies zu so ist E v i t x i t E u i t a i x i t E x i t a i 0 displaystyle operatorname E v it cdot x it operatorname E u it alpha i x it operatorname E x it cdot alpha i neq 0 nbsp und eine gewohnliche Kleinste Quadrate oder RE Schatzung wird in diesem Fall nicht konsistent sein Eine Abhilfe ist der sogenannte Schatzer fur feste Effekte manchmal auch Within Estimator genannt 20 Die Idee hierbei ist die uber die Zeit konstante individuums spezifische Heterogenitat dadurch zu eliminieren dass von jeder Beobachtung der individuums spezifische Durchschnitt uber die Zeitperioden subtrahiert wird Das zu schatzende Modell wird also zu y i t y i x i t x i b u i t u i displaystyle y it overline y i x it overline x i boldsymbol beta u it overline u i nbsp wobei y i 1 T t 1 T y i t displaystyle textstyle overline y i tfrac 1 T sum t 1 T y it nbsp und analog fur die anderen Variablen gilt Da 1 T t 1 T a i a i displaystyle textstyle tfrac 1 T sum t 1 T alpha i alpha i nbsp gilt fallt die individuumsspezifische Heterogenitat der feste Effekt aus dem Modell heraus 21 Der Schatzer fur feste Effekte ergibt sich dann durch eine gewohnliche Kleinste Quadrate Schatzung des transformierten Modelles Der FE oder Within Schatzer ist konsistent Da E u i t x i t a i 0 t 1 T displaystyle operatorname E u it mid x it alpha i 0 t 1 dots T nbsp ist im transformierten Modell E x i t x i u i t u i 0 displaystyle operatorname E x it overline x i cdot u it overline u i 0 nbsp d h die Fehlerterme und ihre Zeitmittelwerte sind nicht mit den erklarenden Variablen und ihren Zeitmittelwerten korreliert Unter der Annahme dass die Fehlerterme fur eine Beobachtungseinheit uber die Zeit hinweg eine konstante Varianz haben und nicht miteinander korreliert sind ist der Within Schatzer auch effizient 22 Weiter kann gezeigt werden dass der Within Schatzer asymptotisch normalverteilt ist Unter der Annahme von Homoskedastie und keiner Autokorrelation der Fehlerterme kann die asymptotische Varianz des Schatzers berechnet werden als V b s u 2 i 1 N t 1 T x i t x i t 1 displaystyle V hat boldsymbol beta sigma u 2 cdot left sum i 1 N sum t 1 T ddot x it ddot x it right 1 nbsp Dabei ist s u 2 displaystyle textstyle sigma u 2 nbsp die Varianz des Fehlerterms u x i t x i t x i displaystyle textstyle ddot x it x it overline x i nbsp Zur Schatzung der Varianz wird dann lediglich noch ein konsistenter Schatzer der Fehlertermvarianz benotigt Ein solcher ist gegeben durch s u 2 1 N T 1 K i 1 N t 1 T ϵ i t 2 displaystyle hat sigma u 2 tfrac 1 N T 1 K cdot sum i 1 N sum t 1 T widehat epsilon it 2 nbsp Falls von der Homoskedastie Annahme abgewichen werden soll kann die Varianz auch durch einen robusten Schatzer geschatzt werden Dieser ist im Falle des Within Schatzers V b i 1 N t 1 T x i t x i t 1 i 1 N t 1 T s 1 T x i t x i s ϵ i t ϵ i s i 1 N t 1 T x i t x i t 1 displaystyle V hat boldsymbol beta left sum i 1 N sum t 1 T ddot x it ddot x it right 1 sum i 1 N sum t 1 T sum s 1 T ddot x it ddot x is widehat ddot epsilon it widehat ddot epsilon is left sum i 1 N sum t 1 T ddot x it ddot x it right 1 nbsp 23 Auf Basis der geschatzten Varianz konnen dann Hypothesentests durchgefuhrt und Konfidenzintervalle berechnet werden Anstatt der geschilderten Transformation des Modells durch Subtraktion der individuellen Durchschnitte uber die Zeit konnen auch andere Schatzer verwendet werden Der sogenannte Kleinste Quadrate Schatzer mit Dummyvariablen bzw OLSDV Schatzer englisch OLSDV fur ordinary least squares dummy variable beispielsweise fugt den erklarenden Variablen des Modells noch Dummyvariablen fur jede Beobachtungseinheit hinzu anschliessend wird eine gewohnliche Kleinste Quadrate Schatzung dieses erweiterten Modells durchgefuhrt Mithilfe des Frisch Waugh Lovell Theorems lasst sich zeigen dass die daraus resultierenden Schatzer fur die b displaystyle beta nbsp Koeffizienten identisch zu denen des Schatzer fur feste Effektes sind Daruber hinaus ergibt die LSDV Regression auch Schatzungen fur die individuellen Terme a i displaystyle alpha i nbsp Diese sind allerdings nur dann konsistent wenn die Anzahl der Zeitperioden gross ist 24 Erste Differenzenschatzer Bearbeiten Eine weitere Moglichkeit das Problem der individuellen Heterogenitat mit Hilfe von Paneldaten Methoden zu adressieren ist die Differenzenbildung die zum erste Differenzenschatzer fuhrt Dabei wird von jeder Beobachtung die zeitlich eine Periode vorhergehende Beobachtung abgezogen y i t y i t 1 x i t x i t 1 b u i t u i t 1 displaystyle y it y it 1 x it x it 1 boldsymbol beta u it u it 1 nbsp Da die individuelle Heterogenitat als uber die Zeit konstant angenommen wird fallt sie hierbei heraus und das Modell in Differenzen kann durch eine Kleinste Quadrate Schatzung geschatzt werden Falls angenommen wird dass die Fehlerterme in der Regression homoskedastisch und uber die Zeit unkorreliert sind ist der Within Schatzer Schatzer fur feste Effekte effizienter als der Erste Differenzenschatzer Unter der schwacheren Annahme dass die ersten Differenzen der Fehlerterme uber die Zeit unkorreliert sind ist dagegen der Erste Differenzenschatzer effizienter 25 Potenzielle Probleme Bearbeiten Ein weit verbreitetes Problem bei der Anwendung von Schatzern im Modell mit festen Effekten besteht falls die zugrundeliegenden Daten mit einem Messfehler erhoben wurden Fehlerbehaftete Datenerhebungen sind auch in normalen Kleinste Quadrate Schatzungen auf Basis von Querschnittsdaten ein Problem das zu inkonsistenter Schatzung fuhren kann Die dem Within Schatzer zugrundeliegende Transformation kann diese Fehlerbehaftung noch verstarken 26 Als Beispiel hierfur kann eine Studie des amerikanischen Okonomen Richard B Freeman aus dem Jahr 1984 genannt werden Zu dieser Zeit wurden Schatzungen der festen Effekte oft verwendet um den kausalen Effekt einer Gewerkschaftsmitgliedschaft auf den Verdienst eines Arbeitnehmers zu schatzen Die zugrundeliegende Argumentation war dass Arbeitnehmer die einer Gewerkschaft beitreten sich auch in anderen unbeobachtbaren Eigenschaften von den Arbeitnehmern unterscheiden die nicht Mitglied einer Gewerkschaft sind Aufgrund dieser vermuteten systematischen Unterschiede boten sich Paneldaten und Schatzer fur feste Effekte geradezu an Freemans Ergebnisse zeigten jedoch dass die Ergebnisse der festen Effekte aufgrund von fehlerbehafteten Datenerhebungen nach unten verzerrt sind wahrend gewohnliche Kleinste Quadrate Schatzungen auf Basis von Querschnittsdaten nach oben verzerrt sind beide Techniken ermoglichen in diesem Fall also keine konsistente Schatzung jedoch konnen die Ergebnisse der festen Effekte als untere Grenze die Kleinste Quadrate Ergebnisse als obere Grenze fur den zugrundeliegenden Effekt angesehen werden 27 Eine mogliche Abhilfe fur Probleme aufgrund von fehlerbehafteten Datenerhebungen ist das Anwenden einer Instrumentvariablenstrategie 28 Wenn es zum Beispiel zwei Messungen einer Variablen gibt kann eine hiervon als Instrument fur die zweite Messung verwendet werden was dann eine konsistente Schatzung des Effektes der doppelt gemessenen Variablen erlaubt 29 Ein weiteres Problem ist dass die Berechnung auf Basis von Abweichungen vom Mittelwert nicht nur die unbeobachtbare individuelle Heterogenitat bereinigt sondern auch einen Teil der Variation in den erklarenden Variablen entfernt es wird also sowohl gute als auch schlechte Variation aus dem Modell entfernt 30 Am deutlichsten wird dies bei erklarenden Variablen die uber die Zeit konstant sind Diese werden vom Within Schatzer und dem Differenzen Schatzer ganzlich aus der Schatzgleichung entfernt 31 Dies ist auch ein Problem fur das eingangs erwahnte Beispiel der Regression von Einkommen auf Bildung Die vor dem Berufsleben erworbene Bildung ist aus spaterer Sicht eine Konstante die verbliebene Variation im Modell beruht also vor allem auf spater erworbenen Abschlussen Die Anwendbarkeit von Schatzer fur feste Effekte auf dieses Modell wurde deswegen bereits in den 1980er Jahren bestritten 32 In einer Arbeit aus dem Jahr 1981 haben Jerry Hausman und William E Taylor einen Weg aufgezeigt wie unter zusatzlichen Annahmen an die Daten auch im feste Effekte Kalkul Koeffizienten fur uber die Zeit konstante Variablen geschatzt werden konnen 33 Vergleich beider Modelle BearbeitenDie Entscheidung ob und welcher Schatzer des Modells mit zufalligen effekten oder des Modells mit festen Effekten angewandt werden soll hangt von der Natur des zu Grunde liegenden Modells ab Falls das zu Grunde liegende Modell die Feste Effekte Struktur also eine Korrelation zwischen individueller Heterogenitat und erklarenden Variablen aufweist so ist der Within Schatzer konsistent und der Schatzer fur zufallige Effekte inkonsistent Besteht dagegen eine RE Struktur so sind sowohl der Within Schatzer als auch Schatzer fur zufallige Effekte konsistent aber der Schatzer fur zufallige Effekte ist effizienter hat also eine kleinere Varianz und erlaubt damit eine genauere Schatzung Fur die Entscheidung welches Modell vorliegt besteht die Moglichkeit der Durchfuhrung des Hausman Spezifikationstests Dabei werden die Unterschiede zwischen den beiden Schatzern verglichen fallen diese statistisch betrachtet gross aus so wird dies als Anzeichen fur das Vorliegen eines Modell mit festen Effekten angesehen 34 Modelle mit zufalligen Effekten konnen auch verwendet werden um Within Schatzer fur zeitveranderliche Variablen zu erhalten indem die Between Schatzer der Variablen in das Modell aufgenommen werden 35 36 37 Dadurch ist es moglich zufallige Effekte zeitkonstanter Variablen und feste Effekte zeitveranderlicher Variablen in einem Modell zu schatzen Dieses Modell wird auch als mixed effects model oder hybrid model bezeichnet Lineare Panelmodelle stossen ausserdem an ihre Grenzen wenn die erklarte Variable in zeitverzogerter Form zugleich erklarende Variable ist zum Beispiel als y i t g y i t 1 a i x i t b u i t displaystyle y it boldsymbol gamma y it 1 alpha i x it boldsymbol beta u it nbsp In einem solchen Modell sind mit den herkommlichen Schatzern auf Basis Linearer Panelmodelle keine konsistenten Schatzungen moglich 38 In solchen Fallen muss deswegen auf Dynamische Paneldatenmodelle zuruckgegriffen werden Schatzmethoden sind hier der dem feste Effekte Kalkul nahe Arellano Bond Schatzer nach Manuel Arellano und Stephen Bond und der dem zufallige Effekte Kalkul ahnliche Bhargava Sargan Schatzer nach Alok Bhargava und John Denis Sargan Literatur BearbeitenJoshua D Angrist und Jorn Steffen Pischke Mostly Harmless Econometrics An Empiricist s Companion Princeton University Press 2008 Badi H Baltagi Econometric Analysis of Panel Data 5 Auflage John Wiley amp Sons 2013 A Colin Cameron und Pravin K Trivedi Microeconometrics Methods and Applications Cambridge University Press 2005 ISBN 0521848059 insb Kapitel 21 Jeffrey M Wooldridge Econometric Analysis of Cross Section and Panel Data Second Edition Cambridge MIT Press 2002 insb Kapitel 10 STATA FAQ What is the between estimator Abgerufen am 5 Oktober 2011 STATA FAQ Fixed between and random effects and xtreg Abgerufen am 5 Oktober 2011 Ludwig Fahrmeir Thomas Kneib Stefan Lang Regression Modelle Methoden und Anwendungen 2 Auflage Springer Verlag 2009 ISBN 978 3 642 01836 7 Anmerkungen Bearbeiten Ludwig Fahrmeir Thomas Kneib Stefan Lang Regression Modelle Methoden und Anwendungen Springer Verlag 2009 S 253 Ludwig Fahrmeir Thomas Kneib Stefan Lang Regression Modelle Methoden und Anwendungen Springer Verlag 2009 S 253 Fur einen Uberblick hierzu siehe unter anderem David Card Estimating the Return to Schooling Progress on Some Persistent Econometric Problems Econometrica 69 5 September 2001 S 1127 1160 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 251 Denkbar ware auch als dritten unbeobachteten Term einen zwischen Personen konstanten aber sich uber die Zeit andernden Term 8 t displaystyle theta t nbsp anzunehmen der fur unbeobachtete Variablen steht die sich uber die Zeit andern aber alle Individuen gleich betreffen zum Beispiel die konjunkturelle Entwicklung Siehe hierzu zum Beispiel Joshua D Angrist und Whitney K Newey Over Identification Tests in Earnings Functions with Fixed Effects Journal of Business and Economic Statistics 9 3 S 321 Cameron amp Trivedi Microeconometrics 2005 S 700 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 257 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 258 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 258f Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 259 Cameron amp Trivedi Microeconometrics 2005 S 702 Cameron amp Trivedi 2005 Microeconometrics S 703 Fur weitere Details siehe Cameron amp Trivedi Microeconometrics 2005 S 82 Ludwig von Auer Okonometrie Eine Einfuhrung Springer ISBN 978 3 642 40209 8 6 durchges u aktualisierte Auflage 2013 S 408 Fur die genaue Berechnung siehe Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 260f Cameron amp Trivedi Microeconometrics 2005 S 81f Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 260 Cameron amp Trivedi Microeconometrics 2005 S 703 Cameron amp Trivedi Microeconometrics 2005 S 726 Cameron amp Trivedi Microeconometrics 2005 S 726 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 269f Cameron amp Trivedi Microeconometrics 2005 S 727 Cameron amp Trivedi Microeconometrics 2005 S 732f Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 279 281 Angrist amp Pischke Mostly Harmless Econometrics 2009 S 225 Richard B Freeman Longitudinal Analyses of the Effects of Trade Unions Journal of Labor Economics 2 1 Januar 1984 S 1 26 Angrist amp Pischke Mostly Harmless Econometrics 2009 S 226f Fur Beispiele hiefur siehe zum Beispiel Orley Ashenfelter amp Alan B Krueger Estimates of the Economic Returns to Schooling from a New Sample of Twins American Economic Review 84 5 1994 S 1157 1173 oder Andreas Ammermuller amp Jorn Steffen Pischke Peer Effects in European Primary Schools Evidence from the Progress in International Reading Literacy Study Journal of Labor Economics 27 3 2009 S 315 348 Angrist amp Pischke Mostly Harmless Econometrics 2009 S 226 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 266 siehe zum Beispiel Jerry A Hausman und William E Taylor Panel Data and Unobservable Individual Effects Econometrica 49 6 1981 S 1377f Angrist amp Newey Over Identification Tests in Earnings Functions with Fixed Effects Journal of Business and Economic Statistics 9 3 dagegen argumentieren dass auch die nachschulische Bildung erwachsener Manner in den USA noch einige Varianz aufweist und deswegen als zeitvariant aufgefasst werden kann Siehe hierzu Jerry A Hausman und William E Taylor Panel Data and Unobservable Individual Effects Econometrica 49 6 1981 S 1377 1398 Wooldridge Econometric Analysis of Cross Section and Panel Data 2002 S 288 Paul D Allison Fixed effects regression models SAGE Publications Thousand Oaks 2009 ISBN 978 0 7619 2497 5 Hans Jurgen Andress Katrin Golsch Alexander Schmidt Applied Panel Data Analysis for Economic and Social Surveys Springer Verlag Heidelberg New York Dordrecht London 2003 ISBN 978 3 642 32913 5 S 164 166 Daniel McNeish Ken Kelley Fixed Effects Models Versus Mixed Effects Models for Clustered Data Reviewing the Approaches Disentangling the Differences and Making Recommendations In Psychological Methods Band 24 Nr 1 2018 S 20 35 doi 10 1037 met0000182 Fur das Beispiel des Within Schatzers siehe Cameron amp Trivedi Microeconometrics 2005 S 763f Abgerufen von https de wikipedia org w index php title Lineare Paneldatenmodelle amp oldid 228741994