www.wikidata.de-de.nina.az
In der Testtheorie ist das Testen allgemeiner linearer Hypothesen Testen linearer Hypothesen 1 allgemeine lineare Hypothesentests die Verallgemeinerung von Testproblemen in Regressionsmodellen Dieses Testverfahren erlaubt im Vergleich zum t Test das Testen mehrerer Nullhypothesen bezuglich einer Gruppe von Parametern in linearen Einzelgleichungsmodellen Unter multiplen Hypothesentests versteht man zum einen den F Test fur das multiple Regressionsmodell welcher sich dadurch auszeichnet dass die Teststatistik des Hypothesentests unter der Nullhypothese einer F Verteilung folgt und den t Test fur das multiple Regressionsmodell Bei einem gewohnlichen F Test wird lediglich eine Einzelgleichung getestet Inhaltsverzeichnis 1 Ausgangslage 2 Allgemeine lineare Hypothese 3 T Test fur das multiple Regressionsmodell 3 1 Einzelgleichungsmodell 4 F Test fur das multiple Regressionsmodell 4 1 Konstruktion der Teststatistik 5 Weblinks 6 Literatur 7 EinzelnachweiseAusgangslage BearbeitenDa viele Variablen des Interesses nicht nur von einer unabhangigen Variablen abhangen betrachtet man haufig eine abhangige Variable die durch mehrere unabhangige Variablen erklart werden sollen Zum Beispiel ist die Gesamtproduktion einer Volkswirtschaft von dessen Kapitaleinsatz Arbeitseinsatz und dessen Flache abhangig Solch eine multiple Abhangigkeit kommt der Realitat viel naher und man gibt die Annahme der einfachen linearen Regression auf bei der die Variable des Interesses nur von einer Variablen abhangt Um solch eine multiple Abhangigkeit zu modellieren betrachten man als Ausgangslage ein typisches multiples lineares Regressionsmodell oder genauer gesagt ein die Normalverteilungsannahme einschliessendes klassisches lineares Modell mit y i x i k i 1 n k 1 K displaystyle y i x ik i 1 dots n k 1 dots K nbsp fur n displaystyle n nbsp Hierbei bezeichnen die y i displaystyle y i nbsp die zufalligen Zielgrossen einfachheitshalber im Folgenden kleingeschrieben und damit nicht deren Realisierung gemeint und die x i displaystyle x i nbsp bezeichnen die fixen Regressoren Hierbei ist zu beachten dass zusatzlich zur Dimension der unabhangigen Variablen auch eine zeitliche Dimension hinzugefugt wird wodurch sich ein lineares Gleichungssystem ergibt was sich auch matriziell darstellen lasst Der Zusammenhang zwischen der abhangigen Variablen und den unabhangigen Variablen kann wie folgt dargestellt werden y i b 0 x i 1 b 1 x i 2 b 2 x i K b K e i x i b e i i 1 2 n displaystyle y i beta 0 x i1 beta 1 x i2 beta 2 ldots x iK beta K varepsilon i mathbf x i top boldsymbol beta varepsilon i quad i 1 2 dotsc n nbsp In Vektor Matrix Form auch y 1 y 2 y n n 1 1 x 11 x 12 x 1 K 1 x 21 x 22 x 2 K 1 x n 1 x n 2 x n K n p b 0 b 1 b K p 1 e 1 e 2 e n n 1 displaystyle begin pmatrix y 1 y 2 vdots y n end pmatrix n times 1 quad quad begin pmatrix 1 amp x 11 amp x 12 amp cdots amp x 1K 1 amp x 21 amp x 22 amp cdots amp x 2K vdots amp vdots amp vdots amp ddots amp vdots 1 amp x n1 amp x n2 amp cdots amp x nK end pmatrix n times p quad cdot quad begin pmatrix beta 0 beta 1 vdots beta K end pmatrix p times 1 quad quad begin pmatrix varepsilon 1 varepsilon 2 vdots varepsilon n end pmatrix n times 1 nbsp oder in kompakter Schreibweise y X b e displaystyle mathbf y mathbf X boldsymbol beta boldsymbol varepsilon nbsp Hier stellt b displaystyle boldsymbol beta nbsp einen Vektor von unbekannten Parametern dar bekannt als Regressionskoeffizienten die mithilfe der Daten geschatzt werden mussen Des Weiteren wird angenommen dass der Erwartungswert des Vektors der Fehlerterme e displaystyle boldsymbol varepsilon nbsp in allen Komponenten 0 ist E e 0 displaystyle operatorname E boldsymbol varepsilon boldsymbol 0 nbsp Diese Annahme bedeutet dass das Modell grundsatzlich fur korrekt gehalten wird und die beobachtete Abweichung als zufallig angesehen wird oder von vernachlassigbaren ausseren Einflussen herruhrt Hierbei nimmt man von der Datenmatrix X R n p displaystyle mathbf X in mathbb R n times p nbsp an dass sie vollen Spalten Rang hat das heisst es gilt Rang X p K 1 displaystyle mbox Rang boldsymbol X p K 1 nbsp Ferner erwartet man fur die Kovarianzmatrix der Fehler dass Cov e s 2 I n displaystyle mbox Cov boldsymbol varepsilon sigma 2 mathbf I n nbsp gilt Des Weiteren wird angenommen dass die Gauss Markow Annahmen gelten damit man obiges Modell effizient und unverzerrt mittels der Methode der kleinsten Quadrate schatzen kann Allgemeine lineare Hypothese BearbeitenEine allgemeine Nullhypothese umfasst eine Anzahl von a displaystyle a nbsp linearen Restriktionen an die Koeffizienten Man kann diese allgemeine lineare Hypothese also die Hypothese bei der das Interesse daran liegt sie zu verwerfen formulieren als H 0 R 1 R 2 R a a p b 0 b 1 b K p 1 r 1 r 2 r a a 1 displaystyle H 0 begin pmatrix boldsymbol R 1 boldsymbol R 2 vdots boldsymbol R a end pmatrix a times p quad cdot quad begin pmatrix beta 0 beta 1 vdots beta K end pmatrix p times 1 quad quad begin pmatrix r 1 r 2 vdots r a end pmatrix a times 1 nbsp beziehungsweise 2 H 0 R b r displaystyle H 0 boldsymbol R boldsymbol beta boldsymbol r nbsp mit p K 1 displaystyle quad p K 1 nbsp der a p displaystyle a times p nbsp Hypothesenmatrix R displaystyle boldsymbol R nbsp und dem a 1 displaystyle a times 1 nbsp Vektor der Restriktionen r displaystyle boldsymbol r nbsp und dem p 1 displaystyle p times 1 nbsp Vektor der Regressionskoeffizienten und den 1 p displaystyle 1 times p nbsp Zeilenvektoren R i displaystyle boldsymbol R i nbsp Das Testproblem lautet dann H 0 R b r gegen H 1 R b r displaystyle H 0 boldsymbol R boldsymbol beta boldsymbol r quad mbox gegen quad H 1 boldsymbol R boldsymbol beta neq boldsymbol r nbsp wobei angenommen wird dass Rang R a p displaystyle operatorname Rang boldsymbol R a leq p nbsp gilt Fur den Vektor der Regressionskoeffizienten wird wie fur ublich angenommen dass man ihn mit der Methode der kleinsten Quadrate schatzt T Test fur das multiple Regressionsmodell BearbeitenEinzelgleichungsmodell Bearbeiten In vielen Fallen ist man nur daran interessiert eine einzelne Hypothese zu testen z B eine einzelne Linearkombination der Regressionskoeffizienten Mochte man beispielsweise unter Voraussetzung einer log linearen Cobb Douglas Funktion y i b 0 b 1 x i 1 b 2 x i 2 b k x i K displaystyle y i beta 0 beta 1 x i1 beta 2 x i2 ldots beta k x iK nbsp mit x i 1 log P i 1 x i 2 log P i 2 x i K log P i K displaystyle x i1 log P i1 x i2 log P i2 ldots x iK log P iK nbsp wobei P i 1 P i K displaystyle P i1 dots P iK nbsp Werte der Produktionsfaktoren P 1 P K displaystyle P 1 dots P K nbsp sind testen ob konstante Skalenertrage vorliegen so musste getestet werden ob r 1 k 1 K b k 1 displaystyle r 1 sum nolimits k 1 K beta k 1 nbsp In Vektorschreibweise ergibt sich dann folgendes Hypothesenpaar H 0 R 1 b 0 1 1 1 b r 1 vs H 1 R 1 b 0 1 1 1 b r 1 displaystyle H 0 boldsymbol R 1 boldsymbol beta begin pmatrix 0 amp 1 amp cdots amp 1 amp cdots amp 1 end pmatrix boldsymbol beta r 1 quad text vs quad H 1 boldsymbol R 1 boldsymbol beta begin pmatrix 0 amp 1 amp cdots amp 1 amp cdots amp 1 end pmatrix boldsymbol beta neq r 1 nbsp Zunachst gilt es die Teststatistik fur diesen Test aufzustellen Daher ist man daran interessiert die Parametrisierung der Verteilung der Linearkombination zu ermitteln Fur die Verteilung ergibt sich R 1 b N R 1 b s 2 R 1 X X 1 R 1 displaystyle boldsymbol R 1 boldsymbol hat beta sim mathcal N boldsymbol R 1 boldsymbol beta sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top nbsp wobei b X X 1 X y displaystyle boldsymbol hat beta mathbf X top mathbf X 1 mathbf X top mathbf y nbsp den Kleinste Quadrate Schatzer darstellt Man standardisiert zur Standardnormalverteilung N 0 1 displaystyle mathcal N 0 1 nbsp und erhalt falls die Nullhypothese richtig ist fur die Pivotgrosse R 1 b r 1 s 2 R 1 X X 1 R 1 H 0 N 0 1 displaystyle frac boldsymbol R 1 boldsymbol hat beta r 1 sqrt sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top stackrel H 0 sim mathcal N 0 1 nbsp dass die Grenzen des zentralen Schwankungsintervalls sie mit der Wahrscheinlichkeit 1 a displaystyle 1 alpha nbsp umschliesst d h P z 1 a 2 lt R 1 b r 1 s 2 R 1 X X 1 R 1 lt z 1 a 2 1 a displaystyle P left z left 1 frac alpha 2 right lt frac boldsymbol R 1 boldsymbol hat beta r 1 sqrt sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top lt z left 1 frac alpha 2 right right 1 alpha nbsp 3 wobei z 1 a 2 displaystyle z left 1 frac alpha 2 right nbsp das 1 a 2 displaystyle 1 tfrac alpha 2 nbsp Quantil der Standardnormalverteilung ist Das Problem an diesem Ausdruck ist dass die Varianz der Storgrossen s 2 s e 2 displaystyle sigma 2 sigma varepsilon 2 nbsp fur gewohnlich unbekannt ist Ersetzt man den unbekannten Parameter durch den erwartungstreuen Schatzer fur die Storgrossenvarianz s 2 1 n K 1 i 1 n e i 2 displaystyle hat sigma 2 tfrac 1 n K 1 sum nolimits i 1 n hat varepsilon i 2 nbsp ergibt sich fur die Pivotgrosse falls die Nullhypothese richtig ist die Verteilung R 1 b r 1 s 2 R 1 X X 1 R 1 H 0 t n p displaystyle frac boldsymbol R 1 hat boldsymbol beta r 1 sqrt hat sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top stackrel H 0 sim mathcal t n p nbsp Die Pivotgrosse ist nun bei Richtigkeit der Nullhypothese t verteilt mit n p displaystyle n p nbsp Freiheitsgeraden anstatt normalverteilt Dadurch ergibt sich fur das Testen der Einzelgleichung folgende Wahrscheinlichkeit P R 1 b t 1 a 2 n p s 2 R 1 X X 1 R 1 lt R 1 b lt R 1 b t 1 a 2 n p s 2 R 1 X X 1 R 1 1 a displaystyle P left boldsymbol R 1 hat boldsymbol beta t left 1 frac alpha 2 right n p sqrt hat sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top lt boldsymbol R 1 boldsymbol beta lt boldsymbol R 1 hat boldsymbol beta t left 1 frac alpha 2 right n p sqrt hat sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top right 1 alpha nbsp und somit folgendes Konfidenzintervall K I 1 a R 1 b R 1 b t 1 a 2 n p s 2 R 1 X X 1 R 1 displaystyle KI 1 alpha boldsymbol R 1 boldsymbol beta R 1 boldsymbol hat beta pm t left 1 frac alpha 2 right n p sqrt hat sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top nbsp Einzelgleichungsmodelle lassen sich nicht nur als F Test fur das multiple Regressionsmodell sondern alternativ auch als t Test darstellen F Test fur das multiple Regressionsmodell BearbeitenKonstruktion der Teststatistik Bearbeiten Fur die Konstruktion der Teststatistik benutzt man folgendes mithilfe der Annahme der Erwartungstreue des Kleinste Quadrate Schatzers und der Rechenregeln fur Kovarianzmatrizen einfach nachzuprufendes Resultat R b r N R b r s 2 R X X 1 R displaystyle boldsymbol R boldsymbol hat beta boldsymbol r sim mathcal N boldsymbol R boldsymbol beta boldsymbol r sigma 2 boldsymbol R mathbf X top mathbf X 1 boldsymbol R top nbsp d h die Nullhypothese folgt beim vorliegenden klassischem Modell einer Normalverteilung mit Kovarianzmatrix s 2 R X X 1 R displaystyle sigma 2 boldsymbol R mathbf X top mathbf X 1 boldsymbol R top nbsp und Erwartungswert R b r displaystyle boldsymbol R boldsymbol beta boldsymbol r nbsp Es kann gezeigt werden dass die gewichtete Hypothesenquadratsumme unter der Nullhypothese Q 1 1 s 2 R b r R X X 1 R 1 R b r x 2 a displaystyle Q 1 frac 1 sigma 2 boldsymbol R boldsymbol hat beta boldsymbol r top boldsymbol R mathbf X top mathbf X 1 boldsymbol R top 1 boldsymbol R boldsymbol hat beta boldsymbol r sim chi 2 a nbsp einer Chi Quadrat Verteilung mit a displaystyle a nbsp Freiheitsgeraden folgt Hierbei misst R b r displaystyle boldsymbol R boldsymbol hat beta boldsymbol r nbsp wie weit der geschatzte Wert b displaystyle boldsymbol hat beta nbsp von der Nullhypothese R b r 0 displaystyle boldsymbol R boldsymbol beta boldsymbol r mathbf 0 nbsp abweicht Weiterhin ist R b r R b r displaystyle boldsymbol R boldsymbol beta boldsymbol r top boldsymbol R boldsymbol beta boldsymbol r nbsp die dazugehorige Summe der quadrierten Abweichungen Analog zur Residuenquadratsumme Diese Summe der quadrierten Abweichungen wird mit der inversen Kovarianzmatrix R X X 1 R 1 s 2 displaystyle boldsymbol R mathbf X top mathbf X 1 boldsymbol R top 1 sigma 2 nbsp gewichtet weil fur eine grosse Kovarianz ebenso so grosse Abweichungen R b r displaystyle boldsymbol R boldsymbol hat beta boldsymbol r nbsp nicht notwendigerweise ein Indikator fur H 0 displaystyle H 0 nbsp sind Ein weiteres wichtiges Resultat das zu Konstruktion der Teststatistik gebraucht wird lautet Q 2 n p s 2 s 2 x 2 n p displaystyle Q 2 frac n p hat sigma 2 sigma 2 sim chi 2 n p nbsp Die Teststatistik ergibt sich nun bei stochastischer Unabhangigkeit von Q 1 displaystyle Q 1 nbsp und Q 2 displaystyle Q 2 nbsp als F H 0 Q 1 a Q 2 n p 1 a R b r R X X 1 R 1 R b r s 2 H 0 F a n p displaystyle begin aligned F stackrel H 0 frac Q 1 a Q 2 n p frac frac 1 a boldsymbol R boldsymbol hat beta boldsymbol r top boldsymbol R mathbf X top mathbf X 1 boldsymbol R top 1 boldsymbol R boldsymbol hat beta boldsymbol r hat sigma 2 stackrel H 0 sim F a n p end aligned nbsp Aus diesem Resultat wird ersichtlich dass sich die Teststatistik alternativ auch als Quotient aus dem mittleren Hypothesenquadrat und dem mittleren Residuenquadrat M Q H S Q H Rang R displaystyle MQH equiv frac SQH operatorname Rang boldsymbol R quad nbsp und M Q R S Q R Rang Q displaystyle quad MQR equiv frac SQR operatorname Rang boldsymbol Q nbsp darstellen lasst also als F H 0 M Q H M Q R 1 Rang R R b r R X X 1 R 1 R b r 1 Rang Q y X b y X b displaystyle begin aligned F stackrel H 0 frac MQH MQR frac frac 1 operatorname Rang boldsymbol R boldsymbol R boldsymbol hat beta boldsymbol r top boldsymbol R mathbf X top mathbf X 1 boldsymbol R top 1 boldsymbol R boldsymbol hat beta boldsymbol r frac 1 operatorname Rang boldsymbol Q boldsymbol y mathbf X boldsymbol hat beta top boldsymbol y mathbf X boldsymbol hat beta end aligned nbsp wobei Rang Q displaystyle operatorname Rang boldsymbol Q nbsp der Rang der residuenerzeugenden Matrix darstellt und Rang R displaystyle operatorname Rang boldsymbol R nbsp der Rang der Hypothesenmatrix darstellt Dividiert man die Quadratsummen durch a displaystyle a nbsp bzw n p displaystyle n p nbsp erhalt man mittlere Abweichungsquadrate Dies ist sinnvoll da fur mehr Hypothesen Beobachtungen auch grossere Abweichungen zu erwarten sind Diese Teststatistik stellt das Gerust und die Basis fur das Testen allgemeiner linearer Hypothesen und Intervallschatzer fur den unbekannten Vektor R b displaystyle boldsymbol R boldsymbol beta nbsp dar Wie fur gewohnlich ist diese Teststatistik sensitiv fur das Testproblem d h wenn also die Abweichung R b r displaystyle boldsymbol R boldsymbol hat beta boldsymbol r nbsp gross relativ zur Fehlervarianz ist so spricht dies gegen H 0 displaystyle H 0 nbsp Um den Test schliesslich durchzufuhren benutzt man entsprechende Quantile der F Verteilung Die Nullhypothese wird abgelehnt wenn F gt F a n p displaystyle F gt F a n p nbsp die F Statistik also grosser als der kritische Wert F a n p displaystyle F a n p nbsp ist Der kritische Wert kann anhand einer Quantil Tabelle der F Verteilung abgelesen werden Weblinks BearbeitenMultiple Hypothesis Testing The F test Quantil Tabelle der F VerteilungLiteratur BearbeitenLudwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 George G Judge R Carter Hill W Griffiths Helmut Lutkepohl T C Lee Introduction to the Theory and Practice of Econometrics 2 Auflage John Wiley amp Sons New York Chichester Brisbane Toronto Singapore 1988 ISBN 0 471 62414 4 E L Lehmann Joseph P Romano Testing Statistical Hypotheses 3 Auflage Springer New York 2005 ISBN 0 387 98864 5 Kapitel 7 Linear Hypotheses Einzelnachweise Bearbeiten Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 296 ff Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 285 ff George G Judge R Carter Hill W Griffiths Helmut Lutkepohl T C Lee Introduction to the Theory and Practice of Econometrics 2 Auflage John Wiley amp Sons New York Chichester Brisbane Toronto Singapore 1988 ISBN 0 471 62414 4 S 242 ff Abgerufen von https de wikipedia org w index php title Testen allgemeiner linearer Hypothesen amp oldid 238501648