www.wikidata.de-de.nina.az
Der Goldfeld Quandt Test ist ein statistischer Test auf Heteroskedastizitat nicht konstante Varianz der Storgrossen bei der Regressionsanalyse Der Test basiert auf dem Vergleich zweier Stichprobenhalften Er wurde benannt nach Stephen Goldfeld und Richard E Quandt 1 Inhaltsverzeichnis 1 Vorgehen 2 Mathematische Formulierung 2 1 Voraussetzung 2 2 Hypothesen und Teststatistik 3 Beispiel 4 Literatur 5 EinzelnachweiseVorgehen Bearbeiten nbsp Vorgehensweise beim Goldfeld Quandt TestDie Stichprobe wird in zwei Teilmengen bzgl einer erklarenden Variablen geteilt siehe Grafik Die beiden Teilmengen mussen disjunkt sein sodass keine Beobachtung in beiden Teilmengen vorkommen Die beiden Teilmengen zusammen mussen aber nicht die gesamte Stichprobe umfassen In der Grafik ist z B der Mittelteil der Beobachtungen in keiner Teilmenge grau Fur beide Teilmengen wird eine Regression geschatzt und die Varianz der Residuen berechnet Danach wird fur jede Teilmenge die Stichprobenvarianz der Residuen s i 2 displaystyle s i 2 nbsp fur i 1 2 bestimmt mit s 1 2 gt s 2 2 displaystyle s 1 2 gt s 2 2 nbsp und der Prufwert s 1 2 s 2 2 displaystyle tfrac s 1 2 s 2 2 nbsp mit einem kritischen Wert aus der F Verteilung verglichen In dem Beispiel liegt Heteroskedastizitat vor da die Regression zu einer Teilmenge eine hohe Residualvarianz rot aufweisen wahrend die Regression zur anderen Teilmenge eine niedrige Residualvarianz blau zeigt Mathematische Formulierung BearbeitenVoraussetzung Bearbeiten Im klassischen Regressionsmodell gilt Y i 1 f 1 x i 1 U i 1 displaystyle Y i1 f 1 x i1 U i1 nbsp bzw Y i 2 f 2 x i 2 U i 2 displaystyle Y i2 f 2 x i2 U i2 nbsp mit U i 1 N 0 s 1 2 displaystyle U i1 sim mathcal N 0 sigma 1 2 nbsp und U i 2 N 0 s 2 2 displaystyle U i2 sim mathcal N 0 sigma 2 2 nbsp Der Test reagiert sensitiv auf Verletzungen der Normalverteilung der Residuen Hypothesen und Teststatistik Bearbeiten Die Null und die Alternativhypothese lauten H 0 s 1 2 s 2 2 s 2 displaystyle H 0 sigma 1 2 sigma 2 2 sigma 2 nbsp Vorliegen von Homoskedastizitat vs H 1 s 1 2 s 2 2 displaystyle H 1 sigma 1 2 neq sigma 2 2 nbsp Vorliegen von Heteroskedastizitat Die Verteilung der Teststatistik ergibt sich als F S 1 2 S 2 2 F n 1 k n 2 k displaystyle F frac S 1 2 S 2 2 sim F n 1 k n 2 k nbsp mit n i displaystyle n i nbsp die Anzahl der Beobachtungen im i displaystyle i nbsp ten Teil und k displaystyle k nbsp die Anzahl der geschatzten Regressionsparameter sowie S i 2 1 n i k j 1 n i U j i 2 displaystyle S i 2 frac 1 n i k sum j 1 n i U ji 2 nbsp Die Nullhypothese Homoskedastizitat wird verworfen wenn der Prufwert grosser ist als der kritische Wert F n 1 k n 2 k 1 a displaystyle F n 1 k n 2 k 1 alpha nbsp aus der F Verteilung mit n 1 k displaystyle n 1 k nbsp und n 2 k displaystyle n 2 k nbsp Freiheitsgraden und einem vorgegebenen Signifikanzniveau a displaystyle alpha nbsp Beispiel BearbeitenVariable Bedeutungmedv Mittlerer Kaufpreis einesHauses in 1000 US lstat Anteil Unterschichtbevolkerungrm Durchschnittliche Raumzahldis Gewichtete Entfernung zu den funfwichtigsten BeschaftigtenzentrenFur das Beispiel wurden lineare Regressionen mit dem Boston Housing Datensatz durchgefuhrt Fur jeden der 506 Bezirke wurden die rechts stehenden Variablen erhoben und eine multiple lineare Regression durchgefuhrt m e d v i 2 8083 0 723 3 l s t a t i 4 873 4 r m i 0 461 3 d i s i u i displaystyle medv i 2 8083 0 7233lstat i 4 8734rm i 0 4613dis i hat u i nbsp Plottet man die Residuen gegen die Variable dis Grafik oben so sieht man dass die Varianz der Residuen abnimmt wenn die Werte von dis zunehmen Man teilt die Daten nun in zwei Teile den roten und den blauen Teil Dann fittet man zwei Regressionsmodelle und berechnet die Summe der quadrierten Residuen Rot m e d v i 1 56 116 1 002 l s t a t i 1 0 664 r m i 1 14 106 d i s i 1 u i 1 displaystyle medv i1 56 116 1 002lstat i1 0 664rm i1 14 106dis i1 hat u i1 nbsp s 1 2 1 n 1 k i 1 n 1 u i 1 2 4899 807 112 4 45 369 displaystyle s 1 2 frac 1 n 1 k sum i 1 n 1 hat u i1 2 frac 4899 807 112 4 45 369 nbsp Blau m e d v i 2 40 858 0 044 l s t a t i 2 9 895 r m i 2 0 233 d i s i 2 u i 2 displaystyle medv i2 40 858 0 044lstat i2 9 895rm i2 0 233dis i2 hat u i2 nbsp s 2 2 1 n 2 k i 1 n 2 u i 2 2 179 927 49 4 3 998 displaystyle s 2 2 frac 1 n 2 k sum i 1 n 2 hat u i2 2 frac 179 927 49 4 3 998 nbsp Dann ergibt sich der Prufwert zu f 45 369 3 998 11 347 displaystyle f tfrac 45 369 3 998 11 347 nbsp und der kritische Wert fur ein Signifikanzniveau a 5 displaystyle alpha 5 nbsp aus der F Verteilung mit 108 und 45 Freiheitsgraden zu c 1 548 displaystyle c 1 548 nbsp Da der Prufwert grosser ist als der kritische Wert muss die Nullhypothese der Homoskedastizitat abgelehnt werden Literatur BearbeitenWilliam E Griffiths R Carter Hill George G Judge Learning and Practicing Econometrics 1 Auflage 1993 ISBN 0 471 51364 4 S 494 ff Einzelnachweise Bearbeiten R E Quandt Stephen M Goldfeld Some Tests for Homoscedasticity In Journal of the American Statistical Association Band 60 Nr 310 Juni 1965 S 539 547 doi 10 1080 01621459 1965 10480811 JSTOR 2282689 Abgerufen von https de wikipedia org w index php title Goldfeld Quandt Test amp oldid 227518452