www.wikidata.de-de.nina.az
In der Statistik tritt eine Verzerrung durch ausgelassene Variablen auch Verzerrung aufgrund von ausgelassenen Variablen englisch Omitted Variable Bias kurz OVB auf wenn eine oder mehrere relevante Variable n bzw Regressor en nicht berucksichtigt wird werden 1 Hierbei ist eine relevante Variable eine Variable die einen von null verschiedenen partiellen wahren Effekt auf die Antwortvariable aufweist also eine Variable die im wahren Modell Einfluss auf die Antwortvariable hat Die Variablen fur die man eigentlich kontrollieren will die aber bei der Schatzung eines Regressionsmodells ausgelassen wurden werden ausgelassene Variablen genannt Die mogliche Folge des Weglassens einer oder mehrerer relevanter Variablen ist ein verzerrter und inkonsistenter Schatzer fur den Effekt des Interesses Falls das mit der Kleinste Quadrate Schatzung geschatzte Regressionsmodell fehlspezifiziert wurde und eine relevante erklarende Variable in der Regressionsgleichung ausgelassen wurde kommt es zu einer Verzerrung der Kleinste Quadrate Schatzer Im Allgemeinen tritt eine Verzerrung ein falls die ausgelassene Variable mit einer im Modell berucksichtigten Variablen korreliert ist und wenn die ausgelassene Variable die Antwortvariable bestimmtDie Verzerrung bei den Kleinste Quadrate Schatzern entsteht weil das Modell versucht die fehlenden relevanten Variablen dadurch zu kompensieren dass es die Effekte der anderen erklarenden Variablen uber oder unterschatzt In der Praxis existiert meist eine Austauschbeziehung zwischen einer Verzerrung durch ausgelassene Variablen und dem Problem des Vorliegens von Multikollinearitat Eine mogliche Losung stellt die Verwendung von Instrumentvariablen dar Inhaltsverzeichnis 1 Ausgangslage 2 Effekte der Modellspezifikation 2 1 Verzerrung des Kleinste Quadrate Schatzers 2 2 Verzerrung des Varianzschatzers 2 3 Verzerrung der Residuen 3 Siehe auch 4 EinzelnachweiseAusgangslage BearbeitenGegeben ein typisches multiples lineares Regressionsmodell y Xb e displaystyle mathbf y mathbf X boldsymbol beta boldsymbol varepsilon nbsp mit b displaystyle boldsymbol beta nbsp dem p 1 displaystyle p times 1 nbsp Vektor der unbekannten Regressionsparameter der n p displaystyle n times p nbsp Versuchsplanmatrix X displaystyle mathbf X nbsp dem n 1 displaystyle n times 1 nbsp Vektor der abhangigen Variablen y displaystyle mathbf y nbsp und dem n 1 displaystyle n times 1 nbsp Vektor der Fehlerterme e displaystyle boldsymbol varepsilon nbsp Des Weiteren wird angenommen dass die Fehlerterme im Mittel null sind E e 0 displaystyle operatorname E boldsymbol boldsymbol varepsilon mathbf 0 nbsp Das bedeutet es kann davon ausgegangen werden dass das Modell im Mittel korrekt ist Man betrachte folgende Situation Der wahre datengenerierende Prozess sei y Xb Zg e e N 0 s2I displaystyle mathbf y mathbf X boldsymbol beta mathbf Z boldsymbol gamma boldsymbol varepsilon quad boldsymbol varepsilon sim mathcal N mathbf 0 sigma 2 mathbf I nbsp mit g 0 displaystyle boldsymbol gamma neq 0 nbsp Der fehlspezifizierte datengenerierende Prozess sei y Xb e e Zg e displaystyle mathbf y mathbf X boldsymbol beta boldsymbol varepsilon quad boldsymbol varepsilon mathbf Z boldsymbol gamma boldsymbol varepsilon nbsp Obwohl das volle Modell korrekt ist wird falschlicherweise das reduzierte Modell geschatzt In diesem Fall werden unzutreffend die relevanten Variablen Z displaystyle mathbf Z nbsp diese Variablen sind relevant weil fur den wahren Parameter gilt g 0 displaystyle boldsymbol gamma neq 0 nbsp vernachlassigt Diese ausgelassenen Variablen wandern in eine neu definierte stochastische Storgrosse weil sie zwar relevant sind aber dennoch nicht im Modell berucksichtigt werden Im Falle von ausgelassenen Variablen ist der Kleinste Quadrate Schatzer b displaystyle mathbf b nbsp im Allgemeinen verzerrt Verzerrung durch ausgelassene Variablen Eine Ausnahme liegt vor wenn X displaystyle mathbf X nbsp und Z displaystyle mathbf Z nbsp orthogonal sind d h jede Variable in X displaystyle mathbf X nbsp ist mit jeder Variablen in Z displaystyle mathbf Z nbsp unkorreliert Daruber hinaus zeigen die Komponenten des Schatzers vom reduzierten Modell eine kleinere Varianz als die entsprechenden Komponenten des Schatzers basierend auf dem wahren Modell 1 Effekte der Modellspezifikation BearbeitenVerzerrung des Kleinste Quadrate Schatzers Bearbeiten Falls man das reduzierte Modell schatzt in Wirklichkeit das wahre Modell aber das volle Modell ist dann ergibt sich wegen E b E X X 1X y E X X 1X Xb Zg e E X X 1X Xb X X 1X Zg X X 1X e b X X 1X Zg X X 1E X e 0 b X X 1X Zg Verzerrung displaystyle begin aligned operatorname E mathbf b amp operatorname E mathbf X top mathbf X 1 mathbf X top mathbf y amp operatorname E mathbf X top mathbf X 1 mathbf X top mathbf X boldsymbol beta mathbf Z boldsymbol gamma boldsymbol varepsilon amp operatorname E mathbf X top mathbf X 1 mathbf X top mathbf X boldsymbol beta mathbf X top mathbf X 1 mathbf X top boldsymbol mathbf Z boldsymbol gamma mathbf X top mathbf X 1 mathbf X top boldsymbol varepsilon boldsymbol beta mathbf X top mathbf X 1 mathbf X top boldsymbol mathbf Z boldsymbol gamma mathbf X top mathbf X 1 underbrace operatorname E mathbf X top boldsymbol varepsilon mathbf 0 amp boldsymbol beta underbrace mathbf X top mathbf X 1 mathbf X top mathbf Z boldsymbol gamma text Verzerrung end aligned nbsp ein systematischer Fehler im Umfang von X X 1X Zg displaystyle mathbf X top mathbf X 1 mathbf X top mathbf Z boldsymbol gamma nbsp Verzerrung des Varianzschatzers Bearbeiten Durch die ausgelassenen Variablen ist der Varianzschatzer fur die wahre Varianz der Storgrossen verzerrt Die Unsicherheit bzgl der Schatzung der Storgrossen steigt also und die Varianz kann nicht mehr erwartungstreu geschatzt werden Fur die Verzerrung der Varianz gilt Bias s 2 E s 2 s2 g Z MZgT K 0 displaystyle operatorname Bias hat sigma 2 operatorname E hat sigma 2 sigma 2 frac boldsymbol gamma top mathbf Z top mathbf M mathbf Z boldsymbol gamma T K geq 0 nbsp d h im Mittel wird die Varianz der Storgrossen systematisch uberschatzt Da der systematische Fehler im Zahler eine quadratische Form hat ist er positiv Verzerrung der Residuen Bearbeiten Durch das Auslassen relevanter Variablen sind die Residuen nicht mehr um Null zentriert E e 0 displaystyle operatorname E boldsymbol varepsilon neq 0 nbsp Dies lasst sich so interpretieren dass im Mittel nicht mehr das wahre Modell geschatzt wird Siehe auch BearbeitenStorfaktor Exogenitat und Endogenitat Instrumentvariablenschatzung Simpson ParadoxonEinzelnachweise Bearbeiten a b Peter Hackl Einfuhrung in die Okonometrie 2 aktualisierte Auflage Pearson Deutschland GmbH 2008 ISBN 978 3 86894 156 2 S 105 ff Abgerufen von https de wikipedia org w index php title Verzerrung durch ausgelassene Variablen amp oldid 236191794