www.wikidata.de-de.nina.az
Fur allgemeine Regressionsmodelle deren Parameter durch Maximum Likelihood Schatzung gefunden werden lassen sich verschiedene Pseudo Bestimmtheitsmasse notiert als Pseudo R 2 displaystyle text Pseudo R 2 definieren die auf der Likelihoodfunktion basieren Inhaltsverzeichnis 1 Motivation 2 Das Pseudo Bestimmtheitsmass 2 1 Likelihood basierte Masse 2 1 1 Maddalas Cox amp Snells Pseudo R2 2 1 2 Nagelkerkes Cragg amp Uhlers Pseudo R2 2 2 Log Likelihood basierte Masse 2 2 1 McFadden R2 2 2 2 McFaddens korrigiertes R2 2 2 3 Aldrich Nelsons R2 2 3 Korrelations basierte Masse 2 3 1 Lave Efrons R2 2 4 Auf der erklarten Variation basierend 2 4 1 McKelvey amp Zavoinas R2 3 Vergleichbarkeit 4 Beispiel 5 Siehe auch 6 Weblinks 7 Literatur 8 EinzelnachweiseMotivation BearbeitenIm Falle einer linearen Regression beschreibt das Bestimmtheitsmass den erklarten Anteil der Variabilitat Varianz einer abhangigen Variablen Y displaystyle Y nbsp durch ein statistisches Modell Bei einem nominalen oder ordinalen Skalenniveau von Y displaystyle Y nbsp z B bei Klassifikationen existiert jedoch kein Aquivalent da man die Varianz und damit ein R 2 displaystyle mathrm R 2 nbsp nicht berechnen kann Das Pseudo Bestimmtheitsmass BearbeitenPseudo Bestimmtheitsmasse sind so konstruiert dass sie den verschiedenen Interpretationen z B erklarte Varianz Verbesserung gegenuber dem Nullmodell oder als Quadrat der Korrelation des Bestimmtheitsmasses genugen Sie sind dem R 2 displaystyle mathrm R 2 nbsp in der Hinsicht ahnlich dass dessen Werte ebenfalls im Intervall von 0 und 1 liegen und ein hoherer Wert einer besseren Anpassung des Modells an die Daten entspricht Likelihood basierte Masse Bearbeiten Maddalas Cox amp Snells Pseudo R2 Bearbeiten R M a d d a l a 2 1 L 0 L 1 2 n displaystyle mathrm R Maddala 2 1 left frac L 0 L 1 right 2 n nbsp mit L 0 displaystyle L 0 nbsp Nullmodell L 1 displaystyle L 1 nbsp Modell mit erklarenden Variablen R M a d d a l a 2 0 1 displaystyle mathrm R Maddala 2 in 0 1 nbsp Vergleicht das Verhaltnis der Werte L 0 displaystyle L 0 nbsp der Wert der Likelihood Funktion in dem die vollige Unabhangigkeit aller Variablen angenommen wird Nullmodell oder Leermodell und L 1 displaystyle L 1 nbsp der Likelihood Funktionen unter Kenntnis des Zusammenhanges zwischen Y displaystyle Y nbsp und X i displaystyle X i nbsp volles Regressionsmodell Je geringer dieses Verhaltnis desto grosser die Verbesserung des ganzen Modells gegenuber dem Nullmodell Maddalas Pseudo R 2 displaystyle text Pseudo R 2 nbsp kann auch bei perfekter Vorhersage nie den Wert 1 erreichen Nagelkerkes Cragg amp Uhlers Pseudo R2 Bearbeiten R N a g e l k e r k e 2 1 L 0 L 1 2 n 1 L 0 2 n displaystyle mathrm R Nagelkerke 2 frac 1 left frac L 0 L 1 right 2 n 1 L 0 2 n nbsp mit L 0 displaystyle L 0 nbsp Nullmodell L 1 displaystyle L 1 nbsp Modell mit erklarenden Variablen R N a g e l k e r k e 2 0 1 displaystyle mathrm R Nagelkerke 2 in 0 1 nbsp Nagelkerkes Pseudo R2 erweitert Maddalas Pseudo R2 sodass durch eine Reskalierung ein moglicher Wert von 1 erreicht werden kann wenn das vollstandige Modell eine perfekte Vorhersage mit einer Wahrscheinlichkeit von 1 trifft Nagelkerke gab auch allgemeine Bedingungen fur ein Pseudo Bestimmtheitsmass an Ein Pseudo Bestimmtheitsmass sollte mit dem Bestimmtheitsmass R 2 displaystyle mathrm R 2 nbsp ubereinstimmen wenn beide berechnet werden konnen Es sollte ebenfalls mit der Maximum Likelihood Schatzung des Modells maximiert werden Es sollte zumindest asymptotisch unabhangig vom Stichprobenumfang sein Die Interpretation sollte die durch das Modell erklarte Variabilitat von Y displaystyle Y nbsp sein Es sollte zwischen Null und Eins liegen Bei einem Wert von Null sollte es keine Aussage uber die Variabilitat von Y displaystyle Y nbsp machen bei einem Wert von Eins sollte es die Variabilitat von Y displaystyle Y nbsp vollstandig erklaren Es sollte keine Masseinheit besitzen Log Likelihood basierte Masse Bearbeiten McFadden R2 Bearbeiten R M c F a d d e n 2 1 ln L 1 ln L 0 1 D 1 D 0 displaystyle mathrm R McFadden 2 1 frac ln L 1 ln L 0 1 frac D 1 D 0 nbsp mit L 0 displaystyle L 0 nbsp Nullmodell L 1 displaystyle L 1 nbsp Modell mit erklarenden Variablen D i displaystyle D i nbsp die Devianz Statistik der entsprechenden Modelle 1 R M c F a d d e n 2 0 1 displaystyle mathrm R McFadden 2 in 0 1 nbsp Das Verhaltnis der logarithmierten der Werte L 1 displaystyle L 1 nbsp und L 0 displaystyle L 0 nbsp der Likelihood Funktion Wahrscheinlichkeiten spiegelt den Grad der Verbesserung des vollstandigen Modells mit Pradiktoren gegenuber dem Nullmodell wider Ein Modell mit einem grosseren McFaddens hat eine bessere Anpassung gegenuber einem anderen Modell mit einem geringeren Wert Daumenregel Bereits 0 2 lt R M c F a d d e n 2 lt 0 4 displaystyle 0 2 lt mathrm R McFadden 2 lt 0 4 nbsp stellt ein besonders gute Anpassung des Modells dar 2 McFaddens korrigiertes R2 Bearbeiten R M c F a d d e n k o r r 2 1 ln L 1 K ln L 0 displaystyle mathrm R McFadden korr 2 1 frac ln L 1 K ln L 0 nbsp Das korrigierte McFaddens bewertet die Anzahl der Pradiktoren K displaystyle K nbsp fur die Anpassungsgute eines Modells Ahnlich dem korrigierten Bestimmtheitsmass R 2 displaystyle bar mathrm R 2 nbsp verringern zu viele Pradiktoren die dem Modell nicht genugend beitragen die Effektivitat eines Modells und schlagen sich negativ im korrigierten McFaddens Pseudo R 2 displaystyle text Pseudo R 2 nbsp nieder Somit sind Werte kleiner 0 moglich Aldrich Nelsons R2 Bearbeiten R A l d r i c h N e l s o n 2 1 2 ln L 1 L 0 2 ln L 1 L 0 c n displaystyle mathrm R AldrichNelson 2 1 frac 2 cdot ln L 1 L 0 2 cdot ln L 1 L 0 c cdot n nbsp c 1 Probit Modell 3 29 Logit Modell R A l d r i c h N e l s o n 2 0 1 displaystyle mathrm R AldrichNelson 2 in 0 1 nbsp Aldrich Nelsons setzt den Likelihood Quotienten ins Verhaltnis der die Rate von Nullmodell und Alternativmodell bei eingetretenem Ereignis angibt Es hat eine obere Grenze von weit unter 1 Korrelations basierte Masse Bearbeiten Lave Efrons R2 Bearbeiten R L a v e 2 1 1 n i 1 n Y i P i 2 1 n i 1 n Y i Y 2 displaystyle mathrm R Lave 2 1 frac displaystyle frac 1 n sum i 1 n Y i hat P i 2 displaystyle frac 1 n sum i 1 n Y i bar Y 2 nbsp Lave Efrons kann man ahnlich dem normalen Bestimmtheitsmass als Quadrat der Korrelation und als erklarte Variabilitat interpretieren Es werden die quadrierten Residuen aufsummiert wobei P i displaystyle hat P i nbsp eine vom Modell vorhergesagte Wahrscheinlichkeit fur Y i 1 displaystyle Y i 1 nbsp ist welche die diskrete abhangige Variable in eine stetige uberfuhrt Hinweis Y i displaystyle Y i nbsp kann nur die Werte 0 und 1 annehmen Auf der erklarten Variation basierend Bearbeiten McKelvey amp Zavoinas R2 Bearbeiten R M c K e l v e y 2 Var y Var y Var e displaystyle mathrm R McKelvey 2 frac widehat operatorname Var hat y widehat operatorname Var hat y operatorname Var e nbsp R M c K e l v e y 2 0 1 displaystyle mathrm R McKelvey 2 in 0 1 nbsp McKelvey amp Zavoinas ist strukturell dem normalen Bestimmtheitsmass nachempfunden Es wird die geschatzte erklarte Quadratsumme der Regression mit der geschatzten erklarten und unerklarten Quadratsumme von Regression und Fehler ins Verhaltnis gesetzt Vergleichbarkeit BearbeitenDie Werte der verschiedenen Pseudo Bestimmtheitsmasse konnen innerhalb eines Modells stark variieren Somit konnen unterschiedliche Masse zwischen verschiedenen Datensatzen nicht miteinander verglichen und unabhangig interpretiert werden Als beste Approximation hat sich McKelvey amp Zavoinas erwiesen 3 Laves McFaddens Nagelkerkes unterschatzen das wahre R 2 displaystyle mathrm R 2 nbsp einer Kleinste Quadrate Schatzung fur ein Modell mit latenten Variablen stark Beispiel BearbeitenEin Wascheklammerproduzent mochte seine neuartigen Wascheklammern auf den Markt bringen und deswegen vorab die Wahrscheinlichkeit eines Kaufes berechnen Er berat sich mit seinem Geschaftspartner der ein Statistikprogramm besitzt Dieser nimmt an dass der Kauf nur von einem Attribut abhangt dem Preis X Preis displaystyle X text Preis nbsp Der aggregierte Einfluss auf die Kaufentscheidung soll eine lineare Beziehung haben Z b 0 b 1 X Preis displaystyle Z b 0 b 1 cdot X text Preis nbsp auch Logit genannt Der Wascheklammerproduzent hingegen glaubt eher dass die Kaufabsicht vom Preis der Farbe und der Grosse abhangt Z b 0 b 1 X Preis b 2 Y Farbe b 3 W Grosse displaystyle Z b 0 b 1 cdot X text Preis b 2 cdot Y text Farbe b 3 cdot W text Grosse nbsp Mittels Marktforschungsdaten sind die Regressionsparameter b 0 displaystyle b 0 nbsp b 1 displaystyle b 1 nbsp b 2 displaystyle b 2 nbsp und b 3 displaystyle b 3 nbsp nach der Maximum Likelihood Schatzung vom Computer iterativ ermittelt worden Allerdings fragt sich nun der Wascheklammerproduzent welche Modellhypothese die Realitat besser wiedergibt und auf welche man weitere Uberlegungen stutzen sollte Zur Einschatzung der Anpassungsgute der angenommenen Modelle an die vorhandenen Daten sollen verschiedene Pseudo Bestimmtheitsmasse benutzt werden Diese lassen sich die beiden Geschaftspartner vom Statistikprogramm ausgeben Pseudo R 2 displaystyle text Pseudo R 2 nbsp Masse der Anpassungsgute Modell 1 b 0 b 1 displaystyle b 0 b 1 nbsp Modell 2 b 0 b 1 b 2 b 3 displaystyle b 0 b 1 b 2 b 3 nbsp McFadden R2 0 307 0 445McFadden Adj R2 0 273 0 389Cragg Uhler Nagelkerke R2 0 436 0 578McKelvey amp Zavoina R2 0 519 0 643Efron Lave R2 0 330 0 472Da die Pseudo Bestimmtheitsmasse fur Modell 2 durchweg hoher sind d h dass dieses Modell die Marktforschungsdaten besser abbildet entscheidet man sich fur dieses und schatzt damit die Kaufwahrscheinlichkeit bzw den moglichen Marktanteil Siehe auch BearbeitenDevianz Statistik Weblinks BearbeitenFAQ What are pseudo R squareds Literatur BearbeitenCragg J G Uhler R 1970 The Demand for Automobiles Canadian Journal of Economics 3 S 386 406 JSTOR 133656 Hagle T M Mitchell II G E 1992 Goodness of Fit Measures for Probit and Logit American Journal of Political Science 36 S 762 784 JSTOR 2111590 McFadden D 1973 Conditional Logit Analysis of Qualitative Choice Behavior PDF 1 77 MB in P Zarembka ed Frontiers in Econometrics Academic Press New York ISBN 0 12 776150 0 S 105 142 McKelvey R Zavoina W 1975 A Statistical Model for the Analysis of Ordinal Level Dependent Variables Journal of Mathematical Sociology 4 S 103 120 doi 10 1080 0022250X 1975 9989847 Nagelkerke N J D 1991 A Note on a General Definition of the Coefficient of Determination Biometrika 78 Nr 3 S 691 692 doi 10 1093 biomet 78 3 691 Veall M R Zimmermann K F 1996 Pseudo R2 Measures for Some Common Limited Dependent Variable Models Sonderforschungsbereich 386 Paper 18 doi 10 5282 ubm epub 1421 Einzelnachweise Bearbeiten https books google de books id xmrRU1opsCEC amp pg PA120 Jordan J Louviere Stated choice methods analysis and applications Cambridge 2000 ISBN 0 511 01172 5 S 54 Veall Zimmermann 1996 Pseudo R2 Measures for Some Common Limited Dependent Variable Models Sonderforschungsbereich 386 Paper 18 Abgerufen von https de wikipedia org w index php title Pseudo Bestimmtheitsmass amp oldid 238671546