www.wikidata.de-de.nina.az
Der Hosmer Lemeshow Test wird zur Bewertung der Anpassungsgute von Klassifikationsmodellen wie beispielsweise der logistischen Regression verwendet 1 2 Die Berechnung der Testgrosse beruht auf den beobachteten Werten y 1 y n 0 1 displaystyle y 1 dots y n in 0 1 von Bernoulli verteilten Zufallsvariablen Y 1 Y n displaystyle Y 1 dots Y n mit unbekannten Eintrittswahrscheinlichkeiten Bernoulli Parametern und den aus einer logistischen Regression mit Hilfe der Maximum Likelihood Methode gewonnenen Schatzwerten fur diese unbekannten Eintrittswahrscheinlichkeiten Dabei bezeichnet n displaystyle n die Anzahl der Beobachtungen Untersuchungseinheiten Die Grundidee des Tests ist aus den beobachteten Werten y 1 y n displaystyle y 1 dots y n und den geschatzten Wahrscheinlichkeiten eine Testgrosse zu bilden mit deren Hilfe auf die Gultigkeit der Modellannahmen geschlossen werden kann Der Hosmer Lemeshow Test wird zur Uberprufung der Kalibrierung eines Modells eingesetzt 3 Kalibrierungskurven Inhaltsverzeichnis 1 Hosmer Lemeshow Test fur die logistische Regression 1 1 Testidee 1 2 Testgrosse 1 3 Testdurchfuhrung 1 4 Theoretische Grundlage 2 Hosmer Lemeshow Test fur die multinomiale logistische Regression 3 Literatur 4 EinzelnachweiseHosmer Lemeshow Test fur die logistische Regression BearbeitenTestidee Bearbeiten Mit p i P Y i 1 i 1 n displaystyle p i hat P Y i 1 quad i 1 dots n nbsp seien die mit Hilfe der Maximum Likelihood Methode aus einem logistischen Regressionsmodell gewonnenen Schatzwerte fur die unbekannten Eintrittswahrscheinlichkeiten P Y i 1 displaystyle P Y i 1 nbsp bezeichnet Die Grundidee des Hosmer Lemeshow Tests ist dass sich fur eine Teilmenge M 1 n displaystyle M subset 1 dots n nbsp mit m lt n displaystyle m lt n nbsp Elementen die ahnliche geschatzte Eintrittswahrscheinlichkeiten haben die beobachtete relative Haufigkeit p o M 1 m i M y i displaystyle p o M frac 1 m sum i in M y i nbsp der eingetretenen Ereignisse und die durchschnittliche durch die logistische Regression geschatzte Eintrittswahrscheinlichkeit p M 1 m i M p i displaystyle bar p M frac 1 m sum i in M p i nbsp nicht zu stark unterscheiden und dass sich diese Abweichungen durch eine Wahrscheinlichkeitsverteilung beschreiben lassen falls das Modell richtig ist Testgrosse Bearbeiten Fur die Testdurchfuhrung werden die Untersuchungseinheiten in g lt n displaystyle g lt n nbsp disjunkte Gruppen aufgeteilt wobei die Anzahl der Gruppen abhangig von den Beobachtungswerten fixiert werden Eine typische Gruppenzahl ist g 10 displaystyle g 10 nbsp Die Zuordnung zu den Gruppen erfolgt anhand der geschatzten Eintrittswahrscheinlichkeiten p 1 p n displaystyle p 1 dots p n nbsp Dabei gibt es zwei Methoden fur die Gruppenbildung Bei der ersten Methode erfolgt die Zuordnung anhand von vorgegebenen festen Intervalle z B 0 0 1 displaystyle 0 0 1 nbsp 0 1 0 2 0 8 0 9 displaystyle 0 1 0 2 dots 0 8 0 9 nbsp 0 9 1 displaystyle 0 9 1 nbsp Bei der zweiten Methode werden die Intervallgrenzen durch die Dezile der geschatzten Eintrittswahrscheinlichkeiten festgelegt so dass etwa 10 gleichgrosse Gruppen entstehen Die so gebildeten Gruppen sind durch G displaystyle G nbsp disjunkte Teilmengen M j 1 n displaystyle M j subset 1 dots n nbsp mit j 1 g M j 1 n displaystyle bigcup j 1 g M j 1 dots n nbsp charakterisiert die jeweils die Indizes derjenigen Untersuchungseinheiten enthalten die zur Gruppe j displaystyle j nbsp gehoren Diese beiden Varianten sind der Grund fur die Abschnittsuberschrift 5 2 2 The Hosmer Lemeshow Tests 2 Die Testgrosse ist h j 1 g o j n j p j 2 n j p j 1 p j displaystyle h sum j 1 g frac o j n j bar p j 2 n j bar p j 1 bar p j nbsp Dabei bezeichnen n j M j displaystyle n j M j nbsp die Anzahl der Beobachtungseinheiten in der Gruppe j displaystyle j nbsp o j i M j y i p o M j n j displaystyle o j sum i in M j y i p o M j n j nbsp die Anzahl der beobachteten englisch observed Ereignisse in der Gruppe j displaystyle j nbsp und p j 1 n j i M j p i displaystyle bar p j frac 1 n j sum i in M j p i nbsp die mittlere geschatzte Eintrittswahrscheinlichkeit in der Gruppe j displaystyle j nbsp Das Produkt e j n j p j displaystyle e j n j bar p j nbsp kann als die geschatzte erwartete englisch expected Anzahl der Ereignisse in der Gruppe j displaystyle j nbsp interpretiert werden Damit ergibt sich fur die Hosmer Lemeshow Prufgrosse die aquivalente Darstellung h j 1 g o j e j 2 n j p j 1 p j displaystyle h sum j 1 g frac o j e j 2 n j bar p j 1 bar p j nbsp die an eine Chi Quadrat Statistik erinnert Im Unterschied zu dieser hangen alle Grossen von den Beobachtungen ab da die e j displaystyle e j nbsp nicht wie bei der Chi Quadrat Statistik die aufgrund eines Modells erwarteten Haufigkeiten sondern geschatzte erwartete Haufigkeiten sind die uber die geschatzten Eintrittswahrscheinlichkeiten p j displaystyle p j nbsp von allen beobachteten Werten der erklarten und der erklarenden Variablen abhangen Eine weitere in der Literatur anzutreffende aquivalente Darstellung 4 der Testgrosse h displaystyle h nbsp mit 2 g displaystyle 2g nbsp anstelle von g displaystyle g nbsp Summenaden ergibt sich aus einer Unterscheidung zwischen Erfolgen y i 1 displaystyle y i 1 nbsp und Misserfolgen y i 0 displaystyle y i 0 nbsp Die Hosmer Lemeshow Prufgrosse wird dann als h j 1 g o j e j 2 e j o j 0 e j 0 2 e j 0 displaystyle h sum j 1 g left frac o j e j 2 e j frac o j0 e j0 2 e j0 right nbsp geschrieben wobei erganzend zu obiger Notation o j 0 n j o j displaystyle o j0 n j o j nbsp die Anzahl der beobachteten Misserfolge in Gruppe j displaystyle j nbsp ist und e j 0 n j 1 p j n j e j displaystyle e j0 n j 1 bar pi j n j e j nbsp die geschatzte erwartete Anzahl der Misserfolge in der Gruppe j displaystyle j nbsp ist Die beiden Varianten der Testgrosse die sich aus der Gruppenbildung mit festen Grenzen und mit beobachtungsabhangigen Grenzen ergeben werden in der Literatur haufig mit C displaystyle hat C nbsp und H displaystyle hat H nbsp bezeichnet Dabei wird haufig weder in der Notation noch in der Sprechweise zwischen der Testgrosse als aus den beobachteten Werten berechneter Zahl und der Teststatistik die als Stichprobenvariable eine Zufallsvariable mit einer Wahrscheinlichkeitsverteilung ist Testdurchfuhrung Bearbeiten Hosmer und Lemeshow vertreten die Position dass die Testgrosse h displaystyle h nbsp unter sehr allgemeinen Bedingungen der realisierte Wert einer Zufallsvariablen H displaystyle H nbsp ist die bei Richtigkeit des logistischen Regressionsmodells fur hinreichend grossen Stichprobenumfang naherungsweise einer Chi Quadrat Verteilung mit g 2 displaystyle g 2 nbsp Freiheitsgraden folgt Die berechnete Testgrosse h displaystyle h nbsp wird daher mit den Quantilen einer Chi Quadrat Verteilung mit g 2 displaystyle g 2 nbsp Freiheitsgraden verglichen wobei kleine Werte fur eine gute Anpassungsgute sprechen Theoretische Grundlage Bearbeiten Anders als es sonst bei statistischen Testverfahren ublich liegt kein bewiesener Satz vor aus dem hervorgeht unter welchen Bedingungen eine Teststatistik deren Realisation die Hosmer Lemeshow Testgrosse h displaystyle h nbsp ist approximativ oder asymptotisch einer Chi Quadrat Verteilung mit g 2 displaystyle g 2 nbsp Freiheitsgraden folgt Die Basis ist vielmehr eine Vermutung die durch Simulationsuntersuchungen gestutzt wird Using an extensive set of simulations Hosmer and Lemeshow 1980 demonstrated that when J n displaystyle J n nbsp and the fitted model is the correct model the distribution of C displaystyle hat C nbsp is well approximated by the chi square distribution with g 2 displaystyle g 2 nbsp degrees of freedom x 2 g 2 displaystyle chi 2 g 2 nbsp While not specically examined it is likely that x 2 g 2 displaystyle chi 2 g 2 nbsp also approximated the distribution when J n displaystyle J approx n nbsp 5 Hierbei bezeichnet J displaystyle J nbsp die Anzahl der beobachteten Wertekonstellationen der erklarenden Variablen Kovariablen covariate pattern 6 und n displaystyle n nbsp die Anzahl der beobachteten Werte This is the case most frequently encountered in practice when there is at least one continuous covariate in the model 7 Jedenfalls setzen damit die Autoren des Tests ein Warnsignal fur Anwendungen bei denen J displaystyle J nbsp deutlich kleiner als n displaystyle n nbsp ist Hosmer Lemeshow Test fur die multinomiale logistische Regression BearbeitenEine Verallgemeinerung der logistischen Regression bei der die erklarte Variable die beiden Wert 0 und 1 annehmen kann ist die multinomiale logistische Regression bei der die erklarte Variable Werte in der Menge 0 1 c 1 displaystyle 0 1 dots c 1 nbsp annimmt und c 3 displaystyle c geq 3 nbsp die Anzahl der Kategorien ist 8 Fur diesen Fall existiert eine Verallgemeinerung des Hosmer Lemeshow Tests 9 10 In diesem Fall gibt es g displaystyle g nbsp Gruppen und c displaystyle c nbsp Kategorien wobei die Kategorie 0 displaystyle 0 nbsp als Referenzkategorie dient Die zu berechnende Testgrosse hat dann c g displaystyle c cdot g nbsp Summanden und besitzt die Form h j 1 g k 0 c 1 o j k e j k 2 e j k displaystyle h sum j 1 g sum k 0 c 1 frac o jk e jk 2 e jk nbsp wobei die o j k displaystyle o jk nbsp die beobachteten Ereignisse und e j k displaystyle e jk nbsp die erwarteten geschatzten Ereignisse in Gruppe j displaystyle j nbsp und Kategorie k displaystyle k nbsp sind Literatur BearbeitenMorten M Fagerland David M Hosmer A M Bofin Multinomial goodness of fit tests for logistic regression models In Statistics in Medicine Band 27 S 4238 4253 doi 10 1002 sim 3202 David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression Wiley Series in Probability and Statistics 3 Auflage Wiley Hoboken 2013 ISBN 978 0 470 58247 3 Abschnitt 5 2 2 The Hosmer Lemeshow Tests S 157 169 doi 10 1002 9781118548387 David W Hosmer Stanley Lemeshow Goodness of fit tests for the multiple logistic regression model In Communications in Statistics Theory and Methods Band 9 Nr 10 1980 S 1043 1069 doi 10 1080 03610928008827941 Einzelnachweise Bearbeiten David W Hosmer Stanley Lemeshow Goodness of fit tests for the multiple logistic regression model In Communications in Statistics Theory and Methods Band 9 Nr 10 1980 S 1043 1069 doi 10 1080 03610928008827941 a b David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression 2013 Abschnitt 5 2 2 The Hosmer Lemeshow Tests Yingxiang Huang Wentao Li Fima Macheret Rodney A Gabriel Lucila Ohno Machado A tutorial on calibration measurements and calibration models for clinical prediction models In Journal of the American Medical Informatics Association Band 27 Nr 4 2020 S 621 633 doi 10 1093 jamia ocz228 Prabasaj Paul Michael L Pennell Stanley Lemeshow Standardizing the power of the Hosmer Lemeshow goodness of fit test in large data sets In Statistics in Medicine Band 32 2013 S 67 80 Formel 1 S 68 doi 10 1002 sim 5525 David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression 2013 Abschnitt 5 2 2 The Hosmer Lemeshow Tests S 158 David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression 2013 Abschnitt 5 2 2 The Hosmer Lemeshow Tests S 154 David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression 2013 Abschnitt 5 2 2 The Hosmer Lemeshow Tests S 155 David M Hosmer Stanley Lemeshow Rodney X Sturdivant Applied Logistic Regression 2013 Abschnitt 8 1 The multinomial logistic regression S 269 289 Morten M Fagerland David M Hosmer A M Bofin Multinomial goodness of fit tests for logistic regression models In Statistics in Medicine Band 27 S 4238 4253 doi 10 1002 sim 3202 Morten M Fagerland David M Hosmer A generalized Hosmer Lemeshow goodness of fit test for multinomial logistic regression models In The Stata Journal Band 12 Nr 3 S 447 453 Abgerufen von https de wikipedia org w index php title Hosmer Lemeshow Test amp oldid 237516467