www.wikidata.de-de.nina.az
Mit Chi Quadrat Test x 2 displaystyle chi 2 Test bezeichnet man in der mathematischen Statistik eine Gruppe von Hypothesentests mit Chi Quadrat verteilter Testprufgrosse Man unterscheidet vor allem die folgenden Tests Verteilungstest auch Anpassungstest genannt Hier wird gepruft ob vorliegende Daten auf eine bestimmte Weise verteilt sind Unabhangigkeitstest Hier wird gepruft ob zwei Merkmale stochastisch unabhangig sind Homogenitatstest Hier wird gepruft ob zwei oder mehr Stichproben derselben Verteilung bzw einer homogenen Grundgesamtheit entstammen Der Chi Quadrat Test und seine Teststatistik wurden erstmals 1900 von Karl Pearson beschrieben 1 Inhaltsverzeichnis 1 Verteilungstest 1 1 Vorgehensweise 1 2 Besonderheiten 1 2 1 Schatzung von Verteilungsparametern 1 2 2 Mindestgrosse der erwarteten Haufigkeiten 1 3 Beispiel zum Verteilungstest 2 Erganzung 2 1 Chi Quadrat Verteilungstest in der Rechtsprechung 3 Unabhangigkeitstest 3 1 Vorgehensweise 3 2 Besonderheiten 3 3 Beispiel zum Unabhangigkeitstest 4 Homogenitatstest 4 1 Vorgehensweise 4 2 Anwendungsbedingungen 4 3 Vergleich zu Unabhangigkeits und Verteilungstest 5 Vierfeldertest 5 1 Vorgehensweise 5 1 1 Teststatistik 5 1 2 Testentscheidung 5 2 Beispiele und Anwendungen 5 2 1 Beispiel 1 5 2 2 Beispiel 2 6 Yates Stetigkeitskorrektur 7 Tabelle der Quantile der Chi Quadrat Verteilung 8 Alternativen zum Chi Quadrat Test 9 Siehe auch 10 Weblinks 11 EinzelnachweiseVerteilungstest Bearbeiten nbsp Chi Quadrat Verteilung mit x 2 displaystyle chi 2 nbsp auf der x Achse und p displaystyle p nbsp auf der y Achse Man betrachtet ein statistisches Merkmal X displaystyle X nbsp dessen Wahrscheinlichkeiten in der Grundgesamtheit unbekannt sind Es wird bezuglich der Wahrscheinlichkeiten von X displaystyle X nbsp eine vorlaufig allgemein formulierte Nullhypothese H 0 displaystyle H 0 nbsp Das Merkmal X displaystyle X nbsp besitzt die Wahrscheinlichkeitsverteilung F 0 x displaystyle F 0 x nbsp aufgestellt Vorgehensweise Bearbeiten Es liegen n displaystyle n nbsp unabhangige Beobachtungen x 1 x n displaystyle x 1 dots x n nbsp des Merkmals X displaystyle X nbsp vor die in m displaystyle m nbsp verschiedene Kategorien fallen Treten bei einem Merkmal sehr viele Auspragungen auf fasst man sie zweckmassigerweise in m displaystyle m nbsp Klassen zusammen und fasst die Klassen als Kategorien auf Die Anzahl der Beobachtungen in der j displaystyle j nbsp ten Kategorie ist die beobachtete Haufigkeit N j displaystyle N j nbsp Man uberlegt sich nun wie viele Beobachtungen im Mittel in einer Kategorie liegen mussten wenn X displaystyle X nbsp tatsachlich die hypothetische Verteilung besasse Dazu berechnet man zunachst die Wahrscheinlichkeit p 0 j displaystyle p 0j nbsp dass eine Auspragung von X displaystyle X nbsp in die Kategorie j displaystyle j nbsp fallt Die unter H 0 displaystyle H 0 nbsp zu erwartende absolute Haufigkeit ist n 0 j p 0 j n displaystyle n 0j p 0j cdot n nbsp Wenn die in der vorliegenden Stichprobe beobachteten Haufigkeiten N j displaystyle N j nbsp zu stark von den erwarteten Haufigkeiten abweichen wird die Nullhypothese abgelehnt Die Prufgrosse fur den Test X 2 j 1 m N j n 0 j 2 n 0 j displaystyle X 2 sum j 1 m frac N j n 0j 2 n 0j nbsp misst die Grosse der Abweichung Die Prufgrosse X 2 displaystyle X 2 nbsp ist bei ausreichend grossen N j displaystyle N j nbsp annahernd Chi Quadrat verteilt mit m 1 displaystyle m 1 nbsp Freiheitsgraden Wenn die Nullhypothese wahr ist sollte der Unterschied zwischen der beobachteten und der theoretisch erwarteten Haufigkeit klein sein Also wird H 0 displaystyle H 0 nbsp bei einem hohen Prufgrossenwert abgelehnt Der Ablehnungsbereich fur H 0 displaystyle H 0 nbsp liegt rechts Bei einem Signifikanzniveau a displaystyle alpha nbsp wird H 0 displaystyle H 0 nbsp abgelehnt wenn X 2 gt x 1 a m 1 2 displaystyle X 2 gt chi 1 alpha m 1 2 nbsp gilt wenn also der aus der Stichprobe erhaltene Wert der Prufgrosse grosser als das 1 a displaystyle 1 alpha nbsp Quantil der x 2 displaystyle chi 2 nbsp Verteilung mit m 1 displaystyle m 1 nbsp Freiheitsgraden ist Es existieren Tabellen der x 2 displaystyle chi 2 nbsp Quantile kritische Werte in Abhangigkeit von der Anzahl der Freiheitsgrade und vom gewunschten Signifikanzniveau siehe unten Soll das Signifikanzniveau das zu einem bestimmten x 2 displaystyle chi 2 nbsp Wert gehort bestimmt werden so muss in der Regel aus der Tabelle ein Zwischenwert berechnet werden Dazu verwendet man logarithmische Interpolation Besonderheiten Bearbeiten Schatzung von Verteilungsparametern Bearbeiten Im Allgemeinen gibt man bei der Verteilungshypothese die Parameter der Verteilung an Kann man diese nicht angeben mussen sie aus der Stichprobe geschatzt werden Hier geht bei der Chi Quadrat Verteilung pro geschatztem Parameter ein Freiheitsgrad verloren Sie hat also m w 1 displaystyle m w 1 nbsp Freiheitsgrade mit w displaystyle w nbsp als Anzahl der geschatzten Parameter Fur die Normalverteilung ware w 2 displaystyle w 2 nbsp wenn der Erwartungswert m displaystyle mu nbsp und die Varianz s 2 displaystyle sigma 2 nbsp abgeschatzt werden Mindestgrosse der erwarteten Haufigkeiten Bearbeiten Damit die Prufgrosse als annahernd Chi Quadrat verteilt betrachtet werden kann muss jede erwartete Haufigkeit eine gewisse Mindestgrosse betragen Verschiedene Lehrwerke setzen diese bei 1 oder 5 an Ist die erwartete Haufigkeit zu klein konnen gegebenenfalls mehrere Klassen zusammengefasst werden um die Mindestgrosse zu erreichen Alternativ kann der Cash Test angewandt werden 2 3 Beispiel zum Verteilungstest Bearbeiten Es liegen von ca 200 borsennotierten Unternehmen die Umsatze vor Das folgende Histogramm zeigt ihre Verteilung nbsp Es sei X displaystyle X nbsp der Umsatz eines Unternehmens Mio Es soll nun die Hypothese getestet werden dass X displaystyle X nbsp normalverteilt ist Da die Daten in vielen verschiedenen Auspragungen vorliegen wurden sie in Klassen eingeteilt Es ergab sich die Tabelle Klasse Intervall Beobachtete Haufigkeitj uber bis nj1 0 02 0 5000 1483 5000 10000 174 10000 15000 55 15000 20000 86 20000 25000 47 25000 30000 38 30000 35000 39 35000 9Summe 197Da keine Parameter vorgegeben werden werden sie aus der Stichprobe ermittelt Es sind geschatzt m x 6892 displaystyle hat mu bar x 6892 nbsp und s s 14984 displaystyle hat sigma s 14984 nbsp Es wird getestet H 0 displaystyle H 0 nbsp X displaystyle X nbsp ist normalverteilt mit dem Erwartungswert m 6892 displaystyle mu 6892 nbsp und der Standardabweichung s 14984 displaystyle sigma 14984 nbsp Um die unter H 0 displaystyle H 0 nbsp erwarteten Haufigkeiten zu bestimmen werden zunachst die Wahrscheinlichkeiten berechnet dass X displaystyle X nbsp in die vorgegebenen Klassen fallt Man errechnet dann p 01 P X 0 H 0 P X m s m s H 0 P Z 6892 14984 F 0 46 0 322 8 displaystyle p 01 P X leq 0 vert H 0 P left left frac X mu sigma leq frac mu sigma right H 0 right P Z leq tfrac 6892 14984 Phi left 0 46 right 0 3228 nbsp Darin ist Z displaystyle Z nbsp eine standardnormalverteilte Zufallsvariable und F displaystyle Phi nbsp ihre Verteilungsfunktion Analog errechnet man p 02 P 0 lt X 5000 H 0 P m s lt X m s 5000 m s H 0 displaystyle p 02 P 0 lt X leq 5000 vert H 0 P left left frac mu sigma lt frac X mu sigma leq frac 5000 mu sigma right H 0 right nbsp P 6892 14984 lt Z 5000 6892 14984 F 0 126 F 0 46 0 127 0 displaystyle P left tfrac 6892 14984 lt Z leq tfrac 5000 6892 14984 right Phi left 0 126 right Phi left 0 46 right 0 1270 nbsp dd Daraus ergeben sich die erwarteten Haufigkeiten n 01 p 01 n 0 322 8 197 63 59 displaystyle n 01 p 01 cdot n 0 3228 cdot 197 63 59 nbsp n 02 p 02 n 0 127 0 197 25 02 displaystyle n 02 p 02 cdot n 0 1270 cdot 197 25 02 nbsp Es mussten also beispielsweise ca 25 Unternehmen im Mittel einen Umsatz zwischen 0 und 5000 haben wenn das Merkmal Umsatz tatsachlich normalverteilt ist Die erwarteten Haufigkeiten sind zusammen mit den beobachteten Haufigkeiten in der folgenden Tabelle aufgefuhrt Klasse Intervall Beobachtete Haufigkeit Wahrscheinlichkeit Erwartete Haufigkeitj uber bis nj p0j n0j1 0 0 0 3228 63 592 0 5000 148 0 1270 25 023 5000 10000 17 0 1324 26 084 10000 15000 5 0 1236 24 355 15000 20000 8 0 1034 20 366 20000 25000 4 0 0774 15 257 25000 30000 3 0 0519 10 238 30000 35000 3 0 0312 6 149 35000 9 0 0303 5 98Summe 197 1 0000 197 00Die Prufgrosse wird jetzt folgendermassen ermittelt X 2 0 63 59 2 63 59 148 25 02 2 25 02 9 5 98 2 5 98 710 79 displaystyle X 2 frac 0 63 59 2 63 59 frac 148 25 02 2 25 02 dotsb frac 9 5 98 2 5 98 710 79 nbsp Bei einem Signifikanzniveau a 0 05 displaystyle alpha 0 05 nbsp liegt der kritische Wert der Testprufgrosse bei x 0 95 9 3 6 2 12 59 displaystyle chi 0 95 9 3 6 2 12 59 nbsp Da X 2 gt 12 59 displaystyle X 2 gt 12 59 nbsp wird die Nullhypothese abgelehnt Man kann davon ausgehen dass das Merkmal Umsatz in der Grundgesamtheit nicht normalverteilt ist was plausibel ist da keine negativen Umsatze gemeldet wurden die in einer Normalverteilung ebenfalls zu erwarten sind Erganzung BearbeitenDie obigen Daten wurden in der Folge logarithmiert Aufgrund des Ergebnisses des Tests des Datensatzes der logarithmierten Daten auf Normalverteilung konnte auf einem Signifikanzniveau von 0 05 die Nullhypothese der Normalverteilung der Daten nicht verworfen werden Unter der Voraussetzung dass die logarithmierten Umsatzdaten tatsachlich einer Normalverteilung entstammen sind die ursprunglichen Umsatzdaten logarithmisch normalverteilt Das folgende Histogramm zeigt die Verteilung der logarithmierten Daten nbsp Chi Quadrat Verteilungstest in der Rechtsprechung Bearbeiten In Deutschland wurde der Chi Quadrat Verteilungstest im Rahmen der Anwendung des Benfordschen Gesetzes gerichtlich als Mittel einer Finanzbehorde bestatigt die Ordnungsmassigkeit der Kassenfuhrung zu beanstanden Konkret wurde die Haufigkeitsverteilung von Ziffern in Kassenbucheintragungen mit dem Chi Quadrat Test untersucht woraus sich ein starkes Indiz fur Manipulationen bei den Einnahmeaufzeichnungen ergab 4 Allerdings ist die Anwendbarkeit Einschrankungen unterworfen und gegebenenfalls mussen andere statistische Verfahren benutzt werden siehe Benfordsches Gesetz Unabhangigkeitstest BearbeitenDer Unabhangigkeitstest ist ein Signifikanztest auf stochastische Unabhangigkeit in der Kontingenztafel Man betrachtet zwei statistische Merkmale X displaystyle X nbsp und Y displaystyle Y nbsp die beliebig skaliert sein konnen Man interessiert sich dafur ob die Merkmale stochastisch unabhangig sind Es wird die Nullhypothese H 0 displaystyle H 0 nbsp Die Merkmale X displaystyle X nbsp und Y displaystyle Y nbsp sind stochastisch unabhangig aufgestellt Vorgehensweise Bearbeiten Die Beobachtungen von X displaystyle X nbsp liegen in m displaystyle m nbsp Kategorien j displaystyle j nbsp j 1 m displaystyle j 1 dotsc m nbsp vor die des Merkmals Y displaystyle Y nbsp in r displaystyle r nbsp Kategorien k displaystyle k nbsp k 1 r displaystyle k 1 dotsc r nbsp Treten bei einem Merkmal sehr viele Auspragungen auf fasst man sie zweckmassigerweise zu Klassen j displaystyle j nbsp zusammen und fasst die Klassenzugehorigkeit als j displaystyle j nbsp te Kategorie auf Es gibt insgesamt n displaystyle n nbsp paarweise Beobachtungen von X displaystyle X nbsp und Y displaystyle Y nbsp die sich auf m r displaystyle m cdot r nbsp Kategorien verteilen Konzeptionell ist der Test so aufzufassen Man betrachte zwei diskrete Zufallsvariablen X displaystyle X nbsp und Y displaystyle Y nbsp deren gemeinsame Wahrscheinlichkeiten in einer Wahrscheinlichkeitstabelle dargestellt werden konnen Man zahlt nun wie oft die j displaystyle j nbsp te Auspragung von X displaystyle X nbsp zusammen mit der k displaystyle k nbsp ten Auspragung von Y displaystyle Y nbsp auftritt Die beobachteten gemeinsamen absoluten Haufigkeiten n j k displaystyle n jk nbsp konnen in einer zweidimensionalen Haufigkeitstabelle mit m displaystyle m nbsp Zeilen und r displaystyle r nbsp Spalten eingetragen werden Merkmal Y displaystyle Y nbsp Summe SMerkmal X displaystyle X nbsp 1 2 k r nj 1 n11 n12 n1k n1r n1 2 n21 n22 n2k n2r n2 j nj1 njk nj m nm1 nm2 nmk nmr nm Summe S n 1 n 2 n k n r nDie Zeilen bzw Spaltensummen ergeben die absoluten Randhaufigkeiten n j displaystyle n j cdot nbsp bzw n k displaystyle n cdot k nbsp als n j k 1 r n j k displaystyle n j cdot sum k 1 r n jk nbsp und n k j 1 m n j k displaystyle n cdot k sum j 1 m n jk nbsp Entsprechend sind die gemeinsamen relativen Haufigkeiten p j k n j k n displaystyle p jk n jk n nbsp und die relativen Randhaufigkeiten p j n j n displaystyle p j cdot n j cdot n nbsp und p k n k n displaystyle p cdot k n cdot k n nbsp Wahrscheinlichkeitstheoretisch gilt Sind zwei Ereignisse A displaystyle A nbsp und B displaystyle B nbsp stochastisch unabhangig ist die Wahrscheinlichkeit fur ihr gemeinsames Auftreten gleich dem Produkt der Einzelwahrscheinlichkeiten P A B P A P B displaystyle P A cap B P A cdot P B nbsp Man uberlegt sich nun dass analog zu oben bei stochastischer Unabhangigkeit von X displaystyle X nbsp und Y displaystyle Y nbsp auch gelten musste p j k p j p k displaystyle p jk approx p j cdot cdot p cdot k nbsp mit n displaystyle n nbsp multipliziert entsprechend n j k n j n k n displaystyle n jk approx frac n j cdot cdot n cdot k n nbsp oder auchn j k n j n k n 0 displaystyle n jk frac n j cdot cdot n cdot k n approx 0 nbsp Sind diese Differenzen fur samtliche j k displaystyle j k nbsp klein kann man vermuten dass X displaystyle X nbsp und Y displaystyle Y nbsp tatsachlich stochastisch unabhangig sind Setzt man fur die erwartete Haufigkeit bei Vorliegen von Unabhangigkeit n j k n j n k n displaystyle n jk frac n j cdot cdot n cdot k n nbsp resultiert aus der obigen Uberlegung die Prufgrosse fur den Unabhangigkeitstest X 2 j 1 m k 1 r n j k n j k 2 n j k displaystyle X 2 sum j 1 m sum k 1 r frac n jk n jk 2 n jk nbsp Die Prufgrosse X 2 displaystyle X 2 nbsp ist bei ausreichend grossen erwarteten Haufigkeiten n j k displaystyle n jk nbsp annahernd Chi Quadrat verteilt mit m 1 r 1 displaystyle m 1 r 1 nbsp Freiheitsgraden Wenn die Prufgrosse klein ist wird vermutet dass die Hypothese wahr ist Also wird H 0 displaystyle H 0 nbsp bei einem hohen Prufgrossenwert abgelehnt der Ablehnungsbereich fur H 0 displaystyle H 0 nbsp liegt rechts Bei einem Signifikanzniveau a displaystyle alpha nbsp wird H 0 displaystyle H 0 nbsp abgelehnt wenn X 2 gt x 1 a m 1 r 1 2 displaystyle X 2 gt chi 1 alpha m 1 r 1 2 nbsp dem 1 a displaystyle 1 alpha nbsp Quantil der Chi Quadrat Verteilung mit m 1 r 1 displaystyle m 1 r 1 nbsp Freiheitsgraden ist Besonderheiten Bearbeiten Damit die Prufgrosse als annahernd Chi Quadrat verteilt betrachtet werden kann muss jede erwartete Haufigkeit n j k displaystyle n jk nbsp eine gewisse Mindestgrosse haben Verschiedene Lehrwerke setzen diese bei 1 oder 5 an Ist die erwartete Haufigkeit zu klein konnen gegebenenfalls mehrere Klassen zusammengefasst werden um die Mindestgrosse zu erreichen Alternativ kann die Stichprobenverteilung der Teststatistik auf Basis der gegebenen Randverteilungen und der Annahme der Unabhangigkeit der Merkmale per Bootstrapping Verfahren untersucht werden Beispiel zum Unabhangigkeitstest Bearbeiten Im Rahmen des Qualitatsmanagements wurden die Kunden einer Bank befragt unter anderem nach ihrer Zufriedenheit mit der Geschaftsabwicklung und nach der Gesamtzufriedenheit Der Grad der Zufriedenheit richtete sich nach dem Schulnotensystem Aus den Daten ergibt sich die folgende Kreuztabelle der Gesamtzufriedenheit von Bankkunden versus ihrer Zufriedenheit mit der Geschaftsabwicklung Man sieht dass einige erwartete Haufigkeiten zu klein waren nbsp Eine Reduzierung der Kategorien auf jeweils drei durch Zusammenfassung der Noten 3 6 auf eine neue Gesamtnote 3 ergab methodisch korrekte Ergebnisse nbsp Die folgende Tabelle enthalt die erwarteten Haufigkeiten n j k displaystyle n jk nbsp die sich so berechnen n 11 102 270 621 44 35 n 12 102 273 621 44 84 n 33 160 78 621 20 10 displaystyle n 11 frac 102 cdot 270 621 44 35 quad n 12 frac 102 cdot 273 621 44 84 quad dotsb quad n 33 frac 160 cdot 78 621 20 10 nbsp Merkmal Y displaystyle Y nbsp Merkmal X displaystyle X nbsp 1 2 3 S1 44 35 44 84 12 81 1022 156 09 157 82 45 09 3593 69 57 70 34 20 10 160S 270 273 78 621Die Prufgrosse wird dann folgendermassen ermittelt X 2 86 44 35 2 44 35 16 44 84 2 44 84 53 20 10 2 20 10 167 187 displaystyle X 2 frac 86 44 35 2 44 35 frac 16 44 84 2 44 84 dotsb frac 53 20 10 2 20 10 167 187 nbsp Bei einem a 0 05 displaystyle alpha 0 05 nbsp liegt der kritische Wert der Testprufgrosse bei x 2 0 95 4 9 488 displaystyle chi 2 0 95 4 9 488 nbsp Da X 2 gt 9 488 displaystyle X 2 gt 9 488 nbsp ist wird die Hypothese signifikant abgelehnt man vermutet also dass die Zufriedenheit mit der Geschaftsabwicklung und die Gesamtzufriedenheit assoziiert sind Homogenitatstest BearbeitenMit dem Chi Quadrat Homogenitatstest kann anhand der zugehorigen Stichprobenverteilungen gepruft werden ob m 2 displaystyle m geq 2 nbsp unabhangige Zufallsstichproben diskreter Merkmale X 1 X m displaystyle X 1 dotsc X m nbsp mit den Stichprobenumfangen n 1 n m displaystyle n 1 dotsc n m nbsp aus identisch verteilten also homogenen Grundgesamtheiten stammen Damit ist er eine Hilfe bei der Entscheidung daruber ob mehrere Stichproben derselben Grundgesamtheit bzw Verteilung entstammen bzw bei der Entscheidung ob ein Merkmal in verschiedenen Grundgesamtheiten z B Manner und Frauen auf die gleiche Art verteilt ist Der Test ist wie die anderen Chi Quadrat Tests auf jedem Skalenniveau anwendbar 5 6 Die Hypothesen lauten H 0 displaystyle H 0 nbsp Die unabhangigen Merkmale X 1 X m displaystyle X 1 dotsc X m nbsp sind identisch verteilt H 1 displaystyle H 1 nbsp Mindestens zwei der Merkmale X 1 X m displaystyle X 1 dotsc X m nbsp sind unterschiedlich verteilt Wenn mit F k displaystyle F k nbsp die Verteilungsfunktion von X k displaystyle X k nbsp angedeutet wird konnen die Hypothesen auch wie folgt formuliert werden H 0 F 1 F 2 F m displaystyle H 0 F 1 F 2 dotsb F m nbsp H 1 F i F j displaystyle H 1 F i neq F j nbsp fur mindestens ein i j displaystyle i neq j nbsp Vorgehensweise Bearbeiten Die untersuchte Zufallsvariable das Merkmal z B Antwort auf die Sonntagsfrage sei k displaystyle k nbsp fach gestuft d h es gibt k displaystyle k nbsp Merkmalskategorien das Merkmal besitzt k displaystyle k nbsp Auspragungen z B SPD CDU B90 Grune FDP Die Linke und Andere 7 d h k 6 displaystyle k 6 nbsp Die Stichproben X i displaystyle X i nbsp konnen z B die Umfrageergebnisse verschiedener Meinungsforschungsinstitute sein Von Interesse konnte dann sein zu prufen ob sich die Umfrageergebnisse signifikant unterscheiden Die beobachteten Haufigkeiten je Stichprobe Umfrage und Merkmalskategorie genannte Partei n i j displaystyle n ij nbsp werden in eine entsprechende m k displaystyle m times k nbsp Kreuztabelle eingetragen hier 3 3 Merkmalskategorie j displaystyle j nbsp Stichprobe X i displaystyle X i nbsp Kategorie 1 Kategorie 2 Kategorie 3 SummeX 1 displaystyle X 1 nbsp n 11 displaystyle n 11 nbsp n 12 displaystyle n 12 nbsp n 13 displaystyle n 13 nbsp n 11 n 12 n 13 n 1 displaystyle n 11 n 12 n 13 n 1 bullet nbsp X 2 displaystyle X 2 nbsp n 21 displaystyle n 21 nbsp n 22 displaystyle n 22 nbsp n 23 displaystyle n 23 nbsp n 21 n 22 n 23 n 2 displaystyle n 21 n 22 n 23 n 2 bullet nbsp X 3 displaystyle X 3 nbsp n 31 displaystyle n 31 nbsp n 32 displaystyle n 32 nbsp n 33 displaystyle n 33 nbsp n 31 n 32 n 33 n 3 displaystyle n 31 n 32 n 33 n 3 bullet nbsp Summe n 11 n 21 n 31 n 1 displaystyle n 11 n 21 n 31 n bullet 1 nbsp n 12 n 22 n 32 n 2 displaystyle n 12 n 22 n 32 n bullet 2 nbsp n 13 n 23 n 33 n 3 displaystyle n 13 n 23 n 33 n bullet 3 nbsp n 1 n 2 n 3 n displaystyle n 1 bullet n 2 bullet n 3 bullet n nbsp Untersucht werden nun die Abweichungen zwischen den beobachteten empirischen Haufigkeits bzw Wahrscheinlichkeitsverteilungen der Stichproben uber die Kategorien des Merkmals Die beobachteten Zellhaufigkeiten n i j displaystyle n ij nbsp werden mit den Haufigkeiten verglichen die bei Gultigkeit der Nullhypothese zu erwarten waren Aus den Randverteilungen werden die unter Gultigkeit der Nullhypothese einer homogenen Grundgesamtheit erwarteten Zellhaufigkeiten bestimmt E i j n i n j n displaystyle E ij n i bullet cdot frac n bullet j n nbsp bezeichnet die erwartete Anzahl von Beobachtungen absolute Haufigkeit von Stichprobe i displaystyle i nbsp in Kategorie j displaystyle j nbsp Anhand der so errechneten Grossen wird folgende approximativ Chi Quadrat verteilte Prufgrosse berechnet x 2 j 1 k i 1 m n i j E i j 2 E i j displaystyle chi 2 sum j 1 k sum i 1 m frac n ij E ij 2 E ij nbsp Um zu einer Testentscheidung zu gelangen wird der erhaltene Wert der Prufgrosse mit dem zugehorigen kritischen Wert verglichen d h mit dem von der Anzahl der Freiheitsgrade und dem Signifikanzniveau a displaystyle alpha nbsp abhangigen Quantil der Chi Quadrat Verteilung alternativ kann der p Wert bestimmt werden Sind die Abweichungen zwischen mindestens zwei Stichprobenverteilungen signifikant wird die Nullhypothese verworfen d h die Nullhypothese der Homogenitat wird abgelehnt falls X 2 gt x k 1 m 1 1 a 2 displaystyle X 2 gt chi k 1 m 1 1 alpha 2 nbsp Der Ablehnungsbereich fur H 0 displaystyle H 0 nbsp liegt rechts vom kritischen Wert Anwendungsbedingungen Bearbeiten Damit die Prufgrosse als naherungsweise approximativ Chi Quadrat verteilt betrachtet werden kann mussen folgende Approximationsbedingungen gelten 8 9 grosser Stichprobenumfang n gt 30 displaystyle n gt 30 nbsp E i j 1 displaystyle E ij geq 1 nbsp fur alle i j displaystyle i j nbsp min 80 der E i j gt 5 displaystyle E ij gt 5 nbsp Rinne 2003 und Voss 2000 fordern zusatzlich Zellhaufigkeiten n i j 10 displaystyle n ij geq 10 nbsp 8 9 Sind einige erwartete Haufigkeiten zu klein mussen mehrere Klassen bzw Merkmalskategorien zusammengefasst werden um die Approximationsbedingungen einzuhalten Besitzt die untersuchte Zufallsvariable sehr viele mogliche Auspragungen z B weil die Variable metrisch stetig ist fasst man diese zweckmassigerweise in m displaystyle m nbsp Klassen Kategorien zusammen um die nun klassierte Zufallsvariable mit dem Chi Quadrat Test untersuchen zu konnen Hierbei ist jedoch zu beachten dass die Art und Weise der Klassierung der Beobachtungen das Testergebnis beeinflussen kann 9 Vergleich zu Unabhangigkeits und Verteilungstest Bearbeiten Der Homogenitatstest kann auch als Unabhangigkeitstest interpretiert werden wenn man die Stichproben als Auspragungen eines zweiten Merkmals ansieht Auch kann er als eine Form des Verteilungstests angesehen werden bei der nicht eine empirische und eine theoretische Verteilung sondern mehrere empirische Verteilungen verglichen werden Unabhangigkeitstest und Verteilungstest sind jedoch Einstichprobenprobleme wahrend der Homogenitatstest ein Mehrstichprobenproblem darstellt Beim Unabhangigkeitstest wird eine einzige Stichprobe bzgl zweier Merkmale erhoben beim Verteilungstest eine Stichprobe bzgl eines Merkmals Beim Homogenitatstest werden mehrere Stichproben bzgl eines Merkmals erhoben Vierfeldertest BearbeitenDer Chi Quadrat Vierfeldertest ist ein statistischer Test Er dient dazu zu prufen ob zwei dichotome Merkmale stochastisch unabhangig voneinander sind bzw ob die Verteilung eines dichotomen Merkmals in zwei Gruppen identisch ist 10 Vorgehensweise Bearbeiten Der Vierfeldertest beruht auf einer 2 2 Kontingenztafel die die bivariate Haufigkeitsverteilung zweier Merkmale visualisiert Merkmal XMerkmal Y Auspragung 1 Auspragung 2 ZeilensummeAuspragung 1 a b a bAuspragung 2 c d c dSpaltensumme a c b d n a b c dLaut einer Faustformel muss der Erwartungswert aller vier Felder mindestens 5 betragen Der Erwartungswert wird dabei berechnet aus Zeilensumme Spaltensumme Gesamtzahl Bei einem Erwartungswert kleiner 5 empfehlen Statistiker den Exakten Fisher Test Teststatistik Bearbeiten Um die Nullhypothese zu prufen dass beide Merkmale stochastisch unabhangig sind wird zunachst folgende Prufgrosse fur einen zweiseitigen Test berechnet X 2 n a d c b 2 a c b d a b c d a x 1 2 displaystyle X 2 frac n cdot a cdot d c cdot b 2 a c cdot b d cdot a b cdot c d stackrel a sim chi 1 2 nbsp Die Prufgrosse ist naherungsweise Chi Quadrat verteilt mit einem Freiheitsgrad Sie sollte nur dann verwendet werden wenn in jeder der beiden Stichproben mindestens sechs Merkmalstrager Beobachtungen enthalten sind Testentscheidung Bearbeiten Ist der auf Grund der Stichprobe erhaltene Prufwert kleiner als der zum gewahlten Signifikanzniveau gehorende kritische Wert d h das entsprechende Quantil der Chi Quadrat Verteilung dann konnte der Test nicht nachweisen dass ein signifikanter Unterschied besteht Errechnet sich dagegen ein Prufwert der grosser oder gleich dem kritischen Wert ist so besteht zwischen den Stichproben ein signifikanter Unterschied Die Wahrscheinlichkeit dass der berechnete oder ein noch grosserer Prufwert nur zufallig auf Grund der Stichprobenziehung erhalten wurde p Wert lasst sich wie folgt naherungsweise berechnen p 1 2 10 x 2 3 84 displaystyle p frac 1 2 cdot 10 frac hat chi 2 3 84 nbsp Die Naherung dieser Faust Formel an den tatsachlichen p Wert ist gut wenn die Prufgrosse zwischen 2 0 und 8 0 liegt 11 Beispiele und Anwendungen Bearbeiten Bei der Frage ob eine medizinische Massnahme wirksam ist oder nicht ist der Vierfeldertest sehr hilfreich da er sich auf das Hauptentscheidungskriterium konzentriert Beispiel 1 Bearbeiten Man befragt jeweils 50 zufallig ausgewahlte Frauen und Manner ob sie rauchen oder nicht Man erhalt das Ergebnis Frauen 25 Raucherinnen 25 Nichtraucherinnen Manner 30 Raucher 20 NichtraucherFuhrt man auf Basis dieser Erhebung einen Vierfeldertest durch dann ergibt sich anhand der oben dargestellten Formel ein Prufwert von ca 1 Da dieser Wert kleiner ist als der kritische Wert 3 841 kann die Nullhypothese dass das Rauchverhalten vom Geschlecht unabhangig ist nicht verworfen werden Der Anteil der Raucher bzw Nichtraucher unterscheidet sich zwischen den Geschlechtern nicht signifikant Beispiel 2 Bearbeiten Man befragt jeweils 500 zufallig ausgewahlte Frauen und Manner ob sie rauchen oder nicht Folgende Daten werden erhalten Frauen 250 Nichtraucher 250 Raucher Manner 300 Nichtraucher 200 RaucherHier ergibt sich anhand des Vierfeldertests ein Prufwert von 1000 99 10 1 displaystyle tfrac 1000 99 approx 10 1 nbsp welcher grosser als 3 841 ist Da 10 1 gt 3 841 displaystyle 10 1 gt 3 841 nbsp kann die Nullhypothese dass die Merkmale Rauchverhalten und Geschlecht stochastisch unabhangig voneinander sind auf einem Signifikanzniveau von 0 05 abgelehnt werden Yates Stetigkeitskorrektur BearbeitenDie Prufgrosse fur die Yates Stetigkeitskorrektur ist definiert als x Yates 2 j 1 m N j n j 0 5 2 n j displaystyle chi text Yates 2 sum j 1 m frac N j n j 0 5 2 n j nbsp Dabei ist N j displaystyle N j nbsp die beobachtete Haufigkeit und n j displaystyle n j nbsp die erwartete Haufigkeit der j displaystyle j nbsp ten Kategorie 12 Fur eine 2 2 Kontingenztafel gilt 13 x Yates 2 j 1 m a d b c m 2 2 m a b c d a c b d displaystyle chi text Yates 2 sum j 1 m frac a cdot d b cdot c frac m 2 2 cdot m a b cdot c d cdot a c cdot b d nbsp Tabelle der Quantile der Chi Quadrat Verteilung BearbeitenDie Tabelle zeigt die wichtigsten Quantile der Chi Quadrat Verteilung In der linken Spalte sind die Freiheitsgrade f displaystyle f nbsp und in der oberen Zeile die 1 a displaystyle 1 alpha nbsp Niveaus eingetragen Ablesebeispiel Das Quantil der Chi Quadrat Verteilung bei 2 Freiheitsgraden und einem a displaystyle alpha nbsp Niveau von 1 betragt 9 21 1 af displaystyle f nbsp 0 900 0 950 0 975 0 990 0 995 0 9991 2 71 3 84 5 02 6 63 7 88 10 832 4 61 5 99 7 38 9 21 10 60 13 823 6 25 7 81 9 35 11 34 12 84 16 274 7 78 9 49 11 14 13 28 14 86 18 475 9 24 11 07 12 83 15 09 16 75 20 526 10 64 12 59 14 45 16 81 18 55 22 467 12 02 14 07 16 01 18 48 20 28 24 328 13 36 15 51 17 53 20 09 21 95 26 129 14 68 16 92 19 02 21 67 23 59 27 8810 15 99 18 31 20 48 23 21 25 19 29 5911 17 28 19 68 21 92 24 72 26 76 31 2612 18 55 21 03 23 34 26 22 28 30 32 9113 19 81 22 36 24 74 27 69 29 82 34 5314 21 06 23 68 26 12 29 14 31 32 36 1215 22 31 25 00 27 49 30 58 32 80 37 7016 23 54 26 30 28 85 32 00 34 27 39 2517 24 77 27 59 30 19 33 41 35 72 40 7918 25 99 28 87 31 53 34 81 37 16 42 3119 27 20 30 14 32 85 36 19 38 58 43 8220 28 41 31 41 34 17 37 57 40 00 45 3121 29 62 32 67 35 48 38 93 41 40 46 8022 30 81 33 92 36 78 40 29 42 80 48 2723 32 01 35 17 38 08 41 64 44 18 49 7324 33 20 36 42 39 36 42 98 45 56 51 1825 34 38 37 65 40 65 44 31 46 93 52 6226 35 56 38 89 41 92 45 64 48 29 54 0527 36 74 40 11 43 19 46 96 49 64 55 4828 37 92 41 34 44 46 48 28 50 99 56 8929 39 09 42 56 45 72 49 59 52 34 58 3030 40 26 43 77 46 98 50 89 53 67 59 7040 51 81 55 76 59 34 63 69 66 77 73 4050 63 17 67 50 71 42 76 15 79 49 86 6660 74 40 79 08 83 30 88 38 91 95 99 6170 85 53 90 53 95 02 100 43 104 21 112 3280 96 58 101 88 106 63 112 33 116 32 124 8490 107 57 113 15 118 14 124 12 128 30 137 21100 118 50 124 34 129 56 135 81 140 17 149 45200 226 02 233 99 241 06 249 45 255 26 267 54300 331 79 341 40 349 87 359 91 366 84 381 43400 436 65 447 63 457 31 468 72 476 61 493 13500 540 93 553 13 563 85 576 49 585 21 603 45Alternativen zum Chi Quadrat Test BearbeitenDer Chi Quadrat Test ist immer noch weit verbreitet obwohl heute bessere Alternativen zur Verfugung stehen Gerade bei kleinen Werten pro Zelle Faustregel x i j lt 5 displaystyle x ij lt 5 nbsp ist die Prufstatistik problematisch wahrend bei grossen Stichproben der Chi Quadrat Test nach wie vor zuverlassig ist Der ursprungliche Vorteil des Chi Quadrat Tests lag darin dass die Prufstatistik besonders fur kleinere Tabellen auch von Hand berechnet werden kann denn der schwierigste Rechenschritt ist die Quadrierung wahrend der genauere G Test als schwierigsten Rechenschritt eine Logarithmierung erfordert Die Prufstatistik G displaystyle G nbsp ist annahernd Chi Quadrat verteilt und ist auch dann robust wenn die Kontingenztafel seltene Ereignisse enthalt In der Computerlinguistik hat sich der G Test durchsetzen konnen da dort die Haufigkeitsanalyse selten vorkommender Worter und Textbausteine ein typisches Problem darstellt Da heutige Computer genug Rechenleistung bieten lassen sich beide Tests durch den Exakten Test nach Fisher ersetzen Siehe auch BearbeitenCramers V Exakter Test nach Fisher G Test Kolmogorow Smirnow TestWeblinks BearbeitenRechner fur einfache und kumulierte Wahrscheinlichkeiten sowie Quantile und Konfidenzintervalle der Chi Quadrat Verteilung Artikel zur Problematik des ein und zweiseitigen Chi Quadrat Signifikanztests Exakte p Werte englisch Der Chi Quadrat Test Deutsche Einfuhrung und Beispiele Vierfeldertest nbsp Wikibooks Vierfeldertest mit R Lern und Lehrmaterialien Programmcode in Visual Basic Programmcode in GambasEinzelnachweise Bearbeiten Karl Pearson On the criterion that a given system of derivations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling In The London Edinburgh and Dublin Philosophical Magazine and Journal of Science Band 50 Nr 5 1900 S 157 175 doi 10 1080 14786440009463897 W Cash Parameter estimation in astronomy through application of the likelihood ratio In The Astrophysical Journal 228 Jahrgang 1979 ISSN 0004 637X S 939 doi 10 1086 156922 The Cash Statistic and Forward Fitting In hesperia gsfc nasa gov Abgerufen am 19 Oktober 2021 Beschluss des FG Munster vom 10 November 2003 Az 6 V 4562 03 E U PDF Horst Rinne Taschenbuch der Statistik 3 Auflage Verlag Harri Deutsch 2003 S 562 563 Bernd Ronz Hans G Strohe Lexikon Statistik Gabler Verlag 1994 S 69 siehe Politische Parteien in Deutschland a b Horst Rinne Taschenbuch der Statistik 3 Auflage Verlag Harri Deutsch 2003 S 562 a b c Werner Voss Taschenbuch der Statistik 1 Auflage Fachbuchverlag Leipzig 2000 S 447 Jurgen Bortz Nicola Doring Forschungsmethoden und Evaluation fur Human und Sozialwissenschaftler 4 Auflage Springer 2006 S 103 Hans Hermann Dubben Hans Peter Beck Bornholdt Der Hund der Eier legt 4 Auflage Rowohlt Science 2009 S 293 Statistics How To Yates Correction Definition Examples Nicola Serra Teresa Rea Paola Di Carlo Consolato Sergi Continuity correction of Pearson s chi square test in 2x2 Contingency Tables A mini review on recent development Abgerufen von https de wikipedia org w index php title Chi Quadrat Test amp oldid 235818070