www.wikidata.de-de.nina.az
Der Kontingenzkoeffizient C displaystyle boldsymbol C nach Karl Pearson ist ein statistisches Zusammenhangsmass Der Pearsonsche Kontingenzkoeffizient druckt die Starke des Zusammenhangs zwischen zwei Variablen eines beliebigen Skalenniveaus aus Er basiert auf dem Vergleich von tatsachlich ermittelten Haufigkeiten zweier Merkmale mit den Haufigkeiten die man bei Unabhangigkeit dieser Merkmale erwartet hatte Inhaltsverzeichnis 1 Quadratische Kontingenz 1 1 Verwendung 1 2 Beispiel 2 Mittlere quadratische Kontingenz 3 Kontingenzkoeffizient nach Karl Pearson 3 1 Korrigierter Kontingenzkoeffizient 4 Cramers V 4 1 Vorgehen 4 2 Interpretation 5 Phi Koeffizient ϕ 5 1 Berechnung 5 2 Beispiele 5 3 Hinweis 5 4 Phi als Mass fur die Effektstarke 6 Literatur 7 Weblinks 8 EinzelnachweiseQuadratische Kontingenz BearbeitenDie quadratische Kontingenz 1 oder der Chi Quadrat Koeffizient x 2 displaystyle boldsymbol chi 2 nbsp auf dem auch der Kontingenzkoeffizient beruht ist ein Mass fur den Zusammenhang der betrachteten Merkmale x 2 i 1 I j 1 J n i j n i n j n 2 n i n j n displaystyle chi 2 sum i 1 I sum j 1 J frac left n ij frac displaystyle n i cdot n cdot j n right 2 displaystyle frac n i cdot n cdot j n nbsp Die Aussagekraft des x 2 displaystyle chi 2 nbsp Koeffizienten ist gering da seine Obergrenze d h der Wert den er bei vollkommener Abhangigkeit der betrachteten Merkmale annimmt abhangig von der Grosse Dimension der Kontingenztafel d h von der Anzahl der Auspragungen der Variablen und der Grosse der untersuchten Gesamtheit n displaystyle n nbsp ist Eine Vergleichbarkeit von Werten des x 2 displaystyle chi 2 nbsp Koeffizienten uber verschiedene Kontingenztabellen und Stichprobengrossen ist daher nicht gegeben 1 2 Bei volliger Unabhangigkeit der Merkmale ist x 2 0 displaystyle chi 2 0 nbsp Es gilt 3 0 x 2 n k 1 displaystyle 0 leq chi 2 leq n cdot k 1 nbsp wobei k min I J displaystyle k min I J nbsp das Minimum der Anzahl I displaystyle I nbsp der Zeilen und der Anzahl J displaystyle J nbsp der Spalten der Kontingenztabelle bezeichnet Verwendung Bearbeiten Die x 2 displaystyle chi 2 nbsp Grosse wird benotigt um den Kontingenzkoeffizienten C displaystyle boldsymbol C nbsp zu ermitteln Auch bei statistischen Tests findet die x 2 displaystyle chi 2 nbsp Grosse Verwendung siehe Chi Quadrat Test Beispiel Bearbeiten Es sei folgende Kontingenztafel aus einer Befragung entstanden Limousine displaystyle textbf Limousine nbsp Kombi displaystyle textbf Kombi nbsp Summe displaystyle textbf Summe nbsp Arbeiter displaystyle textbf Arbeiter nbsp 19 displaystyle 19 nbsp 18 displaystyle 18 nbsp 37 displaystyle 37 nbsp Angestellte displaystyle textbf Angestellte nbsp 43 displaystyle 43 nbsp 20 displaystyle 20 nbsp 63 displaystyle 63 nbsp Summe displaystyle textbf Summe nbsp 62 displaystyle 62 nbsp 38 displaystyle 38 nbsp 100 displaystyle 100 nbsp Berechnung des x 2 displaystyle chi 2 nbsp Koeffizienten 19 37 62 100 2 37 62 100 18 37 38 100 2 37 38 100 43 63 62 100 2 63 62 100 20 63 38 100 2 63 38 100 2 83 displaystyle frac left 19 displaystyle frac 37 cdot 62 100 right 2 displaystyle frac 37 cdot 62 100 frac left 18 displaystyle frac 37 cdot 38 100 right 2 displaystyle frac 37 cdot 38 100 frac displaystyle left 43 displaystyle frac 63 cdot 62 100 right 2 displaystyle frac 63 cdot 62 100 frac displaystyle left 20 displaystyle frac 63 cdot 38 100 right 2 displaystyle frac 63 cdot 38 100 2 83 nbsp Mittlere quadratische Kontingenz BearbeitenEin weiteres Mass um die Starke der Abhangigkeit der Merkmale in einer Kontingenztafel anzugeben ist die mittlere quadratische Kontingenz die im Wesentlichen eine Erweiterung des x 2 displaystyle chi 2 nbsp Koeffizienten darstellt x 2 n 1 n i 1 I j 1 J n i j n i n j n 2 n i n j n displaystyle frac chi 2 n frac 1 n sum i 1 I sum j 1 J frac left n ij displaystyle frac n i cdot n cdot j n right 2 displaystyle frac n i cdot n cdot j n nbsp Je grosser dieses Mass ist desto starker ist der Zusammenhang zwischen den zwei analysierten Merkmalen Sind die beiden Merkmale unabhangig so wird jeder Summand durch den Zahler des Bruches zu 0 displaystyle 0 nbsp das Mass selbst damit auch Im Falle einer 2 2 displaystyle 2 times 2 nbsp Kontingenztafel ist das Mass normiert und nimmt Werte im Intervall 0 1 displaystyle 0 1 nbsp an Kontingenzkoeffizient nach Karl Pearson Bearbeitenx 2 displaystyle chi 2 nbsp kann grundsatzlich sehr grosse Werte annehmen und ist nicht auf das Intervall 0 1 displaystyle 0 1 nbsp beschrankt Um die Abhangigkeit des Koeffizienten vom Stichprobenumfang auszuschalten wird auf Basis des x 2 displaystyle chi 2 nbsp der Kontingenzkoeffizient C displaystyle C nbsp auch C C displaystyle CC nbsp oder K displaystyle K nbsp nach Karl Pearson ermittelt C x 2 x 2 n displaystyle C sqrt frac chi 2 chi 2 n nbsp mit n displaystyle n nbsp der Stichprobenumfang Dieser kann Werte im Intervall 0 1 displaystyle 0 1 nbsp annehmen Problematisch ist dass die obere Grenze des Kontingenzkoeffizienten C displaystyle C nbsp abhangig von der Anzahl der betrachteten Dimensionen ist 4 Es gilt C 0 k 1 k displaystyle C in left 0 sqrt frac k 1 k right nbsp mit k min I J displaystyle k min I J nbsp das Minimum der Anzahl I displaystyle I nbsp der Zeilen und der Anzahl J displaystyle J nbsp der Spalten der Kontingenztabelle Korrigierter Kontingenzkoeffizient Bearbeiten Um zusatzlich zum Einfluss des Stichprobenumfangs auch den Einfluss der Dimension der betrachteten Kontingenztafel der Anzahl der Merkmalsauspragungen auf die Obergrenze des Koeffizienten auszuschalten und damit die Vergleichbarkeit von Ergebnissen zu gewahrleisten wird der korrigierte Kontingenzkoeffizient C k o r r displaystyle C mathrm korr nbsp haufig auch K displaystyle K nbsp zur Messung des Zusammenhangs genutzt C k o r r k k 1 C k k 1 x 2 n x 2 displaystyle C mathrm korr sqrt frac k k 1 cdot C sqrt frac k k 1 cdot sqrt frac chi 2 n chi 2 nbsp mit k displaystyle k nbsp wie oben Es gilt 0 C k o r r 1 displaystyle 0 leq C mathrm korr leq 1 nbsp Ein C k o r r displaystyle C mathrm korr nbsp nahe 0 displaystyle 0 nbsp deutet dabei auf unabhangige Merkmale hin ein C k o r r displaystyle C mathrm korr nbsp nahe 1 displaystyle 1 nbsp auf ein hohes Mass an Abhangigkeit zwischen den Merkmalen Fur das Beispiel ergibt sich ein korrigierter Kontingenzkoeffizient C k o r r 2 2 1 0 166 0 234 displaystyle C mathrm korr sqrt frac 2 2 1 cdot 0 166 0 234 nbsp Cramers V BearbeitenCramers V displaystyle boldsymbol V nbsp englisch Cramer s V displaystyle V nbsp ist ein Kontingenzkoeffizient genauer ein x 2 displaystyle chi 2 nbsp basiertes Zusammenhangsmass Es ist benannt nach dem schwedischen Mathematiker und Statistiker Harald Cramer Cramers V displaystyle V nbsp ist eine x 2 displaystyle chi 2 nbsp basierte Masszahl Cramers V displaystyle V nbsp ist eine symmetrische Masszahl fur die Starke des Zusammenhangs zwischen zwei oder mehr nominalskalierten Variablen wenn mindestens eine der beiden Variablen mehr als zwei Auspragungen hat Bei einer 2 2 displaystyle 2 times 2 nbsp Tabelle entspricht Cramers V displaystyle V nbsp dem absoluten Betrag des Phi Koeffizienten Vorgehen Bearbeiten V x 2 n k 1 displaystyle V sqrt frac chi 2 n cdot k 1 nbsp n displaystyle n nbsp Gesamtzahl der Falle Stichprobenumfang k min I J displaystyle k min I J nbsp das Minimum der Anzahl I displaystyle I nbsp der Zeilen und der Anzahl J displaystyle J nbsp der Spalten der KontingenztabelleInterpretation Bearbeiten Cramers V displaystyle V nbsp liegt bei jeder Kreuztabelle unabhangig von der Anzahl der Zeilen und Spalten zwischen 0 displaystyle 0 nbsp und 1 displaystyle 1 nbsp Er kann bei beliebig grossen Kreuztabellen angewandt werden Da Cramers V displaystyle V nbsp immer positiv ist kann keine Aussage uber die Richtung des Zusammenhangs getroffen werden Phi Koeffizient ϕ Bearbeiten Hauptartikel Matthews Korrelationskoeffizient Der Phi Koeffizient auch Vierfelder Korrelationskoeffizient Vierfelderkoeffizient ϕ displaystyle phi nbsp auch r ϕ displaystyle widehat r phi nbsp ist ein Mass fur die Starke des Zusammenhangs zweier dichotomer Merkmale Berechnung Bearbeiten Um die Vierfelderkorrelation zwischen zwei dichotomen Merkmalen A displaystyle A nbsp und B displaystyle B nbsp zu schatzen stellt man zuerst eine Kontingenztafel auf die die gemeinsame Haufigkeitsverteilung der Merkmale enthalt A 0 displaystyle A 0 nbsp A 1 displaystyle A 1 nbsp Summe displaystyle textbf Summe nbsp B 0 displaystyle B 0 nbsp a displaystyle a nbsp b displaystyle b nbsp a b displaystyle a b nbsp B 1 displaystyle B 1 nbsp c displaystyle c nbsp d displaystyle d nbsp c d displaystyle c d nbsp Summe displaystyle textbf Summe nbsp a c displaystyle a c nbsp b d displaystyle b d nbsp a b c d displaystyle a b c d nbsp Mit den Daten aus der Tabelle kann man ϕ displaystyle phi nbsp nach der Formel ϕ a d b c a b c d a c b d displaystyle phi frac a cdot d b cdot c sqrt a b cdot c d cdot a c cdot b d nbsp berechnen 5 Die Formel ergibt sich aus der allgemeineren Definition des Korrelationskoeffizienten r A B displaystyle rho A B nbsp im Spezialfall zweier binarer Zufallsvariablen A displaystyle A nbsp und B displaystyle B nbsp Beispiele Bearbeiten Messen der Assoziation zwischen Zustimmung zu oder Ablehnung einer Politikentscheidung und dem Geschlecht Vorfuhrung bzw Nichtvorfuhrung eines Werbespots und Kauf oder Nichtkauf eines Produkts Anwendung von ϕ displaystyle phi nbsp auf eine Konfusionsmatrix mit zwei Klassen Hinweis Bearbeiten Zwischen ϕ displaystyle phi nbsp und x 2 displaystyle chi 2 nbsp besteht der Zusammenhang x 2 n ϕ 2 displaystyle chi 2 n cdot phi 2 nbsp bzw ϕ 2 x 2 n displaystyle phi 2 frac chi 2 n nbsp wobei n displaystyle n nbsp die Anzahl der Beobachtungen bezeichnet Damit ist ϕ displaystyle phi nbsp die Quadratwurzel das Vorzeichen spielt keine Rolle aus der mittleren quadratischen Kontingenz siehe oben Als Teststatistik verwendet ist n ϕ 2 displaystyle n cdot phi 2 nbsp unter der Annahme dass ϕ displaystyle phi nbsp gleich null ist x 2 displaystyle chi 2 nbsp verteilt mit einem Freiheitsgrad Phi als Mass fur die Effektstarke Bearbeiten Wenn ein Mass zur Bestimmung der Effektstarke mit Orientierung auf Wahrscheinlichkeiten gesucht wird kann dafur ϕ displaystyle phi nbsp verwendet werden Da bei Kreuztabellen die nicht absolute Haufigkeiten sondern Wahrscheinlichkeiten enthalten an der Stelle an der normalerweise die Fallzahl zu finden ist immer 1 displaystyle 1 nbsp steht wird ϕ displaystyle phi nbsp identisch mit Cohens w displaystyle w nbsp ϕ x 2 n x 2 1 x 2 w displaystyle phi sqrt frac chi 2 n sqrt frac chi 2 1 sqrt chi 2 w nbsp Dabei wird x 2 displaystyle chi 2 nbsp nicht in Bezug auf absolute Haufigkeiten sondern in Bezug auf Wahrscheinlichkeiten berechnet Literatur BearbeitenJ Bortz G A Lienert K Boehnke Verteilungsfreie Methoden in der Biostatistik Springer Berlin 1190 Kap 8 1 S 326 und S 355 ff J M Diehl H U Kohr Deskriptive Statistik 12 Auflage Klotz Eschborn 1999 S 161 P Zofel Statistik fur Psychologen Pearson Studium Munchen 2003 Signifikanzprufung fur die Vierfelderkorrelation PDF 13 kB Weblinks BearbeitenPhi Koeffizient Online RechnerEinzelnachweise Bearbeiten a b Backhaus Multivariate Analysemethoden 11 Auflage Springer 2006 S 241 700 W Kohn Statistik Datenanalysis und Wahrscheinlichkeitsrechnung Springer 2005 S 115 W Kohn Statistik Datenanalysis und Wahrscheinlichkeitsrechnung Springer 2005 S 114 H Toutenburg C Heumann Deskriptive Statistik Eine Einfuhrung in Methoden und Anwendungen mit R und SPSS 6 Auflage Springer 2008 S 115 Bernd Ronz Hans Gerhard Strohe Hrsg Lexikon Statistik Gabler Wiesbaden 1994 S 25 Abgerufen von https de wikipedia org w index php title Kontingenzkoeffizient amp oldid 237306060