www.wikidata.de-de.nina.az
Kontingenztafeln auch Kontingenztabellen oder Kreuztabellen sind Tabellen die die absoluten oder relativen Haufigkeiten Haufigkeitstabellen von Kombinationen bestimmter Merkmalsauspragungen enthalten Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen Das bedeutet es werden Haufigkeiten fur mehrere miteinander durch und bzw sowie Konjunktion verknupfte Merkmale dargestellt Diese Haufigkeiten werden erganzt durch deren Randsummen die die sogenannten Randhaufigkeiten bilden Der haufige Spezialfall einer Kontingenztabelle mit zwei Merkmalen ist eine Konfusionsmatrix Inhaltsverzeichnis 1 Aufbau und Anwendung 1 1 Vierfeldertafel 1 2 Beispiel fur eine zweidimensionale Kontingenztafel 1 3 Der Schein kann trugen 2 Kategorien die in Kontingenztafeln verwendet werden sollen 3 Dreidimensionale Kontingenztafel 4 Graphische Darstellung 5 Statistische Auswertung 6 Siehe auch 7 Einzelnachweise 8 WeblinksAufbau und Anwendung BearbeitenIm Gegensatz zu einer normalen flachen Tabelle die in der 1 Zeile Attributnamen und in allen weiteren Zeilen Auspragungen dieser Attribute besitzt enthalten in einer Kreuztabelle sowohl Zeilen als auch Spaltenuberschriften Merkmalsauspragungen und am Schnittpunkt der entsprechenden Spalte und Zeile wird ein Wert dargestellt der von den in der jeweiligen Spalte und Zeile angegebenen Merkmalauspragungen abhangt X displaystyle X nbsp Y displaystyle Y nbsp y 1 displaystyle y 1 nbsp y 2 displaystyle y 2 nbsp displaystyle ldots nbsp y K displaystyle y K nbsp Randhaufigkeitvon X displaystyle X nbsp x 1 displaystyle x 1 nbsp h 11 displaystyle h 11 nbsp h 12 displaystyle h 12 nbsp displaystyle ldots nbsp h 1 K displaystyle h 1K nbsp h 1 displaystyle h 1 bullet nbsp x 2 displaystyle x 2 nbsp h 21 displaystyle h 21 nbsp h 22 displaystyle h 22 nbsp displaystyle ldots nbsp h 2 K displaystyle h 2K nbsp h 2 displaystyle h 2 bullet nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle ddots nbsp displaystyle vdots nbsp displaystyle vdots nbsp x J displaystyle x J nbsp h J 1 displaystyle h J1 nbsp h J 2 displaystyle h J2 nbsp displaystyle ldots nbsp h J K displaystyle h JK nbsp h J displaystyle h J bullet nbsp Randhaufigkeitvon Y displaystyle Y nbsp h 1 displaystyle h bullet 1 nbsp h 2 displaystyle h bullet 2 nbsp displaystyle ldots nbsp h K displaystyle h bullet K nbsp h displaystyle h bullet bullet nbsp Eine allgemeine Kreuztabelle fur zwei Variablen X displaystyle X nbsp und Y displaystyle Y nbsp ist rechts dargestellt Die Merkmalsauspragungen x 1 x J displaystyle x 1 dotsc x J nbsp der Variablen X displaystyle X nbsp und y 1 y K displaystyle y 1 dotsc y K nbsp der Variablen Y displaystyle Y nbsp sind oben und links angegeben Die Anzahl der Auspragungen J displaystyle J nbsp und K displaystyle K nbsp kann fur beide Variablen unterschiedlich sein Ist sie gleich spricht man von quadratischen Kreuztabellen In der Tabelle findet man die absoluten Haufigkeiten h j k displaystyle h jk nbsp d h die Anzahl der Beobachtungen in denen sowohl die Merkmalsauspragung x j displaystyle x j nbsp und y k displaystyle y k nbsp auftritt Rechts sind die Randhaufigkeiten h j h j 1 h j K displaystyle h j bullet h j1 dotsb h jK nbsp bzw unten die Randhaufigkeiten h k h 1 k h J k displaystyle h bullet k h 1k dotsb h Jk nbsp abgetragen Rechts unten findet sich schliesslich die Summe der Randhaufigkeitenh h 1 h J h 1 h K n displaystyle h bullet bullet h 1 bullet dotsb h J bullet h bullet 1 dotsb h bullet K n nbsp wobei n displaystyle n nbsp die Zahl der Beobachtungen im Datensatz ist Anstelle von absoluten Haufigkeiten konnen auch relative Haufigkeiten dargestellt werden In diesem Fall wird statt h displaystyle h nbsp oft f displaystyle f nbsp benutzt und es gilt f 1 displaystyle f bullet bullet 1 nbsp Vierfeldertafel Bearbeiten Eine Vierfeldertafel ist eine Spezialform einer zweidimensionalen Kontingenztafel Beide Variablen haben nur zwei Merkmalsauspragungen und sie ist wie folgt aufgebaut Merkmal B displaystyle B nbsp B displaystyle bar B nbsp SummeA displaystyle A nbsp h A B displaystyle h A cap B nbsp h A B displaystyle h A cap bar B nbsp h A displaystyle h A nbsp A displaystyle bar A nbsp h A B displaystyle h bar A cap B nbsp h A B displaystyle h bar A cap bar B nbsp h A displaystyle h bar A nbsp Summe h B displaystyle h B nbsp h B displaystyle h bar B nbsp n displaystyle n nbsp Beispiel fur eine zweidimensionale Kontingenztafel Bearbeiten Es werden 2000 Personen daruber befragt ob sie Produkt A oder B bevorzugen Das Ergebnis wird nach Geschlecht des Befragten ausgewertet Es ergibt sich folgende Vierfeldertafel mit absoluten HaufigkeitenProdukt Geschlecht weiblich mannlich SummeProdukt A 660 340 1000Produkt B 340 660 1000Summe 1000 1000 2000mit relativen Haufigkeiten bezogen auf die FallzahlProdukt Geschlecht weiblich mannlich SummeProdukt A 0 33 0 17 0 5Produkt B 0 17 0 33 0 5Summe 0 5 0 5 1mit relativen Haufigkeiten bezogen auf die SpaltenProdukt Geschlecht weiblich mannlich SummeProdukt A 0 66 0 34 1Produkt B 0 34 0 66 1Summe 1 1mit relativen Haufigkeiten bezogen auf die ZeilenProdukt Geschlecht weiblich mannlich SummeProdukt A 0 66 0 34 1Produkt B 0 34 0 66 1Summe 1 1Der Schein kann trugen Bearbeiten Auf den ersten Blick ist zu ersehen dass die weiblichen Kunden dem Produkt A die mannlichen Kunden dagegen dem Produkt B zuneigen Dies kann eine interessante Information sein es kann aber auch nur ein Trugschluss sein Die Auswertung der Befragung hinsichtlich des Alters der Kunden ergibt Produkt Alter bis 40 Jahre uber 40 Jahre SummeProdukt A 700 300 1000Produkt B 300 700 1000Summe 1000 1000 2000Das Kaufverhalten hangt also nicht nur vom Geschlecht sondern auch vom Alter der Befragten ab Das Bedurfnis beide Informationen uber Abhangigkeiten in einen realistischen Bezug zueinander zu bringen erzwingt die Erarbeitung einer dreidimensionalen Kontingenztafel Um aus den Zusammenhangen in den untersuchten Stichproben auf Eigenschaften der zugrundeliegenden Grundgesamtheiten schliessen zu konnen konnen unter gewissen Bedingungen Chi Quadrat Tests verwendet werden Der Exakte Fisher Test ist ein statistischer Test auf Unabhangigkeit in der Kontingenztafel auch fur kleine Stichproben Kategorien die in Kontingenztafeln verwendet werden sollen BearbeitenInsbesondere durch die statistischen Verfahren die auf Kontingenztabellen aufbauen werden Anforderungen an die Kategorien eine einzelne Merkmalsauspragung oder eine Zusammenfassung von verschiedenen Merkmalsauspragungen gestellt Streng genommen mussen alle Kategorien voneinander vollig unabhangig sein Zum Beispiel kann eine Person nicht gleichzeitig weiblich und mannlich sein ausser in seltenen Fallen von Intersexualitat die hier vernachlassigt werden aber bei hat Grundschule besucht und hat Berufslehre abgeschlossen kann man die Mitglieder der letzteren Gruppe eigentlich auch in die erste einfugen da der Besuch der Grundschule fur jeden Menschen in westlich gepragten Gesellschaften obligatorisch ist Das Problem ist dass die Randhaufigkeiten sich dann nicht zu n displaystyle n nbsp oder 1 displaystyle 1 nbsp addieren Des Weiteren sollte es in der Kontingenztabelle keine Zeile oder Spalten geben in denen sich die Haufigkeiten zu Null addieren Zum Beispiel darf eine solche Tafel nicht die Kategorien mannlich und weiblich besitzen wenn man eine ausschliesslich mannliche oder ausschliesslich weibliche Grundgesamtheit untersucht Problematisch ist dass in der statischen Auswertung der Kehrwert dieser Summe auftritt und 1 0 nicht definiert ist Zusatzlich sollte so selten wie moglich eine Kategorie Sonstige eingesetzt werden beispielsweise wie in fahrt Opel fahrt Peugeot fahrt Toyota fahrt anderen Personenwagen Dieser Sammeltopf sollte falls er doch notwendig wird durch eine durchdachte Konzipierung so klein wie moglich gehalten werden Dreidimensionale Kontingenztafel BearbeitenFur eine dreidimensionale Tafel drei Merkmale werden zusatzliche Spalten in die Tabelle eingefugt Geschlecht weiblich Geschlecht mannlichProdukt Alter bis 40 Jahre uber 40 Jahre bis 40 Jahre uber 40 Jahre SummeProdukt A 630 70 30 30 70 70 270 30 1000Produkt B 270 30 70 70 30 30 630 70 1000Summe 900 100 100 100 100 100 900 100 2000Die in Klammern hinzugesetzten Prozentwerte sollen nur den Blick darauf lenken dass die Produktneigung keinesfalls vom Geschlecht abhangig war Dem Produkt A sind gleichermassen 70 der jungeren Frauen wie auch der Manner und 30 der alteren Frauen wie auch der Manner zugeneigt bei Produkt B verhalt es sich genau umgekehrt Um dieses Phanomen einleuchtender zu machen lohnt sich moglicherweise wieder der Blick auf eine diesmal wieder zweidimensionale Kontingenztafel Geschlecht Alter bis 40 Jahre uber 40 Jahre SummeWeiblich 900 100 1000Mannlich 100 900 1000Summe 1000 1000 2000Hier wird deutlich dass unter den jungeren Befragten eine ubergrosse Mehrheit von 90 weiblich war Die jungeren Kunden bevorzugen das Produkt A nicht etwa die weiblichen Dagegen bevorzugen die Alteren in der Befragung vornehmlich Manner Produkt B Es handelt sich bei der Geschlechterrelation aus dem Beispiel nur um ein scheinbares Verhaltnis das aufgrund der unausgewogenen statistischen Menge entstehen konnte Graphische Darstellung BearbeitenZur graphischen Darstellung zweidimensionaler Kontingenztabellen bieten sich 3D Balkendiagramme an Ein Nachteil solcher Diagramme ist jedoch dass je nach Blickwinkel Balken verdeckt werden konnen Zudem fuhrt die 3D Darstellung eine Perspektive ein die es dem Betrachter schwierig machen kann die Hohe der Balken miteinander zu vergleichen um zu erkennen in welcher Zelle nun mehr Beobachtungen sind 1 Eine weitere Moglichkeit die sich insbesondere bei Kontingenztafeln mit relativ wenigen Zellen anbietet ist ein gestapeltes Saulendiagramm das sich auf die relativen Spaltenhaufigkeiten bezieht Besser ist es einen Mosaikplot zu verwenden in dem die Flachen den Haufigkeiten fur jede Kombination von Merkmalsauspragungen entsprechen Zudem kann leicht die Unabhangigkeit von zwei oder mehr Variablen angezeigt werden nbsp 3D Balkendiagramm des Ergebnisses der Parlamentswahlen in der Ukraine am 30 September 2007 aufgeteilt nach Regionen und Parteien nbsp Gestapeltes Saulendiagramm das sich auf die relativen Spaltenhaufigkeiten bezieht fiktive Daten nbsp Mosaikplot der Haufigkeiten der Passagiere der Titanic nach den Variablen Klasse 1 Klasse 2 Klasse 3 Klasse Besatzung Geschlecht mannlich weiblich und Uberlebt ja nein Statistische Auswertung BearbeitenBei komplexer werdenden Kontingenztafeln lassen sich Relationen nicht mehr einfach mit dem Auge ablesen Die Statistik setzt zur systematischen Analyse eine Reihe von Verfahren ein Zusammenhangsmasse Kontingenzkoeffizienten x 2 displaystyle chi 2 nbsp Koeffizient korrigierter Kontingenzkoeffizient Cramers V und Phi Koeffizient Fehlerreduktionsmasse Goodman und Kruskals l bzw t sowie der Unsicherheitskoeffizient Tests Chi Quadrat Unabhangigkeitstest Vierfeldertest Exakter Test nach Fisher Weitere Analyseverfahren Log lineares ModellSiehe auch BearbeitenSimpson Paradoxon Vierfelderkorrelation Vierfeldertest fur den einfachsten FallEinzelnachweise Bearbeiten Heiner Abels Handbuch des statistischen Schaubilds Konstruktion Interpretation und Manipulation von graphischen Darstellungen German Edition Verlag Neue Wirtschafts Briefe 1981 ISBN 978 3 482 56581 6 Weblinks BearbeitenVideo zur Kreuztabelle WMV 19 6 MB Abgerufen von https de wikipedia org w index php title Kontingenztafel amp oldid 235400883 Vierfeldertafel