www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Ein Zusammenhangsmass gibt in der Statistik die Starke und gegebenenfalls die Richtung einer Abhangigkeit zweier statistischer Variablen wieder Ein Assoziationsmass ist ein Zusammenhangsmass bei dem mindestens eine Variable nominalskaliert ist 1 Korrelationskoeffizienten sind im Falle nominalskalierter Variablen ungeeignet da keine Ordnungsrelation auf der nominalen Skala definiert ist Inhaltsverzeichnis 1 Allgemeines 2 Koeffizienten 2 1 Fur zwei nominale Variablen 2 2 Fur zwei ordinale Variablen 2 3 Fur zwei metrische Variablen 2 4 Fur zwei Variablen unterschiedlichen Skalenniveaus 3 EinzelnachweiseAllgemeines Bearbeiten Hauptartikel Proportionale Fehlerreduktionsmasse Je nach Voraussetzung gibt es einen oder mehrere mogliche Zusammenhangsmasse z B abhangig vom Skalenniveau der Merkmale oder Zufallsvariablen kategorial nominal ordinal oder metrisch und abhangig davon ob man ein standardisiertes oder ein nicht standardisiertes Mass verwenden mochte Als nicht standardisierte Zusammenhangsmasse werden solche bezeichnet die ausschliesslich fur Tabellen gleicher Dimension und oder bei gleichem Stichprobenumfang vergleichbar sind Diese Masse nehmen in der Regel den Wert null an wenn keine Abhangigkeit zwischen den betrachteten Merkmalen vorliegt Standardisierte Zusammenhangsmasse nehmen Werte in einem Intervall an damit kann man auch die Starke des Zusammenhangs beurteilen Standardisierte Zusammenhangsmasse bei denen mindestens ein Merkmal nominal skaliert ist nehmen meist nur Werte im Intervall 0 1 displaystyle 0 1 nbsp an Sind beide Merkmale mindestens ordinal skaliert dann nehmen die standardisierten Zusammenhangsmasse Werte in Intervall 1 1 displaystyle 1 1 nbsp Fall 1 oder 0 1 displaystyle 0 1 nbsp Fall 2 an Im ersten Fall wird neben der Starke des Zusammenhangs auch eine Richtung angegeben Zum zweiten Fall zahlen auch die Fehlerreduktionsmasse Hier wird vorausgesetzt dass ein Vorhersagewert fur die abhangige Variable berechnet werden kann Einmal unter Kenntnis des Zusammenhangs je nach Wert Kategorie der unabhangigen Variablen wird ein bestimmter Wert eine bestimmte Kategorie der abhangigen Variablen vorausgesagt und einmal ohne Kenntnis des Zusammenhangs nur basierend auf den Werten Kategorien der abhangigen Variablen Danach wird die Reduktion des Vorhersagefehlers bei beiden Methoden betrachtet Damit wird der Zusammenhang zwischen den Variablen indirekt quantifiziert Dies fuhrt auch zu asymmetrischen Masszahlen je nachdem welche der beiden Variablen die abhangige Variable ist Asymmetrisch bedeutet hier dass sich der Wert des Koeffizienten andert wenn man statt der Beobachtungsreihe x i y i displaystyle x i y i nbsp die Beobachtungsreihe y i x i displaystyle y i x i nbsp betrachtet Koeffizienten BearbeitenFur zwei nominale Variablen Bearbeiten Hauptartikel Kontingenzkoeffizient Bei Koeffizienten fur zwei nominal skalierten Variablen liegt eine Kontingenztabelle mit den gemeinsamen Haufigkeiten bzw Wahrscheinlichkeiten fur Zufallsvariablen zugrunde Fur die direkte Messung des Zusammenhang wird die quadratische Kontingenz verwendet die die beobachten gemeinsamen Haufigkeiten mit den erwarteten gemeinsamen Haufigkeiten unter Unabhangigkeit kein Zusammenhang vergleicht Weichen die beiden Haufigkeiten fur eine oder mehrere Kombinationen von Merkmalsauspragungen voneinander ab dann liegt ein Zusammenhang vor Des Weiteren gibt es spezielle Koeffizienten fur 2x2 Kontingenztabellen Zusammenhangsmasse fur nominale Variablen konnen auch fur ordinale oder metrisch diskrete Merkmale eingesetzt werden Allerdings wird dabei ein Teil der Information in den Daten z B die Rangfolge der Merkmalsauspragungen nicht ausgenutzt Koeffizient Wertebereich BemerkungQuadratische Kontingenz grosser gleich null nicht standardisiert symmetrischMittlere quadratische Kontingenz grosser gleich null standardisiert fur 2x2 Kontingenztabellen symmetrischKontingenzkoeffizient grosser gleich null und kleiner als eins nicht standardisiert symmetrischKorrigierter Kontingenzkoeffizient im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrischCramers V im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrischPhi Koeffizient im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrisch Spezialfall von Cramers V fur 2x2 KontingenztabellenChancenverhaltnis grosser gleich null nicht standardisiert asymmetrisch meist fur 2x2 KontingenztabellenGoodman und Kruskals Lambda im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrisch und asymmetrisch FehlerreduktionsmassGoodman und Kruskals Tau im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrisch und asymmetrisch FehlerreduktionsmassUnsicherheitskoeffizient im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrisch und asymmetrisch FehlerreduktionsmassFur zwei ordinale Variablen Bearbeiten Hauptartikel Rangkorrelationskoeffizient Bei Koeffizienten fur zwei ordinal skalierte Variablen wird die Zahl der Beobachtungspaare x i y i x j y j displaystyle x i y i x j y j nbsp ermittelt die konkordant x i lt x j displaystyle x i lt x j nbsp und y i lt y j displaystyle y i lt y j nbsp bzw diskordant x i lt x j displaystyle x i lt x j nbsp und y i gt y j displaystyle y i gt y j nbsp sind Konkordante Paare sprechen eher fur einen positiven Zusammenhang d h bei den Beobachtungen treten kleine Werte von X displaystyle X nbsp mit kleinen Werten von Y displaystyle Y nbsp und grosse Werte von X displaystyle X nbsp mit grossen Werten von Y displaystyle Y nbsp auf Diskordante Paare sprechen eher fur einen negativen Zusammenhang d h bei den Beobachtungen treten kleine Werte von X displaystyle X nbsp mit grossen Werten von Y displaystyle Y nbsp und grosse Werte von X displaystyle X nbsp mit kleinen Werten von Y displaystyle Y nbsp auf Aus der Zahl der konkordanten und diskordanten wird dann ein Zusammenhangsmass berechnet Die einzelnen Koeffizienten unterscheiden sich dann in der Art und Weise wie Bindungen d h Beobachtungspaare mit x i x j displaystyle x i x j nbsp und oder y i y j displaystyle y i y j nbsp berucksichtigt werden Eine Alternative ist die Verwendung von Rangen Hierbei wird jedem Beobachtungswert x i displaystyle x i nbsp ein Rang zugeordnet der seiner Position in der sortierten Reihe der X displaystyle X nbsp Werte angibt Das Gleiche geschieht mit den Y displaystyle Y nbsp Werten Dann wird fur jede Beobachtung der Rang von x i displaystyle x i nbsp mit dem Rang von y i displaystyle y i nbsp verglichen Je starker die Range bei einer Beobachtung ubereinstimmen desto mehr spricht es fur einen positiven Zusammenhang Je starker sich die Range bei einer Beobachtung unterscheiden desto mehr spricht es fur einen negativen Zusammenhang Zusammenhangsmasse fur ordinale Variablen konnen auch fur metrische Merkmale eingesetzt werden Auch hierbei wird dann ein Teil der Information in den Daten nicht ausgenutzt andererseits sind diese Koeffizienten dann robust gegen Ausreisser und zeigen auch nicht linearen Zusammenhange an Koeffizient Wertebereich BemerkungKovarianz fur Rangplatze im Intervall n n 1 2 n n 1 2 displaystyle left tfrac n n 1 2 tfrac n n 1 2 right nbsp nicht standardisiert symmetrisch Differenz der konkordanten und diskordanten PaareKendall sches Tau a im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch berucksichtigt keine BindungenKendall sches Tau b im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch berucksichtigt keine Beobachtungspaare mit x i x j displaystyle x i x j nbsp und y i y j displaystyle y i y j nbsp erreicht die Werte 1 displaystyle 1 nbsp und 1 displaystyle 1 nbsp auf nicht quadratischen Tabellen nichtKendall sches Tau c im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch berucksichtigt keine Bindungen korrigiert aber fur nicht quadratischen TabellenKendall sches Tau im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch berucksichtigt keine Beobachtungspaare mit x i x j displaystyle x i x j nbsp und y i y j displaystyle y i y j nbsp Goodman und Kruskals Gamma im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch weist beim Vorliegen von Bindungen zu hohe Werte auf der Absolutbetrag ist ein FehlerreduktionsmassYule s Q im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch Spezialfall von Goodman und Kruskals Gamma fur dichotome Variablen kann auch fur nominale Variablen eingesetzt werdenSpearman scher Rangkorrelationskoeffizient im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch setzt implizit voraus dass benachbarte Range immer den gleichen Abstand habenFur zwei metrische Variablen Bearbeiten nbsp Konstruktion der Kovarianz s x y 1 n i 1 n x i x y i y displaystyle s xy frac 1 n sum i 1 n x i bar x y i bar y nbsp Bei Koeffizienten fur zwei metrisch skalierte Variablen wird fur jede Beobachtung der Abstand von x i displaystyle x i nbsp zu einem Mittelwert der X displaystyle X nbsp Werte sowie der Abstand von y i displaystyle y i nbsp zu einem Mittelwert der Y displaystyle Y nbsp Werte ermittelt Danach wird fur jede Beobachtung das Produkt der beiden Abstande berechnet und uber alle Beobachtungen gemittelt Positive Werte des Produktes sprechen fur einen positiven Zusammenhang negative Werte fur einen negativen Zusammenhang Die Grafik rechts zeigt dies fur die Kovarianz einer Beobachtungsreihe Fur jede Beobachtung wird der Abstand zum Mittelwert ermittelt dann multipliziert und gemittelt Die Koeffizienten unterscheiden sich darin wie der Abstand berechnet wird und welcher Mittelwert verwendet wird arithmetisches Mittel oder Median Auch der Spearman sche Rangkorrelationskoeffizient folgt diesem Schema statt x i displaystyle x i nbsp und y i displaystyle y i nbsp werden die Range von x i displaystyle x i nbsp und y i displaystyle y i nbsp in der Bravais Pearson Korrelation verwendet Durch die Eigenschaften der Range z B i 1 n Rang x i n n 1 2 displaystyle textstyle sum i 1 n operatorname Rang x i tfrac n n 1 2 nbsp kann die Formel der Bravais Pearson Korrelation vereinfacht werden Koeffizient Wertebereich BemerkungKovarianz im Intervall displaystyle infty infty nbsp nicht standardisiert symmetrisch nicht robust misst nur den linearen ZusammenhangBravais Pearson Korrelation im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch nicht robust misst nur den linearen ZusammenhangQuadrantenkorrelation im Intervall 1 1 displaystyle 1 1 nbsp standardisiert symmetrisch robust misst auch nicht lineare ZusammenhangeBestimmtheitsmass im Intervall 0 1 displaystyle 0 1 nbsp standardisiert symmetrisch nicht robust FehlerreduktionsmassFur zwei Variablen unterschiedlichen Skalenniveaus Bearbeiten Eine oft genutzte Moglichkeit ist die Benutzung eines Koeffizienten der fur zwei Variablen des niedrigen Skalenniveaus geeignet ist Ist z B eine Variable ordinal die andere metrisch skaliert dann benutzt man einen Koeffizienten fur zwei ordinale Variablen Dabei nimmt man in Kauf dass man nicht alle Informationen in den Beobachtungen ausnutzt Sehr problematisch wird dies wenn eine Variable metrisch stetig ist und die andere nominal Daher wurden eine Reihe von speziellen Koeffizienten fur unterschiedliche Skalenniveaus entwickelt Eine Vertauschung der Rollen der Variablen in den Formeln ist nicht moglich d h es ergibt keinen Sinn von symmetrischen oder asymmetrischen Koeffizienten zu sprechen Koeffizient X displaystyle X nbsp Y displaystyle Y nbsp Wertebereich BemerkungEta Quadrat nominal metrisch im Intervall 0 1 displaystyle 0 1 nbsp Fehlerreduktionsmass nicht robustPunktbiseriale Korrelation dichotom metrisch im Intervall 0 1 displaystyle 0 1 nbsp nicht robustEinzelnachweise Bearbeiten Spektrum Assoziationsmass Abgerufen am 13 Februar 2022 Abgerufen von https de wikipedia org w index php title Zusammenhangsmass amp oldid 220228948