www.wikidata.de-de.nina.az
Dieser Artikel behandelt die Kovarianz von zwei Zufallsvariablen zur Kovarianz einer Datenreihe oder Stichprobe siehe Stichprobenkovarianz Die Kovarianz lateinisch con mit und Varianz Streuung von variare ver andern verschieden sein daher selten auch Mitstreuung 1 ist in der Stochastik ein nichtstandardisiertes Zusammenhangsmass fur einen monotonen Zusammenhang zweier Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsverteilung Der Wert dieser Kennzahl macht tendenzielle Aussagen daruber ob hohe Werte der einen Zufallsvariablen eher mit hohen oder eher mit niedrigen Werten der anderen Zufallsvariablen einhergehen Die Kovarianz ist ein Mass fur die Assoziation d h sie misst den Grad der Un Abhangigkeit zweier Zufallsvariablen wenn mindestens eine der Zufallsvariablen nominalskaliert ist Inhaltsverzeichnis 1 Definition 2 Berechnung 3 Eigenschaften und Rechenregeln 3 1 Interpretation der Kovarianz 3 2 Zusammenhang von Kovarianz und Korrelation 3 3 Existenz 3 4 Verschiebungssatz 3 5 Beziehung zur Varianz 3 6 Linearitat Symmetrie und Definitheit 3 7 Unkorreliertheit und Unabhangigkeit 4 Verallgemeinerungen 5 Kovarianz im Mehrdimensionalen 6 Literatur 7 EinzelnachweiseDefinition BearbeitenSind X displaystyle X nbsp und Y displaystyle Y nbsp zwei reelle integrierbare Zufallsvariablen deren Produkt ebenfalls integrierbar ist d h die Erwartungswerte E X displaystyle operatorname E X nbsp E Y displaystyle operatorname E Y nbsp und E X Y displaystyle operatorname E XY nbsp existieren dann heisst Cov X Y E X E X Y E Y displaystyle operatorname Cov X Y operatorname E bigl X operatorname E X cdot Y operatorname E Y bigr nbsp die Kovarianz von X displaystyle X nbsp und Y displaystyle Y nbsp Die Kovarianz ist also das Produkt der Differenzen je zwischen X displaystyle X nbsp und Y displaystyle Y nbsp und ihren Erwartungswerten In der Statistik werden E X displaystyle operatorname E X nbsp und E Y displaystyle operatorname E Y nbsp als arithmetische Mittelwerte berechnet 2 Berechnung BearbeitenFur die Berechnung oder Schatzung der Kovarianz aus zwei Datenreihen gibt es unterschiedliche Formeln siehe Stichprobenkovarianz Eigenschaften und Rechenregeln BearbeitenInterpretation der Kovarianz Bearbeiten nbsp Normalverteilungen zweier Variablen mit unterschiedlicher KovarianzDie Kovarianz kann anhand dreier Wertebereiche qualitativ beschrieben werden Die Kovarianz ist positiv wenn zwischen X displaystyle X nbsp und Y displaystyle Y nbsp ein Zusammenhang mit gleicher Tendenz besteht d h hohe niedrige Werte von X displaystyle X nbsp gehen mit hohen niedrigen Werten von Y displaystyle Y nbsp einher Die Kovarianz ist hingegen negativ wenn zwischen X displaystyle X nbsp und Y displaystyle Y nbsp ein Zusammenhang mit gegensinniger Tendenz besteht d h hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher und umgekehrt Ist das Ergebnis null so besteht kein systematischer Zusammenhang zwischen X displaystyle X nbsp und Y displaystyle Y nbsp Zusammenhang von Kovarianz und Korrelation Bearbeiten Die Kovarianz ist zu zwei Eigenschaften der Daten proportional der Starke des Zusammenhangs und den Amplituden beider Streuungen Um den Zusammenhang isoliert zu betrachten und vergleichbar zu machen kann die Kovarianz mithilfe der Standardabweichung durch den Korrelationskoeffizient standardisiert werden Durch die Umrechnung der Kovarianz in die Korrelation r x y Corr X Y Cov X Y Std X Std Y Cov X Y Var X Var Y displaystyle rho xy operatorname Corr X Y frac operatorname Cov X Y operatorname Std X operatorname Std Y frac operatorname Cov X Y sqrt operatorname Var X operatorname Var Y nbsp wird der Wertebereich in das Intervall 1 1 displaystyle 1 1 nbsp projiziert Dabei konnen folgende Falle unterschieden werden r x y displaystyle rho xy nbsp 1 vollstandig positiv korreliert0 lt r x y displaystyle rho xy nbsp lt 1 partiell positiv korreliertr x y displaystyle rho xy nbsp 0 vollstandig unkorreliert 1 lt r x y displaystyle rho xy nbsp lt 0 partiell antikorreliertr x y displaystyle rho xy nbsp 1 vollstandig antikorreliertExistenz Bearbeiten Falls X displaystyle X nbsp und Y displaystyle Y nbsp quadratintegrierbar sind also falls E X 2 E X 2 lt displaystyle operatorname E X 2 operatorname E X 2 lt infty nbsp und E Y 2 E Y 2 lt displaystyle operatorname E Y 2 operatorname E Y 2 lt infty nbsp gelten so folgen aus der Cauchy Schwarz Ungleichung E X E X 1 E X 2 lt displaystyle operatorname E X operatorname E X cdot 1 leq sqrt operatorname E X 2 lt infty nbsp und analog E Y E Y 2 lt displaystyle operatorname E Y leq sqrt operatorname E Y 2 lt infty nbsp und zusatzlich E X Y E X Y E X 2 E Y 2 lt displaystyle operatorname E X cdot Y leq operatorname E X cdot Y leq sqrt operatorname E X 2 cdot operatorname E Y 2 lt infty nbsp Somit ist die geforderte Existenz der Erwartungswerte fur quadratintegrierbare Zufallsvariablen erfullt Verschiebungssatz Bearbeiten Zur oft einfacheren Berechnung der Kovarianz kann man auch den Verschiebungssatz als alternative Darstellung der Kovarianz anwenden Satz Verschiebungssatz fur die Kovarianz Cov X Y E X Y E X E Y displaystyle operatorname Cov X Y operatorname E XY operatorname E X operatorname E Y nbsp Beweis Cov X Y E X E X Y E Y E X Y X E Y Y E X E X E Y E X Y E X E Y E Y E X E X E Y E X Y E X E Y displaystyle begin aligned operatorname Cov X Y amp operatorname E bigl X operatorname E X cdot Y operatorname E Y bigr amp operatorname E bigl XY X operatorname E Y Y operatorname E X operatorname E X operatorname E Y bigr amp operatorname E XY operatorname E X operatorname E Y operatorname E Y operatorname E X operatorname E X operatorname E Y amp operatorname E XY operatorname E X operatorname E Y qquad Box end aligned nbsp Beziehung zur Varianz Bearbeiten Satz Die Kovarianz ist die Verallgemeinerung der Varianz denn es gilt Var X Cov X X displaystyle operatorname Var X operatorname Cov X X nbsp Beweis Cov X X E X E X 2 Var X displaystyle begin aligned operatorname Cov X X amp operatorname E bigl X operatorname E X 2 bigr amp operatorname Var X qquad Box end aligned nbsp Die Varianz ist demnach die Kovarianz einer Zufallsvariablen mit sich selbst Mit Hilfe der Kovarianzen lasst sich auch die Varianz einer Summe von quadratintegrierbaren Zufallsvariablen berechnen Allgemein gilt Var i 1 n X i i j 1 n Cov X i X j i 1 n Var X i i j 1 i j n Cov X i X j i 1 n Var X i 2 i 1 n 1 j i 1 n Cov X i X j displaystyle begin aligned operatorname Var left sum i 1 n X i right amp sum i j 1 n operatorname Cov X i X j amp sum i 1 n operatorname Var X i sum i j 1 i neq j n operatorname Cov X i X j amp sum i 1 n operatorname Var X i 2 sum i 1 n 1 sum j i 1 n operatorname Cov X i X j end aligned nbsp Speziell fur die Summe zweier Zufallsvariablen gilt daher die Formel Var X Y Var X Var Y 2 Cov X Y displaystyle operatorname Var X Y operatorname Var X operatorname Var Y 2 operatorname Cov X Y nbsp Wie sich unmittelbar aus der Definition ergibt andert die Kovarianz das Vorzeichen wenn eine der Variablen das Vorzeichen andert Cov X Y Cov X Y displaystyle operatorname Cov X Y operatorname Cov X Y nbsp Somit ergibt sich fur die Differenz zweier Zufallsvariablen die Formel Var X Y Var X Y Var X Var Y 2 Cov X Y displaystyle operatorname Var X Y operatorname Var X Y operatorname Var X operatorname Var Y 2 operatorname Cov X Y nbsp Linearitat Symmetrie und Definitheit Bearbeiten Satz Die Kovarianz ist eine positiv semidefinite symmetrische Bilinearform auf dem Vektorraum der quadratisch integrierbaren Zufallsvariablen Es gelten also die folgenden drei Satze Satz Bilinearitat Fur a b c d e f g h R displaystyle a b c d e f g h in mathbb R nbsp gilt Cov a X b c Y d a c Cov X Y u n d displaystyle operatorname Cov aX b cY d ac operatorname Cov X Y qquad und nbsp Cov X e Y f g Z h e Cov X Y g Cov X Z displaystyle operatorname Cov X eY f gZ h e operatorname Cov X Y g operatorname Cov X Z nbsp Beweis Cov a X b c Y d E a X b E a X b c Y d E c Y d E a X a E X c Y c E Y a c E X E X Y E Y a c Cov X Y displaystyle begin aligned operatorname Cov aX b cY d amp operatorname E bigl aX b operatorname E aX b cdot cY d operatorname E cY d bigr amp operatorname E bigl aX a operatorname E X cdot cY c operatorname E Y bigr amp ac operatorname E bigl X operatorname E X cdot Y operatorname E Y bigr amp ac operatorname Cov X Y end aligned nbsp Cov X e Y f g Z h E X E X e Y f g Z h E e Y f g Z h E X E X e Y e E Y g Z g E Z E X E X e Y E Y X E X g Z E Z e E X E X Y E Y g E X E X Z E Z e Cov X Y g Cov X Z displaystyle begin aligned operatorname Cov X eY f gZ h amp operatorname E bigl X operatorname E X cdot eY f gZ h operatorname E eY f gZ h bigr amp operatorname E bigl X operatorname E X cdot eY e operatorname E Y gZ g operatorname E Z bigr amp operatorname E bigl X operatorname E X cdot e Y operatorname E Y X operatorname E X cdot g Z operatorname E Z bigr amp e operatorname E bigl X operatorname E X cdot Y operatorname E Y bigr g operatorname E bigl X operatorname E X cdot Z operatorname E Z bigr amp e operatorname Cov X Y g operatorname Cov X Z qquad Box end aligned nbsp Die Kovarianz ist offensichtlich invariant unter der Addition von Konstanten zu den Zufallsvariablen In der zweiten Gleichung ist die Kovarianz wegen der Symmetrie auch im ersten Argument linear Satz Symmetrie Cov X Y Cov Y X displaystyle operatorname Cov X Y operatorname Cov Y X nbsp Beweis Cov X Y E Y E Y X E X Cov Y X displaystyle begin aligned operatorname Cov X Y amp operatorname E bigl Y operatorname E Y cdot X operatorname E X bigr amp operatorname Cov Y X qquad Box end aligned nbsp Satz Positive Semidefinitheit Cov X X 0 displaystyle operatorname Cov X X geq 0 nbsp Beweis Cov X X Var X 0 displaystyle operatorname Cov X X operatorname Var X geq 0 qquad Box nbsp Insgesamt folgt wie fur jede positiv semidefinite symmetrische Bilinearform die Cauchy Schwarzsche Ungleichung Cov X Y Var X Var Y displaystyle operatorname Cov X Y leq sqrt operatorname Var X cdot sqrt operatorname Var Y nbsp Die Linearitat der Kovarianz hat zur Folge dass die Kovarianz vom Massstab der Zufallsvariablen abhangt So erhalt man beispielsweise die zehnfache Kovarianz wenn man anstatt X displaystyle X nbsp die Zufallsvariable 10 X displaystyle 10X nbsp betrachtet Insbesondere hangt der Wert der Kovarianz von den verwendeten Masseinheiten der Zufallsvariablen ab Da diese Eigenschaft die absoluten Werte der Kovarianz schwer interpretierbar macht betrachtet man bei der Untersuchung auf einen linearen Zusammenhang zwischen X displaystyle X nbsp und Y displaystyle Y nbsp haufig stattdessen den massstabsunabhangigen Korrelationskoeffizienten Der massstabsunabhangige Korrelationskoeffizient zweier Zufallsvariablen X displaystyle X nbsp und Y displaystyle Y nbsp ist die Kovarianz der standardisierten auf die Standardabweichung bezogenen Zufallsvariablen X X s X displaystyle tilde X X sigma X nbsp und Y Y s Y displaystyle tilde Y Y sigma Y nbsp 3 Cov X Y Cov X s X Y s Y 1 s X s Y Cov X Y r X Y displaystyle operatorname Cov tilde X tilde Y operatorname Cov X sigma X Y sigma Y frac 1 sigma X sigma Y operatorname Cov X Y rho X Y nbsp Unkorreliertheit und Unabhangigkeit Bearbeiten Definition Unkorreliertheit Zwei Zufallsvariablen X displaystyle X nbsp und Y displaystyle Y nbsp heissen unkorreliert wenn Cov X Y 0 displaystyle operatorname Cov X Y 0 nbsp Satz Zwei stochastisch unabhangige Zufallsvariablen sind unkorreliert Beweis Fur stochastisch unabhangige Zufallsvariablen X displaystyle X nbsp und Y displaystyle Y nbsp gilt E X Y E X E Y displaystyle operatorname E XY operatorname E X operatorname E Y nbsp d h E X Y E X E Y 0 Cov X Y 0 displaystyle begin aligned operatorname E XY operatorname E X operatorname E Y amp 0 Leftrightarrow qquad qquad qquad operatorname Cov X Y amp 0 qquad end aligned nbsp Der Umkehrschluss gilt im Allgemeinen nicht Ein Gegenbeispiel ist gegeben durch eine im Intervall 1 1 displaystyle 1 1 nbsp gleichverteilte Zufallsvariable X displaystyle X nbsp und Y X 2 displaystyle Y X 2 nbsp Offenkundig sind X displaystyle X nbsp und Y displaystyle Y nbsp voneinander abhangig Es gilt aber Cov X Y Cov X X 2 E X 3 E X E X 2 0 0 E X 2 0 displaystyle operatorname Cov X Y operatorname Cov X X 2 operatorname E X 3 operatorname E X operatorname E X 2 0 0 cdot operatorname E X 2 0 nbsp Stochastisch unabhangige Zufallsvariablen deren Kovarianz existiert sind also auch unkorreliert Umgekehrt bedeutet Unkorreliertheit aber nicht zwingend dass die Zufallsvariablen stochastisch unabhangig sind denn es kann eine nichtmonotone Abhangigkeit bestehen die die Kovarianz nicht erfasst Weitere Beispiele fur unkorrelierte aber stochastisch abhangige Zufallsvariablen Seien X displaystyle X nbsp und Y displaystyle Y nbsp Zufallsvariablen mit P X 0 Y 1 1 2 displaystyle P X 0 Y 1 tfrac 1 2 nbsp und P X 2 Y 0 P X 2 Y 2 1 4 displaystyle P X 2 Y 0 P X 2 Y 2 tfrac 1 4 nbsp Dann gilt P X 0 P X 2 1 2 displaystyle P X 0 P X 2 tfrac 1 2 nbsp und P Y 0 P Y 2 1 4 displaystyle P Y 0 P Y 2 tfrac 1 4 nbsp P Y 1 1 2 displaystyle P Y 1 tfrac 1 2 nbsp Es folgt E X E Y 1 displaystyle operatorname E X operatorname E Y 1 nbsp und ebenfalls E X Y 1 displaystyle operatorname E XY 1 nbsp also Cov X Y 0 displaystyle operatorname Cov X Y 0 nbsp Andererseits sind X displaystyle X nbsp und Y displaystyle Y nbsp wegen P X 0 Y 1 1 2 1 2 1 2 P X 0 P Y 1 displaystyle P X 0 Y 1 tfrac 1 2 neq tfrac 1 2 cdot tfrac 1 2 P X 0 P Y 1 nbsp nicht stochastisch unabhangig Seien die Zufallsvariablen X displaystyle X nbsp und Y displaystyle Y nbsp bernoulliverteilt mit Parameter p displaystyle p nbsp und unabhangig dann sind X Y displaystyle X Y nbsp und X Y displaystyle X Y nbsp unkorreliert aber nicht unabhangig Die Unkorreliertheit ist klar denn Cov X Y X Y Cov X X Cov X Y Cov Y X Cov Y Y 0 displaystyle operatorname Cov X Y X Y operatorname Cov X X operatorname Cov X Y operatorname Cov Y X operatorname Cov Y Y 0 nbsp Aber X Y displaystyle X Y nbsp und X Y displaystyle X Y nbsp sind nicht unabhangig denn es ist P X Y 0 X Y 1 0 p 1 p 3 P X Y 0 P X Y 1 displaystyle P X Y 0 X Y 1 0 neq p 1 p 3 P X Y 0 P X Y 1 nbsp Verallgemeinerungen BearbeitenDer Kovarianzoperator verallgemeinert die Kovarianz auf unendlich dimensionale Raume Er spielt eine wichtige Rolle in der stochastischen Analysis auf solchen Raumen und der Theorie der stochastischen partiellen Differentialgleichungen Kovarianz im Mehrdimensionalen Bearbeiten Hauptartikel KovarianzmatrixLiteratur BearbeitenNorbert Henze Stochastik fur Einsteiger Eine Einfuhrung in die faszinierende Welt des Zufalls 10 Auflage Verlag Springer Spektrum Wiesbaden 2013 ISBN 978 3 658 03076 6 Kapitel 21 doi 10 1007 978 3 658 03077 3 21 Karl Bosch Elementare Einfuhrung in die Angewandte Statistik Mit Aufgaben und Losungen 9 erw Auflage Vieweg Teubner Verlag 2010 ISBN 978 3 8348 1229 2 doi 10 1007 978 3 8348 9705 3 Einzelnachweise Bearbeiten Hansjochem Autrum Erwin Bunning et al Ergebnisse Der Biologie S 88 Rainer Diaz Bone Statistik fur Soziologen 5 Auflage UVK Verlag ISBN 978 3 8252 5210 6 4 3 2 S87 Ludwig Fahrmeir Rita Kunstler Iris Pigeot und Gerhard Tutz Statistik Der Weg zur Datenanalyse 8 uberarb und erg Auflage Springer Spektrum Berlin Heidelberg 2016 ISBN 978 3 662 50371 3 S 326 Abgerufen von https de wikipedia org w index php title Kovarianz Stochastik amp oldid 237403168