www.wikidata.de-de.nina.az
Dieser Artikel behandelt die Varianz als Kenngrosse der Verteilung einer reellen Zufallsvariablen Fur die Varianz einer Stichprobe siehe Stichprobenvarianz weitere Bedeutungen finden sich unter Varianz Die Varianz lateinisch variantia Verschiedenheit bzw variare ver andern verschieden sein ist ein Mass fur die Streuung einer Wahrscheinlichkeitsdichte um ihren Schwerpunkt Mathematisch wird sie definiert als die mittlere quadratische Abweichung einer reellen Zufallsvariablen von ihrem Erwartungswert Sie ist das zentrale Moment zweiter Ordnung einer Zufallsvariablen Dichtefunktionen zweier normalverteilter Zufallsvariablen X displaystyle X rot und Y displaystyle Y grun mit gleichem Erwartungswert m X m Y 0 displaystyle mu X mu Y 0 aber unterschiedlichen Varianzen Die waagerechte Achse zeigt den Wert die senkrechte die zugehorige Dichte Da die rote Dichtefunktion schmaler um den Erwartungswert verlauft als die grune Dichtefunktion hat X displaystyle X eine kleinere Varianz als Y displaystyle Y s X 2 lt s Y 2 displaystyle sigma X 2 lt sigma Y 2 Die Quadratwurzel der Varianz die Standardabweichung kann bei der Normalverteilung an den Wendepunkten der Dichtefunktion abgelesen werden da diese fur eine Normalverteilung mit den Parametern m displaystyle mu und s 2 displaystyle sigma 2 an den Stellen m s displaystyle mu sigma und m s displaystyle mu sigma liegen Die Varianz kann mit einem Varianzschatzer z B der Stichprobenvarianz bestimmt werden Die Quadratwurzel der Varianz ist das als Standardabweichung bezeichnete wichtigste Streuungsmass in der Stochastik Die Bezeichnung Varianz wurde vor allem von dem britischen Statistiker Ronald Fisher 1890 1962 gepragt Weitere Worter fur die Varianz sind das veraltete Dispersion lateinisch dispersio Zerstreuung bzw dispergere verteilen ausbreiten zerstreuen das Streuungsquadrat oder die Streuung Zu den Eigenschaften der Varianz gehort dass sie niemals negativ ist und sich bei Verschiebung der Verteilung nicht andert Die Varianz einer Summe unkorrelierter Zufallsvariablen ist gleich der Summe ihrer Varianzen Ein Nachteil der Varianz fur praktische Anwendungen ist dass sie im Unterschied zur Standardabweichung eine andere Einheit als die Zufallsvariable besitzt Da sie uber ein Integral definiert wird existiert sie nicht fur alle Verteilungen d h sie kann auch unendlich sein Eine Verallgemeinerung der Varianz ist die Kovarianz Im Unterschied zur Varianz die die Variabilitat der betrachteten Zufallsvariablen misst ist die Kovarianz ein Mass fur die gemeinsame Variabilitat von zwei Zufallsvariablen Aus dieser Definition der Kovarianz folgt dass die Kovarianz einer Zufallsvariablen mit sich selbst gleich der Varianz dieser Zufallsvariablen ist Im Falle eines reellen Zufallsvektors kann die Varianz zur Varianz Kovarianzmatrix verallgemeinert werden Inhaltsverzeichnis 1 Definition 1 1 Mathematische Definition 1 2 Erklarung der Definition 1 3 Eigenschaften 1 4 Interpretation als Funktional 1 5 Notation 2 Einfuhrung in die Problemstellung 3 Berechnung der Varianz 3 1 Varianz bei diskreten Zufallsvariablen 3 2 Varianz bei stetigen Zufallsvariablen 4 Geschichte 5 Kenngrosse einer Wahrscheinlichkeitsverteilung 6 Satze uber die Varianz 6 1 Tschebyscheffsche Ungleichung 6 2 Popovicius Ungleichung fur Varianzen 6 3 Gesetz der totalen Varianz 7 Interpretation 7 1 Physikalische Interpretation 7 2 Interpretation als Abstand 7 3 Interpretation als Mass fur Determinismus 8 Rechenregeln und Eigenschaften 8 1 Verschiebungssatz 8 2 Lineare Transformation 8 3 Beziehung zur Standardabweichung 8 4 Beziehung zur Kovarianz 8 5 Summen und Produkte 8 6 Zusammengesetzte Zufallsvariable 8 7 Momenterzeugende und kumulantenerzeugende Funktion 8 8 Charakteristische und wahrscheinlichkeitserzeugende Funktion 8 9 Varianz als mittlere quadratische Abweichung vom Mittelwert 9 Varianzen spezieller Verteilungen 10 Beispiele 10 1 Berechnung bei diskreten Zufallsvariablen 10 1 1 Munzwurf 10 1 2 Community Cards bei Texas Hold em 10 2 Berechnung bei stetigen Zufallsvariablen 11 Stichprobenvarianz als Schatzer fur die Varianz 12 Bedingte Varianz 13 Verallgemeinerungen 13 1 Varianz Kovarianzmatrix 13 2 Matrixnotation fur die Varianz einer Linearkombination 14 Verwandte Masszahlen 15 Weblinks 16 Literatur 17 Anmerkungen 18 EinzelnachweiseDefinition BearbeitenDie Varianz wird zuerst mathematisch definiert eine Erklarung der Definition folgt danach Mathematische Definition Bearbeiten Sei W S P displaystyle Omega Sigma P nbsp ein Wahrscheinlichkeitsraum und X displaystyle X nbsp eine Zufallsvariable auf diesem Raum Die Varianz ist definiert als die zu erwartende quadratische Abweichung dieser Zufallsvariablen von ihrem Erwartungswert E X m displaystyle mathbb E X mu nbsp sofern dieser existiert 1 Var X E X m 2 W X m 2 d P displaystyle operatorname Var X mathbb E left X mu 2 right int Omega X mu 2 mathrm d P nbsp Erklarung der Definition Bearbeiten Die Definition sagt Folgendes Gegeben ist eine Zufallsvariable X displaystyle X nbsp mit Erwartungswert m displaystyle mu nbsp Die erste GleichungVar X E X m 2 displaystyle operatorname Var X mathbb E left X mu 2 right nbsp dd sagt dass die Varianz von X displaystyle X nbsp dasselbe wie der Erwartungswert der Zufallsvariable X m 2 displaystyle X mu 2 nbsp ist Diese neue Zufallsvariable ist die quadratische Abweichung von X displaystyle X nbsp zu m displaystyle mu nbsp und man spricht von der mittleren quadratischen Abweichung weil man den Erwartungswert der quadratischen Abweichung nimmt Nach den Rechenregeln des Erwartungswertes gilt weiterE X m 2 E X 2 2 m E X m 2 displaystyle mathbb E left X mu 2 right mathbb E X 2 2 mu mathbb E X mu 2 nbsp dd Die zweite GleichungE X m 2 W X w m 2 d P w displaystyle mathbb E left X mu 2 right int Omega X omega mu 2 mathrm d P omega nbsp dd sagt dass sich der Erwartungswert von X m 2 displaystyle X mu 2 nbsp direkt als Integral berechnen lasst Dieses Integral ist hier in der allgemeinen Form wo man uber den Ergebnisraum W displaystyle Omega nbsp integriert um alle Falle miteinzuschliessen Hat man jedoch eine Zufallsvariable mit einer Dichte f x displaystyle f x nbsp von einer Menge S displaystyle S nbsp respektive einer Wahrscheinlichkeitsfunktion p x displaystyle p x nbsp von einer Menge N displaystyle N nbsp so ist dieses Integral gleichwertig mit dem IntegralE X m 2 S x m 2 f x d x displaystyle mathbb E left X mu 2 right int S x mu 2 f x mathrm d x nbsp dd respektive im diskreten Fall mit der SummeE X m 2 k N k m 2 p k displaystyle mathbb E left X mu 2 right sum limits k in N k mu 2 p k nbsp dd Eigenschaften Bearbeiten Sofern die Varianz existiert gilt Var X 0 displaystyle operatorname Var X geq 0 nbsp Die Varianz kann aber auch den Wert Var X displaystyle operatorname Var X infty nbsp annehmen wie es bei der Levy Verteilung der Fall ist Eine Verteilung die keine Varianz hat ist die Cauchy Verteilung da fur diese schon der Erwartungswert nicht existiert Falls man die zentrierte Zufallsvariable Z X m X displaystyle Z X mu X nbsp betrachtet so ist die Varianz deren zweites Moment E Z 2 displaystyle mathbb E Z 2 nbsp Falls eine Zufallsvariable quadratisch integrierbar ist das heisst E X 2 lt displaystyle mathbb E X 2 lt infty nbsp so sind wegen des Verschiebungssatzes ihre Varianz und ihr Erwartungswert endliche Grossen 0 X 1 2 X X X 2 2 X 1 2 X X X 2 1 E X E X 2 1 lt displaystyle 0 leq X 1 2 X implies X leq X 2 2X 1 2 X implies X leq X 2 1 implies mathbb E X leq mathbb E X 2 1 lt infty nbsp Interpretation als Funktional Bearbeiten Die Varianz ist ein Funktional auf dem Raum der Zufallsvariablen mit endlichem Erwartungswert Sie kann aber auch als nichtlineares Funktional auf dem Raum aller Wahrscheinlichkeitsverteilungen x 1 displaystyle chi 1 nbsp die einen endlichen Erwartungswert besitzen verstanden werden Var x 1 R Var F x m F 2 d F x displaystyle begin aligned operatorname Var cdot amp colon chi 1 to mathbb R cup infty operatorname Var F amp int x mu F 2 mathrm d F x end aligned nbsp Dabei werden die Wahrscheinlichkeitsverteilungen mit ihren Verteilungsfunktionen identifiziert Fur Wahrscheinlichkeitsverteilungen deren Erwartungswert m F displaystyle mu F nbsp nicht endlich ist ist die Varianz nicht definiert Notation Bearbeiten Da die Varianz ein Funktional ist wird sie wie der Erwartungswert besonders in anglophoner Literatur oft auch mit eckigen Klammern Var X displaystyle operatorname Var left X right nbsp geschrieben Sie wird mitunter als V X displaystyle operatorname V X nbsp A 1 oder s X 2 displaystyle sigma X 2 nbsp notiert Besteht keine Verwechslungsgefahr wird sie einfach als s 2 displaystyle sigma 2 nbsp lies Sigma Quadrat notiert Da die Varianz vor allem in alterer Literatur auch als Dispersion beziehungsweise Streuung bezeichnet wurde 2 3 begegnet man haufig der Notation D 2 X displaystyle D 2 X nbsp 4 Die Notation mit dem Quadrat des griechischen Buchstabens Sigma s displaystyle sigma nbsp ruhrt daher dass die Berechnung der Varianz der Dichtefunktion einer Normalverteilung genau dem Parameter s 2 displaystyle sigma 2 nbsp der Normalverteilung entspricht Da die Normalverteilung in der Stochastik eine sehr wichtige Rolle spielt wird die Varianz im Allgemeinen mit s 2 displaystyle sigma 2 nbsp notiert siehe auch Abschnitt Varianzen spezieller Verteilungen Des Weiteren wird in der Statistik und insbesondere in der Regressionsanalyse das Symbol s 2 displaystyle sigma 2 nbsp verwendet um die wahre unbekannte Varianz der Storgrossen zu kennzeichnen Einfuhrung in die Problemstellung BearbeitenAls Ausgangspunkt fur die Konstruktion der Varianz betrachtet man eine beliebige Grosse die vom Zufall abhangig ist und somit unterschiedliche Werte annehmen kann Diese Grosse die im Folgenden mit X displaystyle X nbsp bezeichnet wird folgt einer bestimmten Verteilung Der Erwartungswert dieser Grosse wird mit m E X displaystyle mu mathbb E X nbsp abgekurzt A 2 und gibt an welchen Wert die Zufallsvariable X displaystyle X nbsp im Mittel annimmt Er kann als Schwerpunkt der Verteilung interpretiert werden siehe auch Abschnitt Interpretation und gibt ihre Lage wieder Zur hinreichenden Charakterisierung einer Verteilung bedarf es jedoch noch einer Grosse die als Kennzahl Auskunft uber die Starke der Streuung einer Verteilung um ihren Schwerpunkt gibt 5 Diese Grosse sollte stets grosser oder gleich Null sein da sich negative Streuung nicht sinnvoll interpretieren lasst Ein erster naheliegender Ansatz ware die mittlere absolute Abweichung der Zufallsvariablen von ihrem Erwartungswert heranzuziehen 6 E X m displaystyle mathbb E left X mu right nbsp Da die in der Definition der mittleren absoluten Abweichung verwendete Betragsfunktion nicht uberall differenzierbar ist und ansonsten in der Statistik fur gewohnlich Quadratsummen benutzt werden 7 8 ist es sinnvoll statt mit der mittleren absoluten Abweichung mit der mittleren quadratischen Abweichung also der Varianz zu operieren A 3 Berechnung der Varianz BearbeitenVarianz bei diskreten Zufallsvariablen Bearbeiten Eine Zufallsvariable X displaystyle X nbsp mit einem endlichen oder abzahlbar unendlichen Wertebereich T x 1 x 2 x k displaystyle mathcal T x 1 x 2 dotsc x k dotsc nbsp A 4 wird diskret genannt Ihre Varianz berechnet sich dann als gewichtete Summe der Abweichungsquadrate vom Erwartungswert 9 s 2 x 1 m 2 p 1 x 2 m 2 p 2 x k m 2 p k i 1 x i m 2 p i displaystyle sigma 2 x 1 mu 2 p 1 x 2 mu 2 p 2 ldots x k mu 2 p k ldots sum i geq 1 x i mu 2 p i nbsp Hierbei ist p i P X x i displaystyle p i P X x i nbsp die Wahrscheinlichkeit dass X displaystyle X nbsp den Wert x i displaystyle x i nbsp annimmt Es wird in obiger Summe also jede mogliche Auspragung x i m 2 displaystyle x i mu 2 nbsp mit der Wahrscheinlichkeit ihres Auftretens p i displaystyle p i nbsp gewichtet 10 Die Varianz ist bei diskreten Zufallsvariablen also eine gewichtete Summe mit den Gewichten p i i 1 n displaystyle p i i 1 ldots n nbsp Der Erwartungswert einer diskreten Zufallsvariablen X displaystyle X nbsp stellt ebenfalls eine gewichtete Summe dar die durch m x 1 p 1 x 2 p 2 x k p k i 1 x i p i displaystyle mu x 1 p 1 x 2 p 2 ldots x k p k ldots sum i geq 1 x i p i nbsp gegeben ist Die Summen erstrecken sich jeweils uber alle Werte die diese Zufallsvariable annehmen kann Im Falle eines abzahlbar unendlichen Wertebereichs ergibt sich eine unendliche Summe In Worten berechnet sich die Varianz im diskreten Fall als Summe der Produkte der Wahrscheinlichkeiten der Realisierungen der Zufallsvariablen X displaystyle X nbsp mit der jeweiligen quadrierten Abweichung Varianz bei stetigen Zufallsvariablen Bearbeiten Eine Zufallsvariable X displaystyle X nbsp wird als stetig bezeichnet wenn ihr Wertebereich eine uberabzahlbare Menge ist Falls die Zufallsvariable absolut stetig ist dann existiert als Konsequenz des Satzes von Radon Nikodym eine Wahrscheinlichkeitsdichtefunktion kurz Dichte f X x displaystyle f X x nbsp Im Fall einer reellwertigen Zufallsvariablen lasst sich die Verteilungsfunktion F t P X t displaystyle F t P X leq t nbsp t R displaystyle t in mathbb R nbsp wie folgt als Integral darstellen F t t f x d x displaystyle F t int infty t f x mathrm d x nbsp Fur die Varianz einer reellwertigen Zufallsvariablen X displaystyle X nbsp mit Dichte f x displaystyle f x nbsp gilt nun Var X x E X 2 f x d x displaystyle operatorname Var X int infty infty x mathbb E X 2 f x mathrm d x quad nbsp wobei ihr Erwartungswert gegeben ist durch E X x f x d x displaystyle mathbb E X int infty infty xf x mathrm d x nbsp 11 Die Varianz berechnet sich bei Existenz einer Dichte als das Integral uber das Produkt der quadrierten Abweichung und der Dichtefunktion der Verteilung Es wird also uber den Raum aller moglichen Auspragungen moglicher Wert eines statistischen Merkmals integriert Geschichte Bearbeiten nbsp Karl Pearson nbsp Ronald Fisher 1913 Das Konzept der Varianz geht auf Carl Friedrich Gauss zuruck Gauss fuhrte den mittleren quadratischen Fehler ein um zu zeigen wie sehr ein Punktschatzer um den zu schatzenden Wert streut Diese Idee wurde von Karl Pearson dem Begrunder der Biometrie ubernommen Er ersetzte fur dieselbe Idee den von Gauss gepragten Begriff mittlerer Fehler durch seinen Begriff Standardabweichung Diesen verwendet er im Anschluss in seinen Vorlesungen Der Gebrauch des griechischen Buchstabens Sigma fur die Standardabweichung wurde von Pearson erstmals 1894 in seiner Serie von achtzehn Arbeiten mit dem Titel Mathematische Beitrage zur Evolutionstheorie Originaltitel Contributions to the Mathematical Theory of Evolution eingefuhrt Er schrieb dort dann wird s displaystyle sigma nbsp seine Standardabweichung Fehler des mittleren Quadrats Im Jahre 1901 grundete Pearson dann die Zeitschrift Biometrika die eine wichtige Grundlage der angelsachsischen Schule der Statistik wurde Die Bezeichnung Varianz wurde vom Statistiker Ronald Fisher in seinem 1918 veroffentlichtem Aufsatz mit dem Titel Die Korrelation zwischen Verwandten in der Annahme der Mendelschen Vererbung Originaltitel The Correlation between Relatives on the Supposition of Mendelian Inheritance eingefuhrt Ronald Fisher schreibt Der grosse Korper der verfugbaren Statistiken zeigt uns dass die Abweichungen einer menschlichen Messung von ihrem Mittel sehr genau dem Gesetz der Normalverteilung der Storgrossen folgen und folglich dass die Variabilitat gleichmassig durch die Standardabweichung gemessen werden kann die der Quadratwurzel des mittleren quadratischen Fehlers entspricht Wenn es zwei unabhangige Ursachen der Variabilitat gibt die in der Lage sind in einer ansonsten gleichmassigen Populationsverteilung die Standardabweichungen s 1 displaystyle sigma 1 nbsp and s 2 displaystyle sigma 2 nbsp zu produzieren wird festgestellt dass die Verteilung wenn beide Ursachen zusammen interagieren eine Standardabweichung von s 1 2 s 2 2 displaystyle sqrt sigma 1 2 sigma 2 2 nbsp aufweist Es ist daher wunschenswert die Ursachen der Variabilitat zu analysieren um mit dem Quadrat der Standardabweichung als einem Mass fur die Variabilitat umzugehen Wir sollten diese Grosse die Varianz taufen Die Korrelation zwischen Verwandten in der Annahme der Mendelschen Vererbung 12 Fisher fuhrte kein neues Symbol ein sondern benutzte lediglich s 2 displaystyle sigma 2 nbsp zur Notation der Varianz In den folgenden Jahren entwickelte er ein genetisches Modell das zeigt dass eine kontinuierliche Variation zwischen phanotypischen Merkmalen die von Biostatistikern gemessen wurde durch die kombinierte Wirkung vieler diskreter Gene erzeugt werden kann und somit das Ergebnis einer mendelschen Vererbung ist Auf diesen Resultaten aufbauend formulierte Fisher dann sein fundamentales Theorem der naturlichen Selektion das die Gesetzmassigkeiten der Populationsgenetik fur die Zunahme der Fitness von Organismen beschreibt Zusammen mit Pearson entwickelte er u a die Grundlagen der Versuchsplanung 1935 erschien The Design of Experiments und der Varianzanalyse Des Weiteren lasst sich die Mehrzahl der biometrischen Methoden auf Pearson und Fisher zuruckfuhren auf deren Grundlage Jerzy Neyman und Egon Pearson in den 1930er Jahren die allgemeine Testtheorie entwickelten 13 Kenngrosse einer Wahrscheinlichkeitsverteilung Bearbeiten Hauptartikel Wahrscheinlichkeitsverteilung Jede Wahrscheinlichkeitsverteilung oder Zufallsvariable kann durch sogenannte Kenngrossen auch Parameter genannt beschrieben werden die diese Verteilung charakterisieren Die Varianz und der Erwartungswert sind die wichtigsten Kenngrossen einer Wahrscheinlichkeitsverteilung Sie werden bei einer Zufallsvariablen als Zusatzinformationen wie folgt angegeben X m s 2 displaystyle X sim mu sigma 2 nbsp In Worten Die Zufallsvariable X displaystyle X nbsp folgt einer hier nicht naher spezifizierten Verteilung mit Erwartungswert m displaystyle mu nbsp und Varianz s 2 displaystyle sigma 2 nbsp Fur den Fall dass die Zufallsvariable einer speziellen Verteilung folgt zum Beispiel einer Standardnormalverteilung wird dies wie folgt notiert X N 0 1 displaystyle X sim mathcal N 0 1 nbsp Der Erwartungswert von X displaystyle X nbsp ist also Null und die Varianz Eins Weitere wichtige Kenngrossen einer Wahrscheinlichkeitsverteilung stellen neben den Momenten beispielsweise der Median der Modus oder Quantile dar 14 Die Kenngrossen einer Wahrscheinlichkeitsverteilung entsprechen in der deskriptiven Statistik den Kenngrossen einer Haufigkeitsverteilung Satze uber die Varianz BearbeitenTschebyscheffsche Ungleichung Bearbeiten Hauptartikel Tschebyscheffsche Ungleichung Mithilfe der Tschebyscheffschen Ungleichung lasst sich unter Verwendung der existierenden ersten beiden Momente die Wahrscheinlichkeit dafur abschatzen dass die Zufallsvariable X displaystyle X nbsp Werte in bestimmten Intervallen der reellen Zahlengeraden annimmt ohne jedoch die Verteilung von X displaystyle X nbsp zu kennen Sie lautet fur eine Zufallsvariable X displaystyle X nbsp mit Erwartungswert m displaystyle mu nbsp und Varianz s 2 displaystyle sigma 2 nbsp 15 P X m k s 2 k 2 k gt 0 displaystyle P left left X mu right geq k right leq frac sigma 2 k 2 quad k gt 0 nbsp Die Tschebyscheffsche Ungleichung gilt sowohl fur symmetrische als auch fur schiefe Verteilungen sie setzt also keine besondere Verteilungsform voraus Ein Nachteil der Tschebyscheffschen Ungleichung ist dass sie nur eine grobe Abschatzung liefert Popovicius Ungleichung fur Varianzen Bearbeiten Mit Hilfe der Ungleichung von Popoviciu kann man die Varianz nach oben beschranken Sei X displaystyle X nbsp eine Zufallsvariable mit Varianz s 2 displaystyle sigma 2 nbsp und m inf X displaystyle m operatorname inf X nbsp M sup X displaystyle M operatorname sup X nbsp dann gilt s 2 1 4 M m 2 displaystyle sigma 2 leq frac 1 4 M m 2 nbsp Gesetz der totalen Varianz Bearbeiten Das Gesetz der totalen Varianz auch Gesetz der iterierten Varianz oder Eves Gesetz sagt Falls X Y displaystyle X Y nbsp zwei Zufallsvariablen auf dem gleichen Wahrscheinlichkeitsraum sind und die Varianz von Y displaystyle Y nbsp endlich ist dann gilt Var Y E Var Y X Var E Y X displaystyle operatorname Var Y mathbb E left operatorname Var Y mid X right operatorname Var left mathbb E Y mid X right nbsp Interpretation BearbeitenPhysikalische Interpretation Bearbeiten Die Varianz ist neben dem Erwartungswert die zweite wichtige Kenngrosse der Verteilung einer reellen Zufallsvariablen Das r displaystyle r nbsp te zentrale Moment von X displaystyle X nbsp ist m r E X m r displaystyle mu r mathbb E left X mu r right nbsp Fur r 2 displaystyle r 2 nbsp wird das zentrale Moment zweiter Ordnung m 2 E X m 2 displaystyle mu 2 mathbb E left X mu 2 right nbsp Varianz der Verteilung von X displaystyle X nbsp genannt 16 Der Begriff Moment stammt originar aus der Physik Wenn man die moglichen Werte als Massepunkte mit den Massen auf der als gewichtslos angenommenen reellen Zahlengeraden interpretiert dann erhalt man eine physikalische Interpretation des Erwartungswertes Das erste Moment der Erwartungswert stellt dann den physikalischen Schwerpunkt beziehungsweise Massenmittelpunkt des so entstehenden Korpers dar 17 Die Varianz kann dann als Tragheitsmoment des Massesystems bezuglich der Rotationsachse um den Schwerpunkt interpretiert werden 18 Im Gegensatz zum Erwartungswert der also die Wahrscheinlichkeitsmasse balanciert ist die Varianz ein Mass fur die Streuung der Wahrscheinlichkeitsmasse um ihren Erwartungswert Interpretation als Abstand Bearbeiten Die Interpretation der Varianz einer Zufallsvariablen als mittlerer quadrierter Abstand lasst sich wie folgt erklaren Der Abstand zwischen zwei Punkten x 1 displaystyle x 1 nbsp und x 2 displaystyle x 2 nbsp auf der reellen Zahlengeraden ist gegeben durch d x 1 x 2 2 displaystyle d sqrt x 1 x 2 2 nbsp Wenn man jetzt definiert dass ein Punkt die Zufallsvariable X displaystyle X nbsp ist und der andere m E X displaystyle mu mathbb E X nbsp dann gilt d X m 2 displaystyle d sqrt X mu 2 nbsp und der quadrierte Abstand lautet X m 2 displaystyle X mu 2 nbsp Folglich wird E X m 2 displaystyle mathbb E X mu 2 nbsp als der mittlere quadrierte Abstand zwischen der Realisierung der Zufallsvariablen X displaystyle X nbsp und dem Erwartungswert E X displaystyle mathbb E X nbsp interpretiert wenn das Zufallsexperiment unendlich oft wiederholt wird 19 Interpretation als Mass fur Determinismus Bearbeiten nbsp Dichtefunktionen normalverteilter Zufallsvariablen mit unterschiedlichen Erwartungswerten und Varianzen Zu sehen ist dass der Erwartungswert die Lage und die Varianz die Breite der Dichtefunktion wiedergeben Die rote Kurve zeigt die Standardnormalverteilung N 0 1 displaystyle mathcal N 0 1 nbsp mit Erwartungswert Null und Varianz Eins Die Varianz beschreibt ausserdem die Breite einer Wahrscheinlichkeitsfunktion 20 und daher wie stochastisch oder wie deterministisch ein betrachtetes Phanomen ist Bei einer grossen Varianz liegt eher eine stochastische Situation vor und bei einer kleinen Varianz eher eine deterministische 21 Im Spezialfall einer Varianz von Null liegt eine vollstandig deterministische Situation vor Die Varianz ist genau dann Null wenn die Zufallsvariable X displaystyle X nbsp mit hundertprozentiger Wahrscheinlichkeit nur einen bestimmen Wert namlich den Erwartungswert annimmt wenn also P X m 1 displaystyle P X mu 1 nbsp gilt So eine Zufallsvariable ist mit Wahrscheinlichkeit Eins konstant und kann in diesem Sinn als deterministisch bezeichnet werden 22 Da fur eine Zufallsvariable mit dieser Eigenschaft P X x 0 displaystyle P X x 0 nbsp fur alle x m displaystyle x neq mu nbsp gilt wird deren Verteilung manchmal auch als entartet bezeichnet 22 Eine Wahrscheinlichkeitsverteilung mit P X m 1 displaystyle P X mu 1 nbsp fur eine reelle Zahl m displaystyle mu nbsp heisst degenerierte Wahrscheinlichkeitsverteilung oder Dirac Verteilung Der Unterschied zwischen einer Konstanten m R displaystyle mu in mathbb R nbsp die einer reellen Zufallsvariablen X m W R displaystyle X mu colon Omega to mathbb R nbsp mit der Eigenschaft X m w 1 displaystyle X mu omega 1 nbsp fur alle w W displaystyle omega in Omega nbsp entspricht und einer Zufallsvariablen X displaystyle X nbsp mit der Eigenschaft P X m 1 displaystyle P X mu 1 nbsp ist dass im zweiten Fall realisierte Werte der Zufallsvariablen moglich sind die von m displaystyle mu nbsp verschieden sind die aber insgesamt die Wahrscheinlichkeit Null haben es gilt also P X m 1 displaystyle P X neq mu 1 nbsp In beiden Fallen hat die Varianz den Wert Null Im Gegensatz zu diskreten Zufallsvariablen gilt fur stetige Zufallsvariablen stets P X x 0 displaystyle P X x 0 nbsp fur jedes x R displaystyle x in mathbb R nbsp 23 Im stetigen Fall beschreibt die Varianz die Breite einer Dichtefunktion Die Breite wiederum ist ein Mass fur die Unsicherheit die mit einer Zufallsvariable verbunden ist Je schmaler die Dichtefunktion ist desto genauer kann der Wert von X displaystyle X nbsp vorhergesagt werden Rechenregeln und Eigenschaften BearbeitenDie Varianz weist eine Fulle nutzlicher Eigenschaften auf welche die Varianz zum wichtigsten Streuungsmass macht 24 Verschiebungssatz Bearbeiten Der Verschiebungssatz ist das stochastische Analogon zum Steinerschen Satz zur Berechnung von Tragheitsmomenten Es gilt mit E X m displaystyle mathbb E X mu nbsp und fur beliebiges reelles a displaystyle a nbsp E X a 2 Var X m a 2 displaystyle mathbb E left X a 2 right operatorname Var X mu a 2 nbsp d h die mittlere quadratische Abweichung von X displaystyle X nbsp bzgl a displaystyle a nbsp physikalisch das Tragheitsmoment bzgl der Achse a displaystyle a nbsp ist gleich der Varianz physikalisch gleich dem Tragheitsmoment bzgl der Achse durch den Schwerpunkt m displaystyle mu nbsp plus dem Quadrat der Verschiebung m a displaystyle mu a nbsp Beweis wbr E X a 2 E X m m a 2 Var X 2 E X m m a m a 2 displaystyle mathbb E left X a 2 right mathbb E left X mu mu a 2 right operatorname Var X 2 mathbb E left X mu mu a right mu a 2 nbsp Der mittlere Term ergibt unter Ausnutzung der Linearitat des Erwartungswertes 25 2 E X m m a 2 m a E X m 0 displaystyle 2 mathbb E left X mu mu a right 2 mu a mathbb E left X right mu 0 nbsp Damit ist obige Formel bewiesen Aus dem Verschiebungssatz ergibt sich uberdies fur beliebiges reelles a displaystyle a nbsp Var X E X a 2 displaystyle operatorname Var X leq mathbb E left X a 2 right quad nbsp bzw Var X min a R E X a 2 displaystyle quad operatorname Var X min a in R mathbb E left X a 2 right nbsp Siehe auch Frechet Prinzip Fur a 0 displaystyle a 0 nbsp erhalt man als bekannteste Variante des Verschiebungssatzes Var X E X 2 E X 2 E X 2 m 2 displaystyle operatorname Var X mathbb E left X 2 right mathbb E left X right 2 mathbb E left X 2 right mu 2 nbsp Die Varianz als zentrales auf den Erwartungswert das Zentrum bezogenes Moment lasst sich also auch als nichtzentrales Moment ausdrucken Aus dem Verschiebungssatz folgt wegen der Nichtnegativitatsbedingung der Varianz E X 2 E X 2 0 displaystyle mathbb E left X 2 right left mathbb E X right 2 geq 0 nbsp somit gilt E X 2 E X 2 displaystyle mathbb E left X 2 right geq left mathbb E X right 2 nbsp Dieses Resultat ist ein Spezialfall der jensenschen Ungleichung fur Erwartungswerte Der Verschiebungssatz beschleunigt die Berechnung der Varianz da der dazu notige Erwartungswert von X 2 displaystyle X 2 nbsp zusammen mit m displaystyle mu nbsp gebildet werden kann wahrend sonst m displaystyle mu nbsp bereits bekannt sein muss konkret fur diskrete beziehungsweise stetige Zufallsvariablen liefert er Falls X displaystyle X nbsp diskret Falls X displaystyle X nbsp stetigs 2 i 1 x i 2 p i i 1 x i p i 2 displaystyle sigma 2 left sum i geq 1 x i 2 p i right left sum i geq 1 x i p i right 2 nbsp s 2 x 2 f x d x x f x d x 2 displaystyle sigma 2 int infty infty x 2 f x mathrm d x left int infty infty xf x mathrm d x right 2 nbsp Lineare Transformation Bearbeiten Fur zwei Konstanten a b R displaystyle a b in mathbb R nbsp gilt Die Varianz einer Konstanten ist Null da Konstanten per Definition nicht zufallig sind und somit auch nicht streuen Var a 0 displaystyle operatorname Var a 0 nbsp Var b 0 displaystyle operatorname Var b 0 nbsp Translationsinvarianz Fur additive Konstanten gilt Var X b E X b m b 2 Var X displaystyle operatorname Var X b mathbb E left X b mu b 2 right operatorname Var X nbsp Dies bedeutet dass eine Verschiebung der Zufallsvariablen um einen konstanten Betrag keine Auswirkung auf deren Streuung hat Im Gegensatz zu additiven Konstanten haben multiplikative Konstanten eine Auswirkung auf die Skalierung der Varianz Bei multiplikativen Konstanten wird die Varianz mit der quadrierten der Konstanten also a 2 displaystyle a 2 nbsp skaliert 26 Dies kann wie folgt gezeigt werden Var a X E a X a m 2 E a 2 X m 2 a 2 Var X displaystyle operatorname Var aX mathbb E left aX a mu 2 right mathbb E left a 2 X mu 2 right a 2 operatorname Var X nbsp Hierbei wurde die Eigenschaft der Linearitat des Erwartungswertes benutzt Zusammengefasst ergibt die Varianzbildung einer linearen transformierten Zufallsvariablen Y a X b displaystyle Y aX b nbsp Var Y Var a X b a 2 Var X displaystyle operatorname Var Y operatorname Var aX b a 2 operatorname Var X nbsp Insbesondere fur a 1 displaystyle a 1 nbsp folgt Var X Var X displaystyle operatorname Var X operatorname Var X nbsp das heisst das Vorzeichen der Varianz andert sich nicht wenn sich das Vorzeichen der Zufallsvariablen andert Jede Zufallsvariable kann durch Zentrierung und anschliessende Normierung genannt Standardisierung in eine Zufallsvariable Z displaystyle Z nbsp uberfuhrt werden Diese Normierung ist eine lineare Transformation Die derart standardisierte Zufallsvariable Z displaystyle Z nbsp weist eine Varianz von 1 displaystyle 1 nbsp und einen Erwartungswert von 0 displaystyle 0 nbsp auf Beziehung zur Standardabweichung Bearbeiten Die Varianz einer Zufallsvariablen wird immer in Quadrateinheiten angegeben 27 Dies ist problematisch weil quadrierte Einheiten die auf diesem Wege zustande kommen wie zum Beispiel cm 2 displaystyle text cm 2 nbsp keine sinnvolle Interpretation bieten die Interpretation als Flachenmass ist im vorliegenden Beispiel unzulassig Um die gleiche Einheit wie die Zufallsvariable zu erhalten wird daher statt der Varianz i d R die Standardabweichung verwendet Sie hat die gleiche Einheit wie die Zufallsvariable selbst und misst somit bildlich gesprochen mit dem gleichen Mass Die Standardabweichung ist die positive Quadratwurzel aus der Varianz 28 29 SD X Var X E X m 2 displaystyle operatorname SD X sqrt operatorname Var X sqrt mathbb E left X mu 2 right nbsp Sie wird als SD X displaystyle operatorname SD X nbsp gelegentlich auch als D X displaystyle D X nbsp s X displaystyle sigma X nbsp oder einfach als s displaystyle sigma nbsp Sigma notiert Ferner eignet sich die Standardabweichung zur Quantifizierung von Unsicherheit bei Entscheidungen unter Risiko weil sie im Unterschied zur Varianz den Anforderungen an ein Risikomass genugt Bei einigen Wahrscheinlichkeitsverteilungen insbesondere der Normalverteilung konnen aus der Standardabweichung direkt Wahrscheinlichkeiten berechnet werden So befinden sich bei der Normalverteilung immer ca 68 der Werte im Intervall von der Breite von zwei Standardabweichungen um den Erwartungswert Beispiel hierfur ist die Korpergrosse Sie ist fur eine Nation und Geschlecht annahernd normalverteilt sodass z B in Deutschland 2006 ca 68 aller Manner etwa zwischen 171 und 186 cm gross waren ca 178 3 7 3 cm displaystyle 178 3 pm 7 3 text cm nbsp also Erwartungswert plus minus Standardabweichung 30 Fur die Standardabweichung gilt fur jede Konstante c displaystyle c nbsp SD c 0 displaystyle operatorname SD c 0 nbsp Im Gegensatz zur Varianz gilt fur die Standardabweichung die Rechenregel SD a X b a SD X displaystyle operatorname SD aX b a operatorname SD X nbsp mit a b R displaystyle a b in mathbb R nbsp fur lineare Transformationen das heisst die Standardabweichung wird im Gegensatz zur Varianz nicht mit dem Quadrat a 2 displaystyle a 2 nbsp der Konstanten skaliert Insbesondere gilt fur a gt 0 displaystyle a gt 0 nbsp SD a X b a SD X displaystyle operatorname SD aX b a cdot operatorname SD X nbsp Beziehung zur Kovarianz Bearbeiten Hauptartikel Kovarianz Stochastik Im Gegensatz zur Varianz die lediglich die Variabilitat der betrachteten Zufallsvariablen misst misst die Kovarianz die gemeinsame Variabilitat von zwei Zufallsvariablen Die Varianz ist demnach die Kovarianz einer Zufallsvariablen mit sich selbst Cov X X Var X displaystyle operatorname Cov X X operatorname Var X nbsp Diese Beziehung folgt direkt aus den Definition von Varianz und Kovarianz Die Kovarianz zwischen X displaystyle X nbsp und Y displaystyle Y nbsp wird auch mit s X Y displaystyle sigma X Y nbsp abgekurzt Ausserdem gilt da die Kovarianz eine positiv semidefinite Bilinearform ist die Cauchy Schwarzsche Ungleichung Cov X Y 2 Var X Var Y displaystyle operatorname Cov X Y 2 leq operatorname Var X operatorname Var Y nbsp Diese bedeutende Ungleichung findet vor allem in der linearen Algebra Anwendung Summen und Produkte Bearbeiten Fur die Varianz einer beliebigen Summe von Zufallsvariablen X a 1 X 1 a n X n displaystyle X a 1 X 1 dotsb a n X n nbsp gilt allgemein 31 32 Var X a 1 2 Var X 1 a n 2 Var X n 2 a 1 a 2 Cov X 1 X 2 2 a 1 a 3 Cov X 1 X 3 i 1 n a i 2 Var X i 2 i lt j a i a j Cov X i X j displaystyle begin aligned operatorname Var left X right amp a 1 2 operatorname Var left X 1 right dotsb a n 2 operatorname Var left X n right 2a 1 a 2 operatorname Cov left X 1 X 2 right 2a 1 a 3 operatorname Cov left X 1 X 3 right dotsb amp sum nolimits i 1 n a i 2 operatorname Var X i 2 sum nolimits i lt j a i a j operatorname Cov X i X j end aligned nbsp Hierbei bezeichnet Cov X i X j displaystyle operatorname Cov left X i X j right nbsp die Kovarianz der Zufallsvariablen X i displaystyle X i nbsp und X j displaystyle X j nbsp und es wurde die Eigenschaft Cov X i X i Var X i displaystyle operatorname Cov left X i X i right operatorname Var left X i right nbsp verwendet Berucksichtigt man das Verhalten der Varianz bei linearen Transformationen dann gilt fur die Varianz einer Linearkombination einer gewichteten Summe zweier Zufallsvariablen Var a X b Y a 2 Var X b 2 Var Y 2 a b Cov X Y displaystyle operatorname Var aX bY a 2 operatorname Var X b 2 operatorname Var Y 2ab operatorname Cov X Y nbsp Speziell fur zwei Zufallsvariablen X displaystyle X nbsp Y displaystyle Y nbsp und a b 1 displaystyle a b 1 nbsp ergibt sich 33 Var X Y Var X Var Y 2 Cov X Y displaystyle operatorname Var X Y operatorname Var X operatorname Var Y 2 operatorname Cov X Y nbsp Dies bedeutet dass die Variabilitat der Summe zweier Zufallsvariablen gleich der Summe der einzelnen Variabilitaten und dem Zweifachen der gemeinsamen Variabilitat der beiden Zufallsvariablen ist Ein weiterer Grund warum die Varianz anderen Streuungsmassen vorgezogen wird ist die nutzliche Eigenschaft dass die Varianz der Summe unabhangiger Zufallsvariablen gleich der Summe der Varianzen ist 26 34 Var X Y Var X Var Y displaystyle operatorname Var X pm Y operatorname Var X operatorname Var Y nbsp Dies resultiert daraus dass bei unabhangigen Zufallsvariablen Cov X Y 0 displaystyle operatorname Cov X Y 0 nbsp gilt Diese Formel lasst sich auch verallgemeinern Wenn X 1 X n displaystyle X 1 dotsc X n nbsp paarweise unkorrelierte Zufallsvariablen sind das heisst ihre Kovarianzen sind alle gleich Null gilt Var X 1 X n Var X 1 Var X n displaystyle operatorname Var left X 1 dotsb X n right operatorname Var X 1 dotsb operatorname Var X n nbsp oder allgemeiner mit beliebigen Konstanten a 1 a n displaystyle a 1 dotsc a n nbsp Var a 1 X 1 a n X n a 1 2 Var X 1 a n 2 Var X n displaystyle begin aligned operatorname Var left a 1 X 1 dotsb a n X n right a 1 2 operatorname Var left X 1 right dotsb a n 2 operatorname Var left X n right end aligned nbsp Dieses Resultat wurde 1853 vom franzosischen Mathematiker Irenee Jules Bienayme entdeckt und wird daher auch als Gleichung von Bienayme bezeichnet 35 36 Sie gilt insbesondere dann wenn die Zufallsvariablen unabhangig sind denn aus Unabhangigkeit folgt Unkorreliertheit Wenn alle Zufallsvariablen die gleiche Varianz s 2 displaystyle sigma 2 nbsp haben bedeutet dies fur die Varianzbildung des Stichprobenmittels Var X Var 1 n i 1 n X i 1 n 2 i 1 n Var X i s 2 n displaystyle operatorname Var left overline X right operatorname Var left frac 1 n sum i 1 n X i right frac 1 n 2 sum i 1 n operatorname Var left X i right frac sigma 2 n nbsp Man kann erkennen dass die Varianz des Stichprobenmittels sinkt wenn der Stichprobenumfang n displaystyle n nbsp steigt Diese Formel fur die Varianz des Stichprobenmittels wird bei der Definition des Standardfehlers des Stichprobenmittels benutzt der im zentralen Grenzwertsatz angewendet wird Sind zwei Zufallsvariablen X displaystyle X nbsp and Y displaystyle Y nbsp unabhangig dann ist die Varianz ihres Produktes gegeben durch 37 Var X Y E X 2 Var Y E Y 2 Var X Var X Var Y displaystyle operatorname Var XY mathbb E X 2 operatorname Var Y mathbb E Y 2 operatorname Var X operatorname Var X operatorname Var Y nbsp Zusammengesetzte Zufallsvariable Bearbeiten Ist Y displaystyle Y nbsp eine zusammengesetzte Zufallsvariable d h sind N X 1 X 2 displaystyle N X 1 X 2 dotsc nbsp unabhangige Zufallsvariablen sind die X i displaystyle X i nbsp identisch verteilt und ist N displaystyle N nbsp auf N 0 displaystyle mathbb N 0 nbsp definiert so lasst sich Y displaystyle Y nbsp darstellen als Y i 1 N X i displaystyle Y sum nolimits i 1 N X i nbsp Existieren die zweiten Momente von N X 1 X 2 displaystyle N X 1 X 2 dotsc nbsp so gilt fur die zusammengesetzte Zufallsvariable Var Y Var N E X 1 2 E N Var X 1 displaystyle operatorname Var Y operatorname Var N left mathbb E left X 1 right right 2 mathbb E N operatorname Var left X 1 right nbsp Diese Aussage ist auch als Blackwell Girshick Gleichung bekannt und wird z B in der Schadensversicherungsmathematik benutzt Momenterzeugende und kumulantenerzeugende Funktion Bearbeiten Mithilfe der momenterzeugenden Funktion lassen sich Momente wie die Varianz haufig einfacher berechnen Die momenterzeugende Funktion ist definiert als Erwartungswert der Funktion e t X displaystyle e tX nbsp Da fur die momenterzeugende Funktion E e t X displaystyle mathbb E left e tX right nbsp der Zusammenhang 38 M X n t 0 E X n displaystyle M X n t 0 mathbb E left X n right nbsp gilt lasst sich die Varianz durch den Verschiebungssatz damit auf folgende Weise berechnen Var X E X 2 E X 2 M X 0 M X 0 2 displaystyle operatorname Var X mathbb E left X 2 right mathbb E X 2 M X 0 left M X 0 right 2 nbsp Hierbei ist M X displaystyle M X nbsp die momenterzeugende Funktion und M X n displaystyle M X n nbsp deren n displaystyle n nbsp te Ableitung Die kumulantenerzeugende Funktion einer Zufallsvariablen ergibt sich als Logarithmus der momenterzeugenden Funktion und ist definiert als g X t ln E e t X displaystyle g X t ln mathbb E e tX nbsp Leitet man sie zweimal ab und wertet sie an der Stelle Null aus so erhalt man fur die Varianz g X t t 0 s 2 displaystyle g X t bigg t 0 sigma 2 nbsp Die zweite Kumulante ist also die Varianz Charakteristische und wahrscheinlichkeitserzeugende Funktion Bearbeiten Die Varianz einer Zufallsvariablen X displaystyle X nbsp lasst sich auch mit Hilfe ihrer charakteristischen Funktion f X t E e i t X displaystyle varphi X t mathbb E left e mathrm i tX right nbsp darstellen Wegen E X k f X k 0 i k k 1 2 displaystyle mathbb E X k frac varphi X k 0 mathrm i k k 1 2 dots nbsp E X 2 f X 0 i 2 displaystyle mathbb E X 2 left frac varphi X 0 mathrm i right 2 nbsp folgt namlich mit dem Verschiebungssatz 39 Var X E X 2 E X 2 f X 0 i 2 f X 0 i 2 displaystyle operatorname Var X mathbb E X 2 mathbb E X 2 frac varphi X 0 mathrm i 2 left frac varphi X 0 mathrm i right 2 nbsp Auch mit der wahrscheinlichkeitserzeugenden Funktion m X t E t X displaystyle m X t mathbb E t X nbsp die in Beziehung zur charakteristische Funktion steht lasst sich fur diskrete X displaystyle X nbsp die Varianz berechnen Es gilt dann fur die Varianz s 2 lim t 1 m X t m X t m X t 2 displaystyle sigma 2 lim t uparrow 1 left m X t m X t m X t 2 right nbsp falls der linksseitige Grenzwert existiert Varianz als mittlere quadratische Abweichung vom Mittelwert Bearbeiten Im Falle einer diskreten Zufallsvariablen X displaystyle X nbsp mit abzahlbar endlichem Trager T x 1 x 2 x n R displaystyle mathcal T x 1 x 2 dotsc x n subset mathbb R nbsp ergibt sich fur die Varianz der Zufallsvariablen Var X displaystyle operatorname Var X nbsp Var X p 1 x 1 m 2 p 2 x 2 m 2 p n x n m 2 displaystyle operatorname Var X p 1 x 1 mu 2 p 2 x 2 mu 2 dotsb p n x n mu 2 nbsp Hierbei ist p i P X x i displaystyle p i P left X x i right nbsp die Wahrscheinlichkeit dass X displaystyle X nbsp den Wert x i displaystyle x i nbsp annimmt Diese Varianz kann als Summe der Werte x 1 m 2 x 2 m 2 x n m 2 displaystyle left x 1 mu right 2 left x 2 mu right 2 dotsc left x n mu right 2 nbsp gewichtet mit den Wahrscheinlichkeiten p 1 p 2 p n displaystyle p 1 p 2 dotsc p n nbsp interpretiert werden Falls X displaystyle X nbsp gleichverteilt auf x 1 x 2 x n R displaystyle x 1 x 2 dotsc x n subset mathbb R nbsp ist p 1 p 2 p n 1 n displaystyle p 1 p 2 dotsb p n 1 n nbsp ist der Erwartungswert gleich dem arithmetischen Mittel siehe Gewichtetes arithmetisches Mittel als Erwartungswert m E X 1 n x 1 x 2 x n 1 n i 1 n x i x displaystyle mu operatorname E X frac 1 n left x 1 x 2 dotsb x n right frac 1 n sum i 1 n x i overline x nbsp Folglich wird die Varianz Var X p 1 x 1 m 2 p 2 x 2 m 2 p n x n m 2 displaystyle operatorname Var X p 1 x 1 mu 2 p 2 x 2 mu 2 dotsb p n x n mu 2 nbsp zum arithmetischen Mittel der Werte x i x 2 displaystyle x i overline x 2 nbsp s 2 Var X 1 n x 1 x 2 x 2 x 2 x n x 2 1 n i 1 n x i x 2 s 2 displaystyle sigma 2 operatorname Var X frac 1 n left left x 1 overline x right 2 left x 2 overline x right 2 dotsb left x n overline x right 2 right frac 1 n sum i 1 n left x i overline x right 2 s 2 nbsp D h die Varianz ist bei Gleichverteilung gerade die mittlere quadratische Abweichung vom Mittelwert bzw die Stichprobenvarianz s 2 displaystyle s 2 nbsp Varianzen spezieller Verteilungen BearbeitenIn der Stochastik gibt es eine Vielzahl von Verteilungen die meist eine unterschiedliche Varianz aufweisen und oft in Beziehung zueinander stehen Die Varianz der Normalverteilung ist von grosser Bedeutung da die Normalverteilung in der Statistik eine ausserordentliche Stellung einnimmt Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz dem zufolge Verteilungen die durch Uberlagerung einer grossen Zahl von unabhangigen Einflussen entstehen unter schwachen Voraussetzungen annahernd normalverteilt sind Eine Auswahl wichtiger Varianzen ist in nachfolgender Tabelle zusammengefasst Verteilung Stetig diskret Wahrscheinlichkeitsfunktion VarianzNormalverteilung Stetig f x m s 2 1 2 p s 2 exp x m 2 2 s 2 displaystyle f x mid mu sigma 2 frac 1 sqrt 2 pi sigma 2 operatorname exp left frac x mu 2 2 sigma 2 right nbsp s 2 displaystyle sigma 2 nbsp Cauchy Verteilung Stetig f x 1 p s s 2 x t 2 displaystyle f x frac 1 pi cdot frac s s 2 x t 2 nbsp existiert nichtBernoulli Verteilung Diskret f x p p x 1 p 1 x falls x 0 1 0 sonst displaystyle f x mid p begin cases p x 1 p 1 x amp text falls quad x 0 1 0 amp text sonst end cases nbsp p 1 p displaystyle p 1 p nbsp Binomialverteilung Diskret f x n p n x p x 1 p n x falls x 0 1 n 0 sonst displaystyle f x mid n p begin cases binom n x p x 1 p n x amp text falls quad x 0 1 dots n 0 amp text sonst end cases nbsp n p 1 p displaystyle np 1 p nbsp Stetige Gleichverteilung Stetig f x 1 b a falls a x b 0 sonst displaystyle f x begin cases frac 1 b a amp text falls quad a leq x leq b 0 amp text sonst end cases nbsp 1 12 b a 2 displaystyle frac 1 12 b a 2 nbsp Poisson Verteilung Diskret f x l x x e l falls x 0 1 0 sonst displaystyle f x begin cases frac lambda x x mathrm e lambda amp text falls quad x in 0 1 dots 0 amp text sonst end cases nbsp l displaystyle lambda nbsp Degenerierte Verteilung Diskret f x b 1 falls x b 0 sonst displaystyle f x mid b begin cases 1 amp text falls quad x b 0 amp text sonst end cases nbsp 0 displaystyle 0 nbsp Beispiele BearbeitenBerechnung bei diskreten Zufallsvariablen Bearbeiten Munzwurf Bearbeiten Eine Munze wird 7 mal geworfen Wenn die diskrete Zufallsvariable X displaystyle X nbsp die Anzahl der Wurfe zahlt mit denen Zahl geworfen wird ergibt sich fur X displaystyle X nbsp die Binomialverteilung B i 1 2 7 7 k 1 2 i 1 1 2 7 i falls i 0 1 2 3 4 5 6 7 0 sonst displaystyle B i mid tfrac 1 2 7 begin cases binom 7 k left tfrac 1 2 right i left 1 tfrac 1 2 right 7 i amp text falls quad i in 0 1 2 3 4 5 6 7 0 amp text sonst end cases nbsp mit n 7 displaystyle n 7 nbsp und p 1 2 displaystyle p tfrac 1 2 nbsp Die Werte und ihre Wahrscheinlichkeiten lassen sich in folgender Tabelle zusammenfassen X x i displaystyle X x i nbsp 0 displaystyle 0 nbsp 1 displaystyle 1 nbsp 2 displaystyle 2 nbsp 3 displaystyle 3 nbsp 4 displaystyle 4 nbsp 5 displaystyle 5 nbsp 6 displaystyle 6 nbsp 7 displaystyle 7 nbsp P X x i p i displaystyle P X x i p i nbsp 1 128 displaystyle frac 1 128 nbsp 7 128 displaystyle frac 7 128 nbsp 21 128 displaystyle frac 21 128 nbsp 35 128 displaystyle frac 35 128 nbsp 35 128 displaystyle frac 35 128 nbsp 21 128 displaystyle frac 21 128 nbsp 7 128 displaystyle frac 7 128 nbsp 1 128 displaystyle frac 1 128 nbsp Der Erwartungswert betragt m n p 7 1 2 3 5 displaystyle color BrickRed mu np 7 cdot frac 1 2 color BrickRed 3 5 nbsp und daher ist die Varianz gegeben durch s 2 i 0 7 x i m 2 p i 0 3 5 2 1 128 1 3 5 2 7 128 2 3 5 2 21 128 3 3 5 2 35 128 4 3 5 2 35 128 5 3 5 2 21 128 6 3 5 2 7 128 7 3 5 2 1 128 7 4 1 75 displaystyle begin aligned sigma 2 amp sum i 0 7 x i color BrickRed mu 2 p i 0 color BrickRed 3 5 2 cdot frac 1 128 1 color BrickRed 3 5 2 cdot frac 7 128 2 color BrickRed 3 5 2 cdot frac 21 128 3 color BrickRed 3 5 2 cdot frac 35 128 amp quad 4 color BrickRed 3 5 2 cdot frac 35 128 5 color BrickRed 3 5 2 cdot frac 21 128 6 color BrickRed 3 5 2 cdot frac 7 128 7 color BrickRed 3 5 2 cdot frac 1 128 frac 7 4 1 75 end aligned nbsp Auch mit dem Verschiebungssatz erhalt man diesen Wert fur die Varianz s 2 i 0 7 x i 2 p i i 0 7 x i p i 2 0 2 1 128 1 2 7 128 2 2 21 128 3 2 35 128 4 2 35 128 5 2 21 128 6 2 7 128 7 2 1 128 3 5 2 1 75 displaystyle sigma 2 left sum i 0 7 x i 2 p i right left sum i 0 7 x i p i right 2 0 2 cdot frac 1 128 1 2 cdot frac 7 128 2 2 cdot frac 21 128 3 2 cdot frac 35 128 4 2 cdot frac 35 128 5 2 cdot frac 21 128 6 2 cdot frac 7 128 7 2 cdot frac 1 128 color BrickRed 3 5 2 1 75 nbsp Fur die Standardabweichung ergibt sich damit s s 2 1 75 1 323 displaystyle sigma sqrt sigma 2 sqrt 1 75 approx 1 323 nbsp Community Cards bei Texas Hold em Bearbeiten Bei der Pokervariante Texas Hold em werden von den 52 Spielkarten 5 Community Cards aufgedeckt Wenn die diskrete Zufallsvariable X displaystyle X nbsp die Anzahl der Asse zahlt die aufgedeckt werden ergibt sich fur X displaystyle X nbsp die hypergeometrische Verteilung h k 52 4 5 P X k 4 k 52 4 5 k 52 5 displaystyle h k mid 52 4 5 P X k frac displaystyle 4 choose k 52 4 choose 5 k displaystyle 52 choose 5 nbsp mit N 52 displaystyle N 52 nbsp Spielkarten M 4 displaystyle M 4 nbsp Assen und