www.wikidata.de-de.nina.az
Dieser Artikel behandelt Streuungsmasse in der deskriptiven Statistik Fur Streuungsmasse in der Stochastik siehe Dispersionsmass Stochastik Streuungsmasse auch Dispersionsmasse lateinisch dispersio Zerstreuung von dispergere verteilen ausbreiten zerstreuen oder Streuungsparameter genannt fassen in der deskriptiven Statistik verschiedene Masszahlen zusammen die die Streubreite von Beobachtungswerten beziehungsweise einer Haufigkeitsverteilung um einen geeigneten Lageparameter herum beschreiben Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit beziehungsweise Empfindlichkeit gegenuber Ausreissern Inhaltsverzeichnis 1 Anforderungen 2 Masszahlen 2 1 Streuung um das arithmetische Mittel 2 1 1 Summe der Abweichungsquadrate 2 1 2 Empirische Varianz 2 1 3 Empirische Standardabweichung 2 1 4 Variationskoeffizient 2 1 5 Mittlere absolute Abweichung 2 2 Streuung um den Median 2 2 1 Quantilsabstand 2 2 2 Interquartilsabstand 2 2 3 Mittlere absolute Abweichung vom Median 2 2 4 Median der absoluten Abweichungen vom Median 2 3 Weitere Streuungsmasse 2 3 1 Spannweite 2 3 2 Geometrische Standardabweichung 3 Streuungsmasszahlen in der Wahrscheinlichkeitstheorie 3 1 Interquartilsabstand 3 2 Mittlere absolute Abweichung vom Erwartungswert 3 2 1 Median der absoluten Abweichungen vom Median 3 3 Mittlere absolute Abweichung vom Median 4 Graphische Darstellungsformen 5 Siehe auch 6 Einzelnachweise 7 Literatur 8 WeblinksAnforderungen BearbeitenEs sei x 1 x n R n displaystyle x 1 dots x n in mathbb R n nbsp ein Vektor von Beobachtungwerten und s R n R displaystyle s colon mathbb R n rightarrow mathbb R nbsp eine Funktion Die Funktion s displaystyle s nbsp heisst ein Streuungsmass wenn sie im Allgemeinen folgende Anforderungen erfullt s x 1 x n displaystyle s x 1 dots x n nbsp ist eine nichtnegative reelle Zahl die Null ist wenn alle Beobachtungen gleich sind x 1 x 2 x n x displaystyle x 1 x 2 ldots x n overline x nbsp in den Daten ist keinerlei Variabilitat vorhanden und zunimmt wenn die Daten vielfaltiger werden Wenn mindestens zwei Merkmalswerte voneinander verschieden sind dann streuen die Daten untereinander bzw um einen Mittelwert was auch beim Streuungsmass zum Ausdruck kommen sollte Bei einem Streuungsmass wird Nichtnegativitat gefordert da bei Streuung das Ausmass statt die Richtung konstituierend ist Ein Streuungsmass sollte also umso grosser sein je starker Beobachtungswerte voneinander abweichen Noch strenger wird oft gefordert dass sich ein Streuungsmass bei einer Ersetzung eines Beobachtungswertes durch einen neuen Merkmalswert nicht verkleinern darf s displaystyle s nbsp ist translationsinvariant 1 d h eine Verschiebung des Nullpunktes hat keinen Einfluss auf die Verteilung Es muss also folgendes gelten s x 1 a x n a s x 1 x n a R displaystyle s x 1 a dots x n a s x 1 dots x n forall a in mathbb R nbsp Es ist auch wunschenswert dass das Streuungsmass gegenuber Massstabsanderungen invariant ist 2 Ein einfacher Ansatz fur ein Streuungsmass ware die Differenzen der Werte vom empirischen Mittel aufzusummieren Dies fuhrt zu s x i 1 n x i x displaystyle s x sum i 1 n x i overline x nbsp Diese Summe ergibt allerdings stets 0 weil sich positive und negative Summanden gegenseitig aufheben Schwerpunkteigenschaft Das ist also nicht geeignet als Streuungsmass da der Wert nicht zunimmt wenn die Variabilitat der Daten steigt Moglichkeiten bestehen also darin die Absolutbetrage oder die Quadrate der Abweichungen zu summieren Masszahlen BearbeitenIm Folgenden wird davon ausgegangen dass x 1 x n displaystyle x 1 dots x n nbsp reellwertige Beobachtungswerte vorliegen die inhaltlich zu einer Variablen gehoren Dies konnen Messwerte sein Es kann sich um Stichprobenwerte handeln es kann sich aber auch um die Beobachtungswerte einer Gesamtheit handeln die nicht als Stichprobe aufgefasst wird Mit x 1 n i 1 n x i displaystyle bar x frac 1 n sum i 1 n x i nbsp ist der arithmetische Mittelwert der Beobachtungswerte bezeichnet Streuung um das arithmetische Mittel Bearbeiten Summe der Abweichungsquadrate Bearbeiten Hauptartikel Summe der Abweichungsquadrate Ein intuitives Streuungsmass ist die Summe der Abweichungsquadrate bei der die quadrierten Abweichungen der Beobachtungswerte vom arithmetischen Mittelwert aufsummiert werden S Q i 1 n x i x 2 displaystyle SQ sum limits i 1 n x i overline x 2 nbsp Empirische Varianz Bearbeiten Hauptartikel empirische Varianz Einer der wichtigsten Streuungsparameter ist die Varianz der Beobachtungswerte die als s 2 1 n i 1 n x i x 2 displaystyle s 2 frac 1 n sum limits i 1 n left x i overline x right 2 nbsp definiert ist und die aquivalente Darstellung s 2 1 n i 1 n x i 2 x 2 displaystyle s 2 frac 1 n sum i 1 n x i 2 bar x 2 nbsp besitzt 3 In der induktiven Statistik sind die Beobachtungswerte x 1 x n displaystyle x 1 dots x n nbsp Stichprobenwerte aus einer Grundgesamtheit und Realisierungen von Stichprobenvariablen X 1 X n displaystyle X 1 dots X n nbsp Wenn mit Hilfe einer Streuungsmasszahl der Stichprobe auf die Varianz der Grundgesamtheit geschlossen werden soll wird die sogenannte korrigierte Stichprobenvarianz s 2 1 n 1 i 1 n x i x 2 displaystyle s 2 frac 1 n 1 sum limits i 1 n left x i overline x right 2 nbsp verwendet da die zugehorige Stichprobenfunktion S 2 1 n 1 i 1 n X i X 2 displaystyle S 2 frac 1 n 1 sum limits i 1 n left X i overline X right 2 nbsp eine erwartungstreue Schatzfunktion fur die Varianz der Grundgesamtheit ist In einem rein beschreibenden Kontext der deskriptiven Statistik ist die Verwendung der korrigierten Stichprobenvarianz nicht zu rechtfertigen In vielen Anwendungsbereichen in denen die Stichprobeninterpretation der beobachteten Werte der Standardfall ist z B Messungen in der Technik und Biometrie wird die korrigierte Stichprobenvarianz als die Stichprobenvarianz bezeichnet und meistens mit s 2 displaystyle s 2 nbsp bezeichnet Auch in Darstellungen der induktiven Statistik wird haufig das Symbol S 2 displaystyle S 2 nbsp fur die oben mit S 2 displaystyle S 2 nbsp bezeichnete Grosse verwendet Empirische Standardabweichung Bearbeiten Hauptartikel Empirische Standardabweichung Die Standardabweichung ist definiert als die Wurzel aus der Varianz und ist demnach s 1 n i 1 n x i x 2 displaystyle s sqrt frac 1 n sum limits i 1 n left x i overline x right 2 nbsp Ein wesentlicher Unterschied zur Varianz ist dass die Standardabweichung dieselbe Dimension und damit dieselben Einheiten wie die Beobachtungswerte besitzt In der induktiven Statistik wird die korrigierte Standardabweichung s 1 n 1 i 1 n x i x 2 displaystyle s sqrt frac 1 n 1 sum limits i 1 n left x i overline x right 2 nbsp als Schatzwert fur die Standardabweichung der Grundgesamtheit verwendet Variationskoeffizient Bearbeiten Der empirische Variationskoeffizient wird gebildet als Quotient aus empirischer Standardabweichung s displaystyle s nbsp und arithmetischem Mittel x displaystyle overline x nbsp v s x x gt 0 displaystyle v frac s overline x quad overline x gt 0 nbsp Er ist dimensionslos und somit nicht einheitenbehaftet Mittlere absolute Abweichung Bearbeiten Im Falle einer konkreten Stichprobe x 1 x n displaystyle x 1 dots x n nbsp mit dem arithmetischen Mittel x displaystyle overline x nbsp wird sie errechnet durch e 1 n i 1 n x i x displaystyle operatorname e frac 1 n sum i 1 n left x i overline x right nbsp Die mittlere absolute Abweichung wird in der mathematischen Statistik meist zugunsten der quadratischen Abweichung umgangen welche analytisch leichter zu behandeln ist Die in der Definition verwendete Betragsfunktion ist nicht uberall differenzierbar was die Berechnung des Minimums erschwert Aufgrund der Ungleichung vom arithmetisch quadratischen Mittel ist die mittlere absolute Abweichung kleiner oder gleich der Standardabweichung Gleichheit gilt nur fur konstante Zufallsgrossen Streuung um den Median Bearbeiten Quantilsabstand Bearbeiten Der Quantilsabstand ist die Differenz zwischen dem p displaystyle p nbsp und 1 p displaystyle left 1 p right nbsp Quantil Q A p Q 1 p Q p displaystyle QA p Q 1 p Q p nbsp mit 0 p lt 0 5 displaystyle 0 leq p lt 0 5 nbsp Innerhalb des Q A p displaystyle QA p nbsp liegen etwa 100 1 2 p displaystyle 100 cdot 1 2p nbsp Prozent aller Messwerte Interquartilsabstand Bearbeiten Hauptartikel Interquartilsabstand Deskriptive Statistik Der Interquartilsabstand engl interquartile range abgekurzt IQR wird als Differenz der Quartile Q 0 75 displaystyle Q 0 75 nbsp und Q 0 25 displaystyle Q 0 25 nbsp berechnet I Q R Q 0 75 Q 0 25 displaystyle IQR Q 0 75 Q 0 25 nbsp Innerhalb des IQR liegen 50 aller Messwerte Er ist wie auch der Median bzw Q 0 5 displaystyle Q 0 5 nbsp unempfindlich gegenuber Ausreissern Es lasst sich zeigen dass er einen Bruchpunkt von e 0 25 displaystyle varepsilon 0 25 nbsp hat Der Interquartilsabstand ist gleich dem Quantilsabstand Q A 0 25 displaystyle QA 0 25 nbsp Mittlere absolute Abweichung vom Median Bearbeiten Hauptartikel Mittlere absolute Abweichung vom Median Fur n displaystyle n nbsp beobachtete Werte x 1 x n displaystyle x 1 dots x n nbsp mit dem eindeutigen Median x displaystyle tilde x nbsp ist die Mittlere absolute Abweichung vom Median als MD 1 n i 1 n x i x displaystyle operatorname MD frac 1 n sum i 1 n left x i tilde x right nbsp definiert Aufgrund der Extremaleigenschaft des Medians gilt im Vergleich mit der mittleren absoluten Abweichung stets MD e displaystyle operatorname MD leq operatorname e nbsp d h die mittlere absolute Abweichung bezuglich des Medians ist erst recht kleiner als die Standardabweichung Median der absoluten Abweichungen vom Median Bearbeiten Fur Beobachtungswerte x 1 x n displaystyle x 1 dots x n nbsp ist die mittlere absolute Abweichung engl median absolute deviation auch MedMed abgekurzt MAD ist definiert durch MAD median x i x i 1 n displaystyle operatorname MAD operatorname median left x i tilde x right mid i 1 dots n nbsp Die mittlere absolute Abweichung ist ein robuster Schatzer fur die Standardabweichung Es lasst sich zeigen dass sie einen Bruchpunkt von e 0 5 displaystyle varepsilon 0 5 nbsp hat Weitere Streuungsmasse Bearbeiten Spannweite Bearbeiten Die Spannweite englisch range R displaystyle R nbsp berechnet sich als Differenz zwischen dem grossten und dem kleinsten Messwert R x max x min displaystyle R x max x min nbsp Da die Spannweite nur aus den zwei Extremwerten berechnet wird ist sie nicht robust gegenuber Ausreissern Geometrische Standardabweichung Bearbeiten Die geometrische Standardabweichung ist ein Streuungsmass um das geometrische Mittel Streuungsmasszahlen in der Wahrscheinlichkeitstheorie BearbeitenIn der Wahrscheinlichkeitstheorie charakterisieren Streuungsmasszahlen Eigenschaften einer Wahrscheinlichkeitsverteilung Hauptartikel Dispersionsmass Stochastik Interquartilsabstand Bearbeiten Der Interquartilsabstand engl interquartile range abgekurzt IQR ist als Differenz der Quartile Q 0 75 displaystyle Q 0 75 nbsp und Q 0 25 displaystyle Q 0 25 nbsp definiert I Q R Q 0 75 Q 0 25 displaystyle IQR Q 0 75 Q 0 25 nbsp Mittlere absolute Abweichung vom Erwartungswert Bearbeiten Die mittlere absolute Abweichung e displaystyle e nbsp einer Zufallsvariablen X displaystyle X nbsp von ihrem Erwartungswert m E X displaystyle mu operatorname E X nbsp ist definiert durch e E X m displaystyle operatorname e operatorname E left left X mu right right nbsp Damit ist sie das erste absolute zentrierte Moment der Zufallsvariablen X displaystyle X nbsp Fur symmetrische Verteilungen d h Verteilungen mit der Eigenschaft f m x f m x displaystyle f mu x f mu x nbsp fur alle reellen x displaystyle x nbsp mit monoton fallender Dichte fur x gt m displaystyle x gt mu nbsp gilt I Q R 2 e displaystyle IQR leq 2 operatorname e nbsp Fur die stetige Gleichverteilung gilt das Gleichheitszeichen Median der absoluten Abweichungen vom Median Bearbeiten Die mittlere absolute Abweichung engl median absolute deviation auch MedMed abgekurzt MAD ist definiert durch P X x MAD 0 5 displaystyle P left X tilde x right leq operatorname MAD 0 5 nbsp Im Fall der Normalverteilung besteht der Zusammenhang MAD z 0 75 s 0 6745 s displaystyle operatorname MAD z 0 75 cdot sigma approx 0 6745 cdot sigma nbsp zur Standardabweichung Dabei bezeichnet z 0 75 displaystyle z 0 75 nbsp das 0 75 Quantil der Standardnormalverteilung Mittlere absolute Abweichung vom Median Bearbeiten Die mittlere absolute Abweichung engl mean deviation from the median abgekurzt MD vom Median x displaystyle tilde x nbsp ist definiert durch MD E X x displaystyle operatorname MD operatorname E left left X tilde x right right nbsp Fur die Normalverteilung gilt MD e 2 p s 0 80 s displaystyle operatorname MD operatorname e sqrt frac 2 pi cdot sigma approx 0 80 cdot sigma nbsp Fur symmetrische Verteilungen stimmen Median falls dieser eindeutig ist und Erwartungswert falls dieser existiert und endlich ist uberein sodass in diesem Fall MD e displaystyle operatorname MD operatorname e nbsp gilt Graphische Darstellungsformen BearbeitenBox Whisker Plot Streuungsfacherkarte StreudiagrammSiehe auch BearbeitenDispersionsindexEinzelnachweise Bearbeiten Andreas Buchter H W Henn Elementare Stochastik Eine Einfuhrung 2 Auflage Springer 2007 ISBN 978 3 540 45382 6 S 83 Hans Friedrich Eckey et al Statistik Grundlagen Methoden Beispiele S 74 1 Aufl 1992 3 Aufl 2002 ISBN 3 409 32701 0 Die 4 Aufl 2005 und die 5 Aufl 2008 erschienen unter dem Titel Deskriptive Statistik Grundlagen Methoden Beispiele Horst Rinne Taschenbuch der Statistik 4 Auflage Harri Deutsch Frankfurt am Main 2008 ISBN 978 3 8171 1827 4 A 2 3 2 Streuungsparameter Varianz S 43 Literatur BearbeitenP H Muller Hrsg Lexikon der Stochastik Wahrscheinlichkeitsrechnung und mathematische Statistik 5 Auflage Akademie Verlag Berlin 1991 ISBN 978 3 05 500608 1 Streuungsmasse measures of dispersion S 428 429 Horst Rinne Taschenbuch der Statistik 4 Auflage Harri Deutsch Frankfurt am Main 2008 ISBN 978 3 8171 1827 4 A 2 3 2 Streuungsparameter S 42 46 Bernd Ronz Hans Gerhard Strohe Hrsg Lexikon Statistik Gabler Wiesbaden 1994 ISBN 3 409 19952 7 Streuungsmass S 353 Weblinks Bearbeiten nbsp Wiktionary Streuung Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen Abgerufen von https de wikipedia org w index php title Streuungsmass Statistik amp oldid 237629377