www.wikidata.de-de.nina.az
Die Schiefe englisch skewness bzw skew ist eine statistische Kennzahl die die Art und Starke der Asymmetrie einer Wahrscheinlichkeitsverteilung beschreibt Sie zeigt an ob und wie stark die Verteilung nach rechts rechtssteil linksschief negative Schiefe oder nach links linkssteil rechtsschief positive Schiefe geneigt ist Inhaltsverzeichnis 1 Definition 1 1 Empirische Schiefe 1 2 Schatzung der Schiefe einer Grundgesamtheit 2 Weitere Schiefemasse 2 1 Lage von Mittelwert und Median 2 2 Quantilskoeffizient der Schiefe 3 Deutung 4 Interpretation der Schiefe 5 Siehe auch 6 Literatur 7 Einzelnachweise 8 WeblinksDefinition BearbeitenDie Schiefe g m displaystyle gamma m nbsp einer Zufallsvariablen X displaystyle X nbsp ist das zentrale Moment 3 Ordnung m 3 displaystyle mu 3 nbsp falls das Moment 3 Ordnung existiert normiert auf die Standardabweichung s displaystyle sigma nbsp g m m 3 s 3 E X m s 3 E X m 3 s 3 E X 3 3 E X 2 m 2 m 3 s 3 E X 3 3 m s 2 m 3 s 3 displaystyle gamma m frac mu 3 sigma 3 operatorname E left left frac X mu sigma right 3 right frac operatorname E left left X mu right 3 right sigma 3 frac operatorname E left X 3 right 3 operatorname E left X 2 right mu 2 mu 3 sigma 3 frac operatorname E left X 3 right 3 mu sigma 2 mu 3 sigma 3 nbsp mit dem Erwartungswert m E X displaystyle mu operatorname E X nbsp und der Varianz s 2 Var X displaystyle sigma 2 operatorname Var X nbsp Diese Darstellung wird auch Momentenkoeffizient der Schiefe genannt Mit den Kumulanten k i displaystyle kappa i nbsp ergibt sich die Darstellung g m k 3 k 2 3 k 3 Var X 3 2 displaystyle gamma m frac kappa 3 sqrt kappa 2 3 frac kappa 3 operatorname Var X frac 3 2 nbsp Die Schiefe kann jeden reellen Wert annehmen nbsp nbsp Bei negativer Schiefe g m lt 0 displaystyle gamma m lt 0 nbsp spricht man von einer linksschiefen oder rechtssteilen Verteilung sie fallt in typischen Fallen auf der linken Seite flacher ab als auf der rechten Bei positiver Schiefe g m gt 0 displaystyle gamma m gt 0 nbsp spricht man von einer rechtsschiefen oder linkssteilen Verteilung sie fallt typischerweise umgekehrt auf der rechten Seite flacher ab als auf der linken Typische Vertreter rechtsschiefer Verteilungen sind die Bernoulli Verteilung fur p lt 1 2 displaystyle p lt 1 2 nbsp die Exponentialverteilung und die Pareto Verteilung fur k gt 3 displaystyle k gt 3 nbsp Die Schiefe ist invariant unter linearer Transformation mit a gt 0 displaystyle a gt 0 nbsp g m a X b g m X displaystyle gamma m aX b gamma m X nbsp Fur die Summe unabhangiger normierter Zufallsgrossen X i displaystyle X i nbsp gilt g m X 1 X 2 X n g m X 1 g m X 2 g m X n n 3 2 displaystyle gamma m X 1 X 2 ldots X n left gamma m X 1 gamma m X 2 ldots gamma m X n right n frac 3 2 nbsp d h die Schiefe der Summe unabhangiger und identisch verteilter Zufallsgrossen ist die ursprungliche Schiefe dividiert durch n displaystyle sqrt n nbsp Empirische Schiefe Bearbeiten Zur Berechnung der Schiefe einer empirischen Haufigkeitsverteilung wird die folgende Formel benutzt g m m 3 s 3 1 n i 1 n x i x 3 1 n i 1 n x i x 2 3 1 n i 1 n x i x s 3 displaystyle g m frac m 3 s 3 frac tfrac 1 n sum i 1 n x i overline x 3 sqrt tfrac 1 n sum i 1 n x i overline x 2 3 frac 1 n sum i 1 n left frac x i overline x s right 3 nbsp Damit die Schiefe unabhangig von der Masseinheit der Variablen ist werden die Messwerte mit Hilfe des arithmetischen Mittelwertes x displaystyle overline x nbsp und der empirischen Standardabweichung s displaystyle s nbsp der Beobachtungswerte x i displaystyle x i nbsp z i x i x s displaystyle z i frac x i overline x s nbsp standardisiert Durch die Standardisierung gilt z 1 n i 1 n z i 0 displaystyle overline z frac 1 n sum i 1 n z i 0 quad nbsp und s z 2 1 n i 1 n z i 2 1 displaystyle quad s z 2 frac 1 n sum i 1 n z i 2 1 nbsp Schatzung der Schiefe einer Grundgesamtheit Bearbeiten Zur Schatzung der unbekannten Schiefe g m displaystyle gamma m nbsp einer Grundgesamtheit mittels Stichprobendaten x 1 x n displaystyle x 1 ldots x n nbsp n displaystyle n nbsp der Stichprobenumfang mussen der Erwartungswert und die Varianz aus der Stichprobe geschatzt werden d h die theoretischen durch die empirischen Momente ersetzt werden g m 1 n i 1 n x i x s 3 displaystyle tilde gamma m frac 1 n sum i 1 n left frac x i overline x s right 3 nbsp mit x displaystyle overline x nbsp der Stichprobenmittelwert und s displaystyle s nbsp die Stichprobenstandardabweichung Dieser Schatzer ist jedoch nicht erwartungstreu fur g m displaystyle gamma m nbsp im Gegensatz zu g m n n 1 n 2 i 1 n x i x s 3 displaystyle hat gamma m frac n n 1 n 2 sum i 1 n left frac x i overline x s right 3 nbsp Weitere Schiefemasse BearbeitenLage von Mittelwert und Median Bearbeiten Auf Karl Pearson geht die Definition S m x med s displaystyle S frac mu x text med sigma nbsp mit dem Erwartungswert m displaystyle mu nbsp dem Median x med displaystyle x text med nbsp und der Standardabweichung s displaystyle sigma nbsp zuruck Der Wertebereich von S ist das Intervall 1 1 displaystyle 1 1 nbsp Fur symmetrische Verteilungen ist S 0 displaystyle S 0 nbsp Rechtsschiefe Verteilungen besitzen haufig ein positives S displaystyle S nbsp es gibt jedoch Ausnahmen von dieser Faustregel 1 Wenn die Standardabweichung divergiert kann die Pearsonsche Definition verallgemeinert werden indem eine Verteilung rechtsschief bezeichnet wird wenn der Median kleiner als der Erwartungswert ist In diesem Sinn ist die Pareto Verteilung fur beliebigen Parameter k gt 1 displaystyle k gt 1 nbsp rechtsschief Quantilskoeffizient der Schiefe Bearbeiten Der Quantilskoeffizient der Schiefe beschreibt die normierte Differenz zwischen der Entfernung des a displaystyle alpha nbsp und des 1 a displaystyle 1 alpha nbsp Quantils zum Median Er wird also wie folgt berechnet g p x 1 a x med x med x a x 1 a x a a 0 1 2 displaystyle gamma p frac x 1 alpha x text med x text med x alpha x 1 alpha x alpha quad alpha in left 0 tfrac 1 2 right nbsp Dabei kann der Quantilskoeffizient Werte zwischen 1 displaystyle 1 nbsp und 1 displaystyle 1 nbsp annehmen Der Quantilskoeffizient existiert fur beliebige Verteilungen auch wenn Erwartungswert oder die Standardabweichung nicht definiert sein sollten Eine symmetrische Verteilung besitzt den Quantilskoeffizienten 0 displaystyle 0 nbsp eine rechtsschiefe linksschiefe Verteilung besitzt in der Regel einen positiven negativen Quantilskoeffizienten Fur a 1 4 displaystyle alpha tfrac 1 4 nbsp ergibt sich der Quartilskoeffizient Die Pareto Verteilung besitzt fur beliebige Parameter k gt 0 displaystyle k gt 0 nbsp positive Quantilskoeffizienten Deutung Bearbeiten nbsp Beispiel von experimentellen Daten mit einer positiven Schiefe rechtsschief Ist g p gt 0 displaystyle gamma p gt 0 nbsp so ist die Verteilung rechtsschief ist g p lt 0 displaystyle gamma p lt 0 nbsp ist die Verteilung linksschief Fur gutartige Verteilungen gilt Bei rechtsschiefen Verteilungen sind Werte die kleiner sind als der Mittelwert haufiger zu beobachten so dass sich der Gipfel Modus links vom Mittelwert befindet der rechte Teil des Graphs ist flacher als der linke Gilt g p 0 displaystyle gamma p 0 nbsp so ist die Verteilung auf beiden Seiten ausgeglichen Bei symmetrischen Verteilungen ist immer g p 0 displaystyle gamma p 0 nbsp Umgekehrt mussen Verteilungen mit g p 0 displaystyle gamma p 0 nbsp nicht symmetrisch sein Als Faustregeln kann man fur gutartige Verteilungen also festhalten rechtsschief x mod lt x med lt x displaystyle x text mod lt x text med lt overline x nbsp symmetrisch x mod x med x displaystyle x text mod x text med overline x nbsp linksschief x mod gt x med gt x displaystyle x text mod gt x text med gt overline x nbsp Die Schiefe ist ein Mass fur die Asymmetrie einer Wahrscheinlichkeitsverteilung Da die Gausssche Normalverteilung symmetrisch ist also eine Schiefe von null besitzt ist die Schiefe eine mogliche Masszahl um eine Verteilung mit der Normalverteilung zu vergleichen Fur einen Test dieser Eigenschaft siehe z B den Kolmogorow Smirnow Test Interpretation der Schiefe BearbeitenRechtsschiefe Verteilungen findet man z B haufig beim Pro Kopf Einkommen Hier gibt es einige wenige Personen mit extrem hohem Einkommen und sehr viele Personen mit eher niedrigem Einkommen Durch die 3 Potenz erhalten die wenigen sehr extremen Werte ein hohes Gewicht und es entsteht ein Schiefemass mit positivem Vorzeichen Es gibt verschiedene Formeln um die Schiefe zu berechnen Die gangigen Statistikpakete wie SPSS SYSTAT Stata etc nutzen besonders im Falle einer kleinen Fallzahl von obiger momentbasierter Berechnungsvorschrift abweichende Formeln Siehe auch BearbeitenWolbung Statistik Literatur BearbeitenW H Press et al Numerical Recipes in C 2 Auflage Cambridge University Press 1992 Kapitel 14 1 Einzelnachweise Bearbeiten Paul T von Hippel Mean Median and Skew Correcting a Textbook Rule In Journal of Statistics Education 13 Jahrgang Nr 2 2005 amstat org Memento des Originals vom 14 Oktober 2008 im Internet Archive abgerufen am 16 November 2013 Weblinks BearbeitenSchiefe erklart anhand von grafischen Beispielen Abgerufen von https de wikipedia org w index php title Schiefe Statistik amp oldid 234688199