www.wikidata.de-de.nina.az
Dieser Artikel behandelt Quantile von Stichproben Fur Quantile von Wahrscheinlichkeitsverteilungen oder Zufallsvariablen siehe Quantil Wahrscheinlichkeitstheorie Ein empirisches p displaystyle p Quantil auch Stichprobenquantil oder kurz Quantil genannt ist in der Statistik eine Kennzahl einer Stichprobe Fur jede Zahl p displaystyle p zwischen 0 und 1 teilt vereinfacht dargestellt ein empirisches p displaystyle p Quantil die Stichprobe so dass ein Anteil der Stichprobe von p displaystyle p kleiner als das empirische p displaystyle p Quantil ist und ein Anteil von 1 p displaystyle 1 p der Stichprobe grosser als das empirische p displaystyle p Quantil ist Ist beispielsweise eine Stichprobe von Schuhgrossen gegeben so ist das empirische 0 35 Quantil diejenige Schuhgrosse s displaystyle s so dass 35 der Schuhgrossen in der Stichprobe kleiner als s displaystyle s sind und 65 grosser als s displaystyle s sind Einige empirische p displaystyle p Quantile tragen Eigennamen Zu ihnen gehoren der Median p 0 5 displaystyle p 0 5 das obere Quartil und das untere Quartil sowie die Terzile Quintile Dezile und die Perzentile Von den hier besprochenen empirischen Quantilen sind die Quantile im Sinne der Wahrscheinlichkeitstheorie zu unterscheiden Diese sind Kennzahlen einer Wahrscheinlichkeitsverteilung und damit einer abstrakten Mengen Funktion ahnlich dem Erwartungswert wahrend die empirischen Quantile Kennzahlen einer Stichprobe sind ahnlich dem arithmetischen Mittel Eine bekannte Darstellung und Veranschaulichung empirischer Quantile ist die Parade der Einkommen Pen s Parade des Okonomen Jan Pen zur Einkommensverteilung Inhaltsverzeichnis 1 Definition 2 Eigenschaften 3 Beispiel 4 Spezielle Quantile 4 1 Median 4 2 Terzil 4 3 Quartil 4 4 Quintil 4 5 Dezil 4 6 Perzentil 5 Abgeleitete Begriffe 6 Darstellung 7 EinzelnachweiseDefinition BearbeitenEs bezeichne x displaystyle lfloor x rfloor nbsp die Abrundungsfunktion Sie rundet jede Zahl x displaystyle x nbsp auf die nachste kleinere ganze Zahl ab Es gilt also beispielsweise 1 2 1 displaystyle lfloor 1 2 rfloor 1 nbsp und 3 99 3 displaystyle lfloor 3 99 rfloor 3 nbsp Gegeben sei eine Stichprobe x 1 x 2 x n displaystyle left x 1 x 2 dotsc x n right nbsp der Grosse n displaystyle n nbsp deren Elemente der Grosse nach geordnet sind Dies bedeutet es gilt x 1 x 2 x n displaystyle x 1 leq x 2 leq dotsb leq x n nbsp Sei p 0 1 displaystyle p in 0 1 nbsp dann ist x p 1 2 x n p x n p 1 wenn n p ganzzahlig x n p 1 wenn n p nicht ganzzahlig displaystyle x p begin cases tfrac 1 2 x n cdot p x n cdot p 1 amp text wenn n cdot p text ganzzahlig x lfloor n cdot p 1 rfloor amp text wenn n cdot p text nicht ganzzahlig end cases nbsp das empirische p displaystyle p nbsp Quantil von x 1 x 2 x n displaystyle x 1 x 2 dotsc x n nbsp 1 Es existieren einige von der hier angegebenen Definition abweichende Definitionen 2 Eigenschaften BearbeitenDas Stichprobenquantil ist asymptotisch fur grosse Stichprobenumfange und fur Stichprobenvariablen mit einer Wahrscheinlichkeitsdichte f displaystyle f nbsp gemass der folgenden Normalverteilung verteilt 3 Empirisches p Quantil N m p s 2 p 1 p n f x p 2 displaystyle text Empirisches p Quantil sim mathcal N left mu p sigma 2 frac p 1 p nf x p 2 right nbsp wobei p displaystyle p nbsp das Quantil ist n displaystyle n nbsp der Stichprobenumfang und x p F 1 p displaystyle x p F 1 p nbsp der Wert der Zufallsvariable beim p Quantil Beispiel BearbeitenDie folgende Stichprobe besteht aus zehn zufalligen ganzen Zahlen gezogen aus den Zahlen zwischen null und hundert versehen mit der diskreten Gleichverteilung 82 91 12 92 63 9 28 55 96 97 displaystyle 82 91 12 92 63 9 28 55 96 97 nbsp Sortieren liefert die Stichprobe x 1 9 x 2 12 x 3 28 x 4 55 x 5 63 x 6 82 x 7 91 x 8 92 x 9 96 x 10 97 displaystyle x 1 9 x 2 12 x 3 28 x 4 55 x 5 63 x 6 82 x 7 91 x 8 92 x 9 96 x 10 97 nbsp Es ist n 10 displaystyle n 10 nbsp Fur p 0 5 displaystyle p 0 5 nbsp erhalt man p n 5 displaystyle p cdot n 5 nbsp Da dies ganzzahlig ist erhalt man uber die Definition x 0 5 1 2 x 5 x 5 1 1 2 63 82 72 5 displaystyle x 0 5 tfrac 1 2 left x 5 x 5 1 right tfrac 1 2 63 82 72 5 nbsp Fur p 0 25 displaystyle p 0 25 nbsp erhalt man p n 1 0 25 10 1 2 5 1 displaystyle p cdot n 1 0 25 cdot 10 1 2 5 1 nbsp Die Abrundungsfunktion liefert dann 3 5 3 displaystyle lfloor 3 5 rfloor 3 nbsp und damit x 0 25 x 3 28 displaystyle x 0 25 x 3 28 nbsp Analog erhalt man fur p 0 75 displaystyle p 0 75 nbsp direkt p n 1 0 75 10 1 8 5 displaystyle p cdot n 1 0 75 cdot 10 1 8 5 nbsp und damit 8 5 8 displaystyle lfloor 8 5 rfloor 8 nbsp also ist x 0 75 x 8 92 displaystyle x 0 75 x 8 92 nbsp Das empirische Quantil ist im Gegensatz zum arithmetischen Mittel robust gegenuber Ausreissern Dies bedeutet dass wenn man Werte einer Stichprobe oberhalb oder unterhalb eines bestimmten Quantils durch einen Wert oberhalb oder unterhalb des Quantils ersetzt sich das Quantil selbst nicht verandert Dies beruht darauf dass Quantile nur durch ihre Ordnung und damit ihre Lage zueinander bestimmt werden und nicht durch die konkreten Zahlenwerte der Stichprobe So ware im Fall der obigen Stichprobe das arithmetische Mittel x 62 5 displaystyle overline x 62 5 nbsp Modifiziert man nun aber den grossten Wert der Stichprobe setzt beispielsweise x 10 1000 displaystyle x 10 1000 nbsp so ist x 152 8 displaystyle overline x 152 8 nbsp wohingegen der Median sowie das untere und das obere Quartil unverandert bleiben da sich die Reihenfolge der Stichprobe nicht verandert hat Spezielle Quantile BearbeitenFur gewisse p displaystyle p nbsp Werte tragen die zugehorigen Quantile Eigennamen Sie sind hier im Folgenden kurz vorgestellt Zu beachten ist dass auch die entsprechenden Quantile von Wahrscheinlichkeitsverteilungen teils mit denselben Eigennamen bezeichnet werden Median Bearbeiten Hauptartikel Median Der Median ist das 0 5 displaystyle 0 5 nbsp Quantil und teilt somit die Stichprobe in zwei Halften Eine Halfte ist kleiner als der Median die andere grosser als der Median Er ist mit dem Modus und dem arithmetischen Mittel ein wichtiger Lageparameter in der deskriptiven Statistik Terzil Bearbeiten Als Terzile werden die beiden p displaystyle p nbsp Quantile fur p 1 3 displaystyle p tfrac 1 3 nbsp und p 2 3 displaystyle p tfrac 2 3 nbsp bezeichnet Sie teilen die Stichprobe in drei gleich grosse Teile ein Teil ist kleiner als das untere Terzil 1 3 displaystyle tfrac 1 3 nbsp Quantil ein Teil ist grosser als das obere Terzil 2 3 displaystyle tfrac 2 3 nbsp Quantil und ein Teil liegt zwischen den Terzilen Quartil Bearbeiten Als Quartile werden die beiden Quantile mit p 0 25 displaystyle p 0 25 nbsp und p 0 75 displaystyle p 0 75 nbsp bezeichnet Dabei heisst das 0 25 displaystyle 0 25 nbsp Quantil das untere Quartil und das 0 75 displaystyle 0 75 nbsp Quantil das obere Quartil Zwischen oberem und unterem Quartil liegt die Halfte der Stichprobe unterhalb des unteren Quartils und oberhalb des oberen Quartils jeweils ein Viertel der Stichprobe Auf Basis der Quartile wird der Interquartilsabstand definiert ein Streuungsmass Quintil Bearbeiten Als Quintile werden die vier Quantile mit p 0 2 0 4 0 6 0 8 displaystyle p 0 2 0 4 0 6 0 8 nbsp bezeichnet Demnach befinden sich 20 der Stichprobe unter dem ersten Quintil und 80 daruber 40 der Stichprobe unter dem zweiten Quintil und 60 daruber etc Dezil Bearbeiten Die Quantile fur Vielfache von 0 1 displaystyle 0 1 nbsp also fur p 0 1 0 2 0 9 displaystyle p 0 1 0 2 dotsc 0 9 nbsp werden Dezile genannt Dabei heisst das 0 1 displaystyle 0 1 nbsp Quantil das erste Dezil das 0 2 displaystyle 0 2 nbsp Quantil das zweite Dezil etc Unterhalb des ersten Dezils liegen 10 der Stichprobe oberhalb entsprechend 90 der Stichprobe Ebenso liegen 40 der Stichprobe unterhalb des vierten Dezils und 60 oberhalb Perzentil Bearbeiten Als Perzentile werden die Quantile von 0 01 displaystyle 0 01 nbsp bis 0 99 displaystyle 0 99 nbsp in Schritten von 0 01 displaystyle 0 01 nbsp bezeichnet Abgeleitete Begriffe BearbeitenAus den Quantilen lassen sich noch gewisse Streuungsmasse ableiten Das wichtigste ist der Interquartilabstand englisch interquartile range IQR x 0 75 x 0 25 displaystyle text IQR x 0 75 x 0 25 nbsp Er gibt an wie weit das obere und das untere Quartil auseinanderliegen und damit auch wie breit der Bereich ist in dem die mittleren 50 der Stichprobe liegen 4 Etwas allgemeiner kann der Inter quantilabstand definiert werden als x 1 p x p displaystyle x 1 p x p nbsp fur p 0 0 5 displaystyle p in 0 0 5 nbsp Er gibt an wie breit der Bereich ist in dem die mittleren 100 1 2 p displaystyle 100 cdot 1 2p nbsp der Stichprobe liegen Fur p 0 25 displaystyle p 0 25 nbsp entspricht er dem Interquartilabstand Ein weiteres abgeleitetes Streumass ist die mittlere absolute Abweichung vom Median Darstellung Bearbeiten nbsp Box Plot einer StichprobeEine Moglichkeit Quantile darzustellen ist der Box Plot Dabei wird die gesamte Stichprobe durch einen Kasten versehen mit zwei Antennen dargestellt Die aussere Begrenzung des Kastens sind jeweils das obere und das untere Quartil Somit befindet sich die Halfte der Stichprobe im Kasten Der Kasten selbst ist nochmals unterteilt der unterteilende Strich ist dabei der Median der Stichprobe Die Antennen sind nicht einheitlich definiert Eine Moglichkeit ist als Begrenzung der Antennen das erste und das neunte Dezil zu wahlen Einzelnachweise Bearbeiten Norbert Henze Stochastik fur Einsteiger Eine Einfuhrung in die faszinierende Welt des Zufalls 10 Auflage Springer Spektrum Wiesbaden 2013 ISBN 978 3 658 03076 6 S 30 doi 10 1007 978 3 658 03077 3 Eric W Weisstein Quantile In MathWorld englisch Alan Stuart Keith Ord Kendall s Advanced Theory of Statistics Arnold London 1994 ISBN 0 340 61430 7 Eric W Weisstein Interquartile Range In MathWorld englisch Abgerufen von https de wikipedia org w index php title Empirisches Quantil amp oldid 237671782