www.wikidata.de-de.nina.az
Dieser Artikel behandelt den Median in der Statistik Zum Median einer Wahrscheinlichkeitsverteilung siehe Median Stochastik Zu weiteren Bedeutungen siehe Median Begriffsklarung In der Statistik ist der Median auch Zentralwert genannt ein Mittelwert und Lageparameter Der Median der Messwerte einer Urliste ist derjenige Messwert der genau in der Mitte steht wenn man die Messwerte der Grosse nach sortiert Beispielsweise ist fur die ungeordnete Urliste 4 1 37 2 1 der Messwert 2 der Median der zentrale Wert in der geordneten Urliste 1 1 2 4 37 Im Allgemeinen teilt ein Median einen Datensatz eine Stichprobe oder eine Verteilung so in zwei gleich grosse Teile dass die Werte in der einen Halfte nicht grosser als der Medianwert sind und in der anderen nicht kleiner Inhaltsverzeichnis 1 Beschreibung 2 Vergleich mit anderen Massen der zentralen Tendenz 3 Anwendungsbereiche 4 Median einer Stichprobe 4 1 Ober und Untermedian 4 2 Eigenschaften 4 3 Median von gruppierten Daten 4 4 Beispiel 5 Andere Varianten 6 Median und arithmetisches Mittel sehr einfaches Beispiel 7 Weblinks 8 EinzelnachweiseBeschreibung BearbeitenDer Median teilt eine Liste von Werten in zwei Teile Er kann auf folgende Weise bestimmt werden Alle Werte werden aufsteigend geordnet Wenn die Anzahl der Werte ungerade ist ist die mittlere Zahl der Median Wenn die Anzahl der Werte gerade ist wird der Median meist als arithmetisches Mittel der beiden mittleren Zahlen definiert die dann Unter und Obermedian heissen Eine wichtige Eigenschaft des Medians ist Robustheit gegenuber Ausreissern Beispiel Sieben unsortierte Messwerte 4 1 15 2 4 5 4 werden nach Grosse sortiert 1 2 4 4 4 5 15 Der Median auch der Ober und der Untermedian ist der Wert an der mittleren Stelle also 4 Wenn im Beispiel durch einen Fehler eine 4 durch 46 ersetzt wurde andert sich der Median nicht 1 2 4 4 5 15 46 Das arithmetische Mittel hingegen springt von 5 auf 11 Vergleich mit anderen Massen der zentralen Tendenz Bearbeiten nbsp Vergleich zwischen Modus Median und Mittel eigentlich Erwartungswert zweier Log Normalverteilungen mit Median 1Der Median ist ein spezielles Quantil namlich das 1 2 Quantil Andere wichtige Lagemasse sind das arithmetische Mittel und der Modus Im Vergleich zum arithmetischen Mittel oft Durchschnitt genannt ist der Median robuster gegenuber Ausreissern extrem abweichenden Werten und lasst sich auch auf ordinal skalierte Variablen anwenden Der Begriff Median von lateinisch medianus in der Mitte befindlich der Mittlere entstammt der Geometrie wo er ebenfalls eine Grenze zwischen zwei Halften gleicher Grosse bezeichnet Anwendungsbereiche Bearbeiten nbsp Der Median dieses Notenspiegels ist 3 Etwas weniger als die Halfte der Ergebnisse ist schlechter durch Hinzunahme der Notenstufe 3 selbst wird die Halfte gerade uberschritten Im Gegensatz zum arithmetischen Mittel kann der Median auch fur ordinal skalierte Variablen wie beispielsweise Notenstufen bei denen es keinen quantitativen Abstand gibt verwendet werden Aber auch bei intervall und verhaltnisskalierten Daten kann der Median herangezogen werden und hat dann Nachteile und Vorteile gegenuber dem arithmetischen Mittel als Lagemass Fur lediglich nominal skalierte Variablen deren Auspragungen keine naturliche Rangfolge aufweisen wie zum Beispiel eine Variable Geburtsland kann der Median nicht angewendet werden Hier ist der Modalwert das einzige Lagemass das festgestellt werden kann Der Median wird in der Statistik und der Wahrscheinlichkeitstheorie in drei unterschiedlichen Bedeutungen angewendet als Lagemass der deskriptiven Statistik zur Beschreibung einer konkreten Liste von Stichprobenwerten in der Wahrscheinlichkeitstheorie als Median einer Wahrscheinlichkeitsverteilung oder einer Zufallsvariablen Hier stellt der Median eine Alternative zum Erwartungswert fur die Angabe eines mittleren Werts dar in der mathematischen Statistik als Median einer Zufallsstichprobe zur robusten Schatzung unbekannter Verteilungen Median einer Stichprobe BearbeitenEin Wert m displaystyle m nbsp ist Median einer Stichprobe wenn mindestens die Halfte der Stichprobenelemente nicht grosser als m displaystyle m nbsp und mindestens die Halfte nicht kleiner als m displaystyle m nbsp ist Sortiert man die Beobachtungswerte der Grosse nach das heisst geht man zur nach dem Rang geordneten Stichprobe uber so ist der Median bei einer ungeraden Anzahl von Beobachtungen der Wert der in der Mitte dieser Folge liegenden Beobachtung Bei einer geraden Anzahl von Beobachtungen gibt es kein einzelnes mittleres Element sondern zwei Hier sind die Werte der beiden mittleren Beobachtungen sowie alle Werte dazwischen obwohl diese moglicherweise bei keiner Beobachtung aufgetreten sind Mediane der Stichprobe da fur alle diese Werte obige Bedingung zutrifft Bei kardinal skalierten Messgrossen wenn es also sinnvoll moglich ist die Differenz von Messwerten zu berechnen verwendet man im Falle einer geraden Anzahl Beobachtungen meist das arithmetische Mittel der beiden mittleren Beobachtungswerte Der Median x displaystyle tilde x nbsp einer geordneten Stichprobe x 1 x 2 x n displaystyle x 1 x 2 dotsc x n nbsp von n displaystyle n nbsp Messwerten ist dann also x x m 1 fur ungerades n 2m 1 1 2 x m x m 1 fur gerades n 2m displaystyle tilde x begin cases x m 1 amp text fur ungerades n 2m 1 frac 1 2 x m x m 1 amp text fur gerades n 2m end cases nbsp Diese Definition hat den Vorteil dass bei Stichproben aus symmetrischen Verteilungen das arithmetische Mittel und der Median im Erwartungswert identisch sind Ober und Untermedian Bearbeiten Oft mochte man sicherstellen dass der Median ein Element der Stichprobe ist In diesem Fall wird alternativ zu obiger Definition bei einer geraden Anzahl n 2 m displaystyle n 2m nbsp von Elementen entweder der Untermedian x u x m displaystyle tilde x u x m nbsp oder der Obermedian x o x m 1 displaystyle tilde x o x m 1 nbsp als Median gewahlt Im Falle einer ungeraden Anzahl n 2 m 1 displaystyle n 2m 1 nbsp der Beobachtungen gilt naturlich wie oben x x u x o x m 1 displaystyle tilde x tilde x u tilde x o x m 1 nbsp Mithilfe von Gauss Klammern lassen sich die Indizes auch relativ kompakt durch n displaystyle n nbsp selbst ausdrucken x u x n 1 2 displaystyle tilde x u x left lfloor frac n 1 2 right rfloor nbsp x o x n 1 2 displaystyle tilde x o x left lceil frac n 1 2 right rceil nbsp Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine grosse Rolle wie z B bei SELECT Abfragen mittels des Medians der Mediane Eigenschaften Bearbeiten Der Median x displaystyle tilde x nbsp und im Fall einer geraden Anzahl von Messwerten alle Werte x displaystyle tilde x nbsp mit x u x x o displaystyle tilde x u leq tilde x leq tilde x o nbsp minimieren die Summe der absoluten Abweichungen das heisst fur ein beliebiges x displaystyle x nbsp gilt i 1 n x x i i 1 n x x i displaystyle sum i 1 n tilde x x i leq sum i 1 n x x i nbsp Der Median ist Grundlage der Methode der kleinsten absoluten Abweichungen und Verfahren der robusten Regression Das arithmetische Mittel dagegen minimiert die Summe der Abweichungsquadrate ist Grundlage der Methode der kleinsten Quadrate und der Regressionsanalyse und ist mathematisch leichter zu handhaben jedoch nicht robust gegen Ausreisser Der Median kann wie oben beschrieben algorithmisch bestimmt werden indem die Messwerte sortiert werden Das ist im Allgemeinen mit Aufwand W n log n displaystyle Omega n log n nbsp verbunden nur auf speziellen Klassen von Eingabedaten ist O n displaystyle mathcal O n nbsp moglich siehe Sortieralgorithmus Es gibt aber auch Algorithmen zur Quantilsbestimmung mit linearem Worst Case Aufwand O n displaystyle mathcal O n nbsp sowie Algorithmen zur Abschatzung beispielsweise die Cornish Fisher Methode Median von gruppierten Daten Bearbeiten nbsp Bevolkerungspyramide Tansania 2016 der Median liegt bei geschatzt 18 JahrenVor allem in den Sozialwissenschaften wird bei Statistiken haufig der Median geschatzt da nicht alle Daten explizit und exakt gegeben sind sondern nur in Intervallen gruppiert vorliegen So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt sondern nur nach der Einkommensklasse also dem Bereich in dem das Gehalt liegt Wenn nur die Haufigkeiten jeder Klasse bekannt sind dann lasst sich der Median einer solchen Stichprobe im Allgemeinen nur naherungsweise bestimmen Es seien n displaystyle n nbsp die Anzahl aller Daten n i displaystyle n i nbsp die jeweilige Anzahl der Daten der i displaystyle i nbsp ten Gruppe und u i displaystyle u i nbsp bzw o i displaystyle o i nbsp die entsprechenden unteren bzw oberen Intervallgrenzen Zunachst wird nun die mediane Klasse oder mediane Gruppe bestimmt d h diejenige Gruppe in die der Median nach obiger konventioneller Definition hineinfallt z B die m displaystyle m nbsp te Gruppe Die Zahl m displaystyle m nbsp ist dadurch bestimmt dass k 1 m 1 n k lt n 2 displaystyle textstyle sum k 1 m 1 n k lt frac n 2 nbsp aber k 1 m n k n 2 displaystyle textstyle sum k 1 m n k geq frac n 2 nbsp gilt Wenn keine weiteren Angaben uber die Verteilung der Daten gegeben sind wird z B Gleichverteilung postuliert sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann um eine Schatzung des Medians der gruppierten Daten zu erhalten x m e d u m n 2 k 1 m 1 n k n m o m u m displaystyle x mathrm med u m frac frac n 2 sum limits k 1 m 1 n k n m cdot o m u m nbsp Wenn keine weiteren Angaben uber die Verteilung der Daten gegeben sind kann auch jede andere Verteilung ausser der Gleichverteilung vorliegen und somit kann auch jeder andere Wert im m displaystyle m nbsp ten Intervall der Median sein Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangslaufig ein Element aus der tatsachlichen Datenmenge sein die in aller Regel auch gar nicht bekannt ist Beispiel Bearbeiten Einkommen Klasse i displaystyle i nbsp Bereich u i displaystyle u i nbsp bis o i displaystyle o i nbsp Gruppengrosse n i displaystyle n i nbsp 1 mind 0 weniger als 1500 1602 mind 1500 weniger als 2500 3203 mind 2500 weniger als 3500 212Man berechne n 2 212 320 160 2 692 2 346 displaystyle tfrac n 2 tfrac 212 320 160 2 tfrac 692 2 346 nbsp Also liegt der Median in der 2 Klasse d h m 2 displaystyle m 2 nbsp da die erste Klasse nur 160 Elemente umfasst Somit ergibt sich als Schatzung fur den Median x m e d 1500 346 160 320 2500 1500 2081 25 displaystyle x mathrm med 1500 tfrac 346 160 320 cdot 2500 1500 2081 25 nbsp Da die konkrete Verteilung der Daten in den Intervallen unbekannt ist kann auch jeder andere Wert im 2 Intervall der Median sein Der beispielhaft errechnete Wert 2081 25 kann daher bis zu 581 25 zu gross und bis zu 418 75 zu klein sein der Fehler der Schatzung also bis zu 28 betragen Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve Hier wird der Abszissenwert x m e d displaystyle x mathrm med nbsp gesucht der zum Ordinatenwert n 2 displaystyle tfrac n 2 nbsp gehort Bei kleinerem und geradem n displaystyle n nbsp kann stattdessen auch der Ordinatenwert n 2 1 displaystyle tfrac n 2 1 nbsp gewahlt werden Andere Varianten BearbeitenDie Wohlfahrtsfunktion ist eine Alternative zum Median bei der Ermittlung des Masseneinkommens aus einer gegebenen Einkommensverteilung Eine andere Moglichkeit als der Median mit extremen Werten umzugehen ist die Benutzung eines getrimmten Mittelwerts den man ermittelt indem man die kleinsten und grossten Werte vor der Berechnung entfernt typischerweise werden 5 der Werte weggelassen 1 Nach Butler 2 gibt es auch eine strengere Definition von Median die weniger gebrauchlich ist die sagt der Median ist der Wert fur den gilt die Zahl der kleineren Werte in der Reihe ist gleich der Zahl der grosseren Werte in der Reihe Fur Spezialfalle wie 3 3 3 3 4 oder 1 2 3 3 3 gibt es ein Verfahren mit dem man einen eindeutigen Median unter Beibehaltung der strengeren Definition berechnen kann 3 Median und arithmetisches Mittel sehr einfaches Beispiel BearbeitenIn einer Gruppe von zehn Personen haben alle Personen Monatseinkommen in unterschiedlicher Hohe Eine Person erhalt 1 000 000 die ubrigen neun bekommen 1 000 2 000 3 000 usw bis 9 000 Das arithmetische Mittel der Durchschnitt das Monatseinkommen jeder der zehn Personen bei gleichmassiger Aufteilung der Summe aller Einkommen auf sie betragt in diesem Falle 104 500 Allerdings verdient nur eine der zehn Personen mehr als dies die neun anderen deutlich weniger Der Median dagegen ist 5 500 Funf Personen verdienen mehr als das funf Personen weniger Der Median markiert hier die Grenzlinie zwischen der besser verdienenden und der schlechter verdienenden Halfte Weblinks Bearbeiten nbsp Wiktionary Median Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen nbsp Wikibooks M A T H E m a T R i x displaystyle begin smallmatrix mathbf MATHE mu alpha T mathbb R ix end smallmatrix nbsp Mathematik fur die Schule Lageparameter Ausfuhrliche Erlauterungen zur Berechnung des Medians auf dem Fussweg Wikibooks Ausnutzung der robusten Eigenschaften des Medians am Beispiel der Kreisausgleichung Memento vom 2 April 2010 im Internet Archive Eric W Weisstein Statistical Median In MathWorld englisch A V Prokhorov Median in statistics In Michiel Hazewinkel Hrsg Encyclopedia of Mathematics Springer Verlag und EMS Press Berlin 2002 ISBN 1 55608 010 7 englisch encyclopediaofmath org Einzelnachweise Bearbeiten Hans Lohninger Grundlagen der Statistik Mittelwert Christopher Butler Statistics in Linguistics 1985 Zentrale Tendenz Nicht mehr online verfugbar Archiviert vom Original am 16 Januar 2013 abgerufen am 9 Mai 2016 Abgerufen von https de wikipedia org w index php title Median amp oldid 237430282