www.wikidata.de-de.nina.az
Der Gini Koeffizient oder auch Gini Index ist ein statistisches Mass fur die Ungleichverteilungen in einer Gruppe das vom italienischen Statistiker Corrado Gini entwickelt wurde Ungleichverteilungskoeffizienten lassen sich fur jegliche Verteilungen berechnen Beispielsweise gilt der Gini Koeffizient in der Wirtschaftswissenschaft aber auch in der Geographie als Massstab fur die Einkommens und Vermogensverteilung einzelner Lander und somit als Hilfsmittel zur Klassifizierung von Landern und ihrem zugehorigen Entwicklungsstand Gini Koeffizient in der Einkommensverteilung Weltbank 2018 30 30 34 9 35 39 9 40 44 9 45 49 9 50 54 9 55 59 9 60 64 9 keine DatenLorenz Kurve rot der realen Verteilung zur Berechnung des Gini Koeffizienten und ideale Gleichverteilung schwarz Der Gini Koeffizient wird aus der Lorenz Kurve der kumulierten Einkommen uber der geordneten Liste der Teilnehmer Haushalte Personen Lander abgeleitet Er ist das Verhaltnis von zwei Flachen der Differenzflache zwischen der idealen Lorenz Kurve fur vollkommen gleichmassige Verteilung der Einkommen einer ansteigenden Geraden und der realen Lorenz Kurve sowie der gesamten Flache unter der idealen Kurve Er ist 0 fur vollkommene Gleichverteilung keine Differenzflache und 1 fur vollkommene Ungleichverteilung d h wenn nur eine Person das gesamte Einkommen hat Alles ist Differenzflache Mit einer gleichmassigen Verteilung ist dabei nicht die Gleichverteilung von Wahrscheinlichkeiten gemeint die i A noch konkretes Auftreten unterschiedlicher Werte erlaubt sondern dass es konkret nur einen Einkommenswert gibt also eine Verteilung mit einer Varianz von 0 Im haufigsten Anwendungsfall der Einkommensverteilung in einem Staat heisst das dass das Einkommen jedes Erwachsenen gleich hoch ist und nicht dass verschiedene Einkommen sklassen gleich haufig sind Inhaltsverzeichnis 1 Anwendungen 1 1 Okonomie 1 2 Informationstheorie 1 3 Maschinelles Lernen 1 4 Bankwesen 2 Normierung 3 Definition 3 1 Allgemeiner Fall 3 2 Berechnung anhand von Quantilen 3 2 1 Beispiel 4 Datenreduktion 5 Fehlerquelle bei Vergleichen 6 Siehe auch 7 Weblinks 8 EinzelnachweiseAnwendungen BearbeitenOkonomie Bearbeiten Der Gini Koeffizient wird insbesondere in der Wohlfahrtsokonomik verwendet um beispielsweise das Mass der Gleichheit oder Ungleichheit der Verteilung von Vermogen oder Einkommen zu beschreiben Der Koeffizient ist eine Alternative zum S80 S20 Einkommensquintilverhaltnis das in der EU Statistik 1 Verwendung findet Ausserdem wird er als Konzentrationsrate bei der Messung der Unternehmenskonzentration auf einem Markt eingesetzt Informationstheorie Bearbeiten In der Informationstheorie wird er als Mass der Reinheit oder Unreinheit von Information verwendet Maschinelles Lernen Bearbeiten Im Bereich des maschinellen Lernens gibt es ein statistisches Mass das Gini Impurity genannt wird und mit dem Gini Index verwechselt werden kann Gini Impurity im maschinellen Lernen wird verwendet um die Qualitat einer Trennung in Entscheidungsbaumen zu bewerten Das Ziel dabei ist es zu messen wie rein die durch die Trennung entstandenen Teilmengen in Bezug auf die Zielvariable sind Je niedriger das Gini Impurity Mass ist desto reiner sind die Teilmengen Der Gini Index in der Soziookonomie dagegen misst die Verteilung des Einkommens oder Vermogens innerhalb einer Bevolkerung Es ist wichtig beide Gini Indizes nicht zu verwechseln da sie unterschiedliche Zwecke erfullen und in unterschiedlichen Kontexten verwendet werden Bankwesen Bearbeiten Im Bankwesen wird der Gini Koeffizient als Mass dafur verwendet wie gut ein Ratingsystem gute von schlechten Kunden trennen kann Trennscharfe 2 Normierung BearbeitenDie Skala moglicher Werte reicht je nach Anwendungsfall von 0 bis 1 von 0 bis 100 von 0 bis 10000 Je nach Anwendungsfall steht der kleinste oder eben der grosste Wert fur die gleichmassige Verteilung Der Wert der absoluten Ungleichheit kann dabei im Allgemeinen nur asymptotisch erreicht werden Durch Renormierung kann man dies vermeiden Definition BearbeitenAllgemeiner Fall Bearbeiten Fur eine aufsteigend sortierte diskret verteilte Grosse x x 1 x n displaystyle x x 1 ldots x n nbsp Beispiel Haushaltseinkommen ist die Lorenz Kurve L j n displaystyle L j n nbsp gegeben durch L j n i 1 j x i k 1 n x k i 1 j x i n m i 1 j l i displaystyle L j n sum i 1 j frac x i sum k 1 n x k sum i 1 j frac x i n mu sum i 1 j l i nbsp 3 Fur die Position j displaystyle j nbsp in der Einkommensverteilung gibt die Lorenz Kurve daher den kumulierten Anteil am Gesamteinkommen an m i 1 n x i n displaystyle mu frac sum i 1 n x i n nbsp bezeichnet das arithmetische Mittel Bei einer Gleichverteilung entsprache die Flache A displaystyle A nbsp zwischen der 45 Grad Linie und der Lorenzkurve dem Wert 0 und nimmt zu fur ungleichere Verteilungen Aus dieser Uberlegung und dem Ziel ein auf das Intervall 0 1 displaystyle 0 1 nbsp normiertes Mass zu erhalten ergibt sich der Gini Ungleichheitskoeffizient als G U K 2 A displaystyle mathrm GUK 2A nbsp Durch geometrische Zerlegung der Flache A displaystyle A nbsp erhalt man 4 A 1 2 i 1 n l i i 1 n i n 1 2 i 1 n l i 2 i n 1 2 n displaystyle A frac 1 2 sum i 1 n l i left frac i 1 n frac i n right frac 1 2 sum i 1 n l i frac 2i n 1 2n nbsp Fur eine reale Verteilung kann man den Gini Koeffizienten daher direkt folgendermassen unter Verwendung von l i x i n m displaystyle l i x i n mu nbsp berechnen G U K 2 A i 1 n l i 2 i n 1 n 1 n 2 m i 1 n x i 2 i n 1 displaystyle GUK 2A sum i 1 n l i frac 2i n 1 n frac 1 n 2 mu sum i 1 n x i 2i n 1 nbsp Eine alternative Formulierung die keine Sortierung der Daten voraussetzt basiert auf der sogenannten relativen mittleren absoluten Differenz Die mittlere absolute Differenz bezeichnet die durchschnittliche Differenz aller vorhandenen Beobachtungspaare in einer Population Diese wird ins Verhaltnis gesetzt zum Durchschnittseinkommen Damit der Gini Koeffizient den gewunschten Wertebereich annimmt wird die Differenz noch durch 2 geteilt G U K i 1 n j 1 n x i x j 2 n i 1 n x i displaystyle GUK frac sum i 1 n sum j 1 n x i x j 2n sum i 1 n x i nbsp Berechnung anhand von Quantilen Bearbeiten Ein gewisser Teil einer Menge A wird einem Teil einer anderen Menge B zugeordnet Dies kann z B Geld A auf Menschen B oder auch Stromverbrauch A auf Stadte B sein Entscheidend ist dass A eine homogene gut aufteilbare Menge darstellt Zum Beispiel ware der Besitz von Kfz nicht geeignet da Kfz weder homogen einzelne Typen unterscheiden sich erheblich noch in kleine Einheiten aufteilbar sind Der Gini Koeffizient ist die auf die Gleichverteilung normierte Flache zwischen den Lorenz Kurven einer Gleichverteilung und der beobachteten Verteilung G U K A g A u g A g displaystyle mathrm GUK frac A g A ug A g nbsp mit GUK als dem Gini Ungleichverteilungskoeffizienten A g displaystyle A g nbsp der Flache unter der Lorenz Kurve einer Gleichverteilung und A u g displaystyle A ug nbsp der Flache unter der Lorenz Kurve fur die beobachtete Verteilung Beispiel Bearbeiten A wird auf B verteilt beispielsweise wird das Vermogen A auf die Bevolkerung B verteilt 50 Prozent von B b1 wird 2 5 Prozent von A zugeordnet v1 40 Prozent von B b2 wird 47 5 Prozent von A zugeordnet v2 9 Prozent von B b3 wird 27 0 Prozent von A zugeordnet v3 1 Prozent von B b4 wird 23 0 Prozent von A zugeordnet v4 In einem ersten Schritt werden die Daten normalisiert dargestellt b1 0 50 v1 0 025 v1 b1 0 05 b2 0 40 v2 0 475 v2 b2 1 188 b3 0 09 v3 0 270 v3 b3 3 b4 0 01 v4 0 230 v4 b4 23 Im zweiten Schritt wird der Gini Koeffizient berechnet Den Gini Ungleichverteilungskoeffizienten GUK erhalt man durch Auswertung einer Lorenz Kurve Damit tatsachlich eine Lorenz Kurve entsteht mussen gegebenenfalls die obigen Werte umsortiert werden Alle Werte Paare v i b i displaystyle v i b i nbsp mussen zunachst so vorsortiert werden dass gilt v i b i v i 1 b i 1 displaystyle frac v i b i geq frac v i 1 b i 1 nbsp Bei dem obigen Beispiel liegt schon die richtige Sortierung vor so dass nicht umsortiert werden muss Die gesuchte Lorenz Kurve entsteht wenn man xi yi Paare als Punkte in ein kartesisches Koordinatensystem eintragt und anschliessend benachbarte Punkte mit einer Geraden verbindet Die x i y i displaystyle x i y i nbsp Paare entstehen aus den v i b i displaystyle v i b i nbsp Paaren nach folgender Rechenvorschrift x n j 1 n b j und y n j 1 n v j displaystyle x n sum j 1 n b j quad text und quad y n sum j 1 n v j nbsp Im zweiten Schritt werden aus den Daten des ersten Schritts die nachfolgenden Daten durch Summation ermittelt wobei am Anfang 0 0 als fester Wert dazu kommt x0 0 00 y0 0 x1 0 50 y1 0 025 x2 0 90 y2 0 5 da 0 5 0 4 0 9 und 0 025 0 475 0 5 ist x3 0 99 y3 0 77 x4 1 00 y4 1 Bei totaler Gleichverteilung des Vermogens ist die Lorenz Kurve eine gerade Linie von Punkt 0 0 zu Punkt 1 1 Zur Bestimmung des Gini Koeffizienten werden zuerst zwei Grossen bestimmt die graphisch betrachtet Flachen sind Einmal die Flache unter der Gleichverteilungslinie nennen wir diese Grosse beispielsweise A Die zweite Flache ist die Flache unter der tatsachlichen Verteilungskurve nennen wir diese Grosse beispielsweise B Mit diesen beiden Grossen berechnet sich der Gini Ungleichverteilungskoeffizient wie folgt G U K A B A displaystyle mathrm GUK frac A B A nbsp nbsp B ist die dunkelgraue Flache A setzt sich aus der hell und der dunkelgrauen Flache zusammen Errechnen der y Werte der Lorenz Kurve der tatsachlichen Verteilung y0 0 000 y1 v1 0 025 y2 v1 v2 0 500 y3 v1 v2 v3 0 770 y4 v1 v2 v3 v4 1 000 Berechnung der Flache B unter der Lorenz Kurve der tatsachlichen Verteilung siehe unten y1 0 5 v1 b1 0 00625 y2 0 5 v2 b2 0 105 y3 0 5 v3 b3 0 05715 y4 0 5 v4 b4 0 00885 B 0 17725 Da eine normierte Darstellung verwendet wird verbindet die Kurve der totalen Gleichverteilung die Eckpunkte 0 0 und 1 1 miteinander Das Dreieck mit der Flache A betragt also 0 5 Darum gilt fur den Gini Ungleichverteilungskoeffizienten G U K A B A 0 5 B 0 5 1 2 B 1 0 354 5 0 645 5 displaystyle mathrm GUK frac A B A frac 0 5 B 0 5 1 2 cdot B 1 0 3545 0 6455 nbsp 5 Graphisch betrachtet ist der Gini Koeffizient das Verhaltnis der Flache zwischen Gleichverteilungslinie und Lorenzkurve A B zur Flache unterhalb der Gleichverteilungslinie A Erlauterung zur BerechnungDie gesamte Gini Flache ist ein Rechteck mit den Seiten v 1 v 2 v 3 v 4 displaystyle v 1 v 2 v 3 v 4 nbsp mal b 1 b 2 b 3 b 4 displaystyle b 1 b 2 b 3 b 4 nbsp Die Gini Flache einer Gleichverteilung ist die Halfte der gesamten Gini Flache Zur Berechnung der Flache unter der Kurve werden alle Einzelflachen addiert Nehmen wir beispielsweise b 2 displaystyle b 2 nbsp Voll anzurechnen ist das Rechteck mit der Hohe y 1 displaystyle y 1 nbsp und der Breite b 2 displaystyle b 2 nbsp d h von x 1 displaystyle x 1 nbsp bis x 2 displaystyle x 2 nbsp Von dem Rechteck das von der Hohe y 1 displaystyle y 1 nbsp bis zur Hohe y 2 displaystyle y 2 nbsp geht ist nur die Halfte zu nehmen da die andere Halfte oberhalb der Ginilinie nicht zur Gini Flache gehort Also ist Flache y 1 b 2 y 2 y 1 b 2 2 y 2 y 1 b 2 2 displaystyle text Flache y 1 cdot b 2 frac y 2 y 1 cdot b 2 2 frac y 2 y 1 cdot b 2 2 nbsp oder auch Flache y 2 v 2 2 b 2 displaystyle text Flache left y 2 frac v 2 2 right cdot b 2 nbsp Alternative Anschauung zur Flachenberechnung Die Einzelflache uber b 2 displaystyle b 2 nbsp ist die Differenz aus der Rechtecksflache die von den Punkten x1 y0 0 x2 y0 0 x2 y2 x1 y1 begrenzt wird Inhalt b 2 y 2 displaystyle b 2 cdot y 2 nbsp abzuglich der Flache des rechtwinkligen Dreiecks das von den Punkten x1 y1 x2 y1 x1 y2 begrenzt wird Inhalt b 2 v 2 2 displaystyle tfrac b 2 cdot v 2 2 nbsp mit gleichem Ergebnis Datenreduktion BearbeitenDer Gini Koeffizient ist ein statistisches Mass zur Berechnung der Ungleichheitsverteilung Solche Masse reduzieren prinzipiell einen mehr oder minder komplexeren Datensatz auf eine einfache Kennzahl Diese Kennzahl kann zu Fehlinterpretationen fuhren wenn sie nicht sachgemass verwendet wird nbsp Abbildung 1 Verschiedene Lorenzkurven gleicher Gini KoeffizientIm Fall des Gini Koeffizienten gibt es beispielsweise zu fast jeder Lorenzkurve mindestens eine andere Lorenzkurve mit exakt dem gleichen Gini Wert Diese erhalt man durch Spiegelung der ursprunglichen Lorenzkurve an der Linie die durch die Punkte 0 1 und 1 0 verlauft Wenn auf 50 50 die Mengen 10 90 zu verteilen sind ergibt dies die gleiche Lorenzkurve wie die Verteilung der Mengen von 50 50 auf 90 10 der Merkmalstrager Diese beiden Lorenzkurven sind in Abbildung 1 dargestellt Ausnahmen sind lediglich Lorenzkurven die von vornherein symmetrisch zu dieser Linie sind Fur die beiden unterschiedlichen Kurven ergibt sich ein gemeinsamer Gini Koeffizient von 0 4 6 Tatsachlich gibt es zu einem Gini Koeffizienten ausser bei absoluter Gleich oder absoluter Ungleichverteilung sogar unendlich viele mogliche Lorenzkurven In diesem Punkt gleicht der Gini Koeffizient jeder anderen Kennzahl die aus der Akkumulation einer grosseren Datenmenge abgeleitet ist Ungleichverteilungskennzahlen wie der Gini Koeffizient entstehen aus Aggregation von Daten mit dem Ziel Komplexitat zu reduzieren Der damit einhergehende Informationsverlust ist also keine unbeabsichtigte Nebenwirkung Fur Komplexitatsreduktionen gilt generell dass sie erst dann zu einem Nachteil werden wenn man ihr Zustandekommen und ihre Abbildungsfunktion vergisst Siehe auch Satz von Rothschild und StiglitzFehlerquelle bei Vergleichen BearbeitenAussagen in denen Ungleichheitskoeffizienten miteinander verglichen werden erfordern eine besonders kritische Uberprufung der Berechnung der einzelnen Koeffizienten Fur einen korrekten Vergleich ist es erforderlich dass diese Koeffizienten in allen Fallen einheitlich berechnet wurden Beispielsweise fuhrt die unterschiedliche Granularitat der Eingangsdaten zu unterschiedlichen Ergebnissen bei der Berechnung der Ungleichverteilung Ein mit wenigen Quantilen berechneter Gini Koeffizient zeigt in der Regel eine etwas geringere Ungleichverteilung an als ein mit mehr Quantilen berechneter Koeffizient weil im letzteren Fall dank hoherer Messauflosung die Ungleichverteilung berucksichtigt werden kann die innerhalb der Bereiche d h zwischen den Quantilen im ersten Fall wegen der groberen Messauflosung unausgewertet bleibt In einfachen Worten Eine hohere Auflosung der Daten liefert fast immer einen hoheren Gini Koeffizienten Siehe auch BearbeitenListe der Lander nach Einkommensverteilung Liste der Lander nach Vermogensverteilung Theil Index Hoover UngleichverteilungWeblinks BearbeitenTravis Hale University of Texas Inequality Project The Theoretical Basics of Popular Inequality Measures Theorie mit praktischen Beispielen MS Word 1 6 MB Beispiel 1B Rechner Ungleichverteilung online und herunterladbare Skripte und Macros fur Python Lua und OpenOffice org 2 0 Calc E Learning Video Lorenzkurve und Gini Koeffizient World Income Inequality Database der Universitat der Vereinten NationenEinzelnachweise Bearbeiten Eurostat Website Memento vom 4 Dezember 2016 im Internet Archive Leitfadenreihe zum Kreditrisiko Ratingmodelle und validierung Osterreichische Nationalbank und Finanzmarktaufsicht 2004 Archivlink Memento vom 4 Dezember 2011 im Internet Archive P J Lambert The Distribution and Redistribution of Income Manchester University Press 2001 S 31ff R Ochmann und A Peichl 2006 Measuring Distributional Effects of Fiscal Reforms Finanzwissenschaftliche Diskussionsbeitrage Nr 06 9 Finanzwissenschaftliches Forschungsinstitut an der Universitat zu Koln On Line Rechner Ungleichverteilung Vergleich www umverteilung de rechner quantiles 50 10 50 90 blaue Kurve und www umverteilung de rechner quantiles 90 50 10 50 rote Kurve Abgerufen von https de wikipedia org w index php title Gini Koeffizient amp oldid 238515890