www.wikidata.de-de.nina.az
Klasseneinteilung oder Klassierung bezeichnet in der Statistik die Einteilung von Merkmalswerten oder statistischen Reihen in getrennte Gruppen Klassen oder Grossenklassen Jedes Element der untersuchten Gesamtheit wird in Abhangigkeit von seinem Wert auf der entsprechenden Variablen genau einer Klasse zugeordnet Eine Klasseneinteilung ist bei zu grosser Anzahl verschiedener Werte einer beobachteten Zufallsvariablen hilfreich um praktikabel verarbeitet oder dargestellt zu werden Diese Art der Bearbeitung von Daten erfolgt auch wenn die erhobenen Werte nur als Naherung der wahren Werte anzusehen sind oder wenn quasi stetige Variablen mit Methoden fur diskrete Variablen untersucht werden sollen Alle Werte einer Klasse liegen innerhalb der oberen und unteren Klassengrenze wobei die Differenz der oberen und unteren Klassengrenze die Klassenbreite ist Die Klassenmitte stellt den zur weiteren Analyse genutzten reprasentativen Wert einer Klasse dar Die Klassenhaufigkeit oder Besetzungszahl 1 entspricht der Anzahl der in der Klasse enthaltenen Elemente Inhaltsverzeichnis 1 Klasse und Klassierung 2 Klassengrenze 3 Klassenbreite 4 Klassenmitte 5 Haufigkeitsdichte 6 Darstellung klassierter Variablen 7 Lageparameter 8 Siehe auch 9 EinzelnachweiseKlasse und Klassierung BearbeitenKlassen sind disjunkte d h nicht uberlappende aneinandergrenzende Intervalle von Merkmalswerten die durch eine untere und eine obere Klassengrenze begrenzt und eindeutig festgelegt sind Eine Klassierung ist eine Zusammenfassung von gleichen oder ahnlichen Merkmalsauspragungen zu einer Gruppe oder Klasse Da es bei statistischen Untersuchungen oft nicht moglich oder sinnvoll ist alle einzelnen verschiedenen Merkmalsauspragungen oder Realisierungen der untersuchten Zufallsvariablen zu erheben oder zu verarbeiten kann durch eine Klassierung eine bessere Ubersicht uber die Daten erreicht werden Das trifft insbesondere auf stetige oder quasi stetige Merkmale oder auf Merkmale deren Anzahl von unterschiedlichen Merkmalsauspragungen sehr gross ist zu Nachteil der Klassierung ist der Informationsverlust da die einzelnen Beobachtungswerte durch alleinige Betrachtung der Klassen verlorengehen und stattdessen nur reprasentative Grossen wie die Anzahl der in einer bestimmten Klasse enthaltenen Beobachtungen oder die Klassenmitte fur weitere Analysen zur Verfugung stehen Innerhalb einer Klasse sollten die Beobachtungen auf die Merkmalsauspragungen moglichst gleichverteilt sein d h die Auspragungen sollten sich nicht nur in einem begrenzten Bereich der Klasse haufen damit Klasse und Klassenbreite fur die enthaltenen Beobachtungen reprasentativ sind Klassengrenze BearbeitenEine Klassengrenze ist derjenige Wert einer metrisch skalierten Zufalls Variablen der eine Klasse nach unten oder oben begrenzt Eine Klasse j displaystyle j nbsp wird dabei durch zwei Klassengrenzen definiert die untere Klassengrenze x j u displaystyle x j u nbsp und die obere Klassengrenze x j o displaystyle x j o nbsp j 1 k displaystyle j 1 dots k nbsp wobei die obere Klassengrenze der j displaystyle j nbsp ten Klasse der unteren Klassengrenze der j 1 displaystyle j 1 nbsp ten Klasse entspricht d h x j o x j 1 u j 1 k 1 displaystyle x j o x j 1 u quad j 1 ldots k 1 nbsp Der Parameter k displaystyle k nbsp steht hier fur die Anzahl an Klassen Die Zuordnung der Klassengrenzen zu einer Klasse kann auf zwei Arten erfolgen Entweder gehort die untere Klassengrenze x j u displaystyle x j u nbsp zur Klasse j displaystyle j nbsp und die obere Klassengrenze x j o displaystyle x j o nbsp zur Klasse j 1 displaystyle j 1 nbsp oder die untere Klassengrenze x j u displaystyle x j u nbsp gehort zur Klasse j 1 displaystyle j 1 nbsp und die obere Klassengrenze x j o displaystyle x j o nbsp zur Klasse j displaystyle j nbsp d h x j u lt x x j o displaystyle x j u lt x leq x j o nbsp oder x j u x lt x j o j 1 k displaystyle x j u leq x lt x j o quad j 1 ldots k nbsp Das folgende Beispiel illustriert die beiden Alternativen der Klasseneinteilung j 1 bis 4 Bezeichnung Alternative 1 Alternative 2Klasse 1 lt 100 100Klasse 2 100 bis lt 120 gt 100 bis 120Klasse 3 120 bis lt 150 gt 120 bis 150Klasse 4 150 gt 150Ein Beobachtungswert bzw eine untersuchte statistische Einheit x i displaystyle x i nbsp i 1 n displaystyle i 1 dots n nbsp wird also Klasse j displaystyle j nbsp zugeordnet falls x j u x i lt x j o displaystyle x j u leq x i lt x j o nbsp oder x j u lt x i x j o j 1 k displaystyle x j u lt x i leq x j o j 1 ldots k nbsp gilt Fur die Klasse 2 in der Tabelle kann man das sprachlich folgendermassen formulieren Alternative 1 Der Wert betragt mindestens 100 und liegt unter 120 Alternative 2 Der Wert liegt uber 100 und betragt hochstens 120 Klassenbreite BearbeitenDie Klassenbreite ist die Differenz aus oberer und unterer Klassengrenze D x j x j o x j u j 1 k displaystyle Delta x j x j o x j u quad j 1 ldots k nbsp Im Beispiel von oben ergeben sich folgende Klassenbreiten Bezeichnung KlassenbreiteKlasse 1 unbestimmtKlasse 2 20Klasse 3 30Klasse 4 unbestimmtDabei konnen die Klassen eines Merkmals auch verschiedene Breiten aufweisen Die optimale Anzahl der Klassen bzw die Breite der Klassen hangt von der konkreten Untersuchungsituation Daten Ziele ab Einige Faustregeln zur Bestimmung der Anzahl der Klassen oder stattdessen der Klassenbreite finden sich im Artikel zum Histogramm Der Jenks Caspall Algorithmus stellt ein Verfahren zur automatischen Klassierung bereit Klassenmitte BearbeitenNach der Klassierung kann fur weitere Analysen die Klassenmitte x j displaystyle x j nbsp als reprasentativer Wert einer Klasse j displaystyle j nbsp genutzt werden Sie kann bei symmetrischer Verteilung der Elemente einer Klasse auf die enthaltenen Auspragungen bzw Werte in der jeweiligen Klasse als arithmetisches Mittel aus unterer und oberer Klassengrenze ermittelt werden x j x j u x j o 2 j 1 k displaystyle x j frac x j u x j o 2 quad j 1 ldots k nbsp Im Beispiel von oben ergeben sich folgende Klassenmitten Bezeichnung KlassenmitteKlasse 1 unbestimmtKlasse 2 110Klasse 3 135Klasse 4 unbestimmtHaufigkeitsdichte BearbeitenAls Beispiel wird das metrisch stetige Merkmal Nettojahreseinkommen einer wohldefinierten Grundgesamtheit von Personen untersucht Da die Anzahl der Personen mit steigendem Einkommen geringer wird wahlt man i d R die oberen Einkommensklassen breiter als die mittleren und unteren damit die Darstellung ubersichtlich bleibt Wird ein Merkmal in unterschiedlich breite Klassen eingeteilt ist die absolute oder relative Klassenhaufigkeit jedoch ohne Angabe der Klassenbreite wenig aussagekraftig Daher ist die Berechnung der Haufigkeitsdichte wichtig um die Klassen vergleichbar zu machen Sie entspricht der zur Klassenbreite und Klassenhaufigkeit gehorenden Saulenhohe in einem Histogramm Die Haufigkeitsdichte einer Klasse ist das Verhaltnis der absoluten oder der relativen Haufigkeit einer Klasse zur entsprechenden Klassenbreite Die Haufigkeitsdichte fur x j u X lt x j o displaystyle x j u leq X lt x j o nbsp ergibt sich damit wie folgt h x j h x j x j o x j u displaystyle widehat h left x j right frac h left x j right x j o x j u nbsp mit h x j displaystyle h left x j right nbsp die absolute Haufigkeit von Klasse j displaystyle j nbsp oder f x j f x j x j o x j u displaystyle widehat f left x j right frac f left x j right x j o x j u nbsp mit f x j displaystyle f left x j right nbsp die relative Haufigkeit von Klasse j displaystyle j nbsp Darstellung klassierter Variablen BearbeitenEine Moglichkeit der systematischen und ubersichtlichen Darstellung einer klassierten stetigen Zufallsvariablen bietet eine Haufigkeitstabelle Merkmalsklassen x j u X lt x j o displaystyle x j u leq X lt x j o nbsp absolute Haufigkeit h x j displaystyle h x j nbsp relative Haufigkeit f x j displaystyle f x j nbsp x 1 u x 1 o displaystyle x 1 u x 1 o nbsp h x 1 displaystyle h left x 1 right nbsp f x 1 displaystyle f left x 1 right nbsp x 2 u x 2 o displaystyle x 2 u x 2 o nbsp h x 2 displaystyle h left x 2 right nbsp f x 2 displaystyle f left x 2 right nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle vdots nbsp x j u x j o displaystyle x j u x j o nbsp h x j displaystyle h left x j right nbsp f x j displaystyle f left x j right nbsp displaystyle vdots nbsp displaystyle vdots nbsp displaystyle vdots nbsp x k u x k o displaystyle x k u x k o nbsp h x k displaystyle h left x k right nbsp f x k displaystyle f left x k right nbsp Summe n displaystyle n nbsp 1wobei n displaystyle n nbsp die Anzahl der Untersuchungsobjekte ist Fur die Darstellung mehrdimensionaler Haufigkeitsverteilungen konnen Kreuztabellen genutzt werden Die grafische Darstellung klassierter Variablen kann uber ein Histogramm ein Saulen oder Stabdiagramm ein Balkendiagramm oder bei sehr wenigen Klassen uber ein Tortendiagramm erfolgen Lageparameter BearbeitenDa bei einer Klassierung nur Intervalle aber keine exakten Werte vorliegen konnen fur die Lageparameter nur Intervalle und keine exakten Werte ermittelt werden Als Beispiel 2 wird hier die Anzahl der PKW pro tausend Einwohner in Europaischen Landern gewahlt Klassennr Zahl der PKW pro 1000 Zahl der Lander Haufigkeitsdichte1 uber 0 bis 200 5 0 0252 uber 200 bis 300 6 0 063 uber 300 bis 400 6 0 064 uber 400 bis 500 9 0 095 uber 500 bis 700 6 0 03Arithmetisches MittelUntergrenze 5 0 6 200 6 300 9 400 6 500 32 300 Obergrenze 5 200 6 300 6 400 9 500 6 700 32 434 375 Also 300 lt arithmetisches Mittel 434 375 Oder das arithmetische Mittel 367 1875 wobei der Fehler maximal 67 1875 betragen kann dd QuartileDas 1 Quartil liegt in der 2 Klasse also 200 lt 1 Quartil 300 Das 2 Quartil Median liegt in der 3 Klasse also 300 lt 2 Quartil 400 Das 3 Quartil liegt in der 4 Klasse also 400 lt 3 Quartil 500 dd ModusDa die konkrete Verteilung der Werte nicht bekannt ist kann nicht ermittelt werden welche Werte am haufigsten vorkommen also 0 lt Modus 700 dd ModalklasseDie Modalklasse ist die Klasse mit der hochsten Haufigkeitsdichte also die 4 Klasse mit der Haufigkeitsdichte 0 09 dd Hinweis Oft wird als Beispiel eine Haufigkeitsverteilung mit folgenden Zusatzannahmen genommen die Werte pro Klasse sind gleichverteilt d h benachbarte Werte haben den Abstand Klassenbreite Haufigkeit 1 Haufigkeitsdichte die Werte pro Klasse liegen symmetrisch zur Klassenmitte Daraus lassen sich mit Feinanalysen und geometrischen Betrachtungen z B Anwendung der Strahlensatze konkrete Werte fur die Lageparameter ermitteln Oder durch die beiden Annahmen wird eine eindeutige Urliste definiert Im Beispiel lasst sich folgende eindeutige Urliste erstellen eindeutige Urliste nach dem Beispiel Klassennr Zahl der PKW pro 1000 Zahl der Lander Eindeutige Urliste1 uber 0 bis 200 5 20 60 100 140 1802 uber 200 bis 300 6 208 33 225 241 67 258 33 275 291 673 uber 300 bis 400 6 308 33 325 341 67 358 33 375 391 674 uber 400 bis 500 9 405 56 416 67 427 78 438 89 450 461 11 472 22 483 33 494 445 uber 500 bis 700 6 516 67 550 583 33 616 67 650 683 33Aus dieser Liste ergeben sich dann die folgenden Werte Arithmetisches Mittel 5 100 6 250 6 350 9 450 6 600 32 367 1875 1 Quartil 241 67 258 33 2 250 2 Quartil Median 375 391 67 2 383 33 3 Quartil 472 22 483 33 2 477 78 Jeder Wert ist Modus da jeder Wert genau einmal vorkommtAus solcher eindeutigen Urliste lassen sich dann auch Streuungsparameter berechnen Siehe auch BearbeitenPartition Mengenlehre Einzelnachweise Bearbeiten Gunter Bamberg Franz Baur Michael Krapp Statistik 14 Auflage Oldenbourg 2008 S 14 Quelle nbsp Statistik Klassierung eines metrischen Merkmals mit vielen verschiedenen Auspragungen Wikibooks Abgerufen von https de wikipedia org w index php title Klasseneinteilung Statistik amp oldid 228960548