www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Ein Streudiagramm auch Punktwolke genannt engl scatter plot ist die graphische Darstellung von beobachteten Wertepaaren zweier statistischer Merkmale Diese Wertepaare werden in ein kartesisches Koordinatensystem eingetragen wodurch sich eine Punktwolke ergibt Die Darstellung der Punkte kann durch verschiedene Symbole erfolgen Beispiel eines Streudiagramms in dem die Lange und Breite von verschiedenen Artillerieschiffen dargestellt ist Inhaltsverzeichnis 1 Anwendung 2 Bei diskreten Merkmalen 3 Dot Plot 4 Streudiagramm Matrix 5 Siehe auch 6 WeblinksAnwendung BearbeitenMan erhofft sich durch das Muster der Punkte im Streudiagramm Informationen uber die Abhangigkeitsstruktur der beiden Merkmale zu erhalten die durch die Koordinaten reprasentiert sind Nebenstehendes Beispieldiagramm enthalt Punkte die die beiden Merkmale Lange und Breite von verschiedenen Artillerieschiffen darstellen Die Schiffe sind in vier Klassen eingeteilt denen unterschiedliche Farben zugewiesen sind Zerstorer leichter Kreuzer schwerer Kreuzer Schlachtschiff Man erkennt durch ein solches Streudiagramm auf einen Blick verschiedene Korrelationen in den erfassten Daten Haufig auftretende Korrelationen sind Cluster Ballungen und lineare Strukturen Cluster konnen mit der Clusteranalyse untersucht werden Zur Quantifizierung von linearen Korrelationen bietet sich vor allem die Regressionsanalyse an Falls ein drittes metrisches Merkmal auch noch mit dargestellt werden soll kann das durch die Grosse der Symbole geschehen Den dabei entstehenden Diagrammtyp nennt man Blasendiagramm Bei diskreten Merkmalen BearbeitenIm Allgemeinen sind nur stetig verteilte Daten fur Streudiagramme geeignet Beobachtungen diskret verteilter Merkmale uberlagern sich wenn gleiche Werte mehrfach vorliegen Es gibt jedoch auch Moglichkeiten ordinalskalierte Merkmale in Streudiagramme darzustellen durch Sonnenblumen an jedem Koordinatenpaar wird ein Kreis eingetragen Die Zahl der Wertepaare die auf diesem Punkt liegen wird durch Striche an den Kreis dargestellt so dass sich eine stilisierte Sonnenblume ergibt durch einen Jittered Scatterplot Verwackeltes Streudiagramm auf die Daten werden kleine Zufallszahlen addiert so dass die Werte leicht auseinandergezogen werden und eine Punktwolke ergeben Allerdings liegen die Werte eigentlich ubereinander Man konnte sie als pseudometrisch bezeichnen Das folgende Beispiel zeigt beide Moglichkeiten anhand der Evaluation einer Statistik Vorlesung bei der die Merkmale Stoff ist verstandlich und Gesamtnote Statistik Noten von 1 bis 4 in ein Streudiagramm eingetragen wurden Sonnenblumen Streudiagramm Jittered scatter plot nbsp nbsp Dot Plot Bearbeiten nbsp nbsp Der Dot Plot bzw das Punktdiagramm wird auch als eindimensionales Streudiagramm bezeichnet In ihm wird eine Variable entweder auf der x Achse oder auf der y Achse wie in den Grafiken dargestellt Je nachdem wie viele Werte die Beobachtungen der Variablen annehmen ergibt sich das Problem dass man nur einen Datenpunkt sieht obwohl sich hinter ihm viele weitere Beobachtungen verbergen konnen Ahnlich wie beim Sonnenblumen Streudiagramm konnen Symbole auf unterschiedliche Weisen genutzt werden um die Anzahl der Punkte darzustellen Dies soll an einem historischen Beispiel erlautert werden Pferdetritt Daten von Bortkewitsch In der Grafik links symbolisiert ein grosserer Kreis dass sich hinter ihm mehr Beobachtungen verbergen als bei einem kleineren Kreis Blasendiagramm In der Grafik rechts wird fur jeden Datenpunkt ein Kreis gezeichnet tritt der gleiche Wert mehrfach auf werden rechts neben dem ersten Kreis weitere Kreise gezeichnet Eine weitere Moglichkeit ist auf der einen Achse den Beobachtungswert zu zeichnen und fur die andere Achse einen zufalligen z B aus einer Gleichverteilung stammenden Wert zu wahlen Auch kann man eine Dichteschatzung einzeichnen Der Dotplot erlaubt Einblicke in die Verteilung einer Variablen z B wo die Beobachtungen besonders dicht sind oder sich die Beobachtungen auf nur wenige Werte verteilen Streudiagramm Matrix Bearbeiten nbsp Streudiagramm Matrix eines Datensatzes mit funf VariablenIn der Streudiagramm Matrix eines multivariaten Datensatzes werden fur einzelne Paare von Variablen jeweils zwei Streudiagramme gezeichnet die auf beiden Seiten oben rechts unten links der mit Text gefullten Matrix Diagonalen liegen Dabei unterscheiden sich die beiden Streudiagramme die zu einem Variablenpaar gehoren nur dadurch welche Variable auf die x Achse bzw auf die y Achse abgebildet wird D h die entsprechenden Punktwolken auf beiden Seiten der Matrix Diagonalen sind gespiegelt aber nicht an der o g Diagonalen sondern an ihren jeweiligen x y Linien die alle senkrecht auf der Matrix Diagonalen stehen In Variationen der Streudiagramm Matrix werden statt der gespiegelten Punktwolken auch weitere Informationen dargestellt z B Korrelationskoeffizienten oder Regressionsfunktionen Auf der Diagonalen sind in der Grafik rechts nur die Variablennamen eingetragen Es gibt jedoch auch hier Variationen z B mit weiteren Informationen Box Plots Dichteschatzungen uber die jeweilige Variable Die Streudiagramm Matrix hat einige Nachteile Die Anzahl der dargestellten Variablen sollte nicht zu gross werden da sonst die Flache fur jedes Streudiagramm zu klein und damit unubersichtlich wird Die Streudiagramm Matrix zeigt namlich bei p displaystyle p nbsp Variablen genau p p 1 2 displaystyle p p 1 2 nbsp unterschiedliche Projektionen der multivariaten Daten gespiegelte Darstellungen wie oben beschrieben nicht mitgezahlt Im dargestellten Beispiel ist p 5 displaystyle p 5 nbsp und daher die Anzahl der unterschiedlichen Projektionen 5 4 2 10 displaystyle tfrac 5 cdot 4 2 10 nbsp Die Bruder Tukey haben daher Masszahlen vorgeschlagen zusammenfassend mit Scagnostics bezeichnet welche die Eigenschaft der Punktwolke charakterisieren Eine interessante Datenstruktur muss nicht in den Projektionen der Streudiagramm Matrix sichtbar sein Dann sollte man entweder auf die Grand Tour oder Projection Pursuit Verfahren zuruckgreifen Siehe auch BearbeitenStreudiagrammglattung h StreudiagrammWeblinks Bearbeiten nbsp Wiktionary Streudiagramm Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen nbsp Commons Streudiagramme Sammlung von Bildern Videos und Audiodateien Abgerufen von https de wikipedia org w index php title Streudiagramm amp oldid 224305523