www.wikidata.de-de.nina.az
Mit Hilfe von multivariaten Verfahren auch multivariate Analysemethoden werden in der multivariaten Statistik mehrere statistische Variablen oder Zufallsvariablen zugleich untersucht Beispielsweise konnen fur Fahrzeuge die Variablen Anzahl der Sitze Gewicht Lange usw erhoben werden In der univariaten Analyse hingegen wird jede Variable einzeln analysiert Zusammenhangs bzw Abhangigkeitsstrukturen zwischen den Variablen z B grossere Anzahl von Sitzen bedingt ein grosseres Gewicht konnen nur mit einer multivariaten nicht aber mit einer univariaten Analyse erkannt werden Inhaltsverzeichnis 1 Gliederung 1 1 Strukturentdeckende Verfahren 1 2 Strukturprufende Verfahren 2 Grafische Darstellung 3 Beispiele 4 Literatur 5 Weblinks 6 EinzelnachweiseGliederung BearbeitenMultivariate Verfahren wollen im Wesentlichen die in einem Datensatz enthaltene Zahl der Variablen und oder Beobachtungen reduzieren ohne die darin enthaltene Information wesentlich einzuschranken Dazu wird die Zusammenhangs Struktur der Daten analysiert Entweder gibt man eine Struktur vor und pruft ob die Daten mit der vorgegebenen Struktur zusammenpassen Strukturprufende Verfahren Teil der induktiven Statistik oder man versucht die Struktur aus den Daten zu extrahieren Strukturentdeckende Verfahren Teil der explorativen Statistik Die klassischen Verfahren sind durchweg lineare Modelle die besondere Anforderungen an die verwendeten Daten stellen So sollten die Daten ausreisserfrei und nicht asymmetrisch verteilt sein Weichen die Daten von der geforderten Struktur ab behilft man sich beispielsweise indem man vorhandene Ausreisser entfernt oder die Daten einer nichtlinearen Transformation etwa dem Logarithmieren unterzieht Es existieren alternative Methoden die iterativ gewonnene Losungen ermoglichen Haufig verwendete Kriterien fur optimale Losungen sind Abstande zwischen Punkten in einem mehrdimensionalen Raum Erwahnenswert ist hier vor allem der Mahalanobis Abstand Varianzen die minimiert bzw maximiert werden Die Varianz dient in der Informationstheorie als Mass fur den Informationsgehalt von Daten Die manuelle Berechnung multivariater Verfahren ist meist sehr aufwandig Daher erfuhren diese Methoden erst mit der Entwicklung der EDV ihren Aufschwung Die Ergebnisse erlauben haufig keine Ruckschlusse auf zugrundeliegende Daten Beispielsweise konnen bei Ergebnissen nur wenige Angaben uber zugrundeliegende Wahrscheinlichkeitsverteilungen gemacht werden Strukturentdeckende Verfahren Bearbeiten Strukturentdeckende Verfahren sind z B die Faktorenanalyse Hauptkomponentenanalyse und die Korrespondenzanalyse zur Reduktion vieler Variablen auf wenige latente Konstrukte die Clusteranalyse zur Reduktion vieler Beobachtungen auf wenige Gruppen von Beobachtungen und die Multidimensionale Skalierung zur Berechnung niedrigdimensionaler Konfigurationen aus Distanzen oder Un Ahnlichkeiten zwischen Beobachtungen Strukturprufende Verfahren Bearbeiten Beispiele fur Strukturprufende VerfahrenSkalenniveau der unabhangige Variablenabhangige Variable Metrisch KategoriellMetrisch Multiple lineare Regression Varianzanalyse Dummy Variablen RegressionKategoriell Diskriminanzanalyse Logistische Regression Log lineares ModellIm Rahmen der Regressionsanalyse fur eine abhangige Variable und mehrere unabhangige Variablen werden verallgemeinerte lineare Modelle eingesetzt um den Skalenniveaus der abhangigen und unabhangigen Variablen Rechnung zu tragen Dazu gehoren z B die multiple lineare Regression die Logistische Regression Logit Modell und die Log linearen Modelle usw Weitere Strukturprufende Verfahren sind die Varianzanalyse die eigentlich Mittelwertsunterschiede zwischen verschiedenen Gruppen pruft die Konfirmatorische Faktorenanalyse die vorgegebene Zusammenfassungen von vielen Variablen zu wenigen latenten Konstrukten uberpruft die Strukturgleichungsmodelle die zusatzlich noch Regressionmodelle zwischen latenten Konstrukten zulasst die Kunstliche Neuronalen Netze die Diskriminanzanalyse und die Conjoint Analyse Grafische Darstellung Bearbeiten nbsp Karte von Charles Minards aus dem Jahre 1869 Diese zeigt den Verlust an Soldaten die Truppenbewegungen und die Temperaturen im Laufe von Napoleons Russlandfeldzug Lithographie 62 30 cm Fur die Darstellung mehrerer Variablen wurden eine ganze Reihe von speziellen Grafikdarstellungen entwickelt Eine der beruhmtesten fruhen multivariaten Grafiken ist die Karte von Charles Joseph Minard aus dem Jahre 1869 uber den Russlandfeldzug Napoleons Menschen konnen nicht mehr als drei Dimensionen sehen an einem Bildschirm in der Regel sogar nur zwei Dimensionen Hochdimensionale Daten konnen daher haufig nicht ohne Informationsverluste dargestellt werden Spezielle Darstellungsmethoden sind 3D Streudiagramm Streudiagramm Matrix englisch scatter plot matrix Chernoff oder Flury Gesichter Andrews Kurven Parallele Koordinaten Netzdiagramm Grand Tour nbsp 3D Streudiagramm nbsp Streudiagramm Matrix der Iris Daten nbsp Parallele Koordinaten Plot der Flohkafer Daten nbsp Chernoff oder Flury Gesichter Die Gesichtsmerkmale reprasentieren die nationalen Rekorde in verschiedenen Laufdisziplinen Jedes Gesicht entspricht einem Land 1 nbsp Andrews Kurven nbsp Grand Tour der Flohkafer Daten nbsp NetzdiagrammBeispiele BearbeitenBeispiele fur Verwendung von Multivariaten Verfahren Um psychologische Profile zu erstellen und aufgrund von Vergleichen herauszufinden wer der wahrscheinlichste Tater Sprecher Autor ist Kriminologie Sprachwissenschaft Um den Text eines anonymen Autors zu vergleichen mit Texten von bekannten Autoren und den wahrscheinlichsten Autor zu finden eine Spielart des zuerst genannten Punktes Data Mining Grosse Datenmengen in Datenbanken werden auf unbekannte Strukturen hin analysiert Man erhofft sich hier Erkenntnisse uber das Zusammenwirken verschiedener Aspekte beispielsweise die Konsumausgaben von Kunden in Abhangigkeit vom sozialen Status durch Herausfinden von Ahnlichkeitsstrukturen Entwicklung von sozialen Abstimmungsprozessen Politische Soziologie und der Einfluss einzelner Akteure darauf Bonitatsprufungen von Schuldnern Diskriminanzanalyse Bei der Wertpapieranalyse Welche Unternehmenszahlen beeinflussen hauptsachlich die Ertragskraft eines Unternehmens Faktorenanalyse Bei der Suche nach Ursachen fur die Eiszeiten Faktorenanalyse In der Radioastronomie fur die Signalanalyse bei SETI 2 Fur die Analyse von Peak formigen Daten eignet sich das Indirect Hard Modeling Verfahren Literatur BearbeitenH Ahrens Jurgen Lauter Mehrdimensionale Varianzanalyse Akademie Verlag Berlin 1974 P Atteslander J Cromm B Grabow Methoden der empirischen Sozialforschung 11 Auflage Gruyter Verlag 2006 ISBN 3 503 09740 6 Grundlagenwissen Klaus Backhaus B Erichson R Plinke Multivariate Analysemethoden Eine anwendungsorientierte Einfuhrung 11 Auflage Springer Berlin 2006 ISBN 3 540 27870 2 A P M Coxon P M Davies The User s Guide to Multidimensional Scaling Heinemann Educational Books London 1982 ISBN 0 435 82251 9 und ISBN 0 435 82252 7 F Daly u a Elements of Statistics FT Prentice Hall Harlow 1994 ISBN 0 201 42278 6 L Fahrmeir G Tutz Multivariate Statistical Modelling Based on Generalized Linear Models 2 Auflage Springer New York 2001 ISBN 0 387 95187 3 A Handl T Kuhlenkasper Multivariate Analysemethoden Theorie und Praxis mit R 3 Auflage Springer Berlin 2017 ISBN 978 3 662 54753 3 W J Krzanowski Principles of Multivariate Analysis Oxford University Press 2000 K V Mardia J T Kent J M Bibby Multivariate Analysis Probability and Mathematical Statistics Elsevier 2006 ISBN 0 12 471252 5 B Tabachnick L Fidell Using Multivariate Statistics 5 Auflage Allyn amp Bacon Boston 2006 ISBN 0 205 45938 2 Weblinks BearbeitenIrene Rossler Albrecht Ungerer Formelsammlung zu den multivariaten Verfahren PDF 1 86 MB Data Science Textbook TIBCO Software Inc 2020 englisch sehr umfangreiche Darstellung der wichtigsten Multivariaten AnalyseverfahrenEinzelnachweise Bearbeiten Studentische Arbeit der HU Berlin KLT optimized telecomunications In Claudio Maccone Deep space flight and communications Springer Berlin 2009 ISBN 978 3 540 72942 6 S 149 248 Innovative SETI by the KLT PDF abgerufen am 7 Juli 2010Normdaten Sachbegriff GND 4040708 1 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Multivariate Verfahren amp oldid 235715724