www.wikidata.de-de.nina.az
Die totale Varianz nicht zu verwechseln mit der totalen Varianz die sich aus der totalen Quadratsumme berechnet ist in der multivariaten Statistik ein Mass fur die Gesamt streuung eines multivariaten mehrdimensionalen Datensatzes mit p displaystyle p Variablen X j displaystyle X j Ein weiteres Mass fur die Gesamtstreuung eines multivariaten Datensatzes ist die verallgemeinerte Varianz Inhaltsverzeichnis 1 Definition 2 Zusammenhang mit der Kovarianzmatrix 3 Literatur 4 EinzelnachweiseDefinition BearbeitenDie totale Varianz ist definiert als T j 1 p 1 n i 1 n x i j x j 2 1 n i 1 n j 1 p x i j x j 2 d 2 x i x displaystyle T sum j 1 p frac 1 n sum i 1 n x ij overline x j 2 frac 1 n sum i 1 n underbrace sum j 1 p x ij overline x j 2 d 2 x i overline x nbsp wobei x i j displaystyle x ij nbsp die i displaystyle i nbsp te Beobachtung in der Variable X j displaystyle X j nbsp x j displaystyle overline x j nbsp das arithmetische Mittel der Beobachtungen der Variablen X j displaystyle X j nbsp und d 2 x i x displaystyle d 2 x i overline x nbsp die quadrierte euklidische Distanz zwischen der multivariaten Beobachtung x i x i 1 x i p displaystyle x i x i1 ldots x ip nbsp und dem Mittelpunkt der Daten x x 1 x p displaystyle overline x overline x 1 ldots overline x p nbsp darstellt Sie ist damit eine Erweiterung der empirischen Varianz s 2 displaystyle s 2 nbsp einer Variablen auf den multivariaten Fall s 2 1 n i 1 n x i x 2 d 2 x i x displaystyle s 2 frac 1 n sum i 1 n underbrace x i overline x 2 d 2 x i overline x nbsp Eine wichtige Eigenschaft der totalen Varianz ist ihre Invarianz unter einer Rotation des Datensatzes d h die totale Varianz der rotierten Daten ist gleich der totalen Varianz der unrotierten Daten Dies gilt da die totale Varianz der mittlere Abstand der Beobachtung zum Datensatzmittelpunkt ist Zusammenhang mit der Kovarianzmatrix BearbeitenDie totale Varianz steht in einem engen Zusammenhang mit der Kovarianzmatrix der Daten welche ebenfalls als eine Verallgemeinerung der univariaten Varianz betrachtet werden kann aber von der gewahlten Basis abhangt Die totale Varianz ist dann gerade die Spur dieser Matrix sie ist also gleichzeitig die Summe der Eigenwerte der Kovarianzmatrix 1 Der Anteil der erklarten totalen Varianz wird daher in der Hauptkomponentenanalyse der Faktoranalyse und der Clusteranalyse als ein Mass benutzt ob die vorgenommene Datenreduktion den multivariaten Datensatz gut widerspiegelt Bei der Verwendung dieses Masses in der Clusteranalyse spricht man von einer internen Validierung da sie ohne zusatzliche externe Information auskommt Literatur BearbeitenLudwig Fahrmeir Wolfgang Brachinger Alfred Hamerle Gerhard Tutz Multivariate statistische Verfahren Gruyter 2 Auflage 1996Einzelnachweise Bearbeiten Alvin C Rencher Methods of multivariate analysis Vol 492 John Wiley amp Sons 2003 S 74 Abgerufen von https de wikipedia org w index php title Totale Varianz amp oldid 204131192