www.wikidata.de-de.nina.az
In der Statistik gibt die Anzahl der Freiheitsgrade englisch number of degrees of freedom kurz df oder dof an wie viele Werte in einer Berechnungsformel genauer Statistik frei variieren durfen Schatzungen statistischer Parameter konnen auf unterschiedlichen Mengen an Informationen oder Daten basieren Die Anzahl unabhangiger Information die in die Schatzung eines Parameters einfliessen wird als Anzahl der Freiheitsgrade bezeichnet Im Allgemeinen sind die Freiheitsgrade einer Schatzung eines Parameters gleich der Anzahl unabhangiger Einzelinformationen die in die Schatzung einfliessen abzuglich der Anzahl der zu schatzenden Parameter die als Zwischenschritte bei der Schatzung des Parameters selbst verwendet werden Beispielsweise fliessen n displaystyle n Werte in die Berechnung der Stichprobenvarianz ein Dennoch lautet die Anzahl der Freiheitsgrade n 1 displaystyle n 1 da als Zwischenschritt der Mittelwert geschatzt wird und somit ein Freiheitsgrad verloren geht Inhaltsverzeichnis 1 Definition 2 Beispiele 2 1 Beim Erwartungswert der Residuenquadratsumme 2 2 Bei der empirischen Varianz 2 3 Anzahl der Freiheitsgrade von wichtigen Quadratsummen 3 Freiheitsgrade als Parameter von Verteilungen 4 EinzelnachweiseDefinition BearbeitenDie Anzahl n displaystyle n nbsp der unabhangigen Beobachtungswerte abzuglich der Anzahl der schatzbaren Parameter p displaystyle p nbsp wird als Anzahl der Freiheitsgrade f g displaystyle fg nbsp bezeichnet Da es in einem multiplen linearen Regressionsmodell p k 1 displaystyle p k 1 nbsp Parameter mit k displaystyle k nbsp Steigungsparametern b 1 b 2 b k displaystyle beta 1 beta 2 ldots beta k nbsp und einem Niveauparameter b 0 displaystyle beta 0 nbsp gibt kann man schreiben f g n p n k 1 A n z a h l d e r B e o b a c h t u n g e n A n z a h l d e r g e s c h a t z t e n P a r a m e t e r displaystyle fg n p n k 1 mathrm Anzahl der Beobachtungen mathrm Anzahl der gesch ddot a tzten Parameter nbsp Die Freiheitsgrade kann man auch als Anzahl der uberflussigen Messungen interpretieren die nicht zur Bestimmung der Parameter benotigt werden 1 Die Freiheitsgrade werden bei der Schatzung von Varianzen benotigt Ausserdem sind verschiedene Wahrscheinlichkeitsverteilungen mit denen anhand der Stichprobe Hypothesentests durchgefuhrt werden von den Freiheitsgraden abhangig Beispiele BearbeitenBeim Erwartungswert der Residuenquadratsumme Bearbeiten Fur die Schatzung der Storgrossenvarianz wird die Residuenquadratsumme R S S i 1 n e i 2 e e displaystyle mathrm RSS sum i 1 n hat varepsilon i 2 hat boldsymbol varepsilon top hat boldsymbol varepsilon nbsp benotigt Der erwartungstreue Schatzer fur die Storgrossenvarianz ist im multiplen linearen Regressionsmodell s 2 y X b y X b n p e e n p displaystyle hat sigma 2 frac left mathbf y mathbf X mathbf b right top left mathbf y mathbf X mathbf b right n p frac hat boldsymbol varepsilon top hat boldsymbol varepsilon n p nbsp da E s 2 s 2 displaystyle operatorname E hat sigma 2 sigma 2 nbsp Die Residuenquadratsumme hat n p displaystyle n p nbsp Freiheitsgrade entsprechend der Anzahl der unabhangigen Residuen Der Erwartungswert der Residuenquadratsumme ist aufgrund der Formel fur die erwartungstreue Storgrossenvarianz gegeben durch E s 2 s 2 E e e n p s 2 displaystyle operatorname E hat sigma 2 sigma 2 Longleftrightarrow operatorname E hat boldsymbol varepsilon top hat boldsymbol varepsilon n p sigma 2 nbsp Um intuitiv herausfinden zu konnen warum die Anpassung der Freiheitsgrade notwendig ist kann man die Bedingungen erster Ordnung fur die KQ Schatzer betrachten Diese konnen als i 1 n e i 0 displaystyle textstyle sum nolimits i 1 n hat varepsilon i 0 nbsp und i 1 n x i j e i 0 j 1 k displaystyle textstyle sum nolimits i 1 n x ij hat varepsilon i 0 j 1 ldots k nbsp ausgedruckt werden Beim Erhalten der KQ Schatzer werden somit den KQ Residuen k 1 displaystyle k 1 nbsp Restriktionen auferlegt Dies bedeutet dass bei gegebenen n k 1 displaystyle n k 1 nbsp Residuen die verbleibenden k 1 displaystyle k 1 nbsp Residuen bekannt sind In den Residuen gibt es folglich nur n k 1 displaystyle n k 1 nbsp Freiheitsgrade Im Gegensatz dazu gibt es in den wahren Storgrossen e i displaystyle varepsilon i nbsp n Freiheitsgrade in der Stichprobe Eine verzerrte Schatzung die nicht die Anzahl der Freiheitsgrade berucksichtigt ist die Grosses 2 1 n i 1 n e i 2 e e n displaystyle hat sigma 2 frac 1 n sum i 1 n hat e i 2 frac hat boldsymbol varepsilon top hat boldsymbol varepsilon n nbsp Den Schatzer bekommt man bei Anwendung der Maximum Likelihood Schatzung Bei der empirischen Varianz Bearbeiten Fur eine erwartungstreue Schatzung der Varianz der Grundgesamtheit wird die Quadratsumme von X displaystyle X nbsp durch die Anzahl der Freiheitsgrade geteilt und man erhalt die Stichprobenvarianz Schatzfunktion S 2 1 n 1 i 1 n X i X 2 displaystyle S 2 frac 1 n 1 sum i 1 n X i overline X 2 nbsp Da diese Varianz erwartungstreu ist gilt fur sie E S 2 s 2 displaystyle operatorname E S 2 sigma 2 nbsp Das empirische Pendant zu dieser Varianz ist die empirische Varianz s 2 1 n 1 i 1 n x i x 2 displaystyle s 2 frac 1 n 1 sum limits i 1 n left x i overline x right 2 nbsp Intuitiv lasst sich bei der empirischen Varianz die Mittelung durch n 1 displaystyle n 1 nbsp statt durch n displaystyle n nbsp bei der modifizierten Form der empirischen Varianz wie folgt erklaren Aufgrund der Schwerpunkteigenschaft des empirischen Mittels i 1 n x i x 0 displaystyle sum nolimits i 1 n left x i bar x right 0 nbsp ist die letzte Abweichung x n x displaystyle left x n overline x right nbsp bereits durch die ersten n 1 displaystyle n 1 nbsp bestimmt Folglich variieren nur n 1 displaystyle n 1 nbsp Abweichungen frei und man mittelt deshalb indem man durch die Anzahl der Freiheitsgrade n 1 displaystyle n 1 nbsp dividiert 2 Anzahl der Freiheitsgrade von wichtigen Quadratsummen Bearbeiten Die folgende Tafel der Varianzanalyse zeigt die Anzahl der Freiheitsgrade einiger wichtiger Quadratsummen im multiplen linearen Regressionsmodell y i b 0 x i 1 b 1 x i 2 b 2 x i k b k e i i 1 n displaystyle y i beta 0 x i1 beta 1 x i2 beta 2 dotsc x ik beta k varepsilon i quad i 1 ldots n nbsp 3 Variationsquelle Abweichungsquadratsummen Anzahl der Freiheitsgrade mittlere AbweichungsquadrateRegression i 1 n y i y 2 displaystyle displaystyle sum nolimits i 1 n hat y i overline hat y 2 nbsp k displaystyle k nbsp Residual i 1 n y i y i 2 displaystyle displaystyle sum nolimits i 1 n left y i hat y i right 2 nbsp n p displaystyle n p nbsp i 1 n y i y i 2 n p s 2 displaystyle displaystyle sum nolimits i 1 n left y i hat y i right 2 n p hat sigma 2 nbsp Total i 1 n y i y 2 displaystyle displaystyle sum nolimits i 1 n left y i overline y right 2 nbsp n 1 displaystyle n 1 nbsp i 1 n y i y 2 n 1 s y 2 displaystyle displaystyle sum nolimits i 1 n left y i overline y right 2 n 1 s y 2 nbsp Diese Quadratsummen spielen bei der Berechnung des Bestimmtheitsmasses eine grosse Rolle Freiheitsgrade als Parameter von Verteilungen BearbeitenDie Anzahl der Freiheitsgrade ist auch Parameter mehrerer Verteilungen Wenn die Beobachtungen normalverteilt sind dann folgt der Quotient aus der Residuenquadratsumme RSS displaystyle text RSS nbsp und der Storgrossenvarianz s 2 displaystyle sigma 2 nbsp einer Chi Quadrat Verteilung mit n p displaystyle n p nbsp Freiheitsgraden RSS s 2 e e s 2 e I n X X X 1 X e s 2 x 2 n p displaystyle frac text RSS sigma 2 frac hat boldsymbol varepsilon top hat boldsymbol varepsilon sigma 2 frac boldsymbol varepsilon top left mathbf I n mathbf X mathbf X top mathbf X 1 mathbf X top right boldsymbol varepsilon sigma 2 sim chi 2 n p nbsp Die Grosse RSS s 2 displaystyle text RSS sigma 2 nbsp folgt einer Chi Quadrat Verteilung mit n p displaystyle n p nbsp Freiheitsgraden weil die Anzahl der Freiheitsgrade der Chi Quadrat Verteilung der Spur der Projektionsmatrix I n X X X 1 X displaystyle left mathbf I n mathbf X mathbf X top mathbf X 1 mathbf X top right nbsp entspricht also e I X X X 1 X e s 2 x 2 Spur I n X X X 1 X displaystyle frac boldsymbol varepsilon top left mathbf I mathbf X mathbf X top mathbf X 1 mathbf X top right boldsymbol varepsilon sigma 2 sim chi 2 operatorname Spur left mathbf I n mathbf X mathbf X top mathbf X 1 mathbf X top right nbsp Fur die Spur von I n X X X 1 X displaystyle left mathbf I n mathbf X mathbf X top mathbf X 1 mathbf X top right nbsp gilt Spur I n X X X 1 X n p displaystyle operatorname Spur left mathbf I n mathbf X mathbf X top mathbf X 1 mathbf X top right n p nbsp Weitere von der Anzahl der Freiheitsgrade abhangige Verteilungen sind die t Verteilung und die F Verteilung Diese Verteilungen werden fur die Schatzung von Konfidenzintervallen der Parameter und fur Hypothesentests benotigt 4 Eine weitere wichtige Grosse die fur die statistische Inferenz benotigt wird und deren Verteilung von Freiheitsgraden abhangt ist die t Statistik Man kann zeigen dass die Grosse R 1 b R 1 b s 2 R 1 X X 1 R 1 n p s 2 s 2 n p N 0 1 x n 2 n H 0 t n p displaystyle frac frac boldsymbol R 1 boldsymbol hat beta boldsymbol R 1 boldsymbol beta sqrt sigma 2 boldsymbol R 1 mathbf X top mathbf X 1 boldsymbol R 1 top sqrt frac n p hat sigma 2 sigma 2 n p frac mathcal N 0 1 sqrt frac chi n 2 n stackrel H 0 sim mathcal t n p nbsp einer t Verteilung mit t k displaystyle t k nbsp Freiheitsgraden folgt siehe Testen allgemeiner linearer Hypothesen Einzelnachweise Bearbeiten Berhold Witte Hubert Schmidt Vermessungskunde und Grundlagen der Statistik fur das Bauwesen 2 Auflage Wittwer Stuttgart 1989 ISBN 3 87919 149 2 S 59 Fahrmeir L Kunstler R Pigeot I Tutz G Statistik Der Weg zur Datenanalyse 8 Auflage S 65 William H Greene Econometric Analysis 5 Auflage Prentice Hall International 2002 ISBN 0 13 110849 2 S 33 Karl Rudolf Koch Parameterschatzung und Hypothesentests 3 Auflage Dummler Bonn 1997 ISBN 3 427 78923 3 Abgerufen von https de wikipedia org w index php title Anzahl der Freiheitsgrade Statistik amp oldid 232793435