www.wikidata.de-de.nina.az
Die Artikel Schatzung der Varianz einer Schatzfunktion und Standardfehler uberschneiden sich thematisch Informationen die du hier suchst konnen sich also auch im anderen Artikel befinden Gerne kannst du dich an der betreffenden Redundanzdiskussion beteiligen oder direkt dabei helfen die Artikel zusammenzufuhren oder besser voneinander abzugrenzen Anleitung Der Standardfehler oder Stichprobenfehler ist ein Streuungsmass fur eine Schatzfunktion ϑ displaystyle hat vartheta fur einen unbekannten Parameter ϑ displaystyle vartheta der Grundgesamtheit Der Standardfehler ist definiert als die Standardabweichung s ϑ Var ϑ displaystyle sigma hat vartheta sqrt operatorname Var hat vartheta der Schatzfunktion ϑ displaystyle hat vartheta das heisst also die positive Quadratwurzel aus der Varianz 1 In den Naturwissenschaften und der Metrologie wird auch der durch den GUM gepragte Begriff Standardunsicherheit verwendet Bei einem erwartungstreuen Schatzer ist daher der Standardfehler ein Mass fur die durchschnittliche Abweichung des geschatzten Parameterwertes vom wahren Parameterwert Je kleiner der Standardfehler ist desto genauer kann der unbekannte Parameter mit Hilfe der Schatzfunktion geschatzt werden Der Standardfehler hangt unter anderem ab von dem Stichprobenumfang und der Varianz in der Grundgesamtheit Allgemein gilt Je grosser der Stichprobenumfang desto kleiner der Standardfehler je kleiner die Varianz desto kleiner der Standardfehler Eine wichtige Rolle spielt der Standardfehler auch bei der Berechnung von Schatzfehlern Konfidenzintervallen und Teststatistiken Inhaltsverzeichnis 1 Interpretation 2 Beispiel 3 Notation 4 Konfidenzintervalle und Tests 5 Standardfehler des arithmetischen Mittels 5 1 Herleitung 5 2 Schatzung von s 5 3 Beispiel 5 4 Endlich grosse Population 6 Standardfehler der Regressionskoeffizienten im einfachen Regressionsmodell 7 Zusammenhang mit der Log Likelihood 8 Siehe auch 9 EinzelnachweiseInterpretation BearbeitenDer Standardfehler liefert eine Aussage uber die Gute des geschatzten Parameters Je mehr Einzelwerte es gibt desto kleiner ist der Standardfehler und umso genauer kann der unbekannte Parameter geschatzt werden Der Standardfehler macht die gemessene Streuung Standardabweichung zweier Datensatze mit unterschiedlichen Stichprobenumfangen vergleichbar indem er die Standardabweichung auf den Stichprobenumfang normiert Wird mit Hilfe von mehreren Stichproben der unbekannte Parameter geschatzt so werden die Ergebnisse von Stichprobe zu Stichprobe variieren Naturlich stammt diese Variation nicht von einer Variation des unbekannten Parameters denn der ist fix sondern von Zufallseinflussen z B Messungenauigkeiten Der Standardfehler ist die Standardabweichung der geschatzten Parameter in vielen Stichproben Im Allgemeinen gilt Fur eine Halbierung des Standardfehlers ist eine Vervierfachung des Stichprobenumfangs notig Im Gegensatz dazu bildet die Standardabweichung die in einer Grundgesamtheit tatsachlich vorhandene Streuung ab die auch bei hochster Messgenauigkeit und unendlich vielen Einzelmessungen vorhanden ist z B bei Gewichtsverteilung Grossenverteilung Monatseinkommen Sie zeigt ob die Einzelwerte nahe beieinander liegen oder eine starke Spreizung der Daten vorliegt Beispiel BearbeitenAngenommen man untersucht die Grundgesamtheit von Kindern die Gymnasien besuchen hinsichtlich ihrer Intelligenzleistung Der unbekannte Parameter ist also die mittlere Intelligenzleistung der Kinder die ein Gymnasium besuchen Wenn nun zufallig aus dieser Grundgesamtheit eine Stichprobe des Umfanges n displaystyle n nbsp also mit n displaystyle n nbsp Kindern gezogen wird dann kann man aus allen n displaystyle n nbsp Messergebnissen den Mittelwert berechnen Wenn nun nach dieser Stichprobe noch eine weitere zufallig gezogene Stichprobe mit der gleichen Anzahl von n displaystyle n nbsp Kindern gezogen und deren Mittelwert ermittelt wird so werden die beiden Mittelwerte nicht exakt ubereinstimmen Zieht man noch eine Vielzahl weiterer zufalliger Stichproben des Umfanges n displaystyle n nbsp dann kann die Streuung aller empirisch ermittelten Mittelwerte um den Mittelwert der Grundgesamtheit ermittelt werden Diese Streuung ist der Standardfehler Da der Mittelwert der Stichprobenmittelwerte der beste Schatzer fur den Mittelwert der Grundgesamtheit ist entspricht der Standardfehler der Streuung der empirischen Mittelwerte um den Mittelwert der Grundgesamtheit Er bildet nicht die Intelligenzstreuung der Kinder sondern die Genauigkeit des errechneten Mittelwerts ab Notation BearbeitenFur den Standardfehler benutzt man verschiedene Bezeichnungen um ihn von der Standardabweichung s displaystyle sigma nbsp der Grundgesamtheit zu unterscheiden und um zu verdeutlichen dass es sich um die Streuung des geschatzten Parameters von Stichproben handelt s n displaystyle sigma n nbsp s ϑ displaystyle sigma hat vartheta nbsp oder s ϑ displaystyle sigma hat vartheta nbsp Konfidenzintervalle und Tests BearbeitenDer Standardfehler spielt auch eine wichtige Rolle bei Konfidenzintervallen und Tests Wenn die Schatzfunktion ϑ displaystyle hat vartheta nbsp erwartungstreu und zumindest approximativ normalverteilt N ϑ s 2 ϑ displaystyle mathcal N vartheta sigma 2 hat vartheta nbsp ist dann ist ϑ ϑ s ϑ N 0 1 displaystyle frac hat vartheta vartheta sigma hat vartheta approx mathcal N 0 1 nbsp Auf dieser Basis lassen sich 1 a displaystyle 1 alpha nbsp Konfidenzintervalle fur den unbekannten Parameter ϑ displaystyle vartheta nbsp angeben P ϑ z 1 a 2 s ϑ ϑ ϑ z 1 a 2 s ϑ 1 a displaystyle P hat vartheta z 1 alpha 2 sigma hat vartheta leq vartheta leq hat vartheta z 1 alpha 2 sigma hat vartheta 1 alpha nbsp bzw Tests formulieren z B ob der Parameter einen bestimmten Wert ϑ 0 displaystyle vartheta 0 nbsp annimmt H 0 ϑ ϑ 0 displaystyle H 0 vartheta vartheta 0 nbsp vs H 1 ϑ ϑ 0 displaystyle H 1 vartheta neq vartheta 0 nbsp und die Teststatistik ergibt sich zu V ϑ ϑ 0 s ϑ N 0 1 displaystyle V frac hat vartheta vartheta 0 sigma hat vartheta approx mathcal N 0 1 nbsp z 1 a 2 displaystyle z 1 alpha 2 nbsp ist das 1 a 2 displaystyle 1 alpha 2 nbsp Quantil der Standardnormalverteilung und sind auch der kritische Wert fur den formulierten Test In der Regel muss s ϑ displaystyle sigma hat vartheta nbsp aus der Stichprobe geschatzt werden so dass V ϑ ϑ 0 s ϑ t n 1 displaystyle V frac hat vartheta vartheta 0 hat sigma hat vartheta approx t n 1 nbsp gilt wobei n displaystyle n nbsp die Anzahl der Beobachtungen ist Fur n 30 displaystyle n geq 30 nbsp kann die t Verteilung durch die Standardnormalverteilung approximiert werden Standardfehler des arithmetischen Mittels BearbeitenDer Standardfehler des arithmetischen Mittels ist gleich s X s n displaystyle sigma overline X frac sigma sqrt n nbsp wobei s displaystyle sigma nbsp die Standardabweichung einer einzelnen Messung bezeichnet Der Standardfehler des Mittelwertes kann entweder mit obiger Formel und Schatzung von s displaystyle sigma nbsp berechnet werden oder direkt mithilfe des Bootstrapping Verfahrens oder der Jackknife Methode Herleitung Bearbeiten Der Mittelwert einer Stichprobe vom Umfang n displaystyle n nbsp ist definiert durch x 1 n i 1 n x i displaystyle overline x frac 1 n sum i 1 n x i nbsp Betrachtet man die Schatzfunktion X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i nbsp mit unabhangigen identisch verteilten Zufallsvariablen X 1 X n displaystyle X 1 ldots X n nbsp mit endlicher Varianz s 2 displaystyle sigma 2 nbsp so ist der Standardfehler definiert als die Wurzel aus der Varianz von X displaystyle overline X nbsp Man berechnet unter Verwendung der Rechenregeln fur Varianzen und der Gleichung von Bienayme s X 2 Var X Var 1 n i 1 n X i 1 n 2 Var i 1 n X i 1 n 2 i 1 n Var X i 1 n 2 n s 2 s 2 n displaystyle sigma overline X 2 operatorname Var left overline X right operatorname Var left frac 1 n sum i 1 n X i right frac 1 n 2 operatorname Var left sum i 1 n X i right frac 1 n 2 sum i 1 n operatorname Var left X i right frac 1 n 2 n sigma 2 frac sigma 2 n nbsp woraus die Formel fur den Standardfehler folgt Falls Var X i s i 2 displaystyle operatorname Var X i sigma i 2 nbsp gilt so folgt analog s X 2 1 n 2 i 1 n s i 2 displaystyle sigma overline X 2 frac 1 n 2 sum i 1 n sigma i 2 nbsp Schatzung von s Bearbeiten Da in den Standardfehler die Standardabweichung s displaystyle sigma nbsp der Grundgesamtheit eingeht muss fur eine Schatzung des Standardfehlers die Standardabweichung in der Grundgesamtheit mit einem moglichst erwartungstreuen Schatzer derselben geschatzt werden Unterstellt man eine Stichprobenverteilung so kann der Standardfehler anhand der Varianz der Stichprobenverteilung berechnet werden bei der Binomialverteilung mit Parametern N p displaystyle N p nbsp s x b i n o m N p 1 p n displaystyle sigma bar x mathrm binom frac sqrt N cdot p cdot 1 p sqrt n nbsp bei der Exponentialverteilung mit Parameter l displaystyle lambda nbsp Erwartungswert Standardabweichung 1 l displaystyle 1 lambda nbsp s x e x p 1 l n displaystyle sigma bar x mathrm exp frac 1 lambda sqrt n nbsp und bei der Poisson Verteilung mit Parameter l displaystyle lambda nbsp Erwartungswert Varianz l displaystyle lambda nbsp s x p o i s s o n l n displaystyle sigma bar x mathrm poisson sqrt frac lambda n nbsp Dabei bezeichnen s x b i n o m s x e x p s x p o i s s o n displaystyle sigma bar x mathrm binom sigma bar x mathrm exp sigma bar x mathrm poisson nbsp die Standardfehler der jeweiligen Verteilung und n displaystyle n nbsp den Stichprobenumfang Soll der Standardfehler fur den Mittelwert geschatzt werden dann wird die Varianz s 2 displaystyle sigma 2 nbsp mit der korrigierten Stichprobenvarianz geschatzt Beispiel Bearbeiten Fur die Eiscreme Daten 2 3 wurde fur den Pro Kopf Verbrauch von Eiscreme gemessen in Pint das arithmetische Mittel dessen Standardfehler und die Standardabweichung fur die Jahre 1951 1952 und 1953 berechnet Jahr Mittelwert Standardfehlerdes Mittelwerts Standard abweichung Anzahl derBeobachtungen1951 0 34680 0 01891 0 05980 101952 0 34954 0 01636 0 05899 131953 0 39586 0 03064 0 08106 7Fur die Jahre 1951 und 1952 sind die geschatzten Mittelwerte und Standardabweichungen sowie die Beobachtungszahlen etwa gleich Deswegen ergeben die geschatzten Standardfehler auch etwa den gleichen Wert Im Jahr 1953 sind zum einen die Beobachtungszahlen geringer als auch die Standardabweichung grosser Daher ist der Standardfehler fast doppelt so gross wie die Standardfehler aus den Jahren 1951 und 1952 nbsp 95 Schatzintervalle fur drei Jahre fur das arithmetische Mittel des Pro Kopf Eiscremeverbrauchs Die grafische Darstellung kann mittels eines Fehlerbalkendiagramms erfolgen Rechts werden die 95 Schatzintervalle fur die Jahre 1951 1952 und 1953 dargestellt Wenn die Stichprobenfunktion X displaystyle bar X nbsp zumindest approximativ normalverteilt ist dann sind die 95 Schatzintervalle gegeben durch x j 1 96 s j n j displaystyle bar x j pm 1 96 cdot s j sqrt n j nbsp mit j 1951 1952 1953 displaystyle j 1951 1952 1953 nbsp und x j displaystyle bar x j nbsp die Stichprobenmittelwerte und s j 2 displaystyle s j 2 nbsp die Stichprobenvarianzen Auch hier sieht man deutlich dass der Mittelwert 1953 ungenauer geschatzt werden kann als die Mittelwerte von 1951 und 1952 langerer Balken fur 1953 Endlich grosse Population Bearbeiten Bei einer endlich grossen Population mit Grosse N displaystyle N nbsp und Stichprobengrosse n displaystyle n nbsp ist die Varianz des geschatzten Mittelwertes 4 Var 1 n i X i 1 n 1 n N s 2 displaystyle operatorname Var left frac 1 n sum i X i right frac 1 n 1 frac n N sigma 2 nbsp Die Varianz des Mittelwert Schatzers ist somit Null wenn n N displaystyle n N nbsp Standardfehler der Regressionskoeffizienten im einfachen Regressionsmodell BearbeitenIm klassischen Regressionsmodell fur die einfache lineare Regression Y i b 0 b 1 x i e i displaystyle Y i beta 0 beta 1 x i varepsilon i nbsp wird vorausgesetzt dass die Storterme e i 0 s 2 displaystyle varepsilon i sim 0 sigma 2 nbsp normalverteilt sind die Storterme unabhangig sind und die Werte x i displaystyle x i nbsp fix sind also keine Zufallsvariablen wobei i 1 n displaystyle i 1 ldots n nbsp die gemachten Beobachtungen durchlauft Fur die Schatzfunktionen b 1 i x i x Y i Y i x i x 2 displaystyle hat beta 1 frac sum i x i overline x Y i overline Y sum i x i overline x 2 nbsp undb 0 Y b 1 x displaystyle hat beta 0 overline Y hat beta 1 overline x nbsp ergibt sich dann b 1 N b 1 s b 1 2 displaystyle hat beta 1 sim mathcal N beta 1 sigma hat beta 1 2 nbsp und b 0 N b 0 s b 0 2 displaystyle hat beta 0 sim mathcal N beta 0 sigma hat beta 0 2 nbsp Die Standardfehler der Regressionskoeffizienten ergeben sich zu s b 1 SD b 1 s 1 i 1 n x i x 2 a 1 s a 1 displaystyle sigma hat beta 1 operatorname SD hat beta 1 sigma sqrt underbrace frac 1 sum nolimits i 1 n x i overline x 2 a 1 sigma cdot sqrt a 1 nbsp und s b 0 SD b 0 s i 1 n x i 2 n i 1 n x i x 2 a 0 s a 0 displaystyle sigma hat beta 0 operatorname SD hat beta 0 sigma sqrt underbrace frac sum nolimits i 1 n x i 2 n sum nolimits i 1 n x i overline x 2 a 0 sigma cdot sqrt a 0 nbsp Beispiel Fur die Eiscreme Daten 2 3 wurde fur den Pro Kopf Verbrauch von Eiscreme gemessen in halbe Liter eine einfache lineare Regression mit der mittleren Wochentemperatur in Fahrenheit als unabhangige Variable durchgefuhrt Die Schatzung des Regressionsmodells ergab Pro Kopf Verbrauch 0 206 86 0 003 11 Temperatur displaystyle text Pro Kopf Verbrauch 0 20686 0 00311 cdot text Temperatur nbsp Modell Nicht standardisierte Koeffizienten StandardisierteKoeffizienten T Sig Regressionskoeffizienten StandardfehlerKonstante 0 20686 0 02470 8 375 0 000Temperatur 0 00311 0 00048 0 776 6 502 0 000Zwar ist der geschatzte Regressionskoeffizient fur die mittlere Wochentemperatur sehr klein jedoch ergab der geschatzte Standardfehler einen noch kleineren Wert Die Genauigkeit mit der der Regressionskoeffizient geschatzt wird ist gut 6 5 mal so klein wie der Koeffizient selbst Zusammenhang mit der Log Likelihood BearbeitenSiehe auch Schatzung der Varianz einer Schatzfunktion Der Ausdruck s 8 M L 1 2 8 2 ℓ 8 M L displaystyle sigma hat theta ML frac 1 sqrt frac partial 2 partial theta 2 ell hat theta ML nbsp wird auch als Standardfehler des Maximum Likelihood Schatzers bezeichnet wobei ℓ log L displaystyle ell cdot log mathcal L cdot nbsp die Log Likelihood Funktion und 2 8 2 ℓ 8 M L displaystyle frac partial 2 partial theta 2 ell hat theta ML nbsp die beobachtete Fisher Information darstellt die Fisher Information an der Stelle des ML Schatzers 8 M L displaystyle hat theta ML nbsp 5 Siehe auch BearbeitenStandardfehler der RegressionEinzelnachweise Bearbeiten Eric W Weisstein Standard Error Abgerufen am 7 November 2021 englisch a b Koteswara Rao Kadiyala 1970 Testing for the independence of regression disturbances In Econometrica 38 97 117 a b Eiscreme Daten In Data and Story Library abgerufen am 16 Februar 2010 Quenouille M 2014 Introductory Statistics Niederlande Elsevier Science https books google de books id anHiBQAAQBAJ amp pg PA208 Supplement Loglikelihood and Confidence Intervals Abgerufen am 14 Juli 2021 Abgerufen von https de wikipedia org w index php title Standardfehler amp oldid 236673499