www.wikidata.de-de.nina.az
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen beispielsweise Einzelnachweisen ausgestattet Angaben ohne ausreichenden Beleg konnten demnachst entfernt werden Bitte hilf Wikipedia indem du die Angaben recherchierst und gute Belege einfugst Eine Schatzfunktion auch Schatzstatistik oder kurz Schatzer dient in der mathematischen Statistik dazu aufgrund von vorhandenen empirischen Daten einer Stichprobe einen Schatzwert zu ermitteln und dadurch Informationen uber unbekannte Parameter einer Grundgesamtheit zu erhalten Schatzfunktionen sind die Basis zur Berechnung von Punktschatzungen und zur Bestimmung von Konfidenzintervallen mittels Bereichsschatzern und werden als Teststatistiken in Hypothesentests verwendet Sie sind spezielle Stichprobenfunktionen und konnen durch Schatzverfahren z B die Kleinste Quadrate Schatzung die Maximum Likelihood Schatzung oder die Momentenmethode bestimmt werden Im Rahmen der Entscheidungstheorie konnen Schatzfunktionen auch als Entscheidungsfunktionen bei Entscheidungen unter Unsicherheit betrachtet werden Inhaltsverzeichnis 1 Formale Definition 1 1 Beispiel 2 Grundkonzepte Stichprobenvariablen und funktionen 2 1 Stichprobenvariable 2 2 Stichprobenfunktion 2 3 Stichprobenverteilung 2 4 Berechnung der Stichprobenverteilung 2 5 Bootstrap Stichprobenverteilungen 2 6 Beispiele 2 6 1 Beispiel 1 2 6 2 Beispiel 2 2 6 3 Beispiel 3 3 Schatzfunktionen 3 1 Grundgedanke und Konzept der Schatzfunktion 3 2 Formale Definition der Schatzfunktion 4 Ausgewahlte Schatzfunktionen 4 1 Schatzfunktionen und Schatzwert fur den Mittelwert 4 2 Schatzfunktionen und Schatzwert fur die Varianz 4 3 Schatzfunktionen und Schatzwert fur den Anteilswert 5 Verteilung der Schatzfunktionen 6 Gutekriterien von Schatzfunktionen 6 1 Erwartungstreue 6 2 Konsistenz 6 3 Minimale Varianz Effizienz 6 4 Mittlerer quadratischer Fehler 7 Literatur 8 Weblinks 9 EinzelnachweiseFormale Definition BearbeitenEs sei T n h X 1 X n displaystyle T n h X 1 dots X n nbsp eine reellwertige Stichprobenfunktion oder Statistik basierend auf einer Zufallsstichprobe X 1 X n displaystyle X 1 dots X n nbsp aus einer Wahrscheinlichkeitsverteilung mit einem unbekannten skalaren Parameter 8 displaystyle theta nbsp Wenn die Stichprobenfunktion T n displaystyle T n nbsp verwendet wird um statistische Inferenz bzgl 8 displaystyle theta nbsp durchzufuhren heisst sie Schatzfunktion oder Schatzer fur den Parameter 8 displaystyle theta nbsp Der konkrete Wert t n h x 1 x n displaystyle t n h x 1 dots x n nbsp den ein Schatzer fur eine Realisierung x 1 x n displaystyle x 1 dots x n nbsp der Zufallsstichprobe X 1 X n displaystyle X 1 dots X n nbsp annimmt wird als Schatzwert fur den Parameter 8 displaystyle theta nbsp bezeichnet 1 Falls der Stichprobenumfang n displaystyle n nbsp nicht relevant ist schreibt man auch T displaystyle T nbsp statt T n displaystyle T n nbsp und t displaystyle t nbsp statt t n displaystyle t n nbsp Der Begriff Schatzung ist nicht eindeutig er bezeichnet teils das Verfahren zur Ermittlung eines Schatzers teils die Durchfuhrung des Verfahrens zur Ermittlung eines Schatzwertes und teils einen Schatzwert Beispiel Bearbeiten Die Zufallsvariablen X 1 X n displaystyle X 1 dots X n nbsp seien normalverteilt mit X i N 8 1 displaystyle X i sim mathcal N theta 1 nbsp fur i 1 n displaystyle i 1 dots n nbsp mit unbekanntem Parameter 8 R displaystyle theta in mathbb R nbsp Dann ist T n X n 1 n i 1 n X i displaystyle T n bar X n frac 1 n sum i 1 n X i nbsp eine Schatzfunktion fur den Parameter 8 displaystyle theta nbsp Die Schatzfunktion T n displaystyle T n nbsp ist eine Zufallsvariable deren Wahrscheinlichkeitsverteilung typischerweise vom Parameter 8 displaystyle theta nbsp und vom Stichprobenumfang n displaystyle n nbsp abhangt Beispielsweise gilt X n N 8 1 n displaystyle bar X n sim mathcal N theta 1 n nbsp falls die Zufallsvariablen X 1 X n displaystyle X 1 dots X n nbsp stochastisch unabhangig sind Fur realisierte Werte x 1 x n displaystyle x 1 dots x n nbsp ist t n x n 1 n i 1 n x i displaystyle t n bar x n frac 1 n sum i 1 n x i nbsp ein Schatzwert fur den Parameter 8 displaystyle theta nbsp Die reelle Zahl x n displaystyle bar x n nbsp ist ein realisierter Wert der Zufallsvariablen X n displaystyle bar X n nbsp Grundkonzepte Stichprobenvariablen und funktionen BearbeitenIn der Regel befindet sich der Experimentierende in der Situation dass er anhand endlich vieler Beobachtungen einer Stichprobe Aussagen uber die zugrunde liegende Verteilung oder deren Parameter in der Grundgesamtheit treffen mochte Nur in seltenen Fallen lasst sich die Grundgesamtheit vollstandig erheben Total oder Vollerhebung sodass sie dann exakt die gewunschten Informationen liefert Ein Beispiel fur eine Vollerhebung ist die Arbeitslosenstatistik der amtlichen Statistik In den meisten Fallen kann jedoch die Grundgesamtheit nicht vollstandig erhoben werden z B weil sie zu gross ist Interessiert man sich etwa fur die mittlere Grosse der 18 Jahrigen in der EU musste man alle 18 Jahrigen messen was praktisch undurchfuhrbar ist Stattdessen wird nur eine Stichprobe eine zufallige Auswahl von n displaystyle n nbsp Elementen erhoben Teilerhebung Stichprobenvariable Bearbeiten An dieser Stelle setzt die statistische Modellierung an Die Stichprobenvariable X i displaystyle X i nbsp eine Zufallsvariable beschreibt mit ihrer Verteilung die Wahrscheinlichkeit mit der eine bestimmte Merkmalsauspragung bei der i displaystyle i nbsp ten Ziehung aus der Grundgesamtheit auftritt Jeder Beobachtungswert x i displaystyle x i nbsp ist die Realisierung einer Stichprobenvariable X i displaystyle X i nbsp Stichprobenfunktion Bearbeiten Hauptartikel Stichprobenfunktion Die Definition von Stichprobenvariablen X i displaystyle X i nbsp erlaubt die Definition von Stichprobenfunktionen analog z B zu Kennwerten aus der deskriptiven Statistik Arithmetisches Mittel Stichprobenfunktionx 1 n x 1 x 2 x n displaystyle overline x frac 1 n x 1 x 2 ldots x n nbsp X 1 n X 1 X 2 X n displaystyle overline X frac 1 n X 1 X 2 ldots X n nbsp Da jede Stichprobe aufgrund der Zufalligkeit anders ausfallt sind auch diese Stichprobenfunktionen Zufallsvariablen deren Verteilung von der Art der Ziehung der Stichprobe aus der Grundgesamtheit und der Verteilung des Merkmals in der Grundgesamtheitabhangt Stichprobenverteilung Bearbeiten Unter Stichprobenverteilung versteht man die Verteilung einer Stichprobenfunktion g X 1 X n displaystyle g X 1 dotsc X n nbsp uber alle moglichen Stichproben aus der Grundgesamtheit Die Stichprobenfunktion g displaystyle g nbsp ist in der Regel eine Schatzfunktion fur einen unbekannten Parameter der Grundgesamtheit oder eine Teststatistik fur eine Hypothese uber einen unbekannten Parameter der Grundgesamtheit Daher spricht man statt von Stichprobenverteilung auch einfach von der Verteilung einer Schatzfunktion oder Teststatistik Die Verteilung der Stichprobenfunktion dient der Gewinnung von Aussagen uber unbekannte Parameter in der Grundgesamtheit aufgrund einer Stichprobe Die Stichprobenverteilung ist ein frequentistisches Konzept das bayessche Pendant ist die A posteriori Verteilung Berechnung der Stichprobenverteilung Bearbeiten Die Stichprobenverteilung fur eine Stichprobenfunktion mit bestimmtem Stichprobenumfang aus einer endlichen Grundgesamtheit lasst sich stets berechnen siehe die folgenden Beispiele im Allgemeinen jedoch ist man eher an generellen Formeln mit z B unbestimmtem Stichprobenumfang n displaystyle n nbsp interessiert Wichtige Hilfsmittel sind dabei folgende Aussagen Reproduktivitat der Normalverteilung Sind die Stichprobenvariablen X i displaystyle X i nbsp voneinander unabhangig und normalverteilt X i N m s 2 displaystyle X i sim mathcal N mu sigma 2 nbsp dann ist auch X X 1 X n n displaystyle overline X X 1 dotsb X n n nbsp normalverteilt X N m s 2 n displaystyle overline X sim mathcal N mu sigma 2 n nbsp Zentraler Grenzwertsatz Sind die Stichprobenvariablen X i displaystyle X i nbsp voneinander unabhangig und existieren fur sie die Erwartungswerte E X i m displaystyle operatorname E X i mu nbsp und E X i m 2 Var X i s 2 displaystyle operatorname E X i mu 2 bigr operatorname Var X i sigma 2 nbsp ist X X 1 X n n displaystyle overline X X 1 dotsb X n n nbsp fur grosses n displaystyle n nbsp approximativ normalverteilt X N m s 2 n displaystyle overline X approx mathcal N left mu sigma 2 n right nbsp Bootstrap Stichprobenverteilungen Bearbeiten Wenn eine hinreichend grosse Stichprobe reprasentativ fur die Grundgesamtheit ist kann die Stichprobenverteilung fur eine beliebige Stichprobenfunktion nichtparametrisch mit Hilfe des Bootstrap Verfahrens geschatzt werden ohne dass die Verteilung der X i displaystyle X i nbsp bekannt sein muss Jedoch muss allgemein mathematisch gezeigt werden dass die Bootstrap Stichprobenverteilungen mit steigender Zahl der Bootstrap Stichproben gegen die wahre Stichprobenverteilung konvergiert Beispiele Bearbeiten Beispiel 1 Bearbeiten Gegeben sei eine Urne mit sieben Kugeln mit den Aufschriften 10 11 11 12 12 12 und 16 Wenn man zwei Kugeln mit Zurucklegen zieht zeigt die folgende Tabelle alle moglichen Stichproben aus der Grundgesamtheit 10 11 11 12 12 12 1610 10 10 10 11 10 11 10 12 10 12 10 12 10 1611 11 10 11 11 11 11 11 12 11 12 11 12 11 1611 11 10 11 11 11 11 11 12 11 12 11 12 11 1612 12 10 12 11 12 11 12 12 12 12 12 12 12 1612 12 10 12 11 12 11 12 12 12 12 12 12 12 1612 12 10 12 11 12 11 12 12 12 12 12 12 12 1616 16 10 16 11 16 11 16 12 16 12 16 12 16 16Jede der moglichen Stichproben tritt mit der Wahrscheinlichkeit von 1 49 displaystyle 1 49 nbsp auf Berechnet man nun den Stichprobenmittelwert X X 1 X 2 2 displaystyle overline X X 1 X 2 2 nbsp aus den zwei Kugeln so ergibt sich X displaystyle overline X nbsp 10 11 11 12 12 12 1610 10 0 10 5 10 5 11 0 11 0 11 0 13 011 10 5 11 0 11 0 11 5 11 5 11 5 13 511 10 5 11 0 11 0 11 5 11 5 11 5 13 512 11 0 11 5 11 5 12 0 12 0 12 0 14 012 11 0 11 5 11 5 12 0 12 0 12 0 14 012 11 0 11 5 11 5 12 0 12 0 12 0 14 016 13 0 13 5 13 5 14 0 14 0 14 0 16 0Fasst man die Ergebnisse von X displaystyle overline X nbsp entsprechend der Wahrscheinlichkeit des Auftretens der Stichprobe zusammen so erhalt man die Stichprobenverteilung von X displaystyle overline X nbsp x displaystyle x nbsp 10 0 10 5 11 0 11 5 12 0 13 0 13 5 14 0 16 0P X x displaystyle P overline X x nbsp 1 49 4 49 10 49 12 49 9 49 2 49 4 49 6 49 1 49Andert man die Art der Ziehung von einer Ziehung mit Zurucklegen in eine Ziehung ohne Zurucklegen so ergibt sich eine andere Verteilung fur X displaystyle overline X nbsp In den oberen Tabellen fallt dann die Hauptdiagonale weg sodass es nur 42 displaystyle 42 nbsp mogliche Stichproben gibt Daher ergibt sich dann folgende Verteilung fur X displaystyle overline X nbsp x displaystyle x nbsp 10 0 10 5 11 0 11 5 12 0 13 0 13 5 14 0 16 0P X x displaystyle P overline X x nbsp 0 4 42 8 42 12 42 6 42 2 42 4 42 6 42 0Beispiel 2 Bearbeiten In einer Urne sind funf rote und vier blaue Kugeln Es werden drei Kugeln ohne Zurucklegen aus dieser Urne gezogen Definiert man die Stichprobenfunktion X displaystyle X nbsp Zahl der roten Kugeln unter den drei gezogenen ist X displaystyle X nbsp hypergeometrisch verteilt mit M 5 displaystyle M 5 nbsp als Zahl der roten Kugeln in der Urne N 9 displaystyle N 9 nbsp als Gesamtzahl der Kugeln in der Urne und n 3 displaystyle n 3 nbsp als Zahl der Versuche Hier konnen alle Informationen uber die Verteilung von X displaystyle X nbsp gewonnen werden weil sowohl das stochastische Modell Ziehen aus einer Urne als auch die zugehorigen Parameter Anzahl der roten und blauen Kugeln bekannt sind Beispiel 3 Bearbeiten Ein Lebensmittelgrossmarkt bekommt eine Lieferung von 2000 Glasern mit Pflaumenkompott Problematisch sind in den Fruchten verbliebene Kerne Der Kunde toleriert einen Anteil von Glasern mit Kernen von 5 Er mochte sich bei dieser Lieferung vergewissern dass diese Quote nicht uberschritten wird Eine komplette Erhebung der Grundgesamtheit von 2000 Glasern ist allerdings nicht durchfuhrbar denn 2000 Glaser zu kontrollieren ist zu aufwendig und ausserdem zerstort das Offnen eines Glases die Ware Allerdings konnte man eine kleine Zahl von Glasern zufallig aussuchen also eine Stichprobe nehmen und die Zahl der zu beanstandenden Glaser zahlen Ubersteigt diese Zahl eine bestimmte Grenze den kritischen Wert der Prufgrosse geht man davon aus dass auch in der Lieferung zu viele zu beanstandende Glaser sind Eine mogliche Stichprobenfunktion ist p 1 n X 1 X 2 X n displaystyle pi frac 1 n X 1 X 2 ldots X n nbsp wobei X i displaystyle X i nbsp eine Zufallsvariable bezeichnet die nur die Werte 1 Glas enthalt Pflaumen mit Kern oder 0 Glas enthalt keine Pflaumen mit Kern annimmt Wenn die Zufallsvariablen X i displaystyle X i nbsp Bernoulli verteilt sind dann ist aufgrund des zentralen Grenzwertsatzes p displaystyle pi nbsp approximativ normalverteilt Schatzfunktionen BearbeitenGrundgedanke und Konzept der Schatzfunktion Bearbeiten Schatzfunktionen sind spezielle Stichprobenfunktionen um Parameter oder Verteilungen der Grundgesamtheit zu bestimmen Beeinflusst werden Schatzfunktionen unter anderem durch die Art der Ziehung der Stichprobe z B Ziehen mit oder ohne Zurucklegen und die Art der Schatzmethode z B Methode der kleinsten Quadrate Maximum Likelihood Methode oder Momentenmethode Man mochte letztlich versuchen ausschliesslich anhand des Wissens um das zu Grunde liegende Modell und die beobachtete Stichprobe etwa Intervalle anzugeben die mit grosster Wahrscheinlichkeit den wahren Parameter enthalten Alternativ mochte man auch bei einer bestimmten Fehlerwahrscheinlichkeit testen ob eine spezielle Vermutung uber den Parameter zum Beispiel dass zu viele Glaser Kerne enthalten bestatigt werden kann Schatzfunktionen bilden in diesem Sinne die Basis fur jede begrundete Entscheidung uber die Auspragungen der Grundgesamtheit die bestmogliche Wahl solcher Funktionen ist das Ergebnis der mathematischen Untersuchung Trifft man auf dieser Basis eine Entscheidung z B geht die Lieferung zuruck besteht die Moglichkeit dass die Entscheidung falsch ist Es gibt folgende Fehlerquellen Die Stichprobe ist nicht reprasentativ fur die Grundgesamtheit d h sie spiegelt die Grundgesamtheit nicht wider Das Modell fur die Zufallsvariablen X i displaystyle X i nbsp ist falsch Die Stichprobe konnte untypisch ausgefallen sein so dass man die Lieferung falschlicherweise ablehnt Dennoch besteht in der Praxis zumeist keine Alternative zu statistischen Verfahren dieser Art Den zuvor genannten Problemen tritt man auf verschiedene Weisen entgegen Man versucht moglichst eine einfache Zufallsstichprobe zu ziehen Die Modelle fur die Zufallsvariablen X i displaystyle X i nbsp werden zum einen moglichst gross gewahlt so dass das richtige Modell enthalten ist und zum anderen wird die Schatzfunktion so gewahlt dass ihre Verteilung fur viele Modelle berechenbar ist siehe Zentraler Grenzwertsatz Aufgrund der Schatzfunktion wird eine Irrtumswahrscheinlichkeit angegeben Formale Definition der Schatzfunktion Bearbeiten Grundlage einer jeden Schatzfunktion sind die Beobachtungen x i displaystyle x i nbsp eines statistischen Merkmals X displaystyle X nbsp Modelltheoretisch wird dieses Merkmal idealisiert Man geht davon aus dass es sich bei den Beobachtungen in Wahrheit um Realisierungen von Zufallsvariablen X i displaystyle X i nbsp handelt deren wahre Verteilung und wahre Verteilungsparameter unbekannt sind Um Informationen uber die tatsachlichen Eigenschaften des Merkmals zu erhalten erhebt man eine Stichprobe von n displaystyle n nbsp Elementen Mit Hilfe dieser Stichprobenelemente schatzt man dann die gesuchten Parameter bzw die gesuchte Verteilung siehe Kerndichteschatzung Um also beispielsweise einen Parameter g displaystyle gamma nbsp einer unbekannten Verteilung zu schatzen hat man es formal mit einer Zufallsstichprobe vom Umfang n displaystyle n nbsp zu tun es werden also n displaystyle n nbsp Realisierungen x i displaystyle x i nbsp i 1 n displaystyle i 1 dotsc n nbsp der Zufallsvariablen X i displaystyle X i nbsp beobachtet Die Zufallsvariablen X i displaystyle X i nbsp werden dann mittels einer Schatzmethode in einer geeigneten Schatzfunktion g X 1 X 2 X n displaystyle g X 1 X 2 dotsc X n nbsp zusammengefasst Formal wird dabei vorausgesetzt dass g displaystyle g nbsp eine messbare Funktion ist Zur Vereinfachung der Berechnung der Schatzfunktion wird oft vorausgesetzt dass die Zufallsvariablen X i displaystyle X i nbsp unabhangig voneinander und identisch verteilt sind also die gleiche Verteilung und die gleichen Verteilungsparameter besitzen Ausgewahlte Schatzfunktionen BearbeitenIn der statistischen Praxis wird oft nach den folgenden Parametern der Grundgesamtheit gesucht den Mittelwert m displaystyle mu nbsp und der Varianz s 2 displaystyle sigma 2 nbsp eines metrischen Merkmals sowie dem Anteilswert p displaystyle pi nbsp einer dichotomen Grundgesamtheit Schatzfunktionen und Schatzwert fur den Mittelwert Bearbeiten Der Erwartungswert m displaystyle mu nbsp wird in der Regel mit dem arithmetischen Mittel der Stichprobe geschatzt Schatzfunktion SchatzwertX 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i nbsp m x 1 n i 1 n x i displaystyle hat mu overline x frac 1 n sum i 1 n x i nbsp Ist die Verteilung symmetrisch kann auch der Median der Stichprobe als Schatzwert fur den Erwartungswert verwendet werden Schatzfunktion SchatzwertZ X n 1 2 displaystyle Z X left lfloor frac n 1 2 right rfloor nbsp m z x n 1 2 displaystyle hat mu z x left lfloor frac n 1 2 right rfloor nbsp wobei displaystyle left lfloor right rfloor nbsp die untere Gaussklammer bezeichnet Der Median ist also der Wert derjenigen Zufallsvariable die nach Sortierung der Daten in der Mitte liegt Es befinden sich also zahlenmassig genauso viele Werte oberhalb wie unterhalb des Median Welche Schatzfunktion im Falle symmetrischer Verteilungen besser ist hangt von der betrachteten Verteilungsfamilie ab Schatzfunktionen und Schatzwert fur die Varianz Bearbeiten Fur die Varianz der Grundgesamtheit s 2 displaystyle sigma 2 nbsp verwendet man als Schatzfunktion meist die korrigierte Stichprobenvarianz Schatzfunktion SchatzwertS n 2 1 n 1 i 1 n X i X 2 displaystyle S n 2 frac 1 n 1 sum i 1 n X i overline X 2 nbsp s 2 s n 2 1 n 1 i 1 n x i x 2 displaystyle hat sigma 2 s n 2 frac 1 n 1 sum i 1 n x i overline x 2 nbsp Typische andere Vorfaktoren sind auch 1 n displaystyle frac 1 n nbsp und 1 n 1 displaystyle frac 1 n 1 nbsp Alle diese Schatzer sind zwar asymptotisch aquivalent werden aber je nach Art der Stichprobe unterschiedlich benutzt siehe auch Stichprobenvarianz Schatzfunktion Schatzfunktionen und Schatzwert fur den Anteilswert Bearbeiten Man betrachtet hier das Urnenmodell mit zwei Sorten Kugeln Es soll der Anteilswert der Kugeln erster Sorte in der Grundgesamtheit geschatzt werden Als Schatzfunktion verwendet man den Anteil der Kugeln erster Sorte in der Stichprobe Schatzfunktion SchatzwertP X n 1 n i 1 n X i displaystyle Pi frac X n frac 1 n sum i 1 n X i nbsp p 1 n i 1 n x i displaystyle hat pi frac 1 n sum i 1 n x i nbsp mit X displaystyle X nbsp Zahl der Kugeln erster Sorte in der Stichprobe und X i displaystyle X i nbsp eine binare Zufallsvariable Kugel der ersten Sorte in der i displaystyle i nbsp ten Ziehung gezogen X i 1 displaystyle X i 1 nbsp oder nicht gezogen X i 0 displaystyle X i 0 nbsp Die Verteilung von P displaystyle Pi nbsp ist eine Binomialverteilung im Modell mit Zurucklegen und eine hypergeometrische Verteilung im Modell ohne Zurucklegen Verteilung der Schatzfunktionen BearbeitenDie Verteilung der Schatzfunktionen hangt naturlich von der Verteilung des Merkmals in der Grundgesamtheit ab Seien X 1 X 2 X n displaystyle X 1 X 2 dots X n nbsp unabhangig und identisch normalverteilte Zufallsvariablen mit Erwartungswert m displaystyle mu nbsp und Varianz s 2 displaystyle sigma 2 nbsp Der Schatzer X displaystyle overline X nbsp Stichprobenmittel als lineare Transformation der X i displaystyle X i nbsp besitzt dann die Verteilung X N m s 2 n displaystyle overline X sim mathcal N left mu frac sigma 2 n right nbsp Der Varianzschatzer S n 2 displaystyle S n 2 nbsp enthalt eine Quadratsumme von bezuglich X displaystyle overline X nbsp zentrierten normalverteilten Zufallsvariablen Deshalb ist der Ausdruck n 1 S n 2 s 2 x 2 n 1 displaystyle frac n 1 S n 2 sigma 2 sim chi 2 n 1 nbsp Chi Quadrat verteilt mit n 1 displaystyle n 1 nbsp Freiheitsgraden Ist die Verteilung des Merkmals unbekannt kann bei Vorliegen der Voraussetzung des zentralen Grenzwertsatzes die Verteilung der Schatzfunktion naherungsweise mit der Normalverteilung oder einer ihrer abgeleiteten Verteilungen angegeben werden Gutekriterien von Schatzfunktionen Bearbeiten nbsp Wahrscheinlichkeitsdichten fur die konsistenten Schatzfunktionen g n displaystyle g n nbsp n 100 178 400 displaystyle n 100 178 400 nbsp Mit steigendem Stichprobenumfang wird der unbekannte Parameter g displaystyle gamma nbsp immer genauer geschatzt Erwartungstreue Bearbeiten Eine erwartungstreue Schatzfunktion ist im Mittel Erwartungswert gleich dem wahren Parameter g displaystyle gamma nbsp E g n g displaystyle operatorname E g n gamma nbsp Weicht E g n displaystyle operatorname E g n nbsp hingegen systematisch von g displaystyle gamma nbsp ab ist der Schatzer verzerrt englisch biased Die Verzerrung eines Schatzers Bias g n displaystyle operatorname Bias g n nbsp errechnet sich dabei zu Bias g n E g n g E g n g displaystyle operatorname Bias g n operatorname E g n gamma operatorname E g n gamma nbsp Fur eine lediglich asymptotisch erwartungstreue Schatzfunktion dagegen muss nur gelten lim n E g n g displaystyle lim n to infty operatorname E g n gamma nbsp Konsistenz Bearbeiten Eine Schatzfunktion heisst konsistent wenn fur jedes e gt 0 displaystyle varepsilon gt 0 nbsp Infinitesimalzahl gilt lim n P g n g gt e 0 displaystyle lim n to infty P g n gamma gt varepsilon 0 nbsp mit g n g X 1 X 2 X n displaystyle g n g X 1 X 2 dotsc X n nbsp Man spricht hier von stochastischer Konvergenz Die Grafik rechts illustriert den Prozess Fur jedes e gt 0 displaystyle varepsilon gt 0 nbsp mussen die ausgefullten Flachen mit steigendem Stichprobenumfang immer kleiner werden Mit einfachen Worten Eine konsistente Schatzfunktion nahert sich mit wachsendem n displaystyle n nbsp immer mehr dem wahren Parameter g displaystyle gamma nbsp an schatzt den wahren Parameter immer genauer Konsistente Schatzfunktionen mussen daher mindestens asymptotisch erwartungstreu s o sein Diese Eigenschaft ist grundlegend fur die gesamte induktive Statistik sie garantiert dass eine Erhohung des Stichprobenumfangs genauere Schatzungen kleinere Konfidenzintervalle oder kleinere Annahmebereiche der H 0 displaystyle H 0 nbsp in Hypothesentests ermoglicht Minimale Varianz Effizienz Bearbeiten Die Schatzfunktion soll eine moglichst kleine Varianz haben Die Schatzfunktion g n displaystyle g n nbsp aus allen erwartungstreuen Schatzfunktionen g n displaystyle g n nbsp welche die kleinste Varianz hat wird dabei als effiziente beste oder wirksamste Schatzfunktion bezeichnet Var g n min g n Var g n displaystyle operatorname Var g n leq min g n operatorname Var g n nbsp Unter bestimmten Bedingungen kann durch die Cramer Rao Ungleichung auch eine untere Grenze fur Var g n displaystyle operatorname Var g n nbsp angegeben werden Das heisst fur eine Schatzfunktion kann gezeigt werden dass es keine effizienteren Schatzfunktionen geben kann hochstens noch genauso effiziente Schatzfunktionen Mittlerer quadratischer Fehler Bearbeiten Die Genauigkeit einer Schatzfunktion bzw eines Schatzers wird oft durch seinen mittleren quadratischen Fehler englisch mean squared error ausgedruckt Eine dabei nicht notwendigerweise auch erwartungstreue Schatzfunktion sollte daher stets einen moglichst kleinen mittleren quadratischen Fehler aufweisen der sich rechnerisch als Erwartungswert der quadratischen Abweichung des Schatzers g n displaystyle g n nbsp vom wahren Parameter g displaystyle gamma nbsp bestimmen lasst M S E g n E g n g 2 E g n g 2 E g n E g 2 Bias g n 2 Var g n displaystyle mathrm MSE g n operatorname E bigl g n gamma 2 bigr bigl operatorname E g n gamma bigr 2 operatorname E bigl g n E g 2 bigr operatorname Bias g n 2 operatorname Var g n nbsp Wie zu sehen ist der mittlere quadratische Fehler eines nicht erwartungstreuen Schatzers die Summe seiner Varianz und des Quadrats der Bias Verzerrung fur erwartungstreue Schatzer dagegen sind Varianz und MSE gleich gross Literatur BearbeitenBol shev Login Nikolaevich 2001 1994 Statistical estimator Encyclopedia of Mathematics EMS Press Jaynes E T 2007 Probability Theory The logic of science 5 ed Cambridge University Press ISBN 978 0 521 59271 0 Kosorok Michael 2008 Introduction to Empirical Processes and Semiparametric Inference Springer Series in Statistics Springer doi 10 1007 978 0 387 74978 5 ISBN 978 0 387 74978 5 Lehmann E L Casella G 1998 Theory of Point Estimation 2nd ed Springer ISBN 0 387 98502 6 Shao Jun 1998 Mathematical Statistics Springer ISBN 0 387 98674 XWeblinks BearbeitenVolker Schmidt Methoden der Statistik aus dem Vorlesungsskript Stochastik fur Informatiker Physiker Chemiker und Wirtschaftswissenschaftler nbsp Wikibooks Statistik Lern und LehrmaterialienEinzelnachweise Bearbeiten Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg New York Dordrecht London 2014 ISBN 978 3 642 37886 7 S 52 Abgerufen von https de wikipedia org w index php title Schatzfunktion amp oldid 236187050