www.wikidata.de-de.nina.az
Schatzmethoden auch Schatzverfahren werden in der mathematischen Statistik gebraucht Man verwendet sie um Schatzfunktionen fur unbekannte Parameter einer statistischen Grundgesamtheit zu konstruieren Drei klassische Schatzmethoden sind unter anderem Maximum Likelihood Methode Methode der kleinsten Quadrate MomentenmethodeBei allen drei Methoden haben Ausreisser einen sehr starken Einfluss auf das Ergebnis Die Momentenmethode kann auch als Spezialfall des Substitutionsprinzips aufgefasst werden Auch Methoden basierend auf Quantilen werden haufig verwendet und sind oft robuster z B kann der Median oft den Mittelwert als Schatzer ersetzen Die verschiedenen Verfahren sind zum Teil konkurrierend zum Teil auch erganzend Inhaltsverzeichnis 1 Maximum Likelihood Methode 2 Methode der kleinsten Quadrate 2 1 Beispiel 2 1 1 Maximum Likelihood Methode 2 1 2 Methode der kleinsten Quadrate 3 Minimum Chi Quadrat Methode 3 1 Beispiel 3 1 1 Maximum Likelihood Methode 3 1 2 Minimum Chi Quadrat Methode 4 Momentenmethode 4 1 Beispiel 4 1 1 Maximum Likelihood Methode 4 1 2 Momentenmethode 5 Siehe auch 6 Literatur 7 WeblinksMaximum Likelihood Methode Bearbeiten Hauptartikel Maximum Likelihood Methode Man betrachtet hier die Beobachtungen x i displaystyle x i nbsp als Stichproben Realisierungen von n in der Regel stochastisch unabhangigen Zufallsvariablen X i displaystyle X i nbsp mit einem bekannten Verteilungstyp Die Parameter der Verteilung hangen vom gesuchten Parameter ab und der Schatzwert des Parameters ergibt sich als der Wert der mit grosster Plausibilitat die beobachtete Stichprobe hervorbringen wurde Der Vorteil der Maximum Likelihood Methode Methode der grossten Plausibilitat liegt in den Eigenschaften der Schatzfunktion Zum einen ist sie oft konsistent d h je mehr Beobachtungen man in der Stichprobe hat desto genauer kann man den gesuchten Parameter schatzen und asymptotisch effizient d h fur grosse Stichprobenumfange gibt es keine bessere Schatzfunktion Man kann sehr allgemein Signifikanztests fur Modellvergleiche formulieren Ein wesentlicher Nachteil ist es dass man den Verteilungstyp der Stichprobenvariablen kennen muss Irrt man sich hierbei kann die Schatzfunktion vollkommen falsche Werte liefern Des Weiteren muss zur Auffindung des Parameters meist eine numerische Maximierung durchgefuhrt werden die unter Umstanden in einem lokalen statt globalen Maximum landet Da jedoch die Vorteile uberwiegen durfte die Maximum Likelihood Methode die am meisten genutzte Schatzmethode sein Bei einer Normalverteilung sind die Resultate nach der Momentenmethode und nach Maximum Likelihood Methode fast identisch die Momentenmethode liefert einen etwas kleineren systematischen Fehler hinsichtlich der Standardabweichung Bei der Maximum Likelihood Methode sind diese Fehler generell bei kleinem Stichprobenumfang oft nicht vernachlassigbar Methode der kleinsten Quadrate Bearbeiten Hauptartikel Methode der kleinsten Quadrate Hier betrachtet man ebenfalls die Beobachtungen x i displaystyle x i nbsp als Realisierungen von n displaystyle n nbsp Zufallsvariablen X i displaystyle X i nbsp Hierbei hangt der Erwartungswert E X i displaystyle operatorname E X i nbsp direkt oder durch eine bekannte Funktion vom gesuchten Parameter sowie einer Storgrosse ab Daher bestimmt man den gesuchten Parameter so dass die Summe der quadrierten Storgrossen moglichst klein wird Das klassische Beispiel ist die einfache lineare Regression die Regressiongerade y b 0 b 1 x displaystyle y beta 0 beta 1 x nbsp mit den Parametern b 0 displaystyle beta 0 nbsp und b 1 displaystyle beta 1 nbsp wird von einer Storgrosse uberlagert Man beobachtet also x i y i b 0 b 1 x e i displaystyle x i y i beta 0 beta 1 x varepsilon i nbsp Fur die Zufallsvariable Y i displaystyle Y i nbsp gilt E Y i b 0 b 1 x i displaystyle operatorname E Y i beta 0 beta 1 x i nbsp und Var Y i s e 2 displaystyle operatorname Var Y i sigma varepsilon 2 nbsp Nun berechnet man die Summe der quadrierten Storgrossen i 1 n y i b 0 b 1 x i 2 displaystyle sum nolimits i 1 n left y i beta 0 beta 1 x i right 2 nbsp und minimiert sie um Schatzwerte fur b 0 displaystyle beta 0 nbsp und b 1 displaystyle beta 1 nbsp zu finden Die Anpassungsgute der Schatzung kann mit dem Bestimmtheitsmass quantifiziert werden Der Vorteil der Methode der kleinsten Quadrate ist dass keine Annahme uber den Verteilungstyp gemacht werden muss sondern nur bzgl des Zusammenhangs zwischen dem Erwartungswert und dem unbekannten Parameter Damit ist diese Schatzmethode in einem breiteren Problemkreis anwendbar Der Vorteil ist jedoch auch ein Nachteil Da nur Information uber den Erwartungswert benutzt wird und nicht uber die Verteilung wie bei der Maximum Likelihood Methode weisen die Schatzfunktionen nicht so gute Eigenschaften wie Schatzfunktionen aus der Maximum Likelihood Methode auf Falls der Erwartungswert nicht linear vom Parameter abhangt mussen auch bei dieser Methode im Allgemeinen numerische Naherungsverfahren zur Bestimmung des Minimums verwendet werden Beispiel Bearbeiten In einem neuen Spiel kann man 1 00 Euro mit Wahrscheinlichkeit p displaystyle p nbsp verlieren 1 00 Euro mit Wahrscheinlichkeit 1 2 p displaystyle 1 2p nbsp gewinnen und mit Wahrscheinlichkeit p displaystyle p nbsp weder Geld verlieren noch gewinnen Das Spiel wird nun sechsmal gespielt mit dem Ergebnis 1 EUR 1 EUR 1 EUR 0 EUR 1 EUR 1 EUR Wie gross ist der Wert von p displaystyle p nbsp Maximum Likelihood Methode Bearbeiten Nach der Maximum Likelihood Methode ergibt sich die Wahrscheinlichkeit fur die beobachtete Stichprobe als P displaystyle P nbsp X 1 1 X 2 1 X 3 1 X 4 0 X 5 1 X 6 1 displaystyle X 1 1 X 2 1 X 3 1 X 4 0 X 5 1 X 6 1 nbsp p 1 2 p p p 1 2 p 1 2 p displaystyle p cdot 1 2p cdot p cdot p cdot 1 2p cdot 1 2p nbsp p 3 1 2 p 3 displaystyle p 3 cdot 1 2p 3 nbsp Die Maximierung ergibt dann einen Schatzwert p M L 1 4 displaystyle p ML 1 4 nbsp Methode der kleinsten Quadrate Bearbeiten Fur die Methode der kleinsten Quadrate braucht man den Erwartungswert E X i 1 p 0 p 1 1 2 p 1 3 p displaystyle operatorname E X i 1 cdot p 0 cdot p 1 cdot 1 2p 1 3p nbsp d h im Durchschnitt erwartet man 1 3 p displaystyle 1 3p nbsp EUR Gewinn pro Spiel Fur jede Beobachtung berechnet man den quadrierten Fehler zwischen dem beobachteten Gewinn und dem erwarteten Gewinn pro Spiel und summiert diese Q p displaystyle Q p nbsp displaystyle nbsp 1 1 3 p 2 1 1 3 p 2 1 1 3 p 2 displaystyle 1 1 3p 2 1 1 3p 2 1 1 3p 2 nbsp 0 1 3 p 2 1 1 3 p 2 1 1 3 p 2 displaystyle 0 1 3p 2 1 1 3p 2 1 1 3p 2 nbsp displaystyle nbsp 9 30 p 54 p 2 displaystyle 9 30p 54p 2 nbsp Die Minimierung ergibt dann einen Schatzwert p K Q 5 18 displaystyle p KQ 5 18 nbsp Minimum Chi Quadrat Methode BearbeitenDie Minimum Chi Quadrat Methode ist mit der Methode der kleinsten Quadrate verwandt Jedoch wird dabei davon ausgegangen dass die Zufallsvariablen X i displaystyle X i nbsp diskret sind das schliesst auch klassierte Daten ein Das Auffinden des Minimums der quadrierten Fehler wird schwierig da der Minimierungsalgorithmus mit Unstetigkeitsstellen umgehen muss Stattdessen betrachtet man die Zufallsvariablen H j displaystyle H j nbsp die Haufigkeit mit der die Merkmalsauspragung oder Klasse x j displaystyle x j nbsp auftritt Kann man die erwarteten Haufigkeiten mit den gesuchten Parametern verbinden so minimiert man die Teststatistik des Chi Quadrat Anpassungstests um Schatzwerte fur die gesuchten Parameter zu finden Beispiel Bearbeiten In einem Buch wurden zufallig sechs Satze ausgewahlt und gezahlt wie viele Nebensatze sie enthalten Es ergab sich dass drei Satze keinen Nebensatz enthielten zwei Satze einen Nebensatz und nur ein Satz mehr als einen Nebensatz Unterstellt man dass die Nebensatze Poisson verteilt sind stellt sich die Frage wie gross l displaystyle lambda nbsp ist die mittlere Anzahl der Nebensatze pro Satz Maximum Likelihood Methode Bearbeiten Nach der Maximum Likelihood Methode ergibt sich die Wahrscheinlichkeit fur die beobachtete Stichprobe als P displaystyle P nbsp X 1 0 X 2 0 X 3 0 X 4 1 X 5 1 X 6 gt 1 displaystyle X 1 0 X 2 0 X 3 0 X 4 1 X 5 1 X 6 gt 1 nbsp e l e l e l l e l l e l 1 e l l e l displaystyle e lambda cdot e lambda cdot e lambda cdot lambda e lambda cdot lambda e lambda cdot left 1 e lambda lambda e lambda right nbsp l 2 e 5 l 1 e l l e l displaystyle lambda 2 e 5 lambda left 1 e lambda lambda e lambda right nbsp Die Maximierung ergibt dann einen Schatzwert l M L 0 837 2 displaystyle lambda ML 0 8372 nbsp Minimum Chi Quadrat Methode Bearbeiten Fur die Minimum Chi Quadrat Methode braucht man die erwarteten Haufigkeiten H 0 l n e l displaystyle H 0 lambda ne lambda nbsp H 1 l n l e l displaystyle H 1 lambda n lambda e lambda nbsp und H gt 1 l n 1 e l l e l displaystyle H gt 1 lambda n left 1 e lambda lambda e lambda right nbsp x 2 l 3 H 0 l 2 H 0 l 2 H 1 l 2 H 1 l 1 H gt 1 l 2 H gt 1 l displaystyle chi 2 lambda frac 3 H 0 lambda 2 H 0 lambda frac 2 H 1 lambda 2 H 1 lambda frac 1 H gt 1 lambda 2 H gt 1 lambda nbsp Die Minimierung ergibt dann einen Schatzwert p C Q 0 836 9 displaystyle p CQ 0 8369 nbsp Momentenmethode Bearbeiten Hauptartikel Momentenmethode Man betrachtet hier die Beobachtungen x i displaystyle x i nbsp als Stichproben Realisierungen von n in der Regel stochastisch unabhangigen Zufallsvariablen X i displaystyle X i nbsp mit einem bekannten Verteilungstyp Die Momente E X i r displaystyle operatorname E X i r nbsp der jeweiligen Verteilung hangen von den Verteilungsparametern ab die wiederum den gesuchten Parameter beinhalten und man erhalt Gleichungen zwischen den gesuchten Parametern und den Momenten Die Momente konnen wiederum aus den Beobachtungsdaten geschatzt werden 1 n i 1 x i r displaystyle tfrac 1 n sum i 1 x i r nbsp und man erhalt ein Gleichungssystem das nach den gesuchten Parametern aufgelost werden kann Die Losung ist dann eine Schatzung des gesuchten Parameters Der Vorteil der Momentenmethode liegt in der einfachen Berechenbarkeit auch wenn zur Losung eines eventuell nicht linearen Gleichungssystems ein numerisches Iterationsverfahren benutzt werden muss Sie kann aber auch eingesetzt werden wenn die Stichprobenvariablen X i displaystyle X i nbsp nicht unabhangig sind In einem solchen Fall kann die Schatzung mit einer Maximum Likelihood Methode sehr kompliziert werden Die einfache Berechenbarkeit ist aber auch der Nachteil da nicht alle Informationen aus der Stichprobe ausgenutzt werden Dies kann dazu fuhren dass bei kleinen Stichproben Schatzwerte auftreten die ausserhalb des Parameterraums liegen z B negative Werte fur geschatzte Varianzen Die Schatzfunktionen aus der Momentenmethode sind meist nicht effizient d h fur gegebenen Stichprobenumfang gibt es bessere Schatzfunktionen Beispielsweise ist der Momentenschatzer weniger effizient bei einer Gleichverteilung als der nach der Maximum Likelihood Methode Manchmal wird bei komplexen Problemen die Momentenmethode eingesetzt um Startwerte fur die Parameter in der Maximum Likelihood Methode zu erhalten Beispiel Bearbeiten Der Lohn von Angestellten sei Pareto verteilt P k 1 displaystyle mathcal P k 1 nbsp im Intervall 1 displaystyle 1 infty nbsp 1 displaystyle 1 nbsp sei der Mindestlohn Es wurde eine Stichprobe von drei Angestellten beobachtet die jeweils das 1 2 1 5 und 1 8fache des Mindestlohnes verdienen Gesucht ist der Parameter k displaystyle k nbsp denn je grosser k displaystyle k nbsp desto geringer ist die Wahrscheinlichkeit fur einen hohen Lohn P X gt x 1 x k displaystyle P X gt x tfrac 1 x k nbsp Maximum Likelihood Methode Bearbeiten Nach der Maximum Likelihood Methode ergibt sich die Likelihood Funktion fur die beobachtete Stichprobe als L 1 2 1 5 1 8 displaystyle L 1 2 1 5 1 8 nbsp k 1 1 2 k k 1 1 5 k k 1 1 8 k displaystyle k left frac 1 1 2 right k cdot k left frac 1 1 5 right k cdot k left frac 1 1 8 right k nbsp k 3 1 1 2 1 5 1 8 k displaystyle k 3 left frac 1 1 2 cdot 1 5 cdot 1 8 right k nbsp Die Maximierung ergibt dann einen Schatzwert k M L 5 88 displaystyle k ML 5 88 nbsp d h die Wahrscheinlichkeit mehr als das Doppelte des Mindestlohnes zu verdienen betragt in diesem Modell knapp 1 7 Momentenmethode Bearbeiten Fur die Pareto Verteilung ergibt sich E X i k k 1 displaystyle operatorname E X i tfrac k k 1 nbsp falls k gt 1 displaystyle k gt 1 nbsp Der Erwartungswert wird geschatzt mit dem arithmetischen Mittel d h es gilt 1 3 1 2 1 5 1 8 k k 1 displaystyle frac 1 3 1 2 1 5 1 8 frac k k 1 nbsp Auflosen der Gleichung ergibt dann einen Schatzwert k M M 3 displaystyle k MM 3 nbsp d h die Wahrscheinlichkeit mehr als das Doppelte des Mindestlohnes zu verdienen betragt in diesem Modell 12 5 Siehe auch BearbeitenIdentifizierbarkeit Schatzfunktion Regressionsanalyse Konfidenzintervall Statistischer Test Vergleichen und SchatzenLiteratur BearbeitenJ Hartung B Elpelt K H Klosener Statistik 10 durchges Auflage Oldenbourg Munchen Wien 1995 ISBN 3 486 23387 4 F Sixtl Der Mythos des Mittelwertes Oldenbourg Munchen Wien 2000 ISBN 3 486 23320 3 Weblinks Bearbeiten nbsp Wikibooks Statistik Lern und Lehrmaterialien Volker Schmidt Methoden der Statistik aus dem Vorlesungsskript Stochastik fur Informatiker Physiker Chemiker und Wirtschaftswissenschaftler Abgerufen von https de wikipedia org w index php title Schatzmethode Statistik amp oldid 234375501