www.wikidata.de-de.nina.az
Ein Bayes Schatzer IPA ˈbɛɪ zˌʃɛt sɐ anhoren benannt nach Thomas Bayes ist in der mathematischen Statistik eine Schatzfunktion die zusatzlich zu den beobachteten Daten eventuell vorhandenes Vorwissen uber einen zu schatzenden Parameter berucksichtigt Gemass der Vorgehensweise der bayesschen Statistik wird dieses Vorwissen durch eine Verteilung fur den Parameter modelliert die A priori Verteilung Mit dem Satz von Bayes ergibt sich die bedingte Verteilung des Parameters unter den Beobachtungsdaten die A posteriori Verteilung Um daraus einen eindeutigen Schatzwert zu erhalten werden Lagemasse der A posteriori Verteilung wie Erwartungswert Modus oder Median als sogenannte Bayes Schatzer verwendet Da der A posteriori Erwartungswert der wichtigste und in der Praxis am haufigsten angewendete Schatzer ist bezeichnen auch einige Autoren diesen als den Bayes Schatzer 1 Allgemein definiert man einen Bayes Schatzer als denjenigen Wert der den Erwartungswert einer Verlustfunktion unter der A posteriori Verteilung minimiert Fur eine quadratische Verlustfunktion ergibt sich dann gerade der A posteriori Erwartungswert als Schatzer Inhaltsverzeichnis 1 Definition 2 Spezialfalle 2 1 A posteriori Erwartungswert 2 2 A posteriori Median 2 3 A posteriori Modus 3 Beispiel 4 Praktische Berechnung 5 Literatur 6 EinzelnachweiseDefinition BearbeitenEs bezeichnen 8 8 displaystyle theta in Theta nbsp den zu schatzenden Parameter und f x 8 displaystyle f x theta nbsp die Likelihood also die Verteilung der Beobachtung x X displaystyle x in mathcal X nbsp in Abhangigkeit von 8 displaystyle theta nbsp Die A priori Verteilung des Parameters sei mit g 8 displaystyle g theta nbsp bezeichnet Dann ist h 8 x f x 8 g 8 8 f x 8 g 8 d 8 displaystyle h theta x frac f x theta g theta int Theta f x theta g theta mathrm d theta nbsp die A posteriori Verteilung von 8 displaystyle theta nbsp Es sei weiter eine Funktion ℓ 8 8 R displaystyle ell colon Theta times Theta to mathbb R nbsp genannt Verlustfunktion gegeben deren Werte ℓ a 8 displaystyle ell a theta nbsp den Verlust modellieren den man bei einer Schatzung von 8 displaystyle theta nbsp durch a displaystyle a nbsp erleidet Dann heisst ein Wert a 8 displaystyle a in Theta nbsp der den Erwartungswert E ℓ a x 8 ℓ a 8 h 8 x d 8 displaystyle operatorname E ell a cdot x int Theta ell a theta h theta x mathrm d theta nbsp des Verlustes unter der A posteriori Verteilung minimiert ein Bayes Schatzer von 8 displaystyle theta nbsp 2 Im Fall einer diskreten Verteilung von 8 displaystyle theta nbsp sind die Integrale uber 8 displaystyle Theta nbsp als Summation uber 8 8 displaystyle theta in Theta nbsp zu verstehen Spezialfalle BearbeitenA posteriori Erwartungswert Bearbeiten Eine wichtige und haufig verwendete Verlustfunktion ist die quadratische Abweichung ℓ a 8 a 8 2 displaystyle ell a theta a theta 2 nbsp Mit dieser Verlustfunktion ergibt sich als Bayes Schatzer der Erwartungswert der A posteriori Verteilung kurz der A posteriori Erwartungswert E 8 x 8 8 h 8 x d 8 8 8 f x 8 g 8 d 8 8 f x 8 g 8 d 8 displaystyle operatorname E theta x int Theta theta h theta x mathrm d theta frac int Theta theta f x theta g theta mathrm d theta int Theta f x theta g theta mathrm d theta nbsp Das sieht man auf folgende Weise Differenziert man E a 8 2 x displaystyle operatorname E a theta 2 x nbsp nach a displaystyle a nbsp ergibt sich d d a 8 a 8 2 h 8 x d 8 2 8 a 8 h 8 x d 8 2 a 8 h 8 x d 8 1 2 8 8 h 8 x d 8 displaystyle frac mathrm d mathrm d a left int Theta a theta 2 h theta x mathrm d theta right 2 int Theta a theta h theta x mathrm d theta 2a underbrace int Theta h theta x mathrm d theta 1 2 int Theta theta h theta x mathrm d theta nbsp Nullsetzen dieser Ableitung und Auflosen nach a displaystyle a nbsp liefert obige Formel A posteriori Median Bearbeiten Ein weiterer wichtiger Bayes Schatzer ist der Median der A posteriori Verteilung Er ergibt sich bei Verwendung der stuckweise linearen Verlustfunktion ℓ a 8 a 8 displaystyle ell a theta a theta nbsp des Betrags des absoluten Fehlers Bei einer stetigen A posteriori Verteilung ergibt sich der zugehorige Bayes Schatzer als Losung a displaystyle a nbsp der Gleichung a h 8 x d 8 1 2 displaystyle int infty a h theta x mathrm d theta frac 1 2 nbsp also als Median der Verteilung mit Dichte h x displaystyle h cdot x nbsp A posteriori Modus Bearbeiten Hauptartikel Maximum a posteriori Fur diskret verteilte Parameter 8 displaystyle theta nbsp bietet sich die Null Eins Verlustfunktion ℓ a 8 0 a 8 1 sonst displaystyle ell a theta begin cases 0 amp a theta 1 amp text sonst end cases nbsp an die allen falschen Schatzungen einen konstanten Verlust zuordnet und nur eine exakte Schatzung nicht bestraft Als Erwartungswert dieser Verlustfunktion ergibt sich die A posteriori Wahrscheinlichkeit des Ereignisses 8 a displaystyle theta neq a nbsp also 1 h a x displaystyle 1 h a x nbsp Diese wird minimal an den Stellen an denen h a x displaystyle h a x nbsp maximal ist das heisst an den Modalwerten der A posteriori Verteilung Bei stetig verteilten 8 displaystyle theta nbsp hat das Ereignis 8 a displaystyle theta a nbsp fur alle a displaystyle a nbsp Wahrscheinlichkeit null In diesem Fall kann man stattdessen fur ein kleines vorgegebenes e gt 0 displaystyle varepsilon gt 0 nbsp die Verlustfunktion ℓ a 8 0 a 8 e 1 a 8 gt e displaystyle ell a theta begin cases 0 amp a theta leq varepsilon 1 amp a theta gt varepsilon end cases nbsp betrachten Im Limes e 0 displaystyle varepsilon to 0 nbsp ergibt sich dann ebenfalls der A posteriori Modus als Bayes Schatzer Im Falle einer Gleichverteilung als A priori Verteilung ergibt sich der Maximum Likelihood Schatzer der somit einen Spezialfall eines Bayes Schatzers darstellt Beispiel Bearbeiten nbsp A priori gestrichelt und A posteriori Dichte im nebenstehenden Beispiel A posteriori Modus Median und Erwartungswert sind durch vertikale Linien markiertEine Urne enthalt rote und schwarze Kugeln in unbekannter Zusammensetzung das heisst die Wahrscheinlichkeit p displaystyle p nbsp eine rote Kugel zu ziehen ist unbekannt Um 8 p displaystyle theta p nbsp zu schatzen werden n 6 displaystyle n 6 nbsp Kugeln nacheinander mit Zurucklegen gezogen Nur eine einzige Ziehung liefert eine rote Kugel es wird also x 1 displaystyle x 1 nbsp beobachtet Die Anzahl der gezogenen roten Kugeln ist binomialverteilt mit n 6 displaystyle n 6 nbsp und p displaystyle p nbsp also gilt f x 8 n x p x 1 p n x 6 p 1 p 5 displaystyle f x theta binom n x p x 1 p n x 6p 1 p 5 nbsp Da uber den zu schatzenden Parameter p displaystyle p nbsp keinerlei Information vorliegt wird die Gleichverteilung als A priori Verteilung verwendet das heisst g 8 1 displaystyle g theta 1 nbsp fur 8 8 0 1 displaystyle theta in Theta 0 1 nbsp Als A posteriori Verteilung ergibt sich somit h 8 x f x 8 g 8 8 f x 8 g 8 d 8 6 p 1 p 5 0 1 6 p 1 p 5 d p 42 p 1 p 5 displaystyle h theta x frac f x theta g theta int Theta f x theta g theta mathrm d theta frac 6p 1 p 5 int 0 1 6p 1 p 5 mathrm d p 42p 1 p 5 nbsp Das ist die Dichte einer Beta Verteilung mit den Parametern a 2 displaystyle alpha 2 nbsp und b 6 displaystyle beta 6 nbsp Damit ergibt sich als A posteriori Erwartungswert a a b 1 4 displaystyle frac alpha alpha beta frac 1 4 nbsp und als A posteriori Modus a 1 a b 2 1 6 displaystyle frac alpha 1 alpha beta 2 frac 1 6 nbsp Der A posteriori Median muss numerisch bestimmt werden und ergibt ungefahr 0 228 5 displaystyle 0 2285 nbsp Allgemein ergibt sich bei k displaystyle k nbsp roten Kugeln in n displaystyle n nbsp Ziehungen k 1 n 2 displaystyle frac k 1 n 2 nbsp als A posteriori Erwartungswert und k n displaystyle frac k n nbsp also der klassische Maximum Likelihood Schatzer als A posteriori Modus Fur nicht zu kleine Werte von n displaystyle n nbsp ist k 2 3 n 4 3 displaystyle frac k frac 2 3 n frac 4 3 nbsp eine gute Naherung fur den A posteriori Median Praktische Berechnung BearbeitenEin Hindernis bei der Anwendung von Bayes Schatzern kann ihre numerische Berechnung sein Ein klassischer Ansatz ist die Verwendung von sogenannten konjugierten A priori Verteilungen bei denen sich eine A posteriori Verteilung aus einer bekannten Verteilungsklasse ergibt deren Lageparameter dann einfach in einer Tabelle nachgeschlagen werden konnen Verwendet man beispielsweise im obigen Urnenexperiment eine beliebige Betaverteilung als Prior dann ergibt sich auch eine Betaverteilung als A posteriori Verteilung 3 Fur allgemeine A priori Verteilungen zeigt die obige Formel des A posteriori Erwartungswerts dass zu seiner Berechnung zwei Integrale uber den Parameterraum bestimmt werden mussen Eine klassische Naherungsmethode ist die Laplace Approximation bei der die Integranden als Exponentialfunktion geschrieben werden und anschliessend die Exponenten durch eine quadratische Taylor Approximation angenahert werden 4 Mit dem Aufkommen leistungsfahiger Computer wurden weitere numerische Verfahren zur Berechnung der auftretenden Integrale anwendbar siehe Numerische Integration Ein Problem stellen vor allem hochdimensionale Parametermengen dar also der Fall dass sehr viele Parameter aus den Daten geschatzt werden sollen Hierbei kommen haufig Monte Carlo Verfahren als Naherungsverfahren zum Einsatz 5 Literatur BearbeitenLeonhard Held Methoden der statistischen Inferenz Likelihood und Bayes Springer Spektrum Heidelberg 2008 ISBN 978 3 8274 1939 2 Erich Leo Lehmann George Casella Theory of Point Estimation 2 Auflage Springer New York u a 1998 ISBN 0 387 98502 6 Kapitel 4 Einzelnachweise Bearbeiten Karl Rudolf Koch Einfuhrung in die Bayes Statistik Springer Berlin Heidelberg 2000 ISBN 3 540 66670 2 S 66 eingeschrankte Vorschau in der Google Buchsuche Leonhard Held Methoden der statistischen Inferenz Likelihood und Bayes Springer Spektrum Heidelberg 2008 ISBN 978 3 8274 1939 2 Held Methoden der statistischen Inferenz 2008 S 146 148 Held Methoden der statistischen Inferenz 2008 S 188 191 Held Methoden der statistischen Inferenz 2008 S 192 208 Abgerufen von https de wikipedia org w index php title Bayes Schatzer amp oldid 215989394