www.wikidata.de-de.nina.az
Die Likelihood Funktion oft einfach nur Likelihood gelegentlich auch Plausibilitatsfunktion oder Mutmasslichkeitsfunktion genannt 1 ist eine spezielle reellwertige Funktion in der mathematischen Statistik die aus einer Wahrscheinlichkeitsdichtefunktion oder einer Zahldichte gewonnen wird indem man einen Parameter der Dichte als Variable behandelt Zentrale Verwendung der Likelihood Funktion ist die Konstruktion von Schatzfunktionen durch die Maximum Likelihood Methode Zudem werden aus ihr weitere Funktionen wie die Log Likelihood Funktion und die Score Funktion abgeleitet die beispielsweise als Hilfsfunktionen bei der Maximum Likelihood Methode oder zur Konstruktion von Optimalitatskriterien in der Schatztheorie verwendet werden Das Konzept stammt aus den 1920er Jahren von Ronald Aylmer Fisher 2 3 der glaubte es sei ein in sich geschlossenes Rahmenwerk fur statistische Modellierung und Inferenz Spater fuhrten George Alfred Barnard und Allan Birnbaum eine wissenschaftliche Schule an die das Plausibilitatsprinzip vertrat das postulierte dass alle relevanten Informationen fur die statistische Inferenz in der Likelihood Funktion enthalten sind Inhaltsverzeichnis 1 Definition 2 Beispiele 2 1 Wahrscheinlichkeitsdichte 2 2 Zahldichte 3 Verwendung 4 Aufbauende Begriffe 4 1 Log Likelihood Funktion 4 1 1 Definition 4 1 2 Beispiele 4 1 3 Eigenschaften 4 1 4 Verwendung 4 2 Score Funktion 4 2 1 Definition 4 2 2 Beispiel 4 2 3 Verteilung 5 Pseudo Likelihood Funktion 6 Kern der Likelihood Funktion 7 Siehe auch 8 EinzelnachweiseDefinition BearbeitenGegeben sei eine Wahrscheinlichkeitsdichtefunktion oder eine Zahldichte f R n R displaystyle f colon mathbb R n to mathbb R nbsp welche noch zusatzlich von einem oder mehreren Parametern ϑ displaystyle vartheta nbsp aus einer Parametermenge 8 displaystyle Theta nbsp abhangt Es ist also f f ϑ x displaystyle f f vartheta x nbsp Dann heisst die Funktion L 8 R displaystyle L colon Theta to mathbb R nbsp die durch L x ϑ f ϑ x displaystyle L x vartheta f vartheta x nbsp definiert wird die Likelihood Funktion 4 5 Die Dichtefunktion wird somit zur Likelihood Funktion indem man den Parameter ϑ displaystyle vartheta nbsp als Variable auffasst und die Variable x displaystyle x nbsp als Parameter behandelt Wird ein konkretes x R n displaystyle tilde x in mathbb R n nbsp fixiert so nennt man auch L x ϑ displaystyle L tilde x vartheta nbsp die Likelihood Funktion zum Beobachtungswert x displaystyle tilde x nbsp 1 Im Falle einer Zahldichte gibt L x ϑ displaystyle L tilde x vartheta nbsp somit die Wahrscheinlichkeit von x displaystyle tilde x nbsp bei gegebenem Parameter ϑ displaystyle vartheta nbsp an Beispiele BearbeitenWahrscheinlichkeitsdichte Bearbeiten Betrachtet man n displaystyle n nbsp unabhangig und identisch normalverteilte Zufallsvariablen X 1 X 2 X n displaystyle X 1 X 2 dots X n nbsp mit unbekanntem Erwartungswert m displaystyle mu in infty infty nbsp und unbekannter Varianz s 2 gt 0 displaystyle sigma 2 gt 0 nbsp so besitzt X X 1 X 2 X n displaystyle X X 1 X 2 dots X n nbsp aufgrund der Unabhangigkeitsannahme die Wahrscheinlichkeitsdichtefunktion f m s 2 x 1 x 2 x n i 1 n 1 2 p s 2 exp x i m 2 2 s 2 2 p s 2 n 2 exp 1 2 s 2 i 1 n x i m 2 displaystyle f mu sigma 2 x 1 x 2 dots x n prod i 1 n frac 1 sqrt 2 pi sigma 2 exp left frac x i mu 2 2 sigma 2 right left 2 pi sigma 2 right n 2 exp left frac 1 2 sigma 2 sum i 1 n x i mu 2 right nbsp Somit ist der Parameter gegeben als ϑ m s 2 displaystyle vartheta mu sigma 2 nbsp und stammt aus der Parametermenge 8 R 0 displaystyle Theta mathbb R times 0 infty nbsp Folglich ist die Likelihood Funktion L x m s 2 2 p s 2 n 2 exp 1 2 s 2 i 1 n x i m 2 displaystyle L x mu sigma 2 left 2 pi sigma 2 right n 2 exp left frac 1 2 sigma 2 sum i 1 n x i mu 2 right nbsp sie stimmt also mit der Dichtefunktion uberein mit dem Unterschied dass m displaystyle mu nbsp und s 2 displaystyle sigma 2 nbsp die Variablen sind und x x 1 x 2 x n displaystyle x x 1 x 2 dots x n nbsp als Parameter behandelt wird Fur korrelierte Zufallsvariablen erhalt man die Likelihood Funktion nicht als einfaches Produkt und sie muss anders als oben dargestellt berechnet werden 6 Setzt man n 2 displaystyle n 2 nbsp und x 1 2 displaystyle tilde x 1 2 nbsp so ist die Likelihood Funktion unter Annahme von Unabhangigkeit zum Beobachtungswert x displaystyle tilde x nbsp L x m s 2 2 p s 2 1 exp 1 2 s 2 1 m 2 2 m 2 displaystyle L tilde x mu sigma 2 left 2 pi sigma 2 right 1 exp left frac 1 2 sigma 2 left 1 mu 2 2 mu 2 right right nbsp Zahldichte Bearbeiten Ist X displaystyle X nbsp eine zum Parameter p displaystyle p nbsp binomialverteilte Zufallsvariable bei fixiertem n displaystyle n nbsp also X Bin n p displaystyle X sim operatorname Bin n p nbsp so besitzt sie die Zahldichte f p k n k p k 1 p n k displaystyle f p k binom n k p k 1 p n k nbsp fur k 0 1 n displaystyle k 0 1 dots n nbsp Folglich ist die Likelihood Funktion von der Form L k p n k p k 1 p n k displaystyle L k p binom n k p k 1 p n k nbsp mit ϑ p displaystyle vartheta p nbsp und 8 0 1 displaystyle Theta 0 1 nbsp Die Likelihood Funktion zum Beobachtungswert k 2 displaystyle k 2 nbsp ist dann gegeben durch L 2 p n 2 p 2 1 p n 2 displaystyle L 2 p binom n 2 p 2 1 p n 2 nbsp Verwendung Bearbeiten Hauptartikel Maximum Likelihood Methode Hauptverwendung findet die Likelihood Funktion bei der Maximum Likelihood Methode einer intuitiv gut zuganglichen Schatzmethode zur Schatzung eines unbekannten Parameters ϑ displaystyle vartheta nbsp Dabei geht man bei einem Beobachtungsergebnis x x 1 x 2 x n displaystyle tilde x x 1 x 2 dots x n nbsp davon aus dass dieses ein typisches Beobachtungsergebnis ist in dem Sinne dass es sehr wahrscheinlich ist solch ein Ergebnis zu erhalten Die Wahrscheinlichkeit dafur x displaystyle tilde x nbsp zu erhalten hangt von der Wahrscheinlichkeitsdichtefunktion f ϑ displaystyle f vartheta nbsp und damit auch von ϑ displaystyle vartheta nbsp ab Daher gibt man als Schatzung fur den unbekannten Parameter denjenigen Parameter ϑ displaystyle vartheta nbsp an fur den die Wahrscheinlichkeit des Eintretens von x displaystyle tilde x nbsp maximal ist Dafur betrachtet man die Likelihood Funktion zum Beobachtungswert x displaystyle tilde x nbsp und sucht ein ϑ displaystyle tilde vartheta nbsp so dass L x ϑ L x ϑ f u r a l l e ϑ 8 displaystyle L tilde x tilde vartheta geq L tilde x vartheta quad mathrm f ddot u r alle vartheta in Theta nbsp Dies entspricht der Bestimmung einer Maximalstelle der Likelihood Funktion welche meist durch Nullsetzen der Ableitung bestimmt wird d d ϑ L x ϑ 0 displaystyle frac rm d rm d vartheta L tilde x vartheta 0 nbsp Ist diese Gleichung schwer zu losen bietet sich die Log Likelihood Funktion als Hilfsmittel an Aufbauende Begriffe BearbeitenLog Likelihood Funktion Bearbeiten Definition Bearbeiten Die Log Likelihood Funktion auch logarithmische Plausibilitatsfunktion genannt 7 L x displaystyle mathcal L x nbsp ist definiert als der naturliche Logarithmus aus der Likelihood Funktion 5 also beachte Kalligrafie in der Formel L x ϑ ln L x ϑ displaystyle mathcal L x vartheta ln left L x vartheta right nbsp Teils wird die Log Likelihood Funktion auch mit ℓ displaystyle ell nbsp oder l displaystyle l nbsp bezeichnet 8 Beispiele Bearbeiten Aufbauend auf den obigen beiden Beispielen fur die Likelihood Funktion gilt im Falle der unabhangig und identisch normalverteilten Zufallsvariablen fur die Log Likelihood Funktion L x m s 2 n 2 ln 2 p s 2 1 2 s 2 i 1 n x i m 2 displaystyle mathcal L x mu sigma 2 frac n 2 ln left 2 pi sigma 2 right frac 1 2 sigma 2 sum i 1 n x i mu 2 nbsp Im Falle der Binomialverteilung gilt fur die Log Likelihood Funktion L k p ln n k k ln p n k ln 1 p displaystyle mathcal L k p ln left binom n k right k ln p n k ln 1 p nbsp Beides folgt aus den Rechenregeln fur den Logarithmus siehe Logarithmengesetze Eigenschaften Bearbeiten Da der Logarithmus eine streng monoton wachsende Funktion ist ist jedes Minimum der Log Likelihood Funktion auch ein Minimum der Likelihood Funktion Ebenso ist jedes Maximum der Log Likelihood Funktion auch ein Maximum der Likelihood Funktion Ausserdem ist die Log Likelihood Funktion bei unabhangig und identisch verteilten Zufallsvariablen additiv Das bedeutet dass wenn X 1 X 2 X n displaystyle X 1 X 2 dots X n nbsp unabhangig und identisch verteilte Zufallsvariablen mit Dichte f ϑ x i displaystyle f vartheta x i nbsp und Log Likelihood Funktion L x i ϑ displaystyle mathcal L x i vartheta nbsp sind so besitzt X X 1 X 2 X n displaystyle X X 1 X 2 dots X n nbsp die Log Likelihood Funktion L x X ϑ i 1 n L x i ϑ displaystyle mathcal L x X vartheta sum i 1 n mathcal L x i vartheta nbsp Dies folgt direkt aus der Tatsache dass die Dichten von X displaystyle X nbsp als Produkt gebildet werden und den Rechenregeln des Logarithmus Verwendung Bearbeiten Da die Log Likelihood Funktion dieselben Maximalstellen besitzt wie die Likelihood Funktion ist sie ein gangiges Hilfsmittel zur Losung der Gleichung d d ϑ L x ϑ 0 displaystyle frac rm d rm d vartheta L tilde x vartheta 0 nbsp welche bei der Maximum Likelihood Methode anfallt Anstelle dieser Gleichung wird dann die Gleichung d d ϑ L x ϑ 0 displaystyle frac rm d rm d vartheta mathcal L tilde x vartheta 0 nbsp gelost Insbesondere die Additivitat der Log Likelihood Funktion bei unabhangig und identisch verteilten Zufallsvariablen erleichtert das Losen der Gleichung in vielen Fallen Score Funktion Bearbeiten Definition Bearbeiten In einparametrigen Modellen definiert man die Score Funktion als erste Ableitung der Log Likelihood Funktion 9 S ϑ x ϑ ln L x ϑ 1 L x ϑ d d ϑ L x ϑ displaystyle S vartheta x frac partial partial vartheta ln L x vartheta frac 1 L x vartheta cdot frac rm d rm d vartheta L x vartheta nbsp Sie ist also die logarithmische Ableitung der Likelihood Funktion Die Score Funktion gibt die Steigung der Log Likelihood Funktion an der jeweiligen Stelle an und muss nicht immer existieren Sie taucht ebenfalls bei der Fisher Information auf Beispiel Bearbeiten Siehe auch Scoring rule Fur die Binomialverteilung wurde oben bereits gezeigt dass die Likelihood Funktion von der Form L k p n k p k 1 p n k displaystyle L k p binom n k p k 1 p n k nbsp ist Daher ist ln L k p L x p ln n k k ln p n k ln 1 p displaystyle ln left L k p right mathcal L x p ln left binom n k right k ln p n k ln 1 p nbsp Leitet man diese Funktion nach p displaystyle p nbsp ab so fallt der erste Term als Konstante weg und mit den Ableiteregeln fur den Logarithmus siehe Ableitung und Integral folgt S k k 1 p n k 1 1 p k n p p 1 p displaystyle S k k cdot frac 1 p n k cdot frac 1 1 p frac k np p 1 p nbsp fur die Score Funktion Verteilung Bearbeiten Die Score Funktion ist asymptotisch normalverteilt mit Erwartungswert Null und Varianz als Erwartungswert der Fisher Information F ϑ displaystyle F vartheta nbsp auch Erwartete Fisher Information genannt 10 S ϑ E F ϑ a N 0 1 displaystyle frac S vartheta sqrt operatorname E F vartheta stackrel a sim mathcal N 0 1 quad nbsp bzw S ϑ a N 0 E F ϑ displaystyle quad S vartheta stackrel a sim mathcal N 0 operatorname E F vartheta nbsp Pseudo Likelihood Funktion BearbeitenFur die Losung des Maximum Likelihood Problems ist nur das Auffinden des Maximums der Likelihood Funktion von Belang Dies ist einer der Grunde warum die Maximum Likelihood Methode oft auch funktioniert obwohl die Voraussetzungen nicht erfullt sind In den folgenden Fallen spricht man von einer Pseudo Likelihood Funktion die Verteilungsvoraussetzungen fur die Maximum Likelihood Methode sind nicht erfullt Man nennt dann die Likelihood Funktion eine Pseudo Likelihood Funktion und die eigentliche Likelihood Funktion oder Log Likelihood Funktion ist zu schwierig zu maximieren und wird z B durch eine geglattete Version ersetzt und diese Pseudo Likelihood Funktion wird dann maximiert Kern der Likelihood Funktion BearbeitenDen Kern der Likelihood Funktion Kern der Plausibilitatsfunktion erhalt man aus der Likelihood Funktion indem man alle multiplikativen Konstanten vernachlassigt Fur gewohnlich wird mit L x ϑ displaystyle L x vartheta nbsp sowohl die Likelihood Funktion als auch deren Kern bezeichnet Die Verwendung der Log Likelihood Funktion L x ϑ displaystyle mathcal L x vartheta nbsp ist haufig numerisch sinnvoll Multiplikative Konstanten in L x ϑ displaystyle L x vartheta nbsp wandeln sich dann in additive Konstanten in L x ϑ displaystyle mathcal L x vartheta nbsp die wiederum haufig ignoriert werden konnen Eine Log Likelihood Funktion ohne additive Konstanten wird Kern der Log Likelihood Funktion genannt Auch hier wird gewohnlich mit L x ϑ displaystyle mathcal L x vartheta nbsp sowohl die Log Likelihood Funktion als auch deren Kern bezeichnet 11 Beispielsweise ware der Kern der Log Likelihood Funktion einer Normalverteilung mit unbekanntem Erwartungswert m displaystyle mu nbsp und bekannter Varianz s 2 displaystyle sigma 2 nbsp 12 L x m 1 2 s 2 i 1 n x i m 2 displaystyle mathcal L x mu frac 1 2 sigma 2 sum i 1 n x i mu 2 nbsp Siehe auch BearbeitenPseudo R squaredEinzelnachweise Bearbeiten a b Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 S 203 doi 10 1515 9783110215274 Fisher On the probable error of a coefficient of correlation deduced from a small sample Metron Band 1 1921 S 3 32 Fisher On the mathematical foundations of theoretical statistics Philosophical Transactions of the Royal Society A Band 222 1922 S 309 368 Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 162 doi 10 1007 978 3 642 41997 3 a b Ulrich Krengel Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik Fur Studium Berufspraxis und Lehramt 8 Auflage Vieweg Wiesbaden 2005 ISBN 3 8348 0063 5 S 62 doi 10 1007 978 3 663 09885 0 Joseph L Neuringer Alan Kaplan Maximum likelihood equations for a correlated multivariate normal distribution In International Journal of Mathematical Education in Science and Technology Band 14 Nr 4 1 Juli 1983 ISSN 0020 739X S 441 444 doi 10 1080 0020739830140408 Reinhard Viertl Einfuhrung in die Stochastik mit Elementen der Bayes Statistik und Ansatzen fur die Analyse unscharfer Daten Springer Verlag 2013 S 110 Claudia Czado Thorsten Schmidt Mathematische Statistik Springer Verlag Berlin Heidelberg 2011 ISBN 978 3 642 17260 1 S 85 doi 10 1007 978 3 642 17261 8 Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 S 201 doi 10 1515 9783110215274 Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg New York Dordrecht London 2014 ISBN 978 3 642 37886 7 S 87 Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg New York Dordrecht London 2014 ISBN 978 3 642 37886 7 S 15 Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg New York Dordrecht London 2014 ISBN 978 3 642 37886 7 S 27 ff Abgerufen von https de wikipedia org w index php title Likelihood Funktion amp oldid 238627072