www.wikidata.de-de.nina.az
Die Normal Approximation ist eine Methode der Wahrscheinlichkeitsrechnung um die Binomialverteilung fur grosse Stichproben durch die Normalverteilung anzunahern Hierbei handelt es sich um eine Anwendung des Satzes von Moivre Laplace und damit auch um eine Anwendung des Zentralen Grenzwertsatzes Inhaltsverzeichnis 1 Formulierung 1 1 Gute der Approximation 2 Stetigkeitskorrektur 3 Beispiele 3 1 Beispiel 1 3 2 Beispiel 2 4 Literatur 5 EinzelnachweiseFormulierung BearbeitenFur eine binomialverteilte Zufallsvariable S n B i n n p displaystyle S n sim mathrm Bin n p nbsp mit dem Erwartungswert m n E S n n p displaystyle mu n mathbb E S n np nbsp und der Standardabweichung s n V a r S n n p 1 p gt 0 displaystyle sigma n sqrt mathrm Var S n sqrt np 1 p gt 0 nbsp gilt nach dem Satz von Moivre Laplace lim n P S n x F x m n s n 0 x R displaystyle lim n to infty left operatorname P S n leq x Phi left frac x mu n sigma n right right 0 quad x in mathbb R nbsp wobei F displaystyle Phi nbsp die Wahrscheinlichkeitsverteilungsfunktion der Standardnormalverteilung bezeichnet Diesen asymptotischen Zusammenhang verwendet man zur Rechtfertigung der Approximation der Verteilungsfunktion von S n displaystyle S n nbsp durch die Verteilungsfunktion der Normalverteilung N m n s n 2 displaystyle mathcal N mu n sigma n 2 nbsp fur endliches aber hinreichend grosse n displaystyle n nbsp d h P S n x F x m n s n x R displaystyle operatorname P S n leq x approx Phi left frac x mu n sigma n right quad x in mathbb R nbsp Mit dieser Approximation der Verteilungsfunktion erhalt man fur k 1 k 2 0 1 n displaystyle k 1 k 2 in 0 1 dots n nbsp mit k 1 lt k 2 displaystyle k 1 lt k 2 nbsp P k 1 lt S n k 2 P S n k 2 P S n k 1 Binomialverteilung F k 2 m n s n F k 1 m n s n Normalverteilung displaystyle begin aligned operatorname P k 1 lt S n leq k 2 amp underbrace operatorname P S n leq k 2 operatorname P S n leq k 1 text Binomialverteilung amp approx underbrace Phi left frac k 2 mu n sigma n right Phi left frac k 1 mu n sigma n right text Normalverteilung end aligned nbsp Eine exakte Berechnung der Wahrscheinlichkeit wurde dagegen durch P k 1 lt S n k 2 k k 1 1 k 2 n k p k 1 p n k displaystyle operatorname P k 1 lt S n leq k 2 sum k k 1 1 k 2 binom n k p k 1 p n k nbsp erfolgen Gute der Approximation Bearbeiten Fur viele Anwendungen gilt die Naherung als hinreichend gut falls n p 1 p 9 displaystyle np 1 p geq 9 nbsp gilt 1 2 3 Falls dies nicht gilt so sollte zumindest n p 5 displaystyle np geq 5 nbsp und n 1 p 5 displaystyle n 1 p geq 5 nbsp gelten 4 5 Je asymmetrischer die Binomialverteilung ist d h je grosser die Differenz zwischen p displaystyle p nbsp und 1 p displaystyle 1 p nbsp ist umso grosser sollte n displaystyle n nbsp sein Fur p displaystyle p nbsp nahe an 0 ist zur Naherung die Poisson Approximation besser geeignet Dabei wird die Binomialverteilung B i n n p displaystyle mathrm Bin n p nbsp durch eine Poissonverteilung mit dem Parameter n p displaystyle np nbsp approximiert Fur p displaystyle p nbsp nahe an 1 sind beide Approximationen schlecht dann kann jedoch S n n S n displaystyle S n n S n nbsp statt S n displaystyle S n nbsp betrachtet werden d h bei der Binomialverteilung werden Erfolge und Misserfolge vertauscht S n displaystyle S n nbsp ist wieder binomialverteilt mit Parametern n displaystyle n nbsp und 1 p displaystyle 1 p nbsp und kann daher mit der Poisson Approximation angenahert werden Stetigkeitskorrektur BearbeitenMit der Stetigkeitskorrektur wird eine verbesserte Approximation von Wahrscheinlichkeiten der Binomialverteilung B i n n p displaystyle mathrm Bin n p nbsp berechneten Wahrscheinlichkeiten durch die Wahrscheinlichkeiten aus der Normalverteilungsapproximation N m s 2 displaystyle mathcal N mu sigma 2 nbsp mit den Parametern m n p displaystyle mu np nbsp und s 2 n p 1 p displaystyle sigma 2 np 1 p nbsp und der Verteilungsfunktion x F x m s displaystyle x mapsto Phi x mu sigma nbsp angestrebt Die Grundidee ist den n 1 displaystyle n 1 nbsp Stellen 0 1 n displaystyle 0 1 dots n nbsp der Binomialverteilung die Wahrscheinlichkeiten der Normalverteilung in den n 1 displaystyle n 1 nbsp Intervallen I k k 1 2 fur k 0 k 1 2 k 1 2 fur k 1 n 1 k 1 2 fur k n displaystyle I k begin cases infty k 1 2 amp text fur k 0 k 1 2 k 1 2 amp text fur k 1 dots n 1 k 1 2 infty amp text fur k n end cases nbsp zuzuordnen Fur X N m s 2 displaystyle X sim mathcal N mu sigma 2 nbsp gilt dann P X I k F k 1 2 m s fur k 0 F k 1 2 m s F k 1 2 m s fur k 1 n 1 1 F k 1 2 m s fur k n displaystyle P X in I k begin cases Phi left frac k 1 2 mu sigma right amp text fur k 0 Phi left frac k 1 2 mu sigma right Phi left frac k 1 2 mu sigma right amp text fur k 1 dots n 1 1 Phi left frac k 1 2 mu sigma right amp text fur k n end cases nbsp Fur einen Wert k 0 1 n displaystyle k in 0 1 dots n nbsp ergeben sich mit Verwendung der Stetigkeitskorrektur die Approximationen P S n k F k 1 2 m s F k 1 2 m s displaystyle P S n k approx Phi left frac k 1 2 mu sigma right Phi left frac k 1 2 mu sigma right nbsp P S n k F k 1 2 m s displaystyle P S n leq k approx Phi left frac k 1 2 mu sigma right nbsp und P S n k 1 F k 1 2 m s displaystyle P S n geq k approx 1 Phi left frac k 1 2 mu sigma right nbsp Fur zwei Werte k 1 k 2 0 1 n displaystyle k 1 k 2 in 0 1 dots n nbsp mit k 1 k 2 displaystyle k 1 leq k 2 nbsp ergibt sich mit Verwendung der Stetigkeitskorrektur die Approximation P k 1 S n k 2 F k 2 0 5 m s F k 1 0 5 m s displaystyle P k 1 leq S n leq k 2 approx Phi left frac k 2 0 5 mu sigma right Phi left frac k 1 0 5 mu sigma right nbsp Beispiele BearbeitenBeispiel 1 Bearbeiten Ein fairer Wurfel wird 1000 Mal geworfen Gesucht ist die Wahrscheinlichkeit dass mindestens 100 und hochstens 150 Mal die Sechs gewurfelt wird Berechnung mit BinomialverteilungDie Zufallsvariable S 1000 displaystyle S 1000 nbsp die die zufallige Anzahl der gewurfelten Sechsen bei 1000 displaystyle 1000 nbsp Versuchen beschreibt ist binomialverteilt mit den Parametern n 1000 displaystyle n 1000 nbsp und p 1 6 displaystyle p 1 6 nbsp es gilt also S 1000 B i n 1000 1 6 displaystyle S 1000 sim mathrm Bin 1000 1 6 nbsp 6 Die gesuchte Wahrscheinlichkeit ist daherP 100 S 1000 150 k 100 150 1000 k 1 6 k 5 6 1000 k 0 083 7 displaystyle P 100 leq S 1000 leq 150 sum k 100 150 binom 1000 k left frac 1 6 right k left frac 5 6 right 1000 k approx 0 0837 nbsp dd Mit einer Wahrscheinlichkeit von ca 8 4 wird also bei 1000 Versuchen zwischen 100 und 150 Mal die Sechs gewurfelt Berechnung mit Normal ApproximationEs ist n p 1 p 1000 1 6 5 6 138 8 gt 9 displaystyle np 1 p 1000 frac 1 6 frac 5 6 138 bar 8 gt 9 nbsp Entsprechend der Faustformel gilt die approximierte Losung also ausreichend genau Die beiden Parameter fur die Approximation der Binomialverteilung durch eine Normalverteilung sind m n p 1000 6 displaystyle mu np 1000 6 nbsp und s n p 1 p 5000 36 displaystyle sigma sqrt np 1 p sqrt 5000 36 nbsp Die Approximation ohne Stetigkeitskorrektur wobei die Verteilungsfunktion der Binomialverteilung durch die Verteilungsfunktion einer Normalverteilung mit denselben Parametern approximiert wird istP 100 S 1000 150 P S 1000 150 P S 1000 99 F 150 m s F 99 m s F 1 414 2 F 5 741 71 1 F 1 414 2 0 078 6 displaystyle begin aligned P 100 leq S 1000 leq 150 amp P S 1000 leq 150 P S 1000 leq 99 amp approx Phi left frac 150 mu sigma right Phi left frac 99 mu sigma right amp approx Phi 1 4142 Phi 5 74171 approx 1 Phi 1 4142 approx 0 0786 end aligned nbsp dd Berechnung mit Normal Approximation und StetigkeitskorrekturDie Approximation mit Stetigkeitskorrektur istP 100 S 1000 150 F 150 0 5 m s F 100 0 5 m s F 1 371 8 F 5 699 3 1 F 1 371 8 0 085 1 displaystyle begin aligned P 100 leq S 1000 leq 150 amp approx Phi left frac 150 0 5 mu sigma right Phi left frac 100 0 5 mu sigma right amp approx Phi 1 3718 Phi 5 6993 approx 1 Phi 1 3718 approx 0 0851 end aligned nbsp dd Die Werte F z displaystyle Phi z nbsp konnen numerisch bestimmt werden oder aus Tabelle abgelesen werden da keine explizite Stammfunktion existiert Die approximierte Losung ist haufig numerisch gunstiger da keine umfangreichen Berechnungen der Binomialkoeffizienten durchgefuhrt werden mussen Beispiel 2 Bearbeiten nbsp Plot der Dichte der Normalverteilung mit m 12 und s 3 und der Binomialverteilung mit n 48 und p 1 4Gegeben sei eine binomialverteilte Zufallsvariable X displaystyle X nbsp mit den Parametern n 48 displaystyle n 48 nbsp und p 1 4 displaystyle p tfrac 1 4 nbsp dann hat X displaystyle X nbsp den Erwartungswert n p 3 displaystyle np 3 nbsp und die Varianz n p 1 p 9 displaystyle np 1 p 9 nbsp Die Binomialverteilung wird durch eine Normalverteilung N m s 2 displaystyle mathcal N mu sigma 2 nbsp mit dem Mittelwert m n p 12 displaystyle mu np 12 nbsp und der Varianz s 2 n p 1 p 9 displaystyle sigma 2 np 1 p 9 nbsp approximiert Nun suchen wir die Antwort auf die Frage Wie gross ist die Wahrscheinlichkeit dass X displaystyle X nbsp Werte kleiner oder gleich 3 annimmt bzw Wie gross ist die Wahrscheinlichkeit P 0 X 3 displaystyle P 0 leq X leq 3 nbsp Da 3 m 3 s displaystyle 3 mu 3 sigma nbsp ist handelt es sich um eine kleine Wahrscheinlichkeit im linken Verteilungsende die exakt mit Hilfe der Binomialverteilung oder approximativ aus der Normalverteilung berechnet werden kann Fur diese Fragestellung und Parameterkonstellation ergeben sich folgende Resultate Berechnung mit der BinomialverteilungP 0 X 3 k 0 3 48 k 1 4 k 3 4 48 k 0 000 7882 displaystyle P 0 leq X leq 3 sum k 0 3 binom 48 k cdot bigg frac 1 4 bigg k cdot bigg frac 3 4 bigg 48 k approx 0 0007882 nbsp Abschatzung mit der NormalverteilungP 0 X 3 P X 3 P X 1 F 3 12 3 F 1 12 3 F 3 F 13 3 0 001 3499 0 000 0073 0 001 343 displaystyle begin aligned P 0 leq X leq 3 amp P X leq 3 P X leq 1 amp approx Phi left tfrac 3 12 3 right Phi left tfrac 1 12 3 right amp Phi left 3 right Phi left 13 3 right amp approx 0 0013499 0 0000073 approx 0 001343 end aligned nbsp Abschatzung mit Normalverteilung und StetigkeitskorrekturP 0 X 3 F 3 0 5 12 3 F 0 0 5 12 3 F 8 5 3 F 12 5 3 0 002 303 0 0000015 0 002 29 displaystyle begin aligned P 0 leq X leq 3 amp approx Phi left tfrac 3 0 5 12 3 right Phi left tfrac 0 0 5 12 3 right amp Phi left 8 5 3 right Phi left 12 5 3 right amp approx 0 002303 0 0000015 approx 0 00229 end aligned nbsp Die Berechnung mit der Normalverteilung ohne Stetigkeitskorrektur uberschatzt die Wahrscheinlichkeit Dies ist darauf zuruckzufuhren dass die Binomialverteilung bei dieser Parameterkonstellation eine Schiefe aufweist die dazu fuhrt dass die Normalverteilung im linken Verteilungsende die entsprechenden Wahrscheinlichkeiten uberschatzt und im rechten Verteilungsende uberschatzt Ob dieser Approximationsfehler akzeptabel ist hangt von der Anwendung und Fragestellung ab Der absolute Approximationsfehler 0 001343 0 0007882 liegt unter 0 001 und kann damit z B in solchen statistischen Anwendungsfallen akzeptabel sein bei denen Konfidenz und Signifikanzniveaus in einer der groben Stufen a 10 5 1 displaystyle alpha in 10 5 1 nbsp festgelegt werden Anderseits ist der relative Approximationsfehler 0 001343 0 0007882 0 0007882 70 39 Dies kann bei anderen Anwendungen eine unakzeptable Ungenauigkeit der zu bestimmenden Wahrscheinlichkeit sein Die Verwendung der Stetigkeitskorrektur verschlechtert bei dieser Konstellation die Approximation durch die Normalverteilung da durch die Berucksichtigung zusatzlicher Wahrscheinlichkeitsmasse die Uberschatzung durch die Normalverteilung weiter verstarkt wird Das Beispiel zeigt insofern die Problematik einer standardmassigen Anwendung der Stetigkeitskorrektur wenn damit die Vorstellung einer gleichmassigen Verbesserung verbunden ist Literatur BearbeitenHans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage de Gruyter 2009 ISBN 978 3 11 021526 7 doi 10 1515 9783110215274 Ulrich Krengel Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik Vieweg Braunschweig 1988 ISBN 978 3 528 07259 9 doi 10 1007 978 3 322 96418 2 Einzelnachweise Bearbeiten Horst Rinne Taschenbuch der Statistik 4 Auflage Harri Deutsch Frankfurt am Main 2008 ISBN 978 3 8171 1827 4 S 304 Michael Sachs Wahrscheinlichkeitsrechnung und Statistik fur Ingenieurstudenten an Fachhochschulen Fachbuchverlag Leipzig Munchen 2003 ISBN 3 446 22202 2 S 129 130 Christian Hassold Sven Knoth Detlef Steuer Formelsammlung Statistik I amp II Beschreibende Statistik Wahrscheinlichkeitsrechnung Schliessende Statistik Hamburg 2010 S 25 Memento vom 9 Februar 2016 im Internet Archive zuletzt abgerufen 9 Februar 2016 K Zirkelbach W Schmid Kommentierte Formelsammlung Statistik I und II Deskriptive Statistik Wahrscheinlichkeitsrechnung Frankfurt Oder 2008 S 29 Formelsammlung zur Vorlesung Statistik I II fur Statistiker Mathematiker und Informatiker WS 08 09 LMU Munchen 2008 S 23 zuletzt abgerufen 9 Februar 2016 Etwas exakter Zur Modellierung definiert man den Wahrscheinlichkeitsraum W S P displaystyle Omega Sigma P nbsp mit der Ergebnismenge W 0 1000 displaystyle Omega 0 dotsc 1000 nbsp der Anzahl der gewurfelten Sechsen Die s Algebra ist dann kanonisch die Potenzmenge der Ergebnismenge S P W displaystyle Sigma mathcal P Omega nbsp und die Wahrscheinlichkeitsverteilung die Binomialverteilung P k B n p k displaystyle P k B n p k nbsp wobei n 1000 displaystyle n 1000 nbsp ist und p 1 6 displaystyle p 1 6 nbsp Abgerufen von https de wikipedia org w index php title Normal Approximation amp oldid 238933822