www.wikidata.de-de.nina.az
Die hypergeometrische Verteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik Sie ist univariat und zahlt zu den diskreten Wahrscheinlichkeitsverteilungen In Abgrenzung zur allgemeinen hypergeometrischen Verteilung wird sie auch klassische hypergeometrische Verteilung genannt 1 Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung fur n 20 displaystyle n 20 Rot M 20 N 60 displaystyle M 20 N 60 Blau M 20 N 30 displaystyle M 20 N 30 Grun M 50 N 60 displaystyle M 50 N 60 Einer dichotomen Grundgesamtheit werden in einer Stichprobe zufallig n displaystyle n Elemente ohne Zurucklegen entnommen Die hypergeometrische Verteilung gibt dann Auskunft daruber mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt die die gewunschte Eigenschaft haben Bedeutung kommt dieser Verteilung daher etwa bei Qualitatskontrollen zu Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurucklegen zugeordnet siehe auch Kombination ohne Wiederholung Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln Es werden n displaystyle n Kugeln ohne Zurucklegen entnommen Die Zufallsvariable X displaystyle X ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafur dass bei N displaystyle N gegebenen Elementen Grundgesamtheit des Umfangs N displaystyle N von denen M displaystyle M die gewunschte Eigenschaft besitzen beim Herausgreifen von n displaystyle n Probestucken Stichprobe des Umfangs n displaystyle n genau k displaystyle k Treffer erzielt werden d h die Wahrscheinlichkeit fur X k displaystyle X k Erfolge in n displaystyle n Versuchen Beispiel 1 In einer Urne befinden sich 30 displaystyle 30 Kugeln 20 displaystyle 20 davon sind blau also sind 10 displaystyle 10 nicht blau Wie hoch ist die Wahrscheinlichkeit p displaystyle p bei einer Stichprobe von zwanzig Kugeln genau dreizehn blaue Kugeln zu ziehen ohne Zurucklegen Antwort p 0 3096 displaystyle p 0 3096 Dies entspricht dem blauen Balken bei k 13 displaystyle k 13 im Diagramm Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung fur n 20 displaystyle n 20 Beispiel 2 In einer Urne befinden sich 45 displaystyle 45 Kugeln 20 displaystyle 20 davon sind gelb Wie hoch ist die Wahrscheinlichkeit p displaystyle p bei einer Stichprobe von zehn Kugeln genau vier gelbe Kugeln zu ziehen Antwort p 0 269 displaystyle p 0 269 Das Beispiel wird unten durchgerechnet Inhaltsverzeichnis 1 Definition 1 1 Alternative Parametrisierung 2 Eigenschaften der hypergeometrischen Verteilung 2 1 Symmetrien 2 2 Erwartungswert 2 3 Modus 2 4 Varianz 2 5 Schiefe 2 6 Charakteristische Funktion 2 7 Momenterzeugende Funktion 2 8 Wahrscheinlichkeitserzeugende Funktion 3 Beziehung zu anderen Verteilungen 3 1 Beziehung zur Binomialverteilung 3 2 Beziehung zur Polya Verteilung 3 3 Beziehung zum Urnenmodell 3 4 Beziehung zur multivariaten hypergeometrischen Verteilung 4 Beispiele 4 1 Lotto 4 2 Texas Hold em 4 3 Ausfuhrliches Rechenbeispiel mit Kugeln 5 Zahlenwerte zu den Beispielen 6 Weblinks 7 EinzelnachweiseDefinition BearbeitenDie hypergeometrische Verteilung ist abhangig von drei Parametern der Anzahl N displaystyle N nbsp der Elemente einer Grundgesamtheit der Anzahl M N displaystyle M leq N nbsp der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge die Anzahl moglicher Erfolge der Anzahl n N displaystyle n leq N nbsp der Elemente in einer Stichprobe Die Verteilung gibt nun Auskunft daruber wie wahrscheinlich es ist dass sich k displaystyle k nbsp Elemente mit der zu prufenden Eigenschaft Erfolge bzw Treffer in der Stichprobe befinden Der Ergebnisraum W displaystyle Omega nbsp ist daher max 0 n M N min n M displaystyle max 0 n M N dotsc min n M nbsp Eine diskrete Zufallsgrosse X displaystyle X nbsp unterliegt der hypergeometrischen Verteilung mit den Parametern M displaystyle M nbsp N displaystyle N nbsp und n displaystyle n nbsp wenn sie die Wahrscheinlichkeiten h k N M n P X k M k N M n k N n displaystyle h k N M n P X k frac displaystyle M choose k N M choose n k displaystyle N choose n nbsp fur k W displaystyle k in Omega nbsp besitzt Dabei bezeichnet N n displaystyle tbinom N n nbsp den Binomialkoeffizienten N displaystyle N nbsp uber n displaystyle n nbsp Man schreibt dann X H y p N M n displaystyle X sim Hyp N M n nbsp oder X H N M n displaystyle X sim H N M n nbsp Die Verteilungsfunktion H k N M n displaystyle H k mid N M n nbsp gibt dann die Wahrscheinlichkeit an dass hochstens k displaystyle k nbsp Elemente mit der zu prufenden Eigenschaft in der Stichprobe sind Diese kumulierte Wahrscheinlichkeit ist die Summe H k N M n P X k y 0 k h y N M n y 0 k M y N M n y N n displaystyle H k N M n P left X leq k right sum y 0 k h left y mid N M n right sum y 0 k frac displaystyle M choose y displaystyle N M choose n y displaystyle N choose n nbsp Alternative Parametrisierung Bearbeiten Gelegentlich wird auch als Wahrscheinlichkeitsfunktion H y p B 1 B 2 n k B 2 k B 1 n k B 1 B 2 n displaystyle Hyp B 1 B 2 n k frac displaystyle B 2 choose k B 1 choose n k displaystyle B 1 B 2 choose n nbsp verwendet Diese geht mit N B 1 B 2 displaystyle N B 1 B 2 nbsp und M B 2 displaystyle M B 2 nbsp in die obige Variante uber Eigenschaften der hypergeometrischen Verteilung BearbeitenSymmetrien Bearbeiten Es gelten folgende Symmetrien Vertauschung von gezogenen Kugeln und Erfolgen h k N M n h k N n M displaystyle h k N M n h k N n M nbsp Vertauschung von Erfolgen und Misserfolgen h k N M n h n k N N M n displaystyle h k N M n h n k N N M n nbsp Erwartungswert Bearbeiten Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable X displaystyle X nbsp ist E X k 0 n k M k N M n k N n n M N displaystyle operatorname E X sum k 0 n k frac displaystyle M choose k displaystyle N M choose n k displaystyle N choose n n frac M N nbsp Modus Bearbeiten Der Modus der hypergeometrischen Verteilung ist n 1 M 1 N 2 displaystyle left lfloor frac n 1 M 1 N 2 right rfloor nbsp Dabei ist displaystyle lfloor cdot rfloor nbsp die Gaussklammer Varianz Bearbeiten Die Varianz der hypergeometrisch verteilten Zufallsvariable X displaystyle X nbsp ist Var X k 0 n k 2 M k N M n k N n n M N 2 n M N 1 M N N n N 1 displaystyle operatorname Var X sum k 0 n k 2 frac displaystyle M choose k displaystyle N M choose n k displaystyle N choose n left n frac M N right 2 n frac M N left 1 frac M N right frac N n N 1 nbsp wobei der letzte Bruch der so genannte Korrekturfaktor Endlichkeitskorrektur beim Modell ohne Zurucklegen ist Schiefe Bearbeiten Die Schiefe der hypergeometrischen Verteilung ist v X N 2 M N 1 1 2 N 2 n n M N M N n 1 2 N 2 displaystyle operatorname v X frac N 2M N 1 frac 1 2 N 2n nM N M N n frac 1 2 N 2 nbsp Charakteristische Funktion Bearbeiten Die charakteristische Funktion hat die folgende Form ϕ X t N M n 2 F 1 n M N M n 1 e i t N n displaystyle phi X t N M choose n 2 F 1 n M N M n 1 e it over N choose n nbsp Wobei 2 F 1 displaystyle 2 F 1 cdot cdot cdot nbsp die gausssche hypergeometrische Funktion bezeichnet Momenterzeugende Funktion Bearbeiten Auch die momenterzeugende Funktion lasst sich mittels der hypergeometrischen Funktion ausdrucken M X t N M n 2 F 1 n M N M n 1 e t N n displaystyle M X t frac N M choose n 2 F 1 n M N M n 1 e t N choose n nbsp Wahrscheinlichkeitserzeugende Funktion Bearbeiten Die wahrscheinlichkeitserzeugende Funktion ist gegeben als m X t N M n 2 F 1 n M N M n 1 t N n displaystyle m X t frac N M choose n 2 F 1 n M N M n 1 t N choose n nbsp Beziehung zu anderen Verteilungen BearbeitenBeziehung zur Binomialverteilung Bearbeiten Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zuruckgelegt Ist der Umfang n displaystyle n nbsp der Stichprobe im Vergleich zum Umfang N displaystyle N nbsp der Grundgesamtheit relativ klein etwa n N lt 0 05 displaystyle n N lt 0 05 nbsp unterscheiden sich die durch die Binomialverteilung bzw die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander In diesen Fallen wird dann oft die Approximation durch die mathematisch einfacher zu handhabende Binomialverteilung vorgenommen Beziehung zur Polya Verteilung Bearbeiten Die hypergeometrische Verteilung ist ein Spezialfall der Polya Verteilung wahle c 1 displaystyle c 1 nbsp Beziehung zum Urnenmodell Bearbeiten Die hypergeometrische Verteilung entsteht aus der diskreten Gleichverteilung durch das Urnenmodell Aus einer Urne mit insgesamt N displaystyle N nbsp Kugeln sind M displaystyle M nbsp eingefarbt und es werden n displaystyle n nbsp Kugeln gezogen Die hypergeometrische Verteilung gibt fur max 0 n M N k min n M displaystyle max 0 n M N leq k leq min n M nbsp die Wahrscheinlichkeit an dass k displaystyle k nbsp gefarbte Kugeln gezogen werden Andernfalls kann auch mit der Binomialverteilung in der Praxis modelliert werden Siehe hierzu auch das Beispiel Beziehung zur multivariaten hypergeometrischen Verteilung Bearbeiten Die multivariate hypergeometrische Verteilung ist eine Verallgemeinerung der hypergeometrischen Verteilung Sie beantwortet die Frage nach der Anzahl der gezogenen Kugeln einer Farbe aus einer Urne wenn diese mehr als zwei unterscheidbare Farben von Kugeln enthalt Fur zwei Farben stimmt sie mit der hypergeometrischen Verteilung uberein Beispiele BearbeitenLotto Bearbeiten Ein Beispiel fur die praktische Anwendung der hypergeometrischen Verteilung ist das Lotto Beim Zahlenlotto gibt es 49 nummerierte Kugeln davon werden bei der Auslosung 6 gezogen Auf dem Lottoschein werden 6 Zahlen angekreuzt h x 49 6 6 displaystyle h x 49 6 6 nbsp gibt die Wahrscheinlichkeit dafur an genau x 0 1 2 3 4 5 6 displaystyle x in 0 1 2 3 4 5 6 nbsp Richtige zu erzielen Wahrscheinlichkeit beim deutschen Lotto nbsp In linearer Auftragung nbsp In logarithmischer AuftragungTexas Hold em Bearbeiten Bei der Pokervariante Texas Hold em werden von den 52 Spielkarten funf Community Cards aufgedeckt Wenn die diskrete Zufallsvariable X displaystyle X nbsp die Anzahl der Asse zahlt die aufgedeckt werden ergibt sich fur X displaystyle X nbsp die hypergeometrische Verteilung h k 52 4 5 P X k 4 k 52 4 5 k 52 5 displaystyle h k 52 4 5 P X k frac displaystyle 4 choose k 52 4 choose 5 k displaystyle 52 choose 5 nbsp mit N 52 displaystyle N 52 nbsp Spielkarten M 4 displaystyle M 4 nbsp Assen und n 5 displaystyle n 5 nbsp Community Cards Gesucht ist die Wahrscheinlichkeit dass von den funf Community Cards genau zwei Asse sind Gesamtanzahl der Spielkarten N 52 displaystyle N 52 nbsp Anzahl der Asse M 4 displaystyle M 4 nbsp Umfang der Stichprobe n 5 displaystyle n 5 nbsp Anzahl der Treffer Asse k 2 displaystyle k 2 nbsp Also h 2 52 4 5 displaystyle h 2 52 4 5 nbsp Diese Wahrscheinlichkeit ergibt sich aus Anzahl der Moglichkeiten genau zwei Asse auszuwahlengeteilt durch dd Anzahl der Moglichkeiten genau funf von 52 Spielkarten auszuwahlenEs gibt M k 4 2 6 displaystyle M choose k 4 choose 2 6 nbsp Moglichkeiten genau zwei der vier Asse auszuwahlen Es gibt N M n k 48 3 17296 displaystyle N M choose n k 48 choose 3 17296 nbsp Moglichkeiten genau drei der 48 anderen Spielkarten auszuwahlen Da jedes Ass mit jeder anderen Spielkarte kombiniert werden kann ergeben sich M k N M n k 4 2 48 3 6 17296 103776 displaystyle M choose k cdot N M choose n k 4 choose 2 cdot 48 choose 3 6 cdot 17296 103776 nbsp Moglichkeiten fur genau zwei Asse und drei andere Spielkarten Es gibt insgesamt N n 52 5 2598960 displaystyle N choose n 52 choose 5 2598960 nbsp Moglichkeiten funf von 52 Spielkarten aufzudecken Wir erhalten also die Wahrscheinlichkeit P X 3 h 2 52 4 5 4 2 48 3 52 5 103776 2598960 0 039 9 displaystyle P X 3 h 2 52 4 5 frac 4 choose 2 cdot 48 choose 3 52 choose 5 frac 103776 2598960 approx 0 0399 nbsp das heisst in etwa vier Prozent der Falle werden genau zwei Asse aufgedeckt Die Werte und die Wahrscheinlichkeiten fur die hypergeometrische Verteilung h k 52 4 5 displaystyle h k 52 4 5 nbsp lassen sich in folgender Tabelle zusammenfassen X x i displaystyle X x i nbsp 0 displaystyle 0 nbsp 1 displaystyle 1 nbsp 2 displaystyle 2 nbsp 3 displaystyle 3 nbsp 4 displaystyle 4 nbsp P X x i p i displaystyle P X x i p i nbsp 1712304 2598960 displaystyle frac 1712304 2598960 nbsp 778320 2598960 displaystyle frac 778320 2598960 nbsp 103776 2598960 displaystyle frac 103776 2598960 nbsp 4512 2598960 displaystyle frac 4512 2598960 nbsp 48 2598960 displaystyle frac 48 2598960 nbsp Der Erwartungswert betragt m n M N 5 4 52 5 13 displaystyle color BrickRed mu n cdot frac M N 5 cdot frac 4 52 color BrickRed frac 5 13 nbsp Die Varianz ist demnach gegeben durch s 2 i 0 4 x i m 2 p i 0 5 13 2 1712304 2598960 1 5 13 2 778320 2598960 2 5 13 2 103776 2598960 3 5 13 2 4512 2598960 4 5 13 2 48 2598960 0 327 displaystyle sigma 2 sum i 0 4 x i color BrickRed mu 2 p i left 0 color BrickRed frac 5 13 right 2 cdot frac 1712304 2598960 left 1 color BrickRed frac 5 13 right 2 cdot frac 778320 2598960 left 2 color BrickRed frac 5 13 right 2 cdot frac 103776 2598960 left 3 color BrickRed frac 5 13 right 2 cdot frac 4512 2598960 left 4 color BrickRed frac 5 13 right 2 cdot frac 48 2598960 approx 0 327 nbsp Fur die Standardabweichung ergibt sich damit s s 2 0 327 0 572 displaystyle sigma sqrt sigma 2 approx sqrt 0 327 approx 0 572 nbsp Ausfuhrliches Rechenbeispiel mit Kugeln Bearbeiten In einem Behalter befinden sich 45 Kugeln von denen 20 gelb sind Es werden zehn Kugeln ohne Zurucklegen entnommen Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafur an dass genau x 0 1 2 3 10 der entnommenen Kugeln gelb sind nbsp Zu dem oben aufgefuhrten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden dass genau 4 gelbe Kugeln resultieren Gesamtanzahl der Kugeln N 45 displaystyle N 45 nbsp Anzahl mit der Eigenschaft gelb M 20 displaystyle M 20 nbsp Umfang der Stichprobe n 10 displaystyle n 10 nbsp Anzahl der Treffer gelb k 4 displaystyle k 4 nbsp Also h 4 45 20 10 displaystyle h 4 45 20 10 nbsp Die Wahrscheinlichkeit ergibt sich aus Anzahl der Moglichkeiten genau 4 gelbe und damit genau 6 violette Kugeln auszuwahlengeteilt durch dd Anzahl der Moglichkeiten genau 10 von 45 Kugeln beliebiger Farbe auszuwahlenEs gibt M k 20 4 4845 displaystyle M choose k 20 choose 4 4845 nbsp Moglichkeiten genau 4 gelbe Kugeln auszuwahlen Es gibt N M n k 25 6 177 100 displaystyle N M choose n k 25 choose 6 177 100 nbsp Moglichkeiten genau 6 violette Kugeln auszuwahlen Da jede gelbe Kugel mit jeder violetten Kugel kombiniert werden kann ergeben sich M k N M n k 4845 177100 858 049 500 displaystyle M choose k cdot N M choose n k 4845 cdot 177100 858 049 500 nbsp Moglichkeiten fur genau 4 gelbe und 6 violette Kugeln Es gibt insgesamt N n 45 10 3 190 187 286 displaystyle N choose n 45 choose 10 3 190 187 286 nbsp Moglichkeiten 10 Kugeln zu ziehen Wir erhalten also die Wahrscheinlichkeit P X 4 h 4 45 20 10 20 4 25 6 45 10 858049500 3190187286 0 269 displaystyle P X 4 h 4 45 20 10 frac 20 choose 4 cdot 25 choose 6 45 choose 10 frac 858049500 3190187286 approx 0 269 nbsp das heisst in rund 27 Prozent der Falle werden genau 4 gelbe und 6 violette Kugeln entnommen Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden P X 4 h 4 45 10 20 10 4 35 16 45 20 0 269 displaystyle P X 4 h 4 45 10 20 frac 10 choose 4 cdot 35 choose 16 45 choose 20 approx 0 269 nbsp Es befinden sich in der Stichprobe von 10 Kugeln namlich 4 gelbe Kugeln Die restlichen 16 gelben Kugeln befinden sich unter den 35 ubriggebliebenen Kugeln die nicht zur Stichprobe gehoren Zahlenwerte zu den Beispielen Bearbeitenh x 45 20 10 x Anzahl moglicherErgebnisse Wahrscheinlichkeitin 0 3 268 760 0 10241 40 859 500 1 28072 205 499 250 6 44163 547 998 000 17 17764 858 049 500 26 89655 823 727 520 25 82076 490 314 000 15 36947 178 296 000 5 58898 37 791 000 1 18469 4 199 000 0 131610 184 756 0 0058 3 190 187 286 100 0000Erwartungswert 4 4444Varianz 1 9641 h x 45 10 20 x Anzahl moglicherErgebnisse Wahrscheinlichkeitin 0 3 247 943 160 0 10241 40 599 289 500 1 28082 204 190 544 250 6 44163 544 508 118 000 17 17764 852 585 079 500 26 89655 818 481 676 320 25 82076 487 191 474 000 15 36947 177 160 536 000 5 58898 37 550 331 000 1 18469 4 172 259 000 0 131610 183 579 396 0 005811 20 0 0 3 169 870 830 126 100 0000Erwartungswert 4 4444Varianz 1 9641h x 49 6 6 x Anzahl moglicherErgebnisse Wahrscheinlichkeitin 0 6 096 454 43 59651 5 775 588 41 30192 1 851 150 13 23783 246 820 1 7654 13 545 0 09695 258 0 00186 1 0 0000072 13 983 816 100 0000Erwartungswert 0 7347Varianz 0 5776Weblinks Bearbeiten nbsp Wikibooks Hypergeometrische Verteilung Lern und Lehrmaterialien Rechner fur einfache und kumulierte Wahrscheinlichkeiten der hypergeometrischen VerteilungEinzelnachweise Bearbeiten Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 S 36 doi 10 1515 9783110215274 Diskrete univariate Verteilungen Diskrete univariate Verteilungen fur endliche Mengen Benford Bernoulli beta binomial binomial Dirac diskret uniform empirisch hypergeometrisch kategorial negativ hypergeometrisch Rademacher verallgemeinert binomial Zipf Zipf Mandelbrot ZweipunktDiskrete univariate Verteilungen fur unendliche Mengen Boltzmann Conway Maxwell Poisson discrete Phase Type erweitert negativ binomial Gauss Kuzmin gemischt Poisson geometrisch logarithmisch negativ binomial parabolisch fraktal Poisson Skellam verallgemeinert Poisson Yule Simon ZetaKontinuierliche univariate Verteilungen Kontinuierliche univariate Verteilungen mit kompaktem Intervall Beta Cantor Kumaraswamy raised Cosine Dreieck Trapez U quadratisch stetig uniform Wigner HalbkreisKontinuierliche univariate Verteilungen mit halboffenem Intervall Beta prime Bose Einstein Burr Chi Chi Quadrat Coxian Erlang Exponential Extremwert F Fermi Dirac Folded normal Frechet Gamma Gamma Gamma verallgemeinert invers Gauss halblogistisch halbnormal Hartman Watson Hotellings T Quadrat hyper exponentiale hypoexponential invers Chi Quadrat scale invers Chi Quadrat Invers Normal Invers Gamma Kolmogorow Verteilung Levy log normal log logistisch Maxwell Boltzmann Maxwell Speed Nakagami nichtzentriert Chi Quadrat Pareto Phase Type Rayleigh relativistisch Breit Wigner Rice Rosin Rammler shifted Gompertz truncated normal Type 2 Gumbel Weibull Wilks LambdaKontinuierliche univariate Verteilungen mit unbeschranktem Intervall Cauchy Extremwert exponential Power Fishers z Fisher Tippett Gumbel generalized hyperbolic Hyperbolic secant Landau Laplace alpha stabil logistisch normal Gauss normal invers Gauss sch Skew normal Studentsche t Type 1 Gumbel Variance Gamma VoigtMultivariate Verteilungen Diskrete multivariate Verteilungen Dirichlet compound multinomial Ewens gemischt Multinomial multinomial multivariat hypergeometrisch multivariat Poisson negativmultinomial Polya Eggenberger polyhypergeometrischKontinuierliche multivariate Verteilungen Dirichlet GEM generalized Dirichlet multivariat normal multivariat Student normalskaliert invers Gamma Normal Gamma Poisson DirichletMultivariate Matrixverteilungen Invers Wishart Matrix Beta Matrix Gamma Matrix invers Beta Matrix invers Gamma Matrix Normal Matrix Student t Normal invers Wishart Normal Wishart Wishart Abgerufen von https de wikipedia org w index php title Hypergeometrische Verteilung amp oldid 237370319