www.wikidata.de-de.nina.az
Der Begriff Mischverteilung oder zusammengesetzte Verteilung stammt aus der Wahrscheinlichkeitsrechnung Es handelt sich dabei um eine Wahrscheinlichkeitsverteilung die ein gewichtetes Mittel von mehreren Wahrscheinlichkeitsverteilungen ist Das heisst zum Beispiel seien f X 1 f X n displaystyle f X 1 dots f X n die Wahrscheinlichkeitsdichten von n displaystyle n verschiedenen Verteilungen dann ist die Dichte der Mischverteilung von der Form f X a 1 f X 1 a n f X n displaystyle f X a 1 f X 1 cdots a n f X n wobei a 1 a n displaystyle a 1 cdots a n normalisierte Gewichte sind Dadurch entsteht eine Mischung X displaystyle X von Zufallsgrossen X 1 X n displaystyle X 1 dots X n aus mehreren verschiedenen Grundgesamtheiten Inhaltsverzeichnis 1 Einfuhrendes Beispiel 2 Definition 2 1 Stetiger Fall 3 Eigenschaften 4 Haufiger Spezialfall Gausssche Mischmodelle 5 Parameterschatzung 6 Beispiel 7 Siehe auch 8 EinzelnachweiseEinfuhrendes Beispiel BearbeitenBetrachtet man beispielsweise das Merkmal Korpergrosse bei Kleinkindern erste Grundgesamtheit und Erwachsenen zweite Grundgesamtheit ist dieses Merkmal innerhalb jeder einzelnen Grundgesamtheit meist annahernd normalverteilt wobei der Mittelwert fur die Kleinkinder deutlich niedriger liegen durfte als fur die Erwachsenen Die Mischverteilung ist nun die Verteilung der Korpergrosse wenn man die beiden Grundgesamtheiten Kleinkinder und Erwachsene nicht einzeln sondern gemeinsam betrachtet also die Verteilung der Korpergrosse einer Person von der man nicht weiss ob sie Kleinkind oder Erwachsener ist Mathematisch handelt es sich in diesem Beispiel bei der Korpergrosse der Kleinkinder um eine Zufallsgrosse X 1 displaystyle X 1 nbsp aus der einen Grundgesamtheit G 1 displaystyle G 1 nbsp und bei der Korpergrosse der Erwachsenen um eine andere Zufallsgrosse X 2 displaystyle X 2 nbsp aus der anderen Grundgesamtheit G 2 displaystyle G 2 nbsp Die Mischung dieser beiden Zufallsgrossen ist eine weitere Zufallsgrosse X displaystyle X nbsp die mit einer gewissen Wahrscheinlichkeit a 1 displaystyle a 1 nbsp als X 1 displaystyle X 1 nbsp der ersten Grundgesamtheit G 1 displaystyle G 1 nbsp bzw mit Wahrscheinlichkeit a 2 displaystyle a 2 nbsp als X 2 displaystyle X 2 nbsp der anderen Grundgesamtheit G 2 displaystyle G 2 nbsp entstammt Da nur diese beiden Grundgesamtheiten zur Auswahl stehen muss a 1 a 2 1 displaystyle a 1 a 2 1 nbsp gelten Die Wahrscheinlichkeiten a 1 displaystyle a 1 nbsp und a 2 displaystyle a 2 nbsp lassen sich auch als relative Anteile der Grundgesamtheiten G 1 displaystyle G 1 nbsp und G 2 displaystyle G 2 nbsp an der gemeinsamen Grundgesamtheit interpretieren bezogen auf das Beispiel also als Anteil der Kleinkinder beziehungsweise der Erwachsenen an der Gesamtstichprobe Die Verteilung von X displaystyle X nbsp bestimmt sich uber das Gesetz der totalen Wahrscheinlichkeit zu P X x P X x X aus G 1 a 1 P X x X aus G 2 a 2 P X x X X 1 a 1 P X x X X 2 a 2 P X 1 x a 1 P X 2 x a 2 displaystyle begin alignedat 2 amp P X leq x amp amp P X leq x X text aus G 1 cdot a 1 P X leq x X text aus G 2 cdot a 2 amp amp amp P X leq x X X 1 cdot a 1 P X leq x X X 2 cdot a 2 amp amp amp P X 1 leq x cdot a 1 P X 2 leq x cdot a 2 text end alignedat nbsp Wenn X 1 displaystyle X 1 nbsp und X 2 displaystyle X 2 nbsp Verteilungsfunktionen F 1 displaystyle F 1 nbsp und F 2 displaystyle F 2 nbsp haben lautet die Verteilungsfunktion F displaystyle F nbsp von X displaystyle X nbsp also F x F 1 x a 1 F 2 x a 2 displaystyle F x F 1 x cdot a 1 F 2 x cdot a 2 nbsp Definition BearbeitenStetiger Fall Bearbeiten Lasst sich die Dichtefunktion einer stetigen Zufallsvariablen X displaystyle X nbsp als f x k 1 K a k f k x displaystyle f x sum k 1 K a k f k x nbsp schreiben so sagt man dass X displaystyle X nbsp einer Mischverteilung folgt Dabei sind die f k x displaystyle f k x nbsp Dichtefunktionen von stetigen Zufallsvariablen X k displaystyle X k nbsp und die a k displaystyle a k nbsp Wahrscheinlichkeiten mit k 1 K a k 1 displaystyle sum k 1 K a k 1 nbsp f displaystyle f nbsp ist also eine Konvexkombination der Dichten f 1 f K displaystyle f 1 ldots f K nbsp Man kann leicht zeigen dass unter diesen Bedingungen f displaystyle f nbsp nichtnegativ ist und die Normierungseigenschaft f x d x 1 displaystyle int infty infty f x mathrm d x 1 nbsp erfullt ist Entsprechend ergibt sich die Wahrscheinlichkeitsfunktion einer diskreten Mischverteilung als r x i k 1 K a k r k x i displaystyle rho x i sum k 1 K a k rho k x i nbsp aus den Wahrscheinlichkeitsfunktionen r k displaystyle rho k nbsp von diskreten Zufallsvariablen X k displaystyle X k nbsp Eigenschaften BearbeitenFur die Momente von X displaystyle X nbsp gilt E X p k 1 K a k E X k p p 1 2 3 displaystyle operatorname E X p sum k 1 K a k operatorname E X k p p in 1 2 3 dotsc nbsp Dies folgt im stetigen Fall aus E X p x p f x d x x p k 1 K a k f k x d x k 1 K a k x p f k x d x displaystyle operatorname E X p int infty infty x p f x mathrm d x int infty infty x p left sum k 1 K a k f k x right mathrm d x sum k 1 K a k left int infty infty x p f k x mathrm d x right nbsp Eine analoge Rechnung ergibt die Formel fur den diskreten Fall Haufiger Spezialfall Gausssche Mischmodelle Bearbeiten nbsp Beispiel einer Mischverteilung berechnet aus einem Modell mit den Parametern von drei einzelnen gewichteten Gaussverteilungen mit dem EM Algorithmus berechnet mit dem R Paket mclust 1 Ein haufiger Spezialfall von Mischverteilungen sind sogenannte Gausssche Mischmodelle gaussian mixture models kurz GMMs Dabei sind die Dichtefunktionen f 1 f K displaystyle f 1 ldots f K nbsp die der Normalverteilung mit potenziell verschiedenen Mittelwerten m 1 m K displaystyle mu 1 ldots mu K nbsp und Standardabweichungen s 1 s K displaystyle sigma 1 ldots sigma K nbsp beziehungsweise Mittelwertvektoren und Kovarianzmatrizen im d displaystyle d nbsp dimensionalen Fall Es gilt also f k x N m k S k x 1 2 p d 2 S k 1 2 exp 1 2 x m k S k 1 x m k displaystyle f k x mathcal N left mu k Sigma k right x frac 1 left 2 pi right frac d 2 Sigma k frac 1 2 exp left frac 1 2 x mu k Sigma k 1 x mu k right nbsp und die Dichte f displaystyle f nbsp der Mischverteilung hat die Form f x k 1 K a k f k x k 1 K a k 2 p d 2 S k 1 2 exp 1 2 x m k S k 1 x m k displaystyle f x sum k 1 K a k f k x sum k 1 K frac a k left 2 pi right frac d 2 Sigma k frac 1 2 exp left frac 1 2 x mu k Sigma k 1 x mu k right nbsp Parameterschatzung BearbeitenSchatzer fur die Parameter von Wahrscheinlichkeitsverteilungen werden haufig mit dem Maximum Likelihood Verfahren hergeleitet Im Falle von Mischverteilungen ergeben sich dabei allerdings meist Gleichungen deren Losungen sich nicht algebraisch angeben lassen und daher numerisch bestimmt werden mussen 2 Ein typisches Verfahren dazu ist der Expectation Maximization Algorithmus EM Algorithmus der beginnend bei initialen Werten fur die Parameter eine Folge von immer besseren Schatzwerten erzeugt die sich in vielen Fallen den realen Parametern annahern Beispiel Bearbeiten nbsp Verteilung des Gewichts der Forellen g Ein Forellenzuchter verkauft Forellen in grossen Mengen Es wird im Herbst beim Leeren der Teiche eine Bestandsaufnahme gemacht Dabei werden die herausgefischten Forellen gewogen Es ergibt sich die Verteilung des Gewichts wie in der Grafik zu ersehen ist Die Zweigipfligkeit der Verteilung deutet auf eine Mischverteilung hin Es stellt sich heraus dass die Forellen aus zwei verschiedenen Teichen stammen Die Forellengewichte aus dem ersten Teich sind normalverteilt mit dem Erwartungswert 400 g und der Varianz 4900 g2 und die aus dem zweiten Teich mit dem Erwartungswert 600 g und der Varianz 8100 g2 Aus dem ersten Teich stammen 40 der Forellen aus dem zweiten 60 Es ergibt sich die Dichtefunktion f x 0 4 1 70 2 p e 1 2 x 400 70 2 0 6 1 90 2 p e 1 2 x 600 90 2 displaystyle f x 0 4 cdot frac 1 70 cdot sqrt 2 pi e frac 1 2 left frac x 400 70 right 2 0 6 cdot frac 1 90 cdot sqrt 2 pi e frac 1 2 left frac x 600 90 right 2 nbsp siehe Abbildung Siehe auch BearbeitenSatz von Bayes Diskriminanzanalyse Kontaminierte NormalverteilungEinzelnachweise Bearbeiten Fraley Ch Raftery A MCLUST Version 3 for R Normal Mixture Modeling and Model Based Clustering Memento vom 24 September 2015 im Internet Archive Ghojogh Benyamin Ghojogh Aydin Crowley Mark Karray Fakhri Fitting A Mixture Distribution to Data Tutorial 20 Januar 2019 arxiv 1901 06708 englisch Abgerufen von https de wikipedia org w index php title Mischverteilung amp oldid 234761593