www.wikidata.de-de.nina.az
Als Randverteilungen oder Marginalverteilung werden in der Stochastik die Wahrscheinlichkeitsverteilungen von Teilfamilien einer gegebenen Familie von Zufallsvariablen bezeichnet Die Verteilung der gesamten Familie wird zur Verdeutlichung auch gemeinsame Verteilung der Zufallsvariablen genannt Sind beispielsweise X X und Y Y Zufallsvariablen auf demselben Wahrscheinlichkeitsraum dann heissen die Verteilungen der einzelnen Variablen X X und Y Y die Randverteilungen des Zufallsvektors X Y X Y Darstellung der Standardabweichungsellipse einer zweidimensionalen Normalverteilung sowie der beiden Marginalverteilungen rot und blau Randverteilungen kann man sowohl fur diskrete als auch fur stetige Merkmale berechnen Wie bei Verteilungen allgemein unterscheidet man dementsprechend diskrete Randverteilungen stetige RandverteilungenAusserdem kann man die Randverteilung sowohl fur absolute Haufigkeiten als auch fur relative Haufigkeiten bilden Die einzelnen Werte der Randverteilung nennt man dann Randhaufigkeiten auch Marginalhaufigkeiten oder marginale Haufigkeiten Die Randhaufigkeiten fur kategorial unterteilte distinkte Merkmale lassen sich am Rand einer Kontingenztafel ablesen Sie sind hier die Summen der Haufigkeiten uber das vernachlassigte Merkmal hinweg Inhaltsverzeichnis 1 Beispiel anhand von Kontingenztafeln 2 Definition 3 Elementare Eigenschaften 4 Abgeleitete Begriffe 4 1 Rand Verteilungsfunktion 4 2 Randdichte 4 3 Rand Wahrscheinlichkeitsfunktion 5 Beispiel Multinomialverteilung 5 1 In zwei Dimensionen 5 2 In mehreren Dimensionen 6 Verwandte Konzepte 7 Literatur 8 EinzelnachweiseBeispiel anhand von Kontingenztafeln BearbeitenRandverteilungen diskreter Merkmale lassen sich in Kontingenztafeln darstellen Am Rand dieser Tafel lassen sich die Randhaufigkeiten die zusammen die Randverteilung bilden als Summen uber das vernachlassigte Merkmal ablesen Beispielsweise ist hier eine Kontingenztafel mit absoluten Haufigkeiten zu sehen Mann Frau RandhaufigkeitenKlasse 10 10 10 20Klasse 11 4 16 20Randhaufigkeiten 14 26 40Die Randhaufigkeit in der Klasse 10 zu sein unter der Vernachlassigung dessen ob man mannlich oder weiblich ist betragt 20 Die entsprechende Randhaufigkeit fur Klasse 11 ist ebenso 20 Die Randverteilung ist also gleichverteilt weil es gleich viele Schuler in beiden Klassen gibt Das Merkmal Klasse ist distinkt das heisst in klar abgegrenzte Kategorien unterteilt Dieselbe Tabelle ware auch mit relativen Haufigkeiten denkbar Die relativen Randhaufigkeiten sind dann gemass der frequentistischen Interpretation ein Schatzer fur die Randwahrscheinlichkeiten Es gibt allerdings auch Merkmale die nicht in Kategorien unterteilt sind wie zum Beispiel Korpergrosse Diese Merkmale sind stetig weil es fliessende Ubergange zwischen allen moglichen Auspragungen des Merkmals gibt Solche Merkmale lassen sich nicht in Tabellen darstellen Um die Darstellung in einer Kontingenztafel dennoch zu ermoglichen ist es moglich das Merkmal in Klassen gemeint sind hier Kategorien einzuteilen indem man sogenannte Klassengrenzen festlegt 1 Das stetige Merkmal Korpergrosse konnten man einteilen indem man als Klassengrenze 142 cm festlegt und die Personen in Leute grosser als 142 cm und nicht grosser als 142 cm einteilt Fur diese in Klassen eingeteilte Gruppen lassen sich nun wieder Klassenhaufigkeiten messen die man in einer Kontingenztafel eintragt Da eine Person die in einer Klasse gt 142 ist nicht zugleich in einer anderen Klasse 142 sein kann spricht man auch von einer Einteilung in disjunkte Mengen Definition BearbeitenGegeben sei eine W 1 W n displaystyle Omega 1 times cdots times Omega n wertige Zufallsvariable Z X 1 X n displaystyle Z X 1 dotsc X n mit einer multivariaten Verteilung P Z P Z als Wahrscheinlichkeitsmass Dann heisst die Verteilung P X i A P Z W 1 W i 1 A W i 1 W n displaystyle P X i A P Z Omega 1 times dotsb times Omega i 1 times A times Omega i 1 times dotsb times Omega n die i te Randverteilung oder die i te Marginalverteilung von Z Z Alternativ wird sie auch definiert als P X i A P X 1 W 1 X i 1 W i 1 X i A X i 1 W i 1 X n W n displaystyle P X i A P X 1 in Omega 1 dotsc X i 1 in Omega i 1 X i in A X i 1 in Omega i 1 dotsc X n in Omega n Im Zweidimensionalen mit Z X Y Z X Y ware also die erste Randverteilung P X A P Z A W 2 bzw P X A P X A Y W 2 P X A P Z A times Omega 2 text bzw P X A P X in A Y in Omega 2 Allgemeiner lassen sich Randverteilungen auch fur jede Teilmenge J I 1 n displaystyle J subset I 1 dotsc n definieren Ist J m J m so heissen sie m dimensionale Randverteilungen Sie sind dann definiert durch P X J A P X i A i wenn i J X i W i sonst displaystyle P X J A begin cases P X i in A i amp mbox wenn i in J X i in Omega i amp mbox sonst end cases fur A i J A i A prod i in J A i Elementare Eigenschaften BearbeitenEs existieren genau n m tbinom n m m dimensionale Randverteilungen Aus Sicht der Masstheorie handelt es sich bei Randverteilungen um die Bildmasse unter den Projektionen auf eine oder mehrere Koordinaten Sind die X i X i stochastisch unabhangige Zufallsvariablen so ist die gemeinsame Verteilung der X i X i genau das Produkt der eindimensionalen Randverteilungen Abgeleitete Begriffe BearbeitenRand Verteilungsfunktion Bearbeiten Besitzt Z Z die Verteilungsfunktion F Z R n 0 1 F Z colon mathbb R n to 0 1 so lasst sich auch eine Rand Verteilungsfunktion als Verteilungsfunktion der Randverteilungen angeben Fur die eindimensionalen Randverteilungen ist sie definiert als F X i x i F Z x i displaystyle F X i x i F Z infty dotsc infty x i infty dotsc infty Alle Komponenten bis auf die i te werden also auf unendlich gesetzt Analog geht man bei den m dimensionalen Rand Verteilungsfunktionen vor Alle Komponenten in J J bleiben erhalten alle anderen werden auf unendlich gesetzt Fur den zweidimensionalen Fall mit Z X Y Z X Y ergibt sich dann als die erste Randverteilungsfunktion F X x F Z x F X x F Z x infty Randdichte Bearbeiten Ebenso lassen sich fur Randverteilungen auch Wahrscheinlichkeitsdichten angeben die Randdichten genannt werden Das sind diejenigen Funktionen f X i f X i fur die F X i x i x i f X i t d t displaystyle F X i x i int infty x i f X i t mathrm d t gilt Besitzt Z Z eine gemeinsame Dichte f Z x 1 x n displaystyle f Z x 1 dotsc x n so lasst sich die Rand Dichte auch als f X i x i f Z x 1 x i 1 x i x i 1 x n d x 1 d x i 1 d x i 1 d x n displaystyle f X i x i int infty infty dotsi int infty infty int infty infty dotsi int infty infty f Z x 1 dotsc x i 1 x i x i 1 dotsc x n mathrm d x 1 dotsm mathrm d x i 1 mathrm d x i 1 dotsm mathrm d x n definieren Fur m dimensionale Rand Dichten geht man analog vor man integriert dann uber alle Komponenten die nicht in J J enthalten sind Im Zweidimensionalen mit Z X Y Z X Y erhalt man dann mittels Integration uber die jeweils andere Komponente als Rand Dichten f X x f Z x y d y f X x int infty infty f Z x y mathrm d y f Y y f Z x y d x f Y y int infty infty f Z x y mathrm d x Rand Wahrscheinlichkeitsfunktion Bearbeiten Ebenso wie Rand Dichten lassen sich auch Rand Wahrscheinlichkeitsfunktionen angeben Im Wesentlichen wird dabei nur die Integration durch die Summation ersetzt Hat Z Z eine gemeinsame Wahrscheinlichkeitsfunktion f Z x 1 x n displaystyle f Z x 1 dotsc x n so ist die i te Rand Wahrscheinlichkeitsfunktion gegeben als f X i x i j i x j Z f Z x 1 x n displaystyle f X i x i sum j neq i atop x j in mathbb Z f Z x 1 dotsc x n Ebenso erhalt man die m dimensionalen Randverteilungen durch Summation wenn man die Komponenten von Interesse nicht mitsummiert Im zweidimensionalen mit Z X Y Z X Y ergibt sich dann f X x i k K f Z x i y k f X x i sum k in K f Z x i y k f Y y k i I f Z x i y k f Y y k sum i in I f Z x i y k Beispiel Multinomialverteilung BearbeitenIn zwei Dimensionen Bearbeiten Sei als Beispiel Z X Y Z X Y zweidimensional multinomialverteilt also Z M n p 1 p Z sim M n p 1 p Demnach hat Z Z die Wahrscheinlichkeitsfunktion f Z x y n x y p x 1 p y wenn x y n 0 sonst displaystyle f Z x y begin cases n choose x y p x 1 p y amp mbox wenn x y n 0 amp mbox sonst end cases Hierbei ist n x y n choose x y der Multinomialkoeffizient Setzt man y n x y n x so ergibt sich direkt f Z x y n x p x 1 p n x f Z x y n choose x p x 1 p n x Die Wahrscheinlichkeitsfunktion lasst sich also unabhangig von y y darstellen Demnach ist die Randdichte von X X die durch Aufsummieren uber alle y y entsteht wieder genau die Wahrscheinlichkeitsfunktion von Z Z bloss ohne y y als Variable Es ist also f X x n x p x 1 p n x f X x n choose x p x 1 p n x die Randverteilung der Multionomialverteilung ist also eine Binomialverteilung mit den Parametern p p und n n In mehreren Dimensionen Bearbeiten Sei Z X 1 X m displaystyle Z X 1 dotsc X m und m m dimensional multinomialverteilt also Z M n p 1 p m displaystyle Z sim M n p 1 dotsc p m mit p 1 p m 1 displaystyle p 1 dotsb p m 1 Die Wahrscheinlichkeitsfunktion ist dann f Z x 1 x m n x 1 x m p 1 x 1 p k x m wenn x 1 x m N 0 und x 1 x m n 0 sonst displaystyle f Z x 1 dotsc x m begin cases n choose x 1 dotsc x m p 1 x 1 dotsm p k x m amp mbox wenn x 1 dotsc x m in mathbb N 0 mbox und x 1 dotsb x m n 0 amp mbox sonst end cases Zur Berechnung der ersten Randverteilung summiert man nun uber alle x 2 x 3 x m displaystyle x 2 x 3 dotsc x m Zur Vereinfachung der Rechnung gruppiert man p 2 p m 1 p 1 displaystyle p 2 dotsb p m 1 p 1 und x 1 n x 2 x m displaystyle x 1 n x 2 dotsb x m Mithilfe des Multinomialtheorems folgt dann dass die Randverteilung wieder binomialverteilt ist mit den Parametern n n und p 1 p 1 Verwandte Konzepte BearbeitenOftmals sollen einerseits Randverteilungen mit einer speziellen Verteilung generiert werden Anderseits soll die gemeinsame Verteilung von Zufallsvariablen mit ihren Abhangigkeiten richtig dargestellt werden Solche multivariaten Verteilungen sind nicht nur durch die Randverteilungen und die Korrelation beschrieben vielmehr muss die Abhangigkeit oftmals genauer beschrieben und modelliert werden Z B erwartet man bei der Modellierung von Bondreturns moglicherweise dass auch der Spread zwischen den beiden Returns in einem plausiblen Korridor verbleibt Daher ist es bei der Modellierung von multivariaten Verteilungen oftmals notwendig oder nutzlich die Randverteilungen und ihre Abhangigkeit voneinander separat zu modellieren Dies erfolgt uber die Kalibrierung einer Copula Mittels der Randverteilungen lasst sich aus einer multivariaten Verteilung die bedingte Verteilung bestimmen Sie modelliert dass bereits Wissen uber den Wert einer Zufallsvariable vorhanden ist Literatur BearbeitenI N Bronstein Taschenbuch der Mathematik Verlag Harri Deutsch ISBN 3 8171 2006 0 Norbert Henze Stochastik fur Einsteiger Eine Einfuhrung in die faszinierende Welt des Zufalls Vieweg Teubner Verlag 2010 ISBN 978 3 8348 0815 8 doi 10 1007 978 3 8348 9351 2 Christian Hesse Angewandte Wahrscheinlichkeitstheorie 1 Auflage Vieweg Wiesbaden 2003 ISBN 3 528 03183 2 doi 10 1007 978 3 663 01244 3 Einzelnachweise Bearbeiten P Heinz Muller Hrsg Wahrscheinlichkeitsrechnung und mathematische Statistik Lexikon der Stochastik Akademie Verlag Berlin 1980 S 116 und S 124 Abgerufen von https de wikipedia org w index php title Randverteilung amp oldid 228734772