www.wikidata.de-de.nina.az
In der Wahrscheinlichkeitstheorie und in der Statistik ist eine Exponentialfamilie oder exponentielle Familie eine Klasse von Wahrscheinlichkeitsverteilungen einer ganz bestimmten Form Man wahlt diese spezielle Form um bestimmte Rechenvorteile auszunutzen oder aus Grunden der Verallgemeinerung Exponentialfamilien sind in gewissem Sinne sehr naturliche Verteilungen und eine dominierte Verteilungsklasse was viele Vereinfachungen in der Handhabung mit sich bringt Das Konzept der Exponentialfamilien geht zuruck auf 1 E J G Pitman 2 G Darmois 3 und B O Koopman 4 1935 6 Inhaltsverzeichnis 1 Einparametrige Exponentialfamilie 1 1 Definition 1 2 Beispiele 1 3 Alternative Definitionen 2 k parametrige Exponentialfamilie 2 1 Definition 2 2 Beispiel 2 3 Alternative Definitionen 2 4 Die naturliche Parametrisierung 3 Eigenschaften 3 1 Suffizienz 3 2 Score Funktion 3 3 Fisher Information 4 Rolle in der Statistik 4 1 Klassisches Schatzen Suffizienz 4 2 Bayessches Schatzen konjugierte Verteilungen 4 3 Hypothesentests gleichmassig bester Test 5 Literatur 6 EinzelnachweiseEinparametrige Exponentialfamilie BearbeitenDefinition Bearbeiten Eine Familie von Wahrscheinlichkeitsmassen P ϑ ϑ 8 displaystyle P vartheta vartheta in Theta nbsp auf dem Messraum X A displaystyle X mathcal A nbsp mit 8 R displaystyle Theta subset mathbb R nbsp heisst eine einparametrige Exponentialfamilie wenn es ein s endliches Mass m displaystyle mu nbsp gibt so dass alle P ϑ displaystyle P vartheta nbsp eine Dichtefunktion der Gestalt f x ϑ h x A ϑ exp h ϑ T x displaystyle f x vartheta h x A vartheta exp eta vartheta T x nbsp bezuglich m displaystyle mu nbsp besitzen Meist handelt es sich bei m displaystyle mu nbsp um das Lebesgue Mass die Dichtefunktionen sind dann herkommliche Wahrscheinlichkeitsdichtefunktion stetiger Fall um das Zahlmass die Dichtefunktionen sind dann Zahldichten diskreter Fall Dabei ist T X A R B R displaystyle T X mathcal A to mathbb R mathcal B mathbb R nbsp eine messbare Funktion die naturliche suffiziente Statistik oder kanonische Statistik der Exponentialfamilie Ebenso ist h X A R B R displaystyle h X mathcal A to mathbb R mathcal B mathbb R nbsp eine messbare Funktion Die Funktion A 8 R displaystyle A Theta to mathbb R nbsp wird Normierungsfunktion oder Normierungskonstante genannt und garantiert dass die in der Definition eines Wahrscheinlichkeitsmasses geforderte Normierung gegeben ist Des Weiteren ist h 8 R displaystyle eta Theta to mathbb R nbsp eine beliebige reelle Funktionen des Parameters Beispiele Bearbeiten Ein elementares Beispiel sind die Binomialverteilungen auf X 1 n displaystyle X 1 dots n nbsp mit A P X displaystyle mathcal A mathcal P X nbsp Sie besitzen die Wahrscheinlichkeitsfunktion beziehungsweise die Dichtefunktion bezuglich des Zahlmasses f x ϑ n x ϑ x 1 ϑ n x n x 1 ϑ n exp x ln ϑ 1 ϑ displaystyle f x vartheta binom n x vartheta x 1 vartheta n x binom n x 1 vartheta n exp left x ln left frac vartheta 1 vartheta right right nbsp mit ϑ 0 1 displaystyle vartheta in 0 1 nbsp Somit ist die Binomialverteilung teil einer Exponentialfamilie und wird charakterisiert durch T x x h ϑ ln ϑ 1 ϑ A ϑ 1 ϑ n und h x n x displaystyle T x x quad eta vartheta ln left frac vartheta 1 vartheta right quad A vartheta 1 vartheta n text und h x binom n x nbsp Ein weiteres Beispiel sind die Exponentialverteilungen Sie sind auf 0 B 0 displaystyle 0 infty mathcal B 0 infty nbsp definiert mit ϑ 0 displaystyle vartheta in 0 infty nbsp und besitzen die Wahrscheinlichkeitsdichtefunktion f x ϑ ϑ exp ϑ x displaystyle f x vartheta vartheta exp left vartheta x right nbsp Somit ist in diesem Fall T x x h ϑ ϑ sowie A ϑ ϑ displaystyle T x x quad eta vartheta vartheta text sowie A vartheta vartheta nbsp Zu beachten ist dass eine einparametrige Exponentialfamilie durchaus eine multivariate Verteilung sein kann Einparametrig bedeutet hier nur dass die Dimensionalitat des Formparameters ϑ displaystyle vartheta nbsp eins ist Ob die definierte Wahrscheinlichkeitsverteilung univariat oder multivariat ist hangt von der Dimensionalitat des Grundraumes X displaystyle X nbsp ab an die keine Anforderungen gestellt sind Alternative Definitionen Bearbeiten Die Definitionen einer Exponentialfamilie unterscheiden sich meist in den folgenden Punkten Nicht alle Autoren schreiben die Funktionen h displaystyle h nbsp und A displaystyle A nbsp als Produkt vor die Exponentialfunktion teilweise stehen sie auch als Summe in der Exponentialfunktion manchmal mit negativem Vorzeichen So finden sich die Definitionenf x ϑ exp h ϑ T x h x A ϑ oder alternativ f x ϑ h x exp h ϑ T x A ϑ displaystyle f x vartheta exp eta vartheta T x h x A vartheta text oder alternativ f x vartheta h x exp eta vartheta T x tilde A vartheta nbsp Diese unterschiedlich definierten Funktionen lassen sich meist problemlos ineinander umrechen Dennoch ist bei einer Angabe der Funktionen A displaystyle A nbsp und h displaystyle h nbsp darauf zu achten wie genau diese definiert werden Manche Autoren versehen die Dichtefunktion noch mit einer charakteristischen Funktion bezuglich einer Menge M displaystyle M nbsp Die Dichtefunktion ist dann gegeben alsf x ϑ x M x h x A ϑ exp h ϑ T x displaystyle f x vartheta chi M x h x A vartheta exp eta vartheta T x nbsp Dabei soll die Wahl der Menge M displaystyle M nbsp unabhangig vom Parameter ϑ displaystyle vartheta nbsp sein Diese Definition ermoglicht es gewisse Kriterien die auf der Positivitat der Dichtefunktion aufbauen allgemeiner zu fassen Solche Kriterien finden sich beispielsweise in regularen statistischen Modellen k parametrige Exponentialfamilie BearbeitenDefinition Bearbeiten Eine Familie von Wahrscheinlichkeitsmassen P ϑ ϑ 8 displaystyle P vartheta vartheta in Theta nbsp auf dem Messraum X A displaystyle X mathcal A nbsp mit 8 R k displaystyle Theta subset mathbb R k nbsp heisst eine k parametrige Exponentialfamilie wenn es ein s endliches Mass m displaystyle mu nbsp gibt so dass alle P ϑ displaystyle P vartheta nbsp die Dichtefunktion f x ϑ h x A ϑ exp i 1 k h i ϑ T i x displaystyle f x vartheta h x A vartheta exp left sum i 1 k eta i vartheta T i x right nbsp bezuglich m displaystyle mu nbsp besitzen Oftmals wird der Parameter ϑ ϑ 1 ϑ k displaystyle vartheta vartheta 1 dots vartheta k nbsp geschrieben Dabei sind h T 1 T k X A R B R displaystyle h T 1 dots T k X mathcal A to mathbb R mathcal B mathbb R nbsp messbare Funktionen und A h 1 h k R k 8 R displaystyle A eta 1 dots eta k mathbb R k supset Theta to mathbb R nbsp Funktionen des k dimensionalen Parameters ϑ displaystyle vartheta nbsp Hier wird wie im einparametrigen Fall die Funktion T T 1 T k displaystyle T T 1 dots T k nbsp die naturliche suffiziente Statistik oder die kanonische Statistik genannt Beispiel Bearbeiten Klassisches Beispiel fur eine zweiparametrige Exponentialfamilie ist die Normalverteilung Es ist X A R B R displaystyle X mathcal A mathbb R mathcal B mathbb R nbsp sowie 8 R 0 displaystyle Theta mathbb R times 0 infty nbsp Jedes ϑ 8 displaystyle vartheta in Theta nbsp ist dann von der Form ϑ ϑ 1 ϑ 2 displaystyle vartheta vartheta 1 vartheta 2 nbsp Mit den Parametrisierungen m ϑ 1 displaystyle mu vartheta 1 nbsp sowie s 2 ϑ 2 2 displaystyle sigma 2 vartheta 2 2 nbsp erhalt man aus der ublichen Dichtefunktion der Normalverteilung f x ϑ 1 ϑ 2 1 2 p ϑ 2 2 exp ϑ 1 2 2 ϑ 2 2 exp ϑ 1 ϑ 2 2 x 1 2 ϑ 2 2 x 2 displaystyle f x vartheta 1 vartheta 2 frac 1 sqrt 2 pi vartheta 2 2 exp left frac vartheta 1 2 2 vartheta 2 2 right exp left frac vartheta 1 vartheta 2 2 x frac 1 2 vartheta 2 2 x 2 right nbsp Somit ist die Normalverteilung Teil einer zweiparametrigen Exponentialfamilie mit A ϑ 1 ϑ 2 1 2 p ϑ 2 2 exp ϑ 1 2 2 ϑ 2 2 T 1 x x T 2 x x 2 h 1 ϑ 1 ϑ 2 ϑ 1 ϑ 2 2 h 2 ϑ 1 ϑ 2 1 2 ϑ 2 2 displaystyle A vartheta 1 vartheta 2 frac 1 sqrt 2 pi vartheta 2 2 exp left frac vartheta 1 2 2 vartheta 2 2 right quad T 1 x x quad T 2 x x 2 quad eta 1 vartheta 1 vartheta 2 frac vartheta 1 vartheta 2 2 quad eta 2 vartheta 1 vartheta 2 frac 1 2 vartheta 2 2 nbsp Auch hier gilt wieder eine k parametrige Exponentialfamilie kann durchaus eine Wahrscheinlichkeitsverteilung in nur einer Dimension beschreiben Die Zahl k gibt nur die Anzahl der Formparameter an nicht die Dimensionalitat der Verteilung So ist im obigen Beispiel die Normalverteilung eindimensional aber Teil einer zweiparametrigen Exponentialfamilie Ein weiteres Beispiel fur eine zweiparametrige Exponentialfamilie ist die Gammaverteilung Alternative Definitionen Bearbeiten Fur die k parametrige Exponentialfamilie existieren dieselben Varianten in der Definition wie bereits im einparametrigen Fall besprochen wurden Ausserdem fordern manche Autoren noch zusatzlich in der Definition dass folgende beide Eigenschaften gelten Die Funktionen h 1 h k displaystyle eta 1 dots eta k nbsp sind linear unabhangig Die Funktionen 1 T 1 T k displaystyle 1 T 1 dots T k nbsp sind fur alle P ϑ displaystyle P vartheta nbsp fast sicher linear unabhangig Mit diesen zusatzlichen Forderungen lassen sich beispielsweise Aussagen uber die Kovarianzmatrix von T displaystyle T nbsp treffen Die naturliche Parametrisierung Bearbeiten Sowohl im einparametrigen als auch im k parametrig Fall sagt man dass die Exponentialfamilie in der naturlichen Parametrisierung vorliegt wenn h ϑ ϑ displaystyle eta vartheta vartheta nbsp ist Eigenschaften BearbeitenSuffizienz Bearbeiten Fur die Exponentialfamilie ist die kanonische Statistik T displaystyle T nbsp immer eine suffiziente Statistik Dies folgt direkt aus dem Neyman Kriterium fur die Suffizienz Daher wird T displaystyle T nbsp auch als naturliche suffiziente Statistik bezeichnet Score Funktion Bearbeiten Fur eine einparametrige Exponentialfamilie ist die Score Funktion gegeben durch S ϑ x ϑ ln f x ϑ h ϑ T x A ϑ A ϑ displaystyle S vartheta x frac partial partial vartheta ln f x vartheta eta vartheta T x frac A vartheta A vartheta nbsp Bei naturlicher Parametrisierung vereinfacht sich dies zu S ϑ x T x A ϑ A ϑ displaystyle S vartheta x T x frac A vartheta A vartheta nbsp Fisher Information Bearbeiten Aus der Score Funktion lasst sich die Fisher Information ableiten Sie lautet I ϑ Var ϑ S ϑ h ϑ 2 Var ϑ T x displaystyle I vartheta operatorname Var vartheta S vartheta left eta vartheta right 2 cdot operatorname Var vartheta T x nbsp Bei naturlicher Parametrisierung ergibt sich fur die Fisher Information somit I ϑ Var ϑ T x displaystyle I vartheta operatorname Var vartheta T x nbsp Rolle in der Statistik BearbeitenKlassisches Schatzen Suffizienz Bearbeiten Nach dem Pitman Koopman Darmois Theorem gibt es unter Wahrscheinlichkeitsfamilien deren Trager nicht von den Parametern abhangt nur bei den Exponentialfamilien suffiziente Statistiken deren Dimension bei wachsender Stichprobengrosse beschrankt bleibt Etwas ausfuhrlicher Seien X n n 1 2 3 displaystyle X n n 1 2 3 dots nbsp unabhangig und identisch verteilte Zufallsvariablen deren Wahrscheinlichkeitsverteilungsfamilie bekannt ist Nur wenn diese Familie eine Exponentialfamilie ist gibt es eine moglicherweise vektorielle suffiziente Statistik T X 1 X n displaystyle T X 1 dots X n nbsp deren Anzahl skalarer Komponenten nicht ansteigt sollte der Stichprobenumfang n displaystyle n nbsp erhoht werden Bayessches Schatzen konjugierte Verteilungen Bearbeiten Exponentialfamilien sind auch fur die bayessche Statistik wichtig In der bayesschen Statistik wird eine A priori Wahrscheinlichkeitsverteilung mit einer Likelihood Funktion multipliziert und dann normiert um auf die A posteriori Wahrscheinlichkeitsverteilung zu kommen siehe Satz von Bayes Falls die Likelihood zu einer Exponentialfamilie gehort existiert auch eine Familie konjugierter A priori Verteilungen die oft ebenfalls eine Exponentialfamilie ist Eine konjugierte A priori Verteilung p displaystyle pi nbsp fur den Parameter h displaystyle eta nbsp einer Exponentialfamilie ist definiert durch p h exp h a b A h displaystyle pi eta propto exp eta top alpha beta A eta nbsp wobei a R n displaystyle alpha in mathbb R n nbsp und b gt 0 displaystyle beta gt 0 nbsp Hyperparameter sind Parameter die im Rahmen des Modells nicht geschatzt sondern festgelegt werden Im Allgemeinen gehort die Likelihood Funktion keiner Exponentialfamilie an deshalb existiert im Allgemeinen auch keine konjugierte A priori Verteilung Die A posteriori Verteilung muss dann mit numerischen Methoden berechnet werden Hypothesentests gleichmassig bester Test Bearbeiten Die einparametrige Exponentialfamilie zahlt zu den Verteilungsklassen mit monotonem Dichtequotienten in der kanonischen Statistik T displaystyle T nbsp wenn h displaystyle eta nbsp monoton wachsend ist Daher existiert fur das einseitige Testproblem mit 8 0 ϑ 8 ϑ ϑ 0 und 8 1 ϑ 8 ϑ gt ϑ 0 displaystyle Theta 0 vartheta in Theta vartheta leq vartheta 0 quad text und quad Theta 1 vartheta in Theta vartheta gt vartheta 0 nbsp ein gleichmassig bester Test zu einem vorgegebenen Niveau a displaystyle alpha nbsp Eine explizite Beschreibung des Tests mit skizzierter Herleitung aus dem Neyman Pearson Lemma findet sich hier Literatur BearbeitenE L Lehmann Casella G Theory of Point Estimation 1998 ISBN 0 387 98502 6 S 2nd ed sec 1 5 Robert W Keener Statistical Theory Notes for a Course in Theoretical Statistics Springer 2006 S 27 28 32 33 Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 doi 10 1515 9783110215274 Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 doi 10 1007 978 3 642 41997 3 Claudia Czado Thorsten Schmidt Mathematische Statistik Springer Verlag Berlin Heidelberg 2011 ISBN 978 3 642 17260 1 doi 10 1007 978 3 642 17261 8 Einzelnachweise Bearbeiten Erling Andersen Sufficiency and Exponential Families for Discrete Sample Spaces In Journal of the American Statistical Association 65 Jahrgang Nr 331 September 1970 S 1248 1255 doi 10 2307 2284291 E Pitman Sufficient statistics and intrinsic accuracy In Proc Camb phil Soc 32 Jahrgang 1936 S 567 579 G Darmois Sur les lois de probabilites a estimation exhaustive In C R Acad sci Paris 200 Jahrgang 1935 S 1265 1266 franzosisch B Koopman On distribution admitting a sufficient statistic In Trans Amer math Soc 39 Jahrgang 1936 S 399 409 doi 10 2307 1989758 Diskrete univariate Verteilungen Diskrete univariate Verteilungen fur endliche Mengen Benford Bernoulli beta binomial binomial Dirac diskret uniform empirisch hypergeometrisch kategorial negativ hypergeometrisch Rademacher verallgemeinert binomial Zipf Zipf Mandelbrot ZweipunktDiskrete univariate Verteilungen fur unendliche Mengen Boltzmann Conway Maxwell Poisson discrete Phase Type erweitert negativ binomial Gauss Kuzmin gemischt Poisson geometrisch logarithmisch negativ binomial parabolisch fraktal Poisson Skellam verallgemeinert Poisson Yule Simon ZetaKontinuierliche univariate Verteilungen Kontinuierliche univariate Verteilungen mit kompaktem Intervall Beta Cantor Kumaraswamy raised Cosine Dreieck Trapez U quadratisch stetig uniform Wigner HalbkreisKontinuierliche univariate Verteilungen mit halboffenem Intervall Beta prime Bose Einstein Burr Chi Chi Quadrat Coxian Erlang Exponential Extremwert F Fermi Dirac Folded normal Frechet Gamma Gamma Gamma verallgemeinert invers Gauss halblogistisch halbnormal Hartman Watson Hotellings T Quadrat hyper exponentiale hypoexponential invers Chi Quadrat scale invers Chi Quadrat Invers Normal Invers Gamma Kolmogorow Verteilung Levy log normal log logistisch Maxwell Boltzmann Maxwell Speed Nakagami nichtzentriert Chi Quadrat Pareto Phase Type Rayleigh relativistisch Breit Wigner Rice Rosin Rammler shifted Gompertz truncated normal Type 2 Gumbel Weibull Wilks LambdaKontinuierliche univariate Verteilungen mit unbeschranktem Intervall Cauchy Extremwert exponential Power Fishers z Fisher Tippett Gumbel generalized hyperbolic Hyperbolic secant Landau Laplace alpha stabil logistisch normal Gauss normal invers Gauss sch Skew normal Studentsche t Type 1 Gumbel Variance Gamma VoigtMultivariate Verteilungen Diskrete multivariate Verteilungen Dirichlet compound multinomial Ewens gemischt Multinomial multinomial multivariat hypergeometrisch multivariat Poisson negativmultinomial Polya Eggenberger polyhypergeometrischKontinuierliche multivariate Verteilungen Dirichlet GEM generalized Dirichlet multivariat normal multivariat Student normalskaliert invers Gamma Normal Gamma Poisson DirichletMultivariate Matrixverteilungen Invers Wishart Matrix Beta Matrix Gamma Matrix invers Beta Matrix invers Gamma Matrix Normal Matrix Student t Normal invers Wishart Normal Wishart Wishart Abgerufen von https de wikipedia org w index php title Exponentialfamilie amp oldid 230865776