www.wikidata.de-de.nina.az
Dieser Artikel oder Abschnitt ist nicht allgemeinverstandlich formuliert Die Mangel sind unter Diskussion Suffiziente Statistik beschrieben Wenn du diesen Baustein entfernst begrunde dies bitte auf der Artikeldiskussionsseite und erganze den automatisch erstellten Projektseitenabschnitt Wikipedia Unverstandliche Artikel Suffiziente Statistik um Erledigt 1 In der mathematischen Statistik ist eine suffiziente Statistik auch erschopfende Statistik genannt eine Statistik die alle relevante Information bezuglich des unbekannten Parameters aus der Zufallsstichprobe enthalt 1 Aus masstheoretischer Sicht ist Suffizienz bezuglich eines Modells eine mogliche Eigenschaft messbarer Funktionen die aus dem Stichprobenraum in einen beliebigen Messraum abbilden Man charakterisiert dabei solche Abbildungen als suffizient auch erschopfend die einen hochdimensionalen Datenvektor in eine einfachere Form transformieren ohne dabei wesentliche Informationen uber die zu Grunde liegende Wahrscheinlichkeitsverteilung zu verlieren Gegenstuck der Suffizienz ist die Verteilungsfreiheit sie entspricht einer uninformativen Transformation Anschaulich formuliert sind also genau solche Statistiken suffizient die samtliche Informationen uber die zu schatzenden Parameter des Modells beinhalten die in der Stichprobe enthalten sind Die Suffizienz zahlt neben der Erwartungstreue und der Aquivarianz Invarianz zu den klassischen Reduktionsprinzipien der mathematischen Statistik Ihre Bedeutung erhalt die Suffizienz durch den Satz von Rao Blackwell Aus ihm folgt dass optimale Schatzer im Bezug auf den mittleren quadratischen Fehler oder entsprechende Verallgemeinerungen immer in der Menge der suffizienten Schatzer zu finden sind Stephen Stigler bemerkte 1973 dass das Konzept der Suffizienz in der deskriptiven Statistik unbeliebter wurde da es stark auf Verteilungsannahmen beruht allerdings ist es noch immer ein wichtiges Mittel in der Theorie 2 Inhaltsverzeichnis 1 Idee 2 Definition 3 Beispiel Binomialverteilung 4 Satze uber Suffizienz bei dominierten Verteilungsklassen 4 1 Satz von Halmos Savage 4 2 Neyman Kriterium 5 Weitere Suffizienzbegriffe 5 1 Minimalsuffizienz 5 2 Starke Suffizienz 6 Wichtige Satze 7 Weblinks 8 Literatur 9 EinzelnachweiseIdee BearbeitenGegeben sei eine gewohnliche Munze deren i ter Wurf die Bernoulli verteilte Zufallsvariable X i displaystyle X i nbsp Kopf oder Zahl erzeugt Angenommen man interessiert sich fur die Wahrscheinlichkeit Kopf oben p Kopf displaystyle pi text Kopf nbsp Um den unbekannten Parameter p Kopf displaystyle pi text Kopf nbsp zu schatzen wurde man n displaystyle n nbsp mal das Zufallsexperiment Wurf der Munze durchfuhren und eine Eins notieren wenn Kopf oben landet und eine Null wenn Zahl oben ist Aus den Beobachtungswerten x i 0 Zahl oben 1 Kopf oben displaystyle x i begin cases 0 amp text Zahl oben 1 amp text Kopf oben end cases nbsp wurde man einen Schatzwert berechnen mit p Kopf x 1 x 2 x n n t n displaystyle hat pi text Kopf frac x 1 x 2 dots x n n frac t n nbsp Die Statistik t x 1 x 2 x n displaystyle t x 1 x 2 dots x n nbsp bei bekannter fixer Zahl an Wurfen n ware eine suffiziente Statistik da fur eine Schatzung des unbekannten Parameters p Kopf displaystyle pi text Kopf nbsp aus den Beobachtungswerten nur die Information benotigt wird wie oft Kopf oben war Die auch in der Beobachtungswerten enthaltene Information bei welchem Wurf Kopf oben war wird jedoch nicht benotigt Wenn es fur die Schatzung eines unbekannten Parameters ausreichend ist die Statistik t displaystyle t nbsp zu kennen und nicht notwendigerweise die Beobachtungswerte dann ist t displaystyle t nbsp eine suffiziente Statistik Definition BearbeitenFormal seien PS displaystyle Psi nbsp der Stichprobenraum W T displaystyle Omega T nbsp ein beliebiger Messraum und T PS W T displaystyle T colon Psi to Omega T nbsp eine messbare Abbildung zwischen den beiden Raumen Ferner sei X X 1 X n displaystyle X X 1 dotsc X n nbsp eine Zufallsvariable auf dem Stichprobenraum deren Verteilung aus einer Familie von Wahrscheinlichkeitsmassen P P ϑ ϑ 8 displaystyle mathcal P P vartheta vartheta in Theta nbsp stammt T displaystyle T nbsp heisst dann suffizient fur die Familie P displaystyle mathcal P nbsp falls die Verteilung von X T X t displaystyle X T X t nbsp nicht von ϑ displaystyle vartheta nbsp abhangt Allgemeiner lasst sich die Suffizienz einer Statistik mittels der Suffizienz von s Algebren definieren Eine Statistik T displaystyle T nbsp heisst suffizient oder erschopfend wenn die von ihr erzeugte s Algebra eine suffiziente s Algebra ist Beachte dass eine Suffiziente Statistik auch mehrere Werte umfassen kann beispielsweise T a b displaystyle T a b nbsp Beispiel Binomialverteilung BearbeitenEin einfaches Beispiel fur suffiziente Statistiken erhalten wir bei der Untersuchung identisch unabhangig Bernoulli verteilter Zufallsvariablen Das zugrundeliegende Modell ist also ein Bernoulli Prozess Die Zahldichte der Zufallsvariable X X 1 X n displaystyle X X 1 ldots X n nbsp ist in diesem Fall durch f ϑ x ϑ i 1 n x i 1 ϑ n i 1 n x i displaystyle f vartheta x vartheta sum i 1 n x i 1 vartheta n sum i 1 n x i nbsp gegeben wobei die x i displaystyle x i nbsp entweder 0 oder 1 sind Man beachte dass das Zahlmass auf 0 1 n P 0 1 n displaystyle left left 0 1 right n mathcal P left left 0 1 right n right right nbsp endlich insbesondere also s displaystyle sigma nbsp endlich ist und wegen der Existenz der Dichten die Klasse dominiert Daher erkennt man anhand der Neyman Charakterisierung dass i 1 n X i displaystyle sum i 1 n X i nbsp suffizient fur ϑ displaystyle vartheta nbsp ist Mithilfe der Definition zeigt man die Suffizienz von i 1 n X i displaystyle sum i 1 n X i nbsp indem man f ϑ x i 1 n X i t displaystyle f vartheta x sum i 1 n X i t nbsp berechnet Benutzt man nun bedingte Wahrscheinlichkeiten erhalt man f ϑ x i 1 n X i t ϑ t 1 ϑ n t n t ϑ t 1 ϑ n t 1 n t displaystyle f vartheta x sum i 1 n X i t frac vartheta t 1 vartheta n t binom n t vartheta t 1 vartheta n t frac 1 binom n t nbsp Diese bedingte Dichte ist nun unabhangig von ϑ displaystyle vartheta nbsp und somit ist i 1 n X i displaystyle sum i 1 n X i nbsp suffizient Heuristisch gesprochen genugt es also an Stelle des gesamten Datenvektors bloss die Anzahl der Erfolge in diesem Experiment zu kennen um alle Informationen uber den unbekannten Parameter ϑ displaystyle vartheta nbsp zu erhalten Satze uber Suffizienz bei dominierten Verteilungsklassen BearbeitenSatz von Halmos Savage Bearbeiten Hauptartikel Satz von Halmos Savage Der Satz von Halmos Savage liefert ein Suffizienzkriterium unter der Annahme dass die Verteilungsklasse dominiert ist Lassen sich dann abzahlbar unendlich viele Masse der Verteilungsklasse zu einem Mass P displaystyle P nbsp kombinieren so dass dieses die Verteilungsklasse dominiert und jedes Wahrscheinlichkeitsmass der Verteilungsklasse eine S displaystyle mathcal S nbsp messbare Dichte bezuglich P displaystyle P nbsp besitzt dann ist S displaystyle mathcal S nbsp eine suffiziente s Algebra Neyman Kriterium Bearbeiten Hauptartikel Neyman Kriterium Unter der Voraussetzung dass P displaystyle mathcal P nbsp eine dominierte Verteilungsklasse ist ist eine Statistik T displaystyle T nbsp genau dann suffizient wenn messbare Funktionen g ϑ ϑ 8 displaystyle g vartheta left vartheta in Theta right nbsp und h displaystyle h nbsp existieren so dass die Dichte f ϑ displaystyle f vartheta nbsp wie folgt zerlegt werden kann f ϑ x h x g ϑ T x displaystyle f vartheta x h x g vartheta T x nbsp Diese Charakterisierung der Suffizienz geht auf Jerzy Neyman zuruck Insbesondere sind bijektive Transformationen suffizienter Statistiken wieder suffizient Das Neyman Kriterium leitet sich aus dem Satz von Halmos Savage ab ist aber leichter zu handhaben Weitere Suffizienzbegriffe BearbeitenMinimalsuffizienz Bearbeiten Hauptartikel Minimalsuffizienz Die Minimalsuffizienz ist eine starkere Forderung als die Suffizienz die ebenfalls fur Statistiken und s Algebren definiert wird Sie stellt die Frage nach der maximal moglichen Datenkompression also nach einer kleinstmoglichen suffizienten s Algebra Starke Suffizienz Bearbeiten Hauptartikel Starke Suffizienz Die starke Suffizienz ist eine Abwandlung des herkommlichen Suffizienzbegriffes die mittels Markow Kernen definiert wird Fur borelsche Raume stimmen starke Suffizienz und Suffizienz uberein Wichtige Satze BearbeitenEinen Zusammenhang zwischen Suffizienz Verteilungsfreiheit und Vollstandigkeit treffen die Satze von Basu Der Satz von Lehmann Scheffe und der Satz von Rao Blackwell treffen mithilfe suffizienter Statistiken Aussagen uber die Existenz gleichmassig bester erwartungstreuer Schatzer Weblinks BearbeitenA S Kholevo Sufficient statistic In Michiel Hazewinkel Hrsg Encyclopedia of Mathematics Springer Verlag und EMS Press Berlin 2002 ISBN 1 55608 010 7 englisch encyclopediaofmath org Literatur BearbeitenLudger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 doi 10 1007 978 3 642 41997 3 Helmut Pruscha Vorlesungen uber Mathematische Statistik B G Teubner Stuttgart 2000 ISBN 3 519 02393 8 Abschnitt II 3 Einzelnachweise Bearbeiten Leonhard Held und Daniel Sabanes Bove Applied Statistical Inference Likelihood and Bayes Springer Heidelberg New York Dordrecht London 2014 ISBN 978 3 642 37886 7 S 41 Stephen Stigler Studies in the History of Probability and Statistics XXXII Laplace Fisher and the Discovery of the Concept of Sufficiency In Biometrika 60 Jahrgang Nr 3 Dezember 1973 S 439 445 doi 10 1093 biomet 60 3 439 JSTOR 2334992 Abgerufen von https de wikipedia org w index php title Suffiziente Statistik amp oldid 238304241