www.wikidata.de-de.nina.az
Als Normalverteilungsmodell 1 oder Gauss sches Produktmodell 2 bezeichnet man in der Statistik ein spezielles statistisches Modell das sich durch einfache Modellannahmen auszeichnet Dabei soll einerseits die Erhebung der Daten stochastisch unabhangig voneinander sein andererseits sollen die Daten alle normalverteilt sein je nach Prazisierung mit einem oder zwei unbekannten Parametern Die Bedeutung des Normalverteilungsmodells ergibt sich sowohl aus der Tatsache dass es ein sehr gut untersuchtes Modell ist fur das gute Parameterschatzer Konfidenzintervalle und Tests angegeben werden konnen als auch aus der Sonderstellung der Normalverteilung die sich nach dem zentralen Grenzwertsatz immer dann einstellt wenn sich viele voneinander unabhangige zufallige Einflusse uberlagern Es lassen sich drei Falle unterscheiden Man geht von einem bekannten Erwartungswert der Normalverteilungen aus und versucht Aussagen uber die Varianz zu treffen Beispiel hierfur ware die Eichung einer Waage mit einem vorgegebenen genormten Gewicht Man geht von einer bekannten Varianz der Normalverteilungen aus und versucht Aussagen uber den Erwartungswert zu treffen Dieser Fall wurde beispielsweise eintreten bei einer Messung mit einem Messinstrument bekannter Ungenauigkeit die vom Hersteller angegeben ist Sowohl Varianz als auch Erwartungswert sind unbekannt Ein Beispiel fur diesen Fall ware die Schatzung der Schuhgrosse von Mannern Weder ist klar welche Schuhgrosse ein Mann im Mittel hat noch ist klar wie sehr die Schuhgrossen streuen Fur die drei Falle stehen jeweils unterschiedliche Methoden zur Verfugung Inhaltsverzeichnis 1 Erwartungswert bekannt und Varianz unbekannt 1 1 Parameterschatzung 1 2 Konfidenzintervalle 1 3 Testen 2 Varianz bekannt und Erwartungswert unbekannt 2 1 Parameterschatzung 2 2 Konfidenzintervalle 2 3 Testen 3 Varianz und Erwartungswert unbekannt 3 1 Parameterschatzung 3 2 Konfidenzintervalle 3 3 Testen 4 EinzelnachweiseErwartungswert bekannt und Varianz unbekannt BearbeitenBei bekanntem Erwartungswert und unbekannter Varianz werden die Rahmenbedingungen wie folgt formalisiert Das statistische Modell ist gegeben durch R n B R n P displaystyle mathbb R n mathcal B mathbb R n mathcal P nbsp wobei die Verteilungsklasse genauer als P N n m 0 s 2 s 2 0 displaystyle mathcal P mathcal N otimes n mu 0 sigma 2 sigma 2 in 0 infty nbsp definiert ist Hierbei ist m 0 displaystyle mu 0 nbsp der bekannte Erwartungswert Mit P n displaystyle P otimes n nbsp sei das n fache Produktmass des Wahrscheinlichkeitsmasses P displaystyle P nbsp bezeichnet Es handelt sich bei dem Modell folglich um ein einparametriges Modell und ein Produktmodell Die Verteilungsklasse ist Teil der einparametrigen Exponentialfamilie denn die Wahrscheinlichkeitsdichte ϕ x displaystyle phi x nbsp der Normalverteilung besitzt eine Darstellung als ϕ x exp a s b x c s displaystyle phi x exp a sigma cdot b x c sigma nbsp mit a s 1 2 s 2 b x x m 0 2 displaystyle a sigma frac 1 2 sigma 2 b x x mu 0 2 nbsp und c s 1 2 ln 2 p s displaystyle c sigma tfrac 1 2 ln 2 pi sigma nbsp Damit erhalt man fur die Wahrscheinlichkeitsdichte auf dem gesamten Raum die Darstellung f x exp 1 2 s 2 i 1 n x i m 0 2 n 2 ln 2 p s 2 displaystyle f x exp left frac 1 2 sigma 2 sum i 1 n x i mu 0 2 tfrac n 2 ln 2 pi sigma 2 right nbsp Geschatzt werden soll die unbekannte Varianz die zu schatzende Parameterfunktion ist somit gegeben durch g s 2 s 2 displaystyle g sigma 2 sigma 2 nbsp Parameterschatzung Bearbeiten Sowohl die Maximum Likelihood Methode als auch die Momentenmethode liefern als Schatzer fur die unbekannte Varianz die nicht korrigierte Stichprobenvarianz V X 1 n i 1 n X i m 0 2 displaystyle V X frac 1 n sum i 1 n X i mu 0 2 nbsp Sie ist erwartungstreu Die Suffizienz dieser Schatzfunktion folgt aus der Darstellung der Normalverteilung als Teil der Exponentialfamilie und der entsprechenden kanonischen Statistik Ausserdem ist der Schatzer auch vollstandig 3 und somit nach dem Satz von Lehmann Scheffe ein gleichmassig bester erwartungstreuer Schatzer Konfidenzintervalle Bearbeiten Konfidenzintervalle fur die unbekannte Varianz beruhen auf der Pivot Statistik T X s 2 i 1 n X i m 0 s 2 n s 2 V X displaystyle T X sigma 2 sum i 1 n left frac X i mu 0 sigma right 2 frac n sigma 2 cdot V X nbsp Sie ist Chi Quadrat verteilt mit n displaystyle n nbsp Freiheitsgraden also T X s 2 x n 2 displaystyle T X sigma 2 sim chi n 2 nbsp Ein beidseitiges Konfidenzintervall zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp ist somit gegeben durch 4 C X n x n 1 a 2 2 V X n x n a 2 2 V X displaystyle C X left frac n chi n 1 alpha 2 2 V X frac n chi n alpha 2 2 V X right nbsp Hierbei ist x n a 2 displaystyle chi n alpha 2 nbsp das a displaystyle alpha nbsp Quantil der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden Die konkreten Werte der Quantile konnen in der Quantiltabelle der Chi Quadrat Verteilung nachgeschlagen werden Testen Bearbeiten Fur Einstichprobenprobleme existiert der Chi Quadrat Test zur Prufung einer Varianz fur Zweistichprobenprobleme der F Test zum Vergleich zweier Varianzen 5 Varianz bekannt und Erwartungswert unbekannt BearbeitenIst die Varianz bekannt und der Erwartungswert unbekannt so werden die Rahmenbedingungen wie folgt formalisiert das statistische Modell gegeben durch R n B R n P displaystyle mathbb R n mathcal B mathbb R n mathcal P nbsp wobei die Verteilungsklasse genauer als P N n m s 0 2 m R displaystyle mathcal P mathcal N otimes n mu sigma 0 2 mu in mathbb R nbsp definiert ist Hierbei bezeichnet s 0 displaystyle sigma 0 nbsp die bekannte Varianz Es handelt sich bei dem Modell folglich um ein einparametriges Modell und ein Produktmodell Genauso ist die Verteilungsklasse ein Teil der einparametrigen Exponentialfamilie denn die Wahrscheinlichkeitsdichte ϕ x displaystyle phi x nbsp der Normalverteilung besitzt eine Darstellung als ϕ x exp a m b x c m d x displaystyle phi x exp a mu cdot b x c mu d x nbsp mit a m m s 0 2 b x x c m m 2 2 s 0 2 displaystyle a mu frac mu sigma 0 2 b x x c mu tfrac mu 2 2 sigma 0 2 nbsp und d x x 2 2 s 0 2 1 2 ln 2 p s 0 2 displaystyle d x left tfrac x 2 2 sigma 0 2 tfrac 1 2 ln 2 pi sigma 0 2 right nbsp Damit erhalt man fur die Wahrscheinlichkeitsdichte auf dem gesamten Raum die Darstellung f x exp m s 0 2 i 1 n x i n c m n 2 ln 2 p s 0 2 i i n x i 2 2 s 0 2 displaystyle f x exp left frac mu sigma 0 2 sum i 1 n x i n cdot c mu left tfrac n 2 ln 2 pi sigma 0 2 sum i i n tfrac x i 2 2 sigma 0 2 right right nbsp Geschatzt werden soll der unbekannten Erwartungswert die zu schatzende Parameterfunktion ist somit gegeben durch g m m displaystyle g mu mu nbsp Parameterschatzung Bearbeiten Sowohl die Maximum Likelihood Methode als auch die Momentenmethode liefern als Schatzfunktion fur den Erwartungswert das Stichprobenmittel X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i nbsp der Stichprobe Dabei folgt der Maximum Likelihood Schatzer beispielsweise durch Bestimmen des Maximums der Log Likelihood Funktion der Momentenschatzer folgt direkt aus der Tatsache dass es sich bei dem arithmetischen Mittel um das erste empirische Moment handelt und mit dem Erwartungswert das erste stochastische Moment geschatzt werden soll Der Schatzer ist erwartungstreu Da es sich um ausserdem um die kanonische Statistik der Exponentialfamilie handelt ist er auch suffizient Ausserdem ist der Schatzer auch vollstandig 3 und somit nach dem Satz von Lehmann Scheffe ein gleichmassig bester erwartungstreuer Schatzer Konfidenzintervalle Bearbeiten Die Konfidenzintervalle bei bekannter Varianz s 0 2 displaystyle sigma 0 2 nbsp beruhen auf der Pivotstatistik 6 T X m n X m s 0 displaystyle T X mu frac sqrt n overline X mu sigma 0 nbsp Sie ist standardnormalverteilt also T X m N 0 1 displaystyle T X mu sim mathcal N 0 1 nbsp fur alle m displaystyle mu nbsp Es bezeichne u a displaystyle u alpha nbsp das a displaystyle alpha nbsp Quantil der Standardnormalverteilung Dieses kann der Quantiltabelle der Standardnormalverteilung entnommen werden Dann ist ein rechtsseitig unbeschranktes Konfidenzintervall fur den unbekannten Erwartungswert zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp gegeben durch C 1 X X s 0 n u 1 a displaystyle C 1 X left overline X tfrac sigma 0 sqrt n u 1 alpha infty right nbsp Analog ergibt sich ein linksseitig unbeschranktes Konfidenzintervall fur den unbekannten Erwartungswert zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp durch C 2 X X s 0 n u 1 a displaystyle C 2 X left infty overline X tfrac sigma 0 sqrt n u 1 alpha right nbsp Ein zweiseitiges Konfidenzintervall zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp ist gegeben durch C 3 X X s 0 n u 1 a 2 X s 0 n u 1 a 2 displaystyle C 3 X left overline X tfrac sigma 0 sqrt n u 1 alpha 2 overline X tfrac sigma 0 sqrt n u 1 alpha 2 right nbsp Testen Bearbeiten Fur Einstichprobenprobleme existiert der Einstichproben Gauss Test und der Einstichproben t Test fur Zweistichprobenprobleme der Zweistichproben Gauss Test 5 Varianz und Erwartungswert unbekannt BearbeitenSind Erwartungswert und Varianz unbekannt so werden die Rahmenbedingungen wie folgt formalisiert das statistische Modell ist gegeben durch R n B R n P displaystyle mathbb R n mathcal B mathbb R n mathcal P nbsp wobei die Verteilungsklasse genauer als P N n m s 2 s 2 0 m R displaystyle mathcal P mathcal N otimes n mu sigma 2 mid sigma 2 in 0 infty mu in mathbb R nbsp definiert ist Es handelt sich hierbei dann um ein parametrisches Modell und ein Produktmodell Die Verteilungsklasse ist Teil der zweiparametrigen Exponentialfamilie da fur die Wahrscheinlichkeitsdichte der Normalverteilung ϕ x exp a 1 m s b 1 x a 2 m s b 1 x c m s displaystyle phi x exp left a 1 mu sigma cdot b 1 x a 2 mu sigma cdot b 1 x c mu sigma right nbsp mit a 1 m s m s 2 a 2 m s 1 2 s 2 b 1 x x b 2 x x 2 displaystyle a 1 mu sigma tfrac mu sigma 2 a 2 mu sigma tfrac 1 2 sigma 2 b 1 x x b 2 x x 2 nbsp und c m s m 2 2 s 2 1 2 ln 2 p s 2 displaystyle c mu sigma tfrac mu 2 2 sigma 2 tfrac 1 2 ln 2 pi sigma 2 nbsp gilt Geschatzt werden soll Erwartungswert und Varianz die zu schatzenden Parameterfunktionen sind somit gegeben durch g 1 m s 2 m displaystyle g 1 mu sigma 2 mu nbsp und g 2 m s 2 s 2 displaystyle g 2 mu sigma 2 sigma 2 nbsp Parameterschatzung Bearbeiten Die Maximum Likelihood Methode und die Momentenmethode liefern als Schatzfunktion fur den unbekannten Erwartungswert das Stichprobenmittel X 1 n i 1 n X i displaystyle overline X frac 1 n sum i 1 n X i nbsp Dieser Schatzer ist erwartungstreu Sowohl die Maximum Likelihood Methode und die Momentenmethode liefern die nicht korrigierte Stichprobenvarianz V X 1 n i 1 n X i X 2 displaystyle V X tfrac 1 n sum i 1 n X i overline X 2 nbsp als Schatzfunktion fur die unbekannte Varianz Sie ist nicht erwartungstreu sondern nur asymptotisch Erwartungstreu Daher fuhrt man die Bessel Korrektur ein und erhalt somit als erwartungstreuen Schatzer die korrigierte Stichprobenvarianz V X 1 n 1 i 1 n X i X 2 displaystyle V X tfrac 1 n 1 sum i 1 n X i overline X 2 nbsp Sie ist eine erwartungstreue Schatzfunktion fur die unbekannte Varianz Konfidenzintervalle Bearbeiten Konfidenzintervalle fur den Erwartungswert also fur g m s 2 m displaystyle g mu sigma 2 mu nbsp beruhen in diesem Modell auf der Pivotstatistik 6 T X m n X m S n X displaystyle T X mu sqrt n frac overline X mu S n X nbsp wobei S n X 1 n 1 i 1 n X i X 2 displaystyle S n X sqrt frac 1 n 1 sum i 1 n X i overline X 2 nbsp ist Als einseitiges Konfidenzintervall fur den Erwartungswert zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp erhalt man damit C 1 X X S n X n t n 1 1 a displaystyle C 1 X left overline X frac S n X sqrt n t n 1 1 alpha infty right nbsp als zweiseitiges Konfidenzintervall fur den Erwartungswert zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp erhalt man C 2 X X S n n t n 1 1 a 2 X S n n t n 1 a 2 displaystyle C 2 X left overline X frac S n sqrt n t n 1 1 alpha 2 overline X frac S n sqrt n t n 1 alpha 2 right nbsp Hierbei ist t n a displaystyle t n alpha nbsp das a displaystyle alpha nbsp Quantil der Studentschen t Verteilung mit n Freiheitsgraden Die konkreten Werte der Quantile konnen in der Quantiltabelle der Studentschen t Verteilung nachgeschlagen werden Konfidenzintervalle fur die Varianz also fur g m s 2 s 2 displaystyle g mu sigma 2 sigma 2 nbsp beruhen auf der Pivotstatistik 6 T X s 2 S n s 2 displaystyle T X sigma 2 left frac S n sigma right 2 nbsp Sie liefert das einseitige Konfidenzintervall fur die Varianz zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp C 3 X 0 1 x n 1 a 2 i 1 n X i X 2 displaystyle C 3 X left 0 frac 1 chi n 1 alpha 2 sum i 1 n X i overline X 2 right nbsp und das zweiseitige Konfidenzintervall fur die Varianz zum Konfidenzniveau 1 a displaystyle 1 alpha nbsp C 4 X 1 x n 1 1 a 2 2 i 1 n X i X 2 1 x n 1 a 2 2 i 1 n X i X 2 displaystyle C 4 X left frac 1 chi n 1 1 alpha 2 2 sum i 1 n X i overline X 2 frac 1 chi n 1 alpha 2 2 sum i 1 n X i overline X 2 right nbsp Hierbei ist x n a 2 displaystyle chi n alpha 2 nbsp das a displaystyle alpha nbsp Quantil der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden Die konkreten Werte der Quantile konnen in der Quantiltabelle der Chi Quadrat Verteilung nachgeschlagen werden Testen Bearbeiten Fur Einstichprobenprobleme existiert fur die Varianz der Chi Quadrat Test zur Prufung einer Varianz Fur Zweistichprobenprobleme existiert fur die Varianz der F Test zum Vergleich zweier Varianzen fur den Erwartungswert siehe Behrens Fisher Problem 5 Einzelnachweise Bearbeiten Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 96 doi 10 1007 978 3 642 41997 3 Hans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 S 205 doi 10 1515 9783110215274 a b Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 110 111 doi 10 1007 978 3 642 41997 3 Claudia Czado Thorsten Schmidt Mathematische Statistik Springer Verlag Berlin Heidelberg 2011 ISBN 978 3 642 17260 1 S 143 144 doi 10 1007 978 3 642 17261 8 a b c Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 196 doi 10 1007 978 3 642 41997 3 a b c Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 S 231 232 doi 10 1007 978 3 642 41997 3 Abgerufen von https de wikipedia org w index php title Normalverteilungsmodell amp oldid 229452279