www.wikidata.de-de.nina.az
Die Chi Quadrat Verteilung bzw x 2 displaystyle chi 2 Verteilung altere Bezeichnung Helmert Pearson Verteilung nach Friedrich Robert Helmert und Karl Pearson ist eine stetige Wahrscheinlichkeitsverteilung uber der Menge der nichtnegativen reellen Zahlen Ublicherweise ist mit Chi Quadrat Verteilung die zentrale Chi Quadrat Verteilung gemeint Die Chi Quadrat Verteilung hat einen einzigen Parameter namlich die Anzahl der Freiheitsgrade n displaystyle n Dichten der Chi Quadrat Verteilung mit unterschiedlicher Anzahl an Freiheitsgraden kSie ist eine der Verteilungen die aus der Normalverteilung N m s 2 displaystyle mathcal N left mu sigma 2 right abgeleitet werden kann Sind Z 1 Z n displaystyle Z 1 Z n unabhangige und standardnormalverteilte Zufallsvariablen so ist die Chi Quadrat Verteilung mit n displaystyle n Freiheitsgraden definiert als die Verteilung der Summe Z 1 2 Z n 2 displaystyle Z 1 2 dotsb Z n 2 der quadrierten Zufallsvariablen Solche Summen quadrierter Zufallsvariablen treten bei Schatzfunktionen wie der Stichprobenvarianz zur Schatzung der empirischen Varianz auf Die Chi Quadrat Verteilung ermoglicht damit unter anderem ein Urteil uber die Kompatibilitat eines vermuteten funktionalen Zusammenhangs Abhangigkeit von der Zeit Temperatur Druck etc mit empirisch ermittelten Messpunkten Kann z B eine Gerade die Daten erklaren oder braucht man doch eine Parabel oder vielleicht einen Logarithmus Man wahlt verschiedene Modelle aus und dasjenige mit der besten Anpassungsgute dem kleinsten Chi Quadrat Wert bietet die beste Erklarung der Daten 1 2 So stellt die Chi Quadrat Verteilung durch die Quantifizierung der zufalligen Schwankungen die Auswahl verschiedener Erklarungsmodelle auf eine numerische Basis Ausserdem erlaubt sie wenn man die empirische Varianz bestimmt hat die Schatzung des Vertrauensintervalls das den unbekannten Wert der Varianz der Grundgesamtheit mit einer gewissen Wahrscheinlichkeit einschliesst Diese und weitere Anwendungen sind weiter unten und im Artikel Chi Quadrat Test beschrieben Die Chi Quadrat Verteilung wurde 1876 eingefuhrt von Friedrich Robert Helmert die Bezeichnung stammt von Karl Pearson 1900 3 Inhaltsverzeichnis 1 Definition 2 Dichte 3 Verteilungsfunktion 4 Eigenschaften 4 1 Erwartungswert 4 2 Varianz 4 3 Modus 4 4 Schiefe 4 5 Kurtosis 4 6 Momenterzeugende Funktion 4 7 Charakteristische Funktion 4 8 Entropie 4 9 Nichtzentrale Chi Quadrat Verteilung 4 9 1 Dichtefunktion 4 9 2 Verteilungsfunktion 5 Beispiel 5 1 Herleitung der Verteilung der Stichprobenvarianz 6 Beziehung zu anderen Verteilungen 6 1 Beziehung zur Gammaverteilung 6 2 Beziehung zur Normalverteilung 6 3 Beziehung zur Exponentialverteilung 6 4 Beziehung zur Erlang Verteilung 6 5 Beziehung zur F Verteilung 6 6 Beziehung zur Poisson Verteilung 6 7 Beziehung zur stetigen Gleichverteilung 7 Herleitung der Dichtefunktion 8 Quantilfunktion 8 1 Quantilfunktion fur kleinen Stichprobenumfang 8 2 Naherung der Quantilfunktion fur feste Wahrscheinlichkeiten 9 Literatur 10 Weblinks 11 EinzelnachweiseDefinition Bearbeiten nbsp Dichte und Verteilung von mehreren Chi Quadrat verteilten ZufallsgrossenDas Quadrat einer standardnormalverteilten Zufallsvariable Z N 0 1 displaystyle Z sim mathcal N 0 1 nbsp folgt einer Chi Quadrat Verteilung mit einem Freiheitsgrad Z 2 x 2 1 displaystyle Z 2 sim chi 2 1 nbsp Weiterhin gilt Wenn X r 1 X r n displaystyle X r 1 dotsc X r n nbsp gemeinsam stochastisch unabhangige Chi Quadrat verteilte Zufallsvariablen sind dann ist deren Summe Chi Quadrat verteilt mit der Summe der jeweiligen Freiheitsgrade 4 Y X r 1 X r n x 2 r 1 r n displaystyle Y X r 1 dotsb X r n sim chi 2 r 1 dotsb r n nbsp Die Chi Quadrat Verteilung ist also reproduktiv Sind Z 1 Z n displaystyle Z 1 dotsc Z n nbsp stochastisch unabhangige und standardnormalverteilte Zufallsvariablen dann gilt fur deren Quadratsumme Q displaystyle Q nbsp dass sie Chi Quadrat verteilt mit der Anzahl n displaystyle n nbsp der Freiheitsgrade ist Q Z 1 2 Z n 2 x 2 n displaystyle Q Z 1 2 dotsb Z n 2 sim chi 2 n nbsp Das Zeichen displaystyle sim nbsp ist eine Kurzschreibweise fur folgt der Verteilung Bspw bedeutet Q x 2 n displaystyle Q sim chi 2 n nbsp auch oft als Q x n 2 displaystyle Q sim chi n 2 nbsp geschrieben Die Zufallsvariable Q displaystyle Q nbsp folgt einer Chi Quadrat Verteilung mit der Anzahl n displaystyle n nbsp der Freiheitsgrade Die Summe quadrierter Grossen kann keine negativen Werte annehmen Im Unterschied dazu gilt fur die einfache Summe Z 1 Z n N 0 n displaystyle Z 1 dotsb Z n sim mathcal N 0 n nbsp mit um den Nullpunkt symmetrischer Verteilung Dichte BearbeitenDie Dichte f n displaystyle f n nbsp der x n 2 displaystyle chi n 2 nbsp Verteilung mit n displaystyle n nbsp Freiheitsgraden hat die Form f n x 1 2 n 2 G n 2 x n 2 1 exp x 2 x gt 0 displaystyle f n x frac 1 2 frac n 2 Gamma tfrac n 2 x frac n 2 1 operatorname exp left frac x 2 right quad x gt 0 nbsp Dabei steht G r displaystyle Gamma r nbsp fur die Gammafunktion Die Werte von G n 2 displaystyle Gamma tfrac n 2 nbsp kann man mit G 1 2 p G 1 1 displaystyle Gamma tfrac 1 2 sqrt pi quad Gamma 1 1 nbsp G r 1 r G r mit r R displaystyle Gamma r 1 r cdot Gamma r quad text mit quad r in mathbb R nbsp berechnen Verteilungsfunktion BearbeitenDie Verteilungsfunktion kann man mit Hilfe der regularisierten unvollstandigen Gammafunktion schreiben F n x P n 2 x 2 displaystyle F n x P tfrac n 2 tfrac x 2 nbsp Wenn n displaystyle n nbsp eine naturliche Zahl ist dann kann die Verteilungsfunktion mehr oder weniger elementar dargestellt werden P n 2 x 2 1 e x 2 k 0 n 2 1 1 G k 1 x 2 k n 2 4 displaystyle P left tfrac n 2 tfrac x 2 right 1 e frac x 2 sum limits k 0 n 2 1 frac 1 Gamma k 1 tfrac x 2 k quad n 2 4 dotsc nbsp P n 2 x 2 Erf x 2 e x 2 k 0 n 2 1 1 G k 3 2 x 2 k 1 2 n 1 3 displaystyle P tfrac n 2 tfrac x 2 operatorname Erf left sqrt tfrac x 2 right e frac x 2 sum limits k 0 lfloor n 2 rfloor 1 frac 1 Gamma k tfrac 3 2 tfrac x 2 k tfrac 1 2 quad n 1 3 dotsc nbsp wobei Erf displaystyle operatorname Erf nbsp die Fehlerfunktion bezeichnet Die Verteilungsfunktion beschreibt die Wahrscheinlichkeit dass x n 2 displaystyle chi n 2 nbsp im Intervall 0 x displaystyle 0 x nbsp liegt Eigenschaften BearbeitenErwartungswert Bearbeiten Der Erwartungswert der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden ist gleich der Anzahl der Freiheitsgrade E x n 2 n displaystyle operatorname E left chi n 2 right n nbsp Unter der Voraussetzung einer standardnormalverteilten Grundgesamtheit sollte also bei richtiger Abschatzung der Varianz der Grundgesamtheit der Wert x n 2 n displaystyle chi n 2 n nbsp in der Nahe von 1 liegen Varianz Bearbeiten Die Varianz der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden ist gleich 2 mal die Anzahl der Freiheitsgrade Var x n 2 2 n displaystyle operatorname Var chi n 2 2n nbsp Modus Bearbeiten Der Modus der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden ist n 2 displaystyle n 2 nbsp fur n 2 displaystyle n geq 2 nbsp Schiefe Bearbeiten Die Schiefe g m displaystyle gamma m nbsp der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden ist g m x n 2 2 2 n displaystyle gamma m chi n 2 frac 2 sqrt 2 sqrt n nbsp Die Chi Quadrat Verteilung besitzt eine positive Schiefe d h sie ist linkssteil bzw rechtsschief Je hoher die Anzahl der Freiheitsgrade n displaystyle n nbsp desto weniger schief ist die Verteilung Kurtosis Bearbeiten Die Kurtosis Wolbung b 2 displaystyle beta 2 nbsp der Chi Quadrat Verteilung mit n displaystyle n nbsp Freiheitsgraden ist gegeben durch b 2 3 12 n displaystyle beta 2 3 frac 12 n nbsp Der Exzess g 2 displaystyle gamma 2 nbsp gegenuber der Normalverteilung ergibt sich damit zu g 2 12 n displaystyle gamma 2 tfrac 12 n nbsp 5 Daher gilt Je hoher die Anzahl der Freiheitsgrade n displaystyle n nbsp desto geringer der Exzess Momenterzeugende Funktion Bearbeiten Die momenterzeugende Funktion fur X x n 2 displaystyle X sim chi n 2 nbsp hat die Form 6 M X t 1 1 2 t n 2 displaystyle M X t frac 1 1 2t n 2 nbsp Charakteristische Funktion Bearbeiten Die charakteristische Funktion fur X x n 2 displaystyle X sim chi n 2 nbsp ergibt sich aus der momenterzeugenden Funktion als f X s 1 1 2 i s n 2 displaystyle varphi X s frac 1 1 2is n 2 nbsp Entropie Bearbeiten Die Entropie der Chi Quadrat Verteilung ausgedruckt in nats betragt H X ln 2 G n 2 1 n 2 ps n 2 n 2 displaystyle H X ln left 2 Gamma left frac n 2 right right left 1 frac n 2 right psi left frac n 2 right frac n 2 nbsp wobei ps p die Digamma Funktion bezeichnet Nichtzentrale Chi Quadrat Verteilung Bearbeiten Wenn die normalverteilten Zufallsvariablen nicht bezuglich ihres Erwartungswertes m i i 1 n displaystyle mu i i 1 ldots n nbsp zentriert sind d h wenn nicht alle m i 0 displaystyle mu i 0 nbsp sind erhalt man die nichtzentrale Chi Quadrat Verteilung Sie hat als zweiten Parameter neben n displaystyle n nbsp den Nichtzentralitatsparameter l gt 0 displaystyle lambda gt 0 nbsp Seien Z i N m i 1 i 1 2 n displaystyle Z i sim mathcal N mu i 1 i 1 2 ldots n nbsp so ist i 1 n Z i 2 x 2 n l displaystyle sum i 1 n Z i 2 sim chi 2 n lambda nbsp mit l i 1 n m i 2 displaystyle lambda sum i 1 n mu i 2 nbsp Insbesondere folgt aus X x 2 n 1 displaystyle X sim chi 2 n 1 nbsp und Z N l 1 displaystyle Z sim mathcal N sqrt lambda 1 nbsp dass X Z 2 x 2 n l displaystyle X Z 2 sim chi 2 n lambda nbsp ist Eine zweite Moglichkeit eine nichtzentrale Chi Quadrat Verteilung zu erzeugen ist als Mischverteilung der zentralen Chi Quadrat Verteilung Dabei ist x 2 n 2 j x 2 n l displaystyle chi 2 n 2 j chi 2 n lambda nbsp wenn j P l 2 displaystyle j sim mathcal P left tfrac lambda 2 right nbsp aus einer Poisson Verteilung gezogen wird Dichtefunktion Bearbeiten Die Dichtefunktion der nichtzentralen Chi Quadrat Verteilung ist f x exp 1 2 x l 2 n 2 j 0 x n 2 j 1 l j 2 2 j G n 2 j j displaystyle f x frac operatorname exp left frac 1 2 x lambda right 2 frac n 2 sum j 0 infty frac x frac n 2 j 1 lambda j 2 2j Gamma left frac n 2 j right j nbsp fur x 0 displaystyle x geq 0 nbsp f x 0 displaystyle f x 0 nbsp fur x lt 0 displaystyle x lt 0 nbsp Die Summe uber j fuhrt auf eine modifizierte Bessel Funktion erster Gattung I q x displaystyle I q x nbsp Damit erhalt die Dichtefunktion folgende Form f x exp 1 2 x l x 1 2 n 1 l 2 l x n 4 I n 2 1 l x displaystyle f x frac operatorname exp left frac 1 2 x lambda right x frac 1 2 n 1 sqrt lambda 2 lambda x frac n 4 I frac n 2 1 left sqrt lambda x right nbsp fur x 0 displaystyle x geq 0 nbsp Erwartungswert und Varianz der nichtzentralen Chi Quadrat Verteilung n l displaystyle n lambda nbsp und 2 n 4 l displaystyle 2n 4 lambda nbsp gehen ebenso wie die Dichte selbst bei l 0 displaystyle lambda to 0 nbsp in die entsprechenden Ausdrucke der zentralen Chi Quadrat Verteilung uber Verteilungsfunktion Bearbeiten Die Verteilungsfunktion der nichtzentralen Chi Quadrat Verteilung kann mit Hilfe der Marcum Q Funktion Q M a b displaystyle Q M a b nbsp ausgedruckt werden 7 F x 1 Q n 2 l x displaystyle F x 1 Q frac n 2 left sqrt lambda sqrt x right nbsp Beispiel BearbeitenGegeben sind n displaystyle n nbsp Messungen einer Grosse x displaystyle x nbsp die aus einer normalverteilten Grundgesamtheit stammen Sei x displaystyle overline x nbsp der empirische Mittelwert der n displaystyle n nbsp gemessenen Werte und s 2 1 n 1 k 1 n x k x 2 displaystyle s 2 frac 1 n 1 sum k 1 n x k overline x 2 nbsp die korrigierte Stichprobenvarianz Dann lasst sich z B das Konfidenzintervall fur die Varianz der Grundgesamtheit s 2 displaystyle sigma 2 nbsp angeben n 1 x b 2 s 2 s 2 n 1 x a 2 s 2 displaystyle tfrac n 1 chi b 2 s 2 leq sigma 2 leq tfrac n 1 chi a 2 s 2 nbsp Die Grenzen ergeben sich daraus dass n 1 s 2 s 2 displaystyle tfrac n 1 s 2 sigma 2 nbsp wie x n 1 2 displaystyle chi n 1 2 nbsp verteilt ist Konkretes Beispiel Stichprobe mit n 100 displaystyle n 100 nbsp Werten Varianz s 2 1 0 displaystyle s 2 1 0 nbsp 95 Konfidenzintervall 95 der Werte sollen sich innerhalb des Intervalls befinden Es wird also davon Ausgegangen dass je 2 5 der Werte die obere bzw untere Intervallgrenze uberschreiten durfen In diesem Fall wird daher x b 2 displaystyle chi b 2 nbsp durch F n 1 x b 2 0 975 displaystyle F n 1 chi b 2 0 975 nbsp und x a 2 displaystyle chi a 2 nbsp durch F n 1 x a 2 0 025 displaystyle F n 1 chi a 2 0 025 nbsp bestimmt Bei der Berechnung der Grenzen des Konfidenzintervalls in Programmen wird ublicherweise die Inverse Funktion verwendet Kehrwert der kumulierten Chi Quadrat Verteilung z B in Excel oder Numbers die Funktion CHIINV p n 1 Die obere Intervallgrenze ergibt sich mit s 2 1 0 displaystyle s 2 1 0 nbsp aus CHIINV 0 025 99 99 s 2 1 2971Die untere Intervallgrenze ergibt sich aus CHIINV 0 975 99 99 s 2 0 7410 Herleitung der Verteilung der Stichprobenvarianz Bearbeiten Sei x 1 x n displaystyle x 1 dots x n nbsp eine Stichprobe von n displaystyle n nbsp Messwerten gezogen aus einer normalverteilten Zufallsvariablen X displaystyle X nbsp mit empirischen Mittelwert x 1 n i 1 n x i displaystyle overline x tfrac 1 n sum i 1 n x i nbsp und Stichprobenvarianz s 2 1 n 1 i 1 n x i x 2 displaystyle s 2 tfrac 1 n 1 sum i 1 n x i overline x 2 nbsp als Schatzfunktionen fur Erwartungswert m displaystyle mu nbsp und Varianz s 2 displaystyle sigma 2 nbsp der Grundgesamtheit Dann lasst sich zeigen dass n 1 s 2 s 2 i 1 n x i x 2 s 2 displaystyle tfrac n 1 s 2 sigma 2 sum i 1 n tfrac x i overline x 2 sigma 2 nbsp verteilt ist wie x n 1 2 displaystyle chi n 1 2 nbsp Dazu werden nach Helmert 8 die x i displaystyle x i nbsp mittels einer orthonormalen Linearkombination in neue Variablen y j displaystyle y j nbsp transformiert Die Transformation lautet y 1 1 2 x 1 1 2 x 2 displaystyle y 1 tfrac 1 sqrt 2 x 1 tfrac 1 sqrt 2 x 2 nbsp y 2 1 6 x 1 1 6 x 2 2 6 x 3 displaystyle y 2 tfrac 1 sqrt 6 x 1 tfrac 1 sqrt 6 x 2 tfrac 2 sqrt 6 x 3 nbsp displaystyle vdots nbsp y n 1 1 n n 1 x 1 1 n n 1 x 2 1 n n 1 x n 1 n 1 n n 1 x n displaystyle y n 1 tfrac 1 sqrt n n 1 x 1 tfrac 1 sqrt n n 1 x 2 dotsb tfrac 1 sqrt n n 1 x n 1 tfrac n 1 sqrt n n 1 x n nbsp y n 1 n x 1 1 n x 2 1 n x n 1 1 n x n n x displaystyle y n tfrac 1 sqrt n x 1 tfrac 1 sqrt n x 2 dotsb tfrac 1 sqrt n x n 1 tfrac 1 sqrt n x n sqrt n overline x nbsp Die neuen unabhangigen Variablen y i displaystyle y i nbsp sind wie X displaystyle X nbsp normalverteilt mit gleicher Varianz s y i 2 s x i 2 s 2 i 1 n displaystyle sigma y i 2 sigma x i 2 sigma 2 i 1 dots n nbsp aber mit Erwartungswert E y i 0 i 1 n 1 displaystyle mathrm E y i 0 i 1 dots n 1 nbsp beides aufgrund der Faltungsinvarianz der Normalverteilung Ausserdem gilt fur die Koeffizienten a i j displaystyle a ij nbsp in y i j 1 n a i j x j displaystyle y i sum j 1 n a ij x j nbsp falls j gt i 1 displaystyle j gt i 1 nbsp ist a i j 0 displaystyle a ij 0 nbsp wegen der Orthonormalitat i 1 n a i j a i k d j k displaystyle sum i 1 n a ij a ik delta jk nbsp Kronecker Delta und damit i 1 n y i 2 i 1 n j 1 n a i j x j k 1 n a i k x k j 1 n k 1 n d j k x j x k j 1 n x j 2 displaystyle sum i 1 n y i 2 sum i 1 n sum j 1 n a ij x j sum k 1 n a ik x k sum j 1 n sum k 1 n delta jk x j x k sum j 1 n x j 2 nbsp Deshalb ergibt sich nun fur die Summe der Abweichungsquadrate n 1 s 2 i 1 n x i x 2 i 1 n x i 2 n x 2 i 1 n y i 2 y n 2 i 1 n 1 y i 2 displaystyle n 1 s 2 sum i 1 n x i overline x 2 sum i 1 n x i 2 n overline x 2 sum i 1 n y i 2 y n 2 sum i 1 n 1 y i 2 nbsp und schlussendlich nach Division durch s 2 displaystyle sigma 2 nbsp n 1 s 2 s 2 i 1 n 1 y i 2 s 2 displaystyle n 1 frac s 2 sigma 2 sum i 1 n 1 frac y i 2 sigma 2 nbsp Der Ausdruck auf der linken Seite ist offenbar verteilt wie eine Summe von quadrierten standardnormalverteilten unabhangigen Variablen mit n 1 displaystyle n 1 nbsp Summanden wie fur x n 1 2 displaystyle chi n 1 2 nbsp gefordert Demnach ist also die Summe Chi Quadrat verteilt mit n 1 displaystyle n 1 nbsp Freiheitsgraden i 1 n x i x s 2 x n 1 2 displaystyle sum i 1 n left tfrac x i overline x sigma right 2 sim chi n 1 2 nbsp wahrend laut Definition der Chi Quadrat Summe i 1 n x i m s 2 x n 2 displaystyle sum i 1 n left tfrac x i mu sigma right 2 sim chi n 2 nbsp Ein Freiheitsgrad wird hier verbraucht denn aufgrund der Schwerpunkteigenschaft des empirischen Mittels i 1 n x i x 0 displaystyle sum nolimits i 1 n left x i bar x right 0 nbsp ist die letzte Abweichung x n x displaystyle left x n overline x right nbsp bereits durch die ersten n 1 displaystyle n 1 nbsp bestimmt Folglich variieren nur n 1 displaystyle n 1 nbsp Abweichungen frei und man mittelt die empirische Varianz deshalb indem man durch die Anzahl der Freiheitsgrade n 1 displaystyle n 1 nbsp dividiert Beziehung zu anderen Verteilungen BearbeitenBeziehung zur Gammaverteilung Bearbeiten Die Chi Quadrat Verteilung ist ein Spezialfall der Gammaverteilung Ist X x n 2 displaystyle X sim chi n 2 nbsp so gilt X g n 2 1 2 displaystyle X sim gamma tfrac n 2 tfrac 1 2 nbsp Beziehung zur Normalverteilung Bearbeiten nbsp Quantile einer Normalverteilung und einer Chi Quadrat VerteilungSeien Z 1 Z n displaystyle Z 1 dotsc Z n nbsp unabhangige und standardnormalverteilte Zufallsvariablen dann ist deren Quadratsumme Q displaystyle Q nbsp chi Quadrat verteilt mit n displaystyle n nbsp Freiheitsgraden Q Z 1 2 Z n 2 x 2 n displaystyle Q Z 1 2 dotsb Z n 2 sim chi 2 n nbsp Fur n 30 displaystyle n geq 30 nbsp ist Y 2 X 2 n 1 displaystyle Y sqrt 2X sqrt 2n 1 nbsp naherungsweise standardnormalverteilt Fur n gt 100 displaystyle n gt 100 nbsp ist die Zufallsvariable X n displaystyle X n nbsp naherungsweise normalverteilt mit Erwartungswert n displaystyle n nbsp und Standardabweichung 2 n displaystyle sqrt 2n nbsp bzw bei einer nichtzentralen Chi Quadrat Verteilung mit Erwartungswert n l displaystyle n lambda nbsp und Standardabweichung 2 n 4 l displaystyle sqrt 2n 4 lambda nbsp Beziehung zur Exponentialverteilung Bearbeiten Eine Chi Quadrat Verteilung mit 2 Freiheitsgraden ist eine Exponentialverteilung Exp l displaystyle operatorname Exp lambda nbsp mit dem Parameter l 1 2 displaystyle lambda 1 2 nbsp Beziehung zur Erlang Verteilung Bearbeiten Eine Chi Quadrat Verteilung mit 2 n displaystyle 2n nbsp Freiheitsgraden ist identisch mit einer Erlang Verteilung Erl l n displaystyle operatorname Erl lambda n nbsp mit n displaystyle n nbsp Freiheitsgraden und l 1 2 displaystyle lambda 1 2 nbsp Beziehung zur F Verteilung Bearbeiten Seien x 2 r 1 displaystyle chi 2 r 1 nbsp und x 2 r 2 displaystyle chi 2 r 2 nbsp unabhangige Chi Quadrat verteilte Zufallsvariablen mit r 1 displaystyle r 1 nbsp und r 2 displaystyle r 2 nbsp Freiheitsgraden dann ist der Quotient F x 2 r 1 r 1 x 2 r 2 r 2 displaystyle F frac chi 2 r 1 r 1 chi 2 r 2 r 2 nbsp F verteilt mit r 1 displaystyle r 1 nbsp Zahlerfreiheitsgraden und r 2 displaystyle r 2 nbsp Nennerfreiheitsgraden 9 Beziehung zur Poisson Verteilung Bearbeiten Die Verteilungsfunktionen der Poisson Verteilung und der Chi Quadrat Verteilung hangen auf folgende Weise zusammen Die Wahrscheinlichkeit n displaystyle n nbsp oder mehr Ereignisse in einem Intervall zu finden innerhalb dessen man im Mittel l displaystyle lambda nbsp Ereignisse erwartet gleicht der Wahrscheinlichkeit dass der Wert von x 2 n 2 2 l displaystyle chi 2n 2 leq 2 lambda nbsp ist Es gilt namlich 1 Q n l P n l displaystyle 1 Q n lambda P n lambda nbsp mit P displaystyle P nbsp und Q displaystyle Q nbsp als regularisierte Gammafunktionen Beziehung zur stetigen Gleichverteilung Bearbeiten Fur gerade n 2 m displaystyle n 2m nbsp kann man die x n 2 displaystyle chi n 2 nbsp Verteilung als m displaystyle m nbsp fache Faltung bilden mit Hilfe der gleichmassig stetigen Dichte U 0 1 displaystyle U 0 1 nbsp x n 2 2 ln i 1 m u i 2 i 1 m ln u i displaystyle chi n 2 2 ln left prod i 1 m u i right 2 sum i 1 m ln u i nbsp worin die u i displaystyle u i nbsp m displaystyle m nbsp unabhangige gleichmassig stetig verteilte Zufallsvariablen sind Fur ungerade n displaystyle n nbsp gilt dagegen x n 2 x n 1 2 N 0 1 2 displaystyle chi n 2 chi n 1 2 left mathcal N 0 1 right 2 nbsp Herleitung der Dichtefunktion BearbeitenDie Dichte der Zufallsvariable x n 2 X 1 2 X n 2 displaystyle chi n 2 X 1 2 dotsb X n 2 nbsp mit X 1 X n displaystyle X 1 dots X n nbsp unabhangig und standardnormalverteilt ergibt sich aus der gemeinsamen Dichte der Zufallsvariablen X 1 X n displaystyle X 1 dots X n nbsp Diese gemeinsame Dichte ist das n displaystyle n nbsp fache Produkt der Standardnormalverteilungsdichte f X 1 X n x 1 x n i 1 n e 1 2 x i 2 2 p 2 p n 2 e 1 2 x 1 2 x n 2 displaystyle f X 1 dots X n x 1 dots x n prod i 1 n frac e frac 1 2 x i 2 sqrt 2 pi 2 pi frac n 2 e frac 1 2 x 1 2 dotsb x n 2 nbsp Fur die gesuchte Dichte gilt f x n 2 z lim h 0 1 h P z lt x n 2 z h lim h 0 1 h K 2 p n 2 e 1 2 x 1 2 x n 2 d x 1 d x n 2 p n 2 e z 2 lim h 0 1 h K d x 1 d x n displaystyle begin aligned f chi n 2 z amp lim h to 0 frac 1 h P z lt chi n 2 leq z h amp lim h to 0 frac 1 h int limits K 2 pi frac n 2 e frac 1 2 x 1 2 dotsb x n 2 dx 1 ldots dx n amp 2 pi tfrac n 2 e frac z 2 lim h to 0 frac 1 h int limits K dx 1 ldots dx n end aligned nbsp mit K z x 1 2 x n 2 z h displaystyle K z leq x 1 2 dotsb x n 2 leq z h nbsp Im Grenzwert ist die Summe im Argument der Exponentialfunktion gleich z displaystyle z nbsp Man kann zeigen dass man den Integranden als 2 p n 2 e z 2 displaystyle 2 pi tfrac n 2 e frac z 2 nbsp vor das Integral und den Limes ziehen kann Das verbleibende Integral K d x 1 d x n V n z h V n z displaystyle int limits K dx 1 ldots dx n V n sqrt z h V n sqrt z nbsp entspricht dem Volumen der Schale zwischen der Kugel mit Radius z h displaystyle sqrt z h nbsp und der Kugel mit Radius z displaystyle sqrt z nbsp wobei V n R p n 2 R n G n 2 1 displaystyle V n R frac pi frac n 2 R n Gamma frac n 2 1 nbsp das Volumen der n dimensionalen Kugel mit Radius R angibt Es folgt lim h 0 1 h K d x 1 d x n d V n z d z p n 2 z n 2 1 G n 2 displaystyle lim h to 0 frac 1 h int limits K dx 1 ldots dx n frac mathrm d V n sqrt z mathrm d z frac pi tfrac n 2 z tfrac n 2 1 Gamma tfrac n 2 nbsp und nach Einsetzen in den Ausdruck fur die gesuchte Dichte f n z 1 2 n 2 G n 2 z n 2 1 exp z 2 z gt 0 displaystyle f n z frac 1 2 frac n 2 Gamma tfrac n 2 z frac n 2 1 operatorname exp left frac z 2 right quad z gt 0 nbsp Quantilfunktion BearbeitenDie Quantilfunktion x p displaystyle x p nbsp der Chi Quadrat Verteilung ist die Losung der Gleichung p P n 2 x p 2 displaystyle p P tfrac n 2 tfrac x p 2 nbsp und damit prinzipiell uber die Umkehrfunktion zu berechnen Konkret gilt hier x p 2 P 1 n 2 p displaystyle x p 2P 1 left tfrac n 2 p right nbsp mit P 1 displaystyle P 1 nbsp als Inverse der regularisierten unvollstandigen Gammafunktion Dieser Wert x p displaystyle x p nbsp ist in der Quantiltabelle unter den Koordinaten p displaystyle p nbsp und n displaystyle n nbsp eingetragen Quantilfunktion fur kleinen Stichprobenumfang Bearbeiten Fur wenige Werte n displaystyle n nbsp 1 2 4 kann man die Quantilfunktion auch alternativ angeben n 1 x p 2 Erf 1 p 2 displaystyle n 1 x p 2 operatorname Erf 1 p 2 nbsp n 2 x p 2 ln 1 p displaystyle n 2 x p 2 ln 1 p nbsp n 4 x p 2 1 W 1 1 p e displaystyle n 4 x p 2 1 W 1 1 p e nbsp wobei Erf displaystyle operatorname Erf nbsp die Fehlerfunktion W 1 x displaystyle W 1 x nbsp den unteren Zweig der Lambertschen W Funktion bezeichnet und e displaystyle e nbsp die Eulersche Zahl Naherung der Quantilfunktion fur feste Wahrscheinlichkeiten Bearbeiten Fur bestimmte feste Wahrscheinlichkeiten p displaystyle p nbsp lassen sich die zugehorigen Quantile x p displaystyle x p nbsp durch die einfache Funktion des Stichprobenumfangs n displaystyle n nbsp x p n a n sgn a n b c n displaystyle x p approx n a sqrt n operatorname sgn a sqrt n b c n nbsp mit den Parametern a b c displaystyle a b c nbsp aus der Tabelle annahern wobei sgn a displaystyle operatorname sgn a nbsp die Signum Funktion bezeichnet die einfach das Vorzeichen ihres Arguments darstellt p displaystyle p nbsp 0 005 0 01 0 025 0 05 0 1 0 5 0 9 0 95 0 975 0 99 0 995a displaystyle a nbsp 3 643 3 298 2 787 2 34 1 83 0 1 82 2 34 2 78 3 29 3 63b displaystyle b nbsp 1 8947 1 327 0 6 0 082 0 348 0 67 0 58 0 15 0 43 1 3 2c displaystyle c nbsp 2 14 1 46 0 69 0 24 0 0 104 0 34 0 4 0 4 0 3 0Der Vergleich mit einer x 2 displaystyle chi 2 nbsp Tabelle zeigt ab n gt 3 displaystyle n gt 3 nbsp einen relativen Fehler unter 0 4 ab n gt 10 displaystyle n gt 10 nbsp unter 0 1 Da die x 2 displaystyle chi 2 nbsp Verteilung fur grosse n displaystyle n nbsp in eine Normalverteilung mit Standardabweichung 2 n displaystyle sqrt 2n nbsp ubergeht besitzt der Parameter a displaystyle a nbsp aus der Tabelle der hier frei angepasst wurde bei der entsprechenden Wahrscheinlichkeit p displaystyle p nbsp etwa die Grosse des 2 displaystyle sqrt 2 nbsp fachen des Quantils der Normalverteilung 2 Erf 1 2 p 1 displaystyle sqrt 2 operatorname Erf 1 2p 1 nbsp wobei Erf 1 displaystyle operatorname Erf 1 nbsp die Umkehrfunktion der Fehlerfunktion bedeutet Das 95 Konfidenzintervall fur die Varianz der Grundgesamtheit aus dem Abschnitt Beispiel kann z B mit den beiden Funktionen x p displaystyle x p nbsp aus den Zeilen mit p 0 025 x a 2 displaystyle p 0 025 to chi a 2 nbsp und p 0 975 x b 2 displaystyle p 0 975 to chi b 2 nbsp auf einfache Weise als Funktion von n displaystyle n nbsp grafisch dargestellt werden Der Median befindet sich in der Spalte der Tabelle mit p 0 5 displaystyle p 0 5 nbsp Literatur BearbeitenJoachim Hartung Barbel Elpelt Karl Heinz Klosener Statistik 12 Auflage Oldenbourg 1999 ISBN 3 486 24984 3 S 152 ff Weblinks Bearbeiten nbsp Wikibooks Tabelle der x2 Verteilung Quantiltabelle Lern und LehrmaterialienEinzelnachweise Bearbeiten R Barlow Statistics Wiley 1989 S 152 Goodness of Fit Kendall Stuart The Advanced Theory Of Statistics Vol 2 Third Edition London 1973 S 436 Goodness of Fit F R Helmert In Zeitschrift fuer Math und Physik 21 1876 S 192 219 Karl Pearson On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling In Philosophical Magazine 5 Band 50 1900 S 157 175 Zitiert nach L Schmetterer Mathematische Statistik Springer Wien 1966 S 93 George G Judge R Carter Hill W Griffiths Helmut Lutkepohl T C Lee Introduction to the Theory and Practice of Econometrics 2 Auflage John Wiley amp Sons New York Chichester Brisbane Toronto Singapore 1988 ISBN 0 471 62414 4 S 51 Wolfram Mathworld A C Davison Statistical Models Cambridge University Press 2008 ISBN 1 4672 0331 9 Kapitel 3 2 Albert H Nuttall Some Integrals Involving the QM Function In IEEE Transactions on Information Theory Nr 21 1975 S 95 96 doi 10 1109 TIT 1975 1055327 Helmert In Astronomische Nachrichten 88 1876 S 113 132 George G Judge R Carter Hill W Griffiths Helmut Lutkepohl T C Lee Introduction to the Theory and Practice of Econometrics 2 Auflage John Wiley amp Sons New York Chichester Brisbane Toronto Singapore 1988 ISBN 0 471 62414 4 S 51 Diskrete univariate Verteilungen Diskrete univariate Verteilungen fur endliche Mengen Benford Bernoulli beta binomial binomial Dirac diskret uniform empirisch hypergeometrisch kategorial negativ hypergeometrisch Rademacher verallgemeinert binomial Zipf Zipf Mandelbrot ZweipunktDiskrete univariate Verteilungen fur unendliche Mengen Boltzmann Conway Maxwell Poisson discrete Phase Type erweitert negativ binomial Gauss Kuzmin gemischt Poisson geometrisch logarithmisch negativ binomial parabolisch fraktal Poisson Skellam verallgemeinert Poisson Yule Simon ZetaKontinuierliche univariate Verteilungen Kontinuierliche univariate Verteilungen mit kompaktem Intervall Beta Cantor Kumaraswamy raised Cosine Dreieck Trapez U quadratisch stetig uniform Wigner HalbkreisKontinuierliche univariate Verteilungen mit halboffenem Intervall Beta prime Bose Einstein Burr Chi Chi Quadrat Coxian Erlang Exponential Extremwert F Fermi Dirac Folded normal Frechet Gamma Gamma Gamma verallgemeinert invers Gauss halblogistisch halbnormal Hartman Watson Hotellings T Quadrat hyper exponentiale hypoexponential invers Chi Quadrat scale invers Chi Quadrat Invers Normal Invers Gamma Kolmogorow Verteilung Levy log normal log logistisch Maxwell Boltzmann Maxwell Speed Nakagami nichtzentriert Chi Quadrat Pareto Phase Type Rayleigh relativistisch Breit Wigner Rice Rosin Rammler shifted Gompertz truncated normal Type 2 Gumbel Weibull Wilks LambdaKontinuierliche univariate Verteilungen mit unbeschranktem Intervall Cauchy Extremwert exponential Power Fishers z Fisher Tippett Gumbel generalized hyperbolic Hyperbolic secant Landau Laplace alpha stabil logistisch normal Gauss normal invers Gauss sch Skew normal Studentsche t Type 1 Gumbel Variance Gamma VoigtMultivariate Verteilungen Diskrete multivariate Verteilungen Dirichlet compound multinomial Ewens gemischt Multinomial multinomial multivariat hypergeometrisch multivariat Poisson negativmultinomial Polya Eggenberger polyhypergeometrischKontinuierliche multivariate Verteilungen Dirichlet GEM generalized Dirichlet multivariat normal multivariat Student normalskaliert invers Gamma Normal Gamma Poisson DirichletMultivariate Matrixverteilungen Invers Wishart Matrix Beta Matrix Gamma Matrix invers Beta Matrix invers Gamma Matrix Normal Matrix Student t Normal invers Wishart Normal Wishart Wishart Abgerufen von https de wikipedia org w index php title Chi Quadrat Verteilung amp oldid 238003611