www.wikidata.de-de.nina.az
Das Behrens Fisher Problem ist eine Problemstellung der mathematischen Statistik deren exakte Losungen nachgewiesenermassen unerwunschte Eigenschaften haben weswegen man Approximationen bevorzugt Gesucht ist ein nichtrandomisierter ahnlicher Test der Nullhypothese gleicher Erwartungswerte H 0 m 1 m 2 displaystyle H 0 colon mu 1 mu 2 zweier normalverteilter Grundgesamtheiten deren Varianzen s 1 2 displaystyle sigma 1 2 und s 2 2 displaystyle sigma 2 2 unbekannt sind und nicht als gleich vorausgesetzt werden Die Ahnlichkeit des Tests besagt dabei dass die Nullhypothese bei deren Gultigkeit exakt mit Wahrscheinlichkeit a displaystyle alpha dem vorgegebenen Signifikanzniveau abgelehnt wird wie gross und unterschiedlich auch immer die unbekannten Varianzen s 1 2 displaystyle sigma 1 2 und s 2 2 displaystyle sigma 2 2 sind Aus Grunden der Macht des Tests bezieht man sich auf folgende Behrens Fisher Testgrosse T x 1 x 2 s 1 2 n 1 s 2 2 n 2 displaystyle T bar x 1 bar x 2 over sqrt s 1 2 n 1 s 2 2 n 2 wobei x 1 displaystyle bar x 1 und x 2 displaystyle bar x 2 die Mittelwerte und s 1 displaystyle s 1 und s 2 displaystyle s 2 die Standardabweichungen der beiden Stichproben sind mit n 1 displaystyle n 1 und n 2 displaystyle n 2 wird deren jeweiliger Umfang bezeichnet Das Behrens Fisher Problem verallgemeinert den t Test fur zwei unabhangige Stichproben dieser setzt namlich voraus dass die Varianzen beider Grundgesamtheiten ubereinstimmen Inhaltsverzeichnis 1 Entstehung 2 Nichtexistenz einer wunschenswerten Losung 3 Beste Approximation mittels eines nichtkonvergenten Reihenansatzes 4 Die Approximation im sogenannten Welch Test 5 LiteraturEntstehung BearbeitenRonald Fisher fuhrte 1935 die fiducial inference zur Losung dieses Problems ein Er bezog sich hierbei auf eine fruhere Arbeit von Walter Ulrich Behrens aus dem Jahr 1929 Behrens und Fisher schlugen vor die Verteilung der oben erwahnten Testgrosse T displaystyle T nbsp zu bestimmen Fisher approximierte diese Verteilung indem er die Zufalligkeit der relativen Grosse s 1 2 n 1 s 1 2 n 1 s 2 2 n 2 1 2 displaystyle s 1 2 n 1 s 1 2 n 1 s 2 2 n 2 1 2 nbsp ignorierte Folglich hatte der so entstandene Test nicht die gewunschte Eigenschaft die Nullhypothese mit Wahrscheinlichkeit a displaystyle alpha nbsp abzulehnen wenn immer sie zutrifft Das rief eine Kontroverse hervor die gemeinhin als das Behrens Fisher Problem bekannt ist Nichtexistenz einer wunschenswerten Losung BearbeitenLinnik 1968 Theorem 8 3 1 hat gezeigt dass es fur die Grenze zwischen Annahme und Ablehnbereich der eingangs genannten Behrens Fisher Testgrosse T displaystyle T nbsp keine stetige Funktion gibt die nur vom Quotienten der empirischen Varianzen der Mittelwerte s 1 2 n 1 s 2 2 n 2 displaystyle s 1 2 n 1 s 2 2 n 2 nbsp und naturlich Konstanten wie n 1 n 1 1 displaystyle nu 1 n 1 1 nbsp n 2 n 2 1 displaystyle nu 2 n 2 1 nbsp und dem Signifikanzniveau a displaystyle alpha nbsp abhangt Die Grenze zwischen Annahme und Ablehnbereich jeder exakten Losung des Behrens Fisher Problems ist notwendigerweise unstetig in diesem Quotienten Mehr noch Eine exakte Losung fordert dass der Ablehnbereich der Behrens Fisher Testgrosse Umgebungen von Punkten enthalt fur die x 1 x 2 displaystyle bar x 1 bar x 2 nbsp ist eine untragbare Eigenschaft Linnik 1968 Dass sich Linnik anstatt auf T displaystyle T nbsp und den genannten Varianzquotienten auf x 1 x 2 s 2 displaystyle bar x 1 bar x 2 s 2 nbsp und s 1 s 2 displaystyle s 1 s 2 nbsp bezieht ist nicht wesentlich da mittels letzterer das Problem in aquivalenter Weise beschrieben wird Beste Approximation mittels eines nichtkonvergenten Reihenansatzes BearbeitenEine Arbeit die Linnik 1968 nie erwahnt hat ist die von B L Welch 1947 Schon zwei Jahrzehnte fruher hat namlich Welch 1947 der wie Fisher am University College London tatig war einen Ansatz zur exakten Losung des Behrens Fisher Problems gemacht der die Grenze zwischen Annahme und Ablehnbereich der Testgrosse T displaystyle T nbsp als stetige Funktion in s 1 2 n 1 s 2 2 n 2 displaystyle s 1 2 n 1 s 2 2 n 2 nbsp beschreiben wurde Welch 1947 gibt fur gegebenes Signifikanzniveau a displaystyle alpha nbsp diese Grenze zunachst fur die empirische Mittelwertsdifferenz d x 1 x 2 displaystyle bar d bar x 1 bar x 2 nbsp als Funktion h displaystyle h nbsp von den empirischen Varianzen s 1 2 displaystyle s 1 2 nbsp und s 2 2 displaystyle s 2 2 nbsp in Form einer partiellen Differentialgleichung unendlicher Ordnung exakt an Auch beschreibt er die Methode wie man die Losung mittels dreier Taylor Entwicklungen beliebig genau annahert Die Reihenentwicklung dieser Funktion h displaystyle h nbsp lasst erkennen dass sie in ein Produkt aus der geschatzten Standardabweichung der Mittelwertsdifferenz s d s 1 2 n 1 s 2 2 n 2 1 2 displaystyle s bar d s 1 2 n 1 s 2 2 n 2 1 2 nbsp und einer nur vom Varianzquotienten s 1 2 n 1 s 2 2 n 2 displaystyle s 1 2 n 1 s 2 2 n 2 nbsp und Konstanten abhangigen Funktion faktorisiert werden kann Die entsprechend der Testgrosse T displaystyle T nbsp standardisierte Funktion h h s d displaystyle h h s bar d nbsp hangt also wie gewunscht nur vom Varianzquotienten s 1 2 n 1 s 2 2 n 2 displaystyle s 1 2 n 1 s 2 2 n 2 nbsp ab Konvergierte nun Welch s Reihenansatz gleichmassig sodass die Funktion unendlich oft differenzierbar also auch stetig ware wurde dies Linniks Beweis widersprechen demgemass es eine solche Funktion nicht gibt Es folgt dass Welchs Ansatz nicht gleichmassig konvergieren kann Graphische Darstellungen der Funktion h displaystyle h nbsp bis zu verschieden weit entwickelten Ordnungen bei sehr kleinen wie auch etwas grosseren n 1 displaystyle nu 1 nbsp n 2 displaystyle nu 2 nbsp und a displaystyle alpha nbsp lassen diese Schlussfolgerung durchaus glaubwurdig erscheinen obwohl fur nicht allzu kleine n 1 displaystyle nu 1 nbsp n 2 displaystyle nu 2 nbsp und a displaystyle alpha nbsp die Ergebnisse hinsichtlich der Glatte von h displaystyle h nbsp und der Genauigkeit der numerisch errechneten Irrtumswahrscheinlichkeiten erster Art beachtlich sind Aspins 1948 Weiterentwicklung des Reihenansatzes von Welch bis zur vierten Potenz in Kehrwerten von Freiheitsgraden liefert die mit Abstand genaueste Approximation es sei denn n 1 displaystyle nu 1 nbsp n 2 displaystyle nu 2 nbsp und a displaystyle alpha nbsp seien viel kleiner als ublich Der so entstandene Welch Aspin Test ist in Bachmaier 2000 ausfuhrlich und in deutscher Sprache beschrieben Die Approximation im sogenannten Welch Test BearbeitenApproximative Ansatze zur Losung des Behrens Fisher Problems gibt es mehrere Eine der am meisten benutzten Approximationen beispielsweise in Microsoft Excel stammt ebenfalls von Welch Man bezeichnet den auf dieser Welch Approximation beruhenden Test auch als Welch Test Die Varianz der Mittelwertsdifferenz d x 1 x 2 displaystyle bar d bar x 1 bar x 2 nbsp ist s d 2 s 1 2 n 1 s 2 2 n 2 displaystyle s bar d 2 s 1 2 n 1 s 2 2 n 2 nbsp Die Verteilung von s d 2 displaystyle s bar d 2 nbsp approximierte Welch 1938 durch diejenige Pearson Kurve vom Typ III eine skalierte Chi Quadrat Verteilung deren erste beide Momente Erwartungswert und Varianz mit denen von s d 2 displaystyle s bar d 2 nbsp ubereinstimmen Dies trifft bei folgender Anzahl n displaystyle nu nbsp an Freiheitsgraden degrees of freedom d f mit im Allgemeinen nichtganzzahligen Werten zu n g 1 g 2 2 g 1 2 n 1 1 g 2 2 n 2 1 m i t g i s i 2 n i displaystyle nu gamma 1 gamma 2 2 over gamma 1 2 n 1 1 gamma 2 2 n 2 1 qquad rm mit gamma i sigma i 2 n i nbsp Bei Gultigkeit der Nullhypothese gleicher Erwartungswerte H 0 m 1 m 2 displaystyle H 0 colon mu 1 mu 2 nbsp konnte die Verteilung der eingangs erwahnten Behrens Fisher Testgrosse T displaystyle T nbsp die ein wenig vom Quotienten der Standardabweichungen s 1 s 2 displaystyle sigma 1 sigma 2 nbsp abhangt durch Students t Verteilung mit diesen n displaystyle nu nbsp Freiheitsgraden approximiert werden Nun enthalt dieses n displaystyle nu nbsp aber auch die Varianzen s i 2 displaystyle sigma i 2 nbsp der Grundgesamtheiten welche unbekannt sind Es hat sich schliesslich folgende Schatzung der Freiheitsgrade durchgesetzt die einfach auf der Ersetzung der Grundgesamtheits Varianzen durch die Stichproben Varianzen beruht n g 1 g 2 2 g 1 2 n 1 1 g 2 2 n 2 1 m i t g i s i 2 n i displaystyle hat nu g 1 g 2 2 over g 1 2 n 1 1 g 2 2 n 2 1 qquad rm mit g i s i 2 n i nbsp Durch diese Schatzung wird aber n displaystyle hat nu nbsp eine Zufallsvariable Eine t Verteilung mit einer zufalligen Anzahl von Freiheitsgraden gibt es aber nicht Das ist jedoch kein Hinderungsgrund die Testgrosse T displaystyle T nbsp mit entsprechenden Quantilswerten der t Verteilung mit den geschatzten n displaystyle hat nu nbsp Freiheitsgraden zu vergleichen Auf diese Weise entsteht eine unendlich oft differenzierbare von den empirischen Varianzen s i 2 displaystyle s i 2 nbsp abhangige Funktion als Grenze zwischen Annahme und Ablehnbereich der Teststgrosse T displaystyle T nbsp Diese Methode halt das Signifikanzniveau nicht exakt ist aber nicht allzu weit entfernt davon Nur wenn die Grundgesamtheits Varianzen s 1 2 displaystyle sigma 1 2 nbsp und s 2 2 displaystyle sigma 2 2 nbsp identisch sind oder im Falle eher kleiner Stichprobenumfange wenigstens als nahezu identisch angenommen werden konnen ist der gewohnliche t Test von Student die bessere Wahl Literatur BearbeitenA A Aspin An Examination and Further Development of a Formula Arising in the Problem of Comparing Two Mean Values Biometrika 35 1948 S 88 96 doi 10 1093 biomet 35 1 2 88 JSTOR 2332631 M Bachmaier Das Behrens Fisher Problem In M Bachmaier Klassische robuste und nichtparametrische Bartlett Tests und robuste Varianzanalyse bei heterogenen Skalenparametern Shaker Aachen 2000 S 231 245 W U Behrens Ein Beitrag zur Fehlerberechnung bei wenigen Beobachtungen Landwirtschaftliche Jahrbucher 68 1929 S 807 837 R A Fisher The fiducial argument in statistical inference Annals of Eugenics 8 1935 S 391 398 doi 10 1111 j 1469 1809 1935 tb02120 x Juri Wladimirowitsch Linnik Statistical problems with nuisance parameters American Mathematical Society Providence Rhode Island 1968 H Ruben A simple conservative and robust solution of the Behrens Fisher problem In The Indian Journal of Statistics Series A Volume 64 Teil 1 2002 S 139 155 JSTOR 25051377 Kam Wah Tsui Shijie Tang Distributional Property of the Generalized p value for the Behrens Fisher Problem with Applications to Multiple Testing University of Wisconsin 31 Oktober 2005 PDF Datei 192 kB B L Welch The Significance of the Difference between Two Means When the Population Variances Are Unequal Biometrika 29 1938 S 350 362 doi 10 1093 biomet 29 3 4 350 JSTOR 2332010 B L Welch The Generalization of Student s Problem When Several Different Population Variances Are Involved Biometrika 34 1947 S 28 35 doi 10 1093 biomet 34 1 2 28 JSTOR 2332510 Abgerufen von https de wikipedia org w index php title Behrens Fisher Problem amp oldid 184490129