www.wikidata.de-de.nina.az
Der Ausreissertest nach Walsh ist ein statistischer Test mit dem Ausreisser in einer Stichprobe erkannt werden konnen Er setzt keine bestimmte Haufigkeitsverteilung der Daten voraus und zahlt deshalb zu den nichtparametrischen Verfahren Entwickelt wurde der Test vom amerikanischen Statistiker John E Walsh der ihn 1950 erstmals beschrieb Der Ausreissertest nach Walsh ist nicht von dem Problem der meisten anderen Ausreissertests betroffen die auf der Annahme einer Normalverteilung basieren und bei Stichproben deren Werte beispielsweise lognormalverteilt sind zu falsch positiven Ergebnissen fuhren konnen Voraussetzung fur die Testanwendung ist allerdings ein Stichprobenumfang von mehr als 60 Werten fur ein Signifikanzniveau von a 0 10 und von mehr als 220 Werten fur a 0 05 Daruber hinaus muss zur Durchfuhrung des Tests die Zahl der angenommenen Ausreisser a priori angegeben werden Die Nullhypothese des Tests ist die Annahme dass alle Beobachtungen zur Stichprobe gehoren und die Stichprobe somit keine Ausreisser enthalt Die Alternativhypothese ist demgegenuber dass die der zur Testdurchfuhrung angegebenen Zahl der angenommenen Ausreisser entsprechenden hochsten beziehungsweise niedrigsten Einzelwerte tatsachlich Ausreisser sind Inhaltsverzeichnis 1 Testdurchfuhrung 2 Beispiel 3 Mathematischer Hintergrund 4 Literatur 5 WeblinksTestdurchfuhrung BearbeitenNullhypothese AlternativhypotheseH0min displaystyle H 0 mathrm min nbsp Die r displaystyle r nbsp kleinsten Werte gehoren zu einer Verteilung H1min displaystyle H 1 mathrm min nbsp Die r displaystyle r nbsp kleinsten Werte gehoren nicht zu einer Verteilung sind also Ausreisser H0max displaystyle H 0 mathrm max nbsp Die r displaystyle r nbsp grossten Werte gehoren zu einer Verteilung H1max displaystyle H 1 mathrm max nbsp Die r displaystyle r nbsp grossten Werte gehoren nicht zu einer Verteilung sind also Ausreisser Folgende Berechnungsschritte werden durchgefuhrt c 2n displaystyle c lfloor sqrt 2n rfloor nbsp mit x displaystyle lfloor x rfloor nbsp die grosste ganze Zahl kleiner als x displaystyle x nbsp abrunden k c r displaystyle k c r nbsp b 1 a displaystyle b sqrt 1 alpha nbsp und a 1 bc b2c 1c b2 1 displaystyle a frac 1 b sqrt frac c b 2 c 1 c b 2 1 nbsp Gilt nun x r 1 a x r 1 ax k lt 0 displaystyle x r 1 a x r 1 ax k lt 0 nbsp dann kann die Nullhypothese H0min displaystyle H 0 min nbsp zum Signifikanzniveau a displaystyle alpha nbsp verworfen werden oder x n 1 r 1 a x n r ax n 1 k gt 0 displaystyle x n 1 r 1 a x n r ax n 1 k gt 0 nbsp dann kann die Nullhypothese H0max displaystyle H 0 max nbsp zum Signifikanzniveau a displaystyle alpha nbsp verworfen werden Der Wert x i displaystyle x i nbsp gibt dabei die i displaystyle i nbsp kleinste Beobachtung der Stichprobe an siehe auch Rang Statistik Da der Wert a gt 0 displaystyle a gt 0 nbsp sein muss muss gelten a gt 1 2n 1 displaystyle alpha gt frac 1 lfloor sqrt 2n rfloor 1 nbsp Daher sind fur ein Signifikanzniveau von a 10 displaystyle alpha 10 nbsp mindestens 61 Beobachtungen erforderlich fur ein Signifikanzniveau von a 5 displaystyle alpha 5 nbsp mindestens 221 Beobachtungen Beispiel BearbeitenWenn n 75 displaystyle n 75 nbsp a 10 displaystyle alpha 10 nbsp und r 2 displaystyle r 2 nbsp dann ist c 12 displaystyle c 12 nbsp k 14 displaystyle k 14 nbsp b 3 1623 displaystyle b 3 1623 nbsp a 2 348 displaystyle a 2 348 nbsp D h wenn x 2 3 348x 3 2 348x 14 lt 0 displaystyle x 2 3 348x 3 2 348x 14 lt 0 nbsp dann wird H0min displaystyle H 0 min nbsp verworfen bzw x 74 3 348x 73 2 348x 62 gt 0 displaystyle x 74 3 348x 73 2 348x 62 gt 0 nbsp dann wird H0max displaystyle H 0 max nbsp verworfen Mathematischer Hintergrund BearbeitenWalsh betrachtet eine lineare Kombination von Ordnungsstatistiken X i displaystyle X i nbsp der Form L X r 1 a X j aX k displaystyle L X r 1 a X j aX k nbsp mit 1 lt j lt k displaystyle 1 lt j lt k nbsp und a gt 0 displaystyle a gt 0 nbsp Wenn die Nullhypothese H0min displaystyle H 0 min nbsp gilt dann folgt j r 1 displaystyle j r 1 nbsp wenn die Var L 1 o 1 displaystyle Var L 1 o 1 nbsp minimal sein soll Gilt des Weiteren E L KVar L 1 o 1 displaystyle E L K sqrt Var L 1 o 1 nbsp so folgt mittels der Tschebyscheff Ungleichung P X r 1 a X r 1 aX k lt 0 P L lt 0 P L E L Var L lt K o 1 1K2 o 1 displaystyle P X r 1 a X r 1 aX k lt 0 P L lt 0 P left frac L E L sqrt Var L lt K o 1 right leq frac 1 K 2 o 1 nbsp Einige nicht sehr restriktive Voraussetzungen mussen jedoch erfullt sein Wenn Q p displaystyle Q p nbsp die inverse Verteilungsfunktion der Grundgesamtheit bzw Q p displaystyle Q p nbsp deren erste Ableitung ist dann muss fur r lt s displaystyle r lt s nbsp allenfalls mit o n displaystyle o sqrt n nbsp unter H0 displaystyle H 0 nbsp gelten E X r Q sn 1 s rn 1Q sn 1 1 o 1 displaystyle E X r Q left frac s n 1 right frac s r n 1 Q left frac s n 1 right 1 o 1 nbsp Var X r r n 1 2 Q sn 1 2 1 o 1 displaystyle Var X r frac r n 1 2 left Q left frac s n 1 right right 2 1 o 1 nbsp Var X s s n 1 2 Q sn 1 2 1 o 1 displaystyle Var X s frac s n 1 2 left Q left frac s n 1 right right 2 1 o 1 nbsp Cov X r X s r n 1 2 Q sn 1 2 1 o 1 displaystyle Cov X r X s frac r n 1 2 left Q left frac s n 1 right right 2 1 o 1 nbsp sowie analogen Bedingungen fur n 1 r displaystyle n 1 r nbsp und n 1 s displaystyle n 1 s nbsp Fur 2n gt K2 1 displaystyle lfloor sqrt 2n rfloor gt K 2 1 nbsp konnen die o 1 displaystyle o 1 nbsp Terme vernachlassigt werden und es ergibt sich dann k r 2n displaystyle k r leq sqrt 2n nbsp Literatur BearbeitenJohn Edward Walsh Some Nonparametric Tests of whether the Largest Observations of a Set are too Large or too Small In Annals of Mathematical Statistics Band 21 Nr 4 1950 ISSN 0003 4851 S 583 592 doi 10 1214 aoms 1177729753 John Edward Walsh Correction to Some Nonparametric Tests of Whether the Largest Observations of a set are too Large or too Small In Annals of Mathematical Statistics Band 24 Nr 1 1953 S 134 135 doi 10 1214 aoms 1177729095 John Edward Walsh Large Sample Nonparametric Rejection of Outlying Observations In Annals of the Institute of Statistical Mathematics 10 1958 The Institute of Statistical Mathematics S 223 232 ISSN 0020 3157 Large Sample Outlier Detection In Douglas M Hawkins Identification of Outliers Chapman amp Hall London und New York 1980 ISBN 0 41 221900 X S 83 84Weblinks BearbeitenGrundlagen der Statistik Ausreissertest nach Walsh Beschreibung der Testdurchfuhrung Abgerufen von https de wikipedia org w index php title Ausreissertest nach Walsh amp oldid 202639209