www.wikidata.de-de.nina.az
Der Shapiro Wilk Test ist ein statistischer Signifikanztest der die Hypothese uberpruft dass die zugrunde liegende Grundgesamtheit einer Stichprobe normalverteilt ist Die Nullhypothese H 0 displaystyle H 0 nimmt an dass eine Normalverteilung der Grundgesamtheit vorliegt Demgegenuber unterstellt die Alternativhypothese H 1 displaystyle H 1 dass keine Normalverteilung gegeben ist Wenn der Wert der Teststatistik W displaystyle W grosser ist als der kritische Wert W kritisch displaystyle W text kritisch wird die Nullhypothese nicht abgelehnt und es wird angenommen dass eine Normalverteilung vorliegt Wird alternativ der p displaystyle p Wert des Tests ermittelt so wird die Nullhypothese in der Regel nicht abgelehnt wenn der p displaystyle p Wert grosser ist als das festgelegte Signifikanzniveau a displaystyle alpha Das Testverfahren wurde 1965 von dem Amerikaner Samuel Shapiro und dem Kanadier Martin Wilk veroffentlicht und ist das Ergebnis ihrer ursprunglichen Idee die graphischen Informationen der Analyse auf Normalverteilung mittels Normalwahrscheinlichkeitsplot in einer Kennzahl zusammenzufassen Der Test kann zum Uberprufen von univariaten Stichproben mit 3 bis 5000 Beobachtungen eingesetzt werden Eine Weiterentwicklung des Tests der sogenannte Royston s H Test ermoglicht die Uberprufung mehrdimensionaler Stichproben auf mehrdimensionale Normalverteilung Neben anderen bekannten Tests auf Normalverteilung wie beispielsweise dem Kolmogorow Smirnow Test oder dem Chi Quadrat Test zeichnet sich der Shapiro Wilk Test durch seine vergleichsweise hohe Teststarke in zahlreichen Testsituationen aus insbesondere bei der Uberprufung von kleineren Stichproben mit n lt 50 displaystyle n lt 50 Der Shapiro Wilk Test oder Abwandlungen des Tests wie der Ryan Joiner Test sind in gangigen kommerziellen und nicht kommerziellen statistischen Softwarepaketen vertreten Inhaltsverzeichnis 1 Eigenschaften 1 1 Vortest fur weitere Testvorhaben 1 2 Kein allgemeiner Anpassungstest 1 3 Eigenschaft als Omnibus Test 1 4 Stichprobenumfang bis 5000 Beobachtungen 1 5 Hohe Teststarke 2 Funktionsweise 3 Voraussetzungen 4 Berechnung der Teststatistik 4 1 Aufstellen der Hypothesen und Festlegung des Signifikanzniveaus 4 2 Erstellung der Ordnungsstatistiken 4 3 Berechnung der Schatzer b2 und s2 4 4 Vergleich der Teststatistik mit einem kritischen Wert 5 Beurteilung der Ergebnisse 6 Auswertung mittels p Wert 7 Praktisches Beispiel 8 Vor und Nachteile 8 1 Vorteile 8 2 Nachteile 9 Alternative Verfahren 9 1 Andere Signifikanztests 9 2 Graphische Methoden 10 Einzelnachweise 11 Literatur 12 WeblinksEigenschaften BearbeitenVortest fur weitere Testvorhaben Bearbeiten Einige inferenzstatistische Analyseverfahren wie beispielsweise Varianzanalyse t Test oder lineare Regression setzen voraus dass die Vorhersagefehler Residuen aus einer normalverteilten Grundgesamtheit stammen dies zumindest bei kleinen Stichprobenumfangen mit n lt 30 displaystyle n lt 30 nbsp Somit kann der Shapiro Wilk Test auf Normalverteilung auch als Vortest fur weitere Testvorhaben aufgefasst werden Kein allgemeiner Anpassungstest Bearbeiten Wahrend einige Normalitatstests wie der Kolmogorow Smirnow Test oder der Chi Quadrat Test allgemeine Anpassungstests Goodness of Fit Tests darstellen die im Stande sind eine Stichprobe auf verschiedene hypothetische Verteilungen hin zu testen einschliesslich der Normalverteilung ist der Shapiro Wilk Test einzig auf die Untersuchung hinsichtlich Normalverteilung konzipiert Im Unterschied zu allgemeinen Anpassungstests die fur gewohnlich mindestens 50 bis 100 Beobachtungen benotigen um aussagekraftige Testergebnisse zu erhalten sind beim Shapiro Wilk Test oft weniger Beobachtungen vonnoten Eigenschaft als Omnibus Test Bearbeiten Der Shapiro Wilk Test ist ein Omnibus Test d h er ist lediglich in der Lage festzustellen ob es eine signifikante Abweichung zur Normalverteilung gibt oder nicht Er ist nicht im Stande zu beschreiben in welcher Form die Abweichung auftritt Er kann z B keine Aussage daruber treffen ob die Verteilung links oder rechtsschief ist oder ob es sich um eine endlastige Verteilung handelt oder ggf beides Stichprobenumfang bis 5000 Beobachtungen Bearbeiten Ursprunglich war der Test nur im Stande Stichproben vom Umfang 3 n lt 50 displaystyle 3 leq n lt 50 nbsp zu untersuchen Im Jahr 1972 wurde es moglich den Test durch eine Erweiterung von Shapiro und Francia auch fur Stichproben vom Umfang n lt 100 displaystyle n lt 100 nbsp einzusetzen Danach gab es weitere Anpassungen die den moglichen Anwendungsbereich weiter vergrosserten Royston fuhrte 1982 1 eine weitere Verbesserung ein und machte Stichproben der Grosse n lt 2000 displaystyle n lt 2000 nbsp moglich Rahman und Govidarajulu 2 erweiterten 1997 den Einsatzbereich des Tests auf Stichproben vom Umfang n 5000 displaystyle n leq 5000 nbsp Hohe Teststarke Bearbeiten Allgemein ist die Teststarke fur samtliche Normalitatstests bei kleinen Stichprobenumfangen geringer als bei grosseren da hier der Standardfehler relativ gross ist Erst wenn der Stichprobenumfang grosser wird reduziert sich der Standardfehler und die Teststarke wachst Der Shapiro Wilk Test hat auch bei kleinem Stichprobenumfang n lt 50 displaystyle n lt 50 nbsp eine relativ grosse Teststarke verglichen mit anderen Tests Beispielsweise hat der Shapiro Wilk Test eine Teststarke von 54 bei einer Stichprobengrosse von 20 Beobachtungen wenn die tatsachliche Verteilung eine Chi Quadrat Verteilung ist im Vergleich zum D Agostino Test von 1970 der eine Teststarke von 29 aufweist 3 Funktionsweise BearbeitenDie Teststatistik W displaystyle W nbsp ist ein Quotient der das Verhaltnis zweier Varianz Schatzer zueinander ausdruckt W b 2 n 1 s 2 displaystyle W frac b 2 n 1 s 2 nbsp Die Teststatistik berechnet mittels eines ersten Schatzers im Zahler wie die Varianz einer Stichprobe aussehen musste wenn sie aus einer normalverteilten Grundgesamtheit stammte und vergleicht diese erwartete Varianz mit einem zweiten Schatzer im Nenner fur die tatsachliche Varianz der Stichprobe Wenn die Grundgesamtheit der Stichprobe in der Tat normalverteilt ist dann mussten beide Schatzer fur die Varianz unabhangig voneinander zu etwa demselben Ergebnis kommen Je geringer die geschatzten Varianzen also voneinander abweichen desto wahrscheinlicher ist es dass die Grundgesamtheit der Stichprobe in Wirklichkeit normalverteilt ist Der Shapiro Wilk Test basiert demzufolge auf einer Varianzanalyse ANOVA der Stichprobe was auch der Originaltitel der Veroffentlichung An Analysis of Variance Test for Normality for complete samples deutlich macht Der Schatzer fur die Stichprobenvarianz im Nenner ist die ubliche korrigierte Stichprobenvarianz s 2 displaystyle s 2 nbsp s 2 1 n 1 i 1 n x i x 2 displaystyle s 2 frac 1 n 1 sum limits i 1 n left x i overline x right 2 nbsp Die erwartete Varianz fur eine aus einer normalverteilten Grundgesamtheit stammende Stichprobe im Zahler also angenommen H 0 displaystyle H 0 nbsp ist wahr wird mittels der Methode der kleinsten Quadrate geschatzt durch die Steigung der Regressionsgeraden im QQ Diagramm der die geordneten Beobachtungen einer Stichprobe mit entsprechenden Ordnungsstatistiken aus einer Normalverteilung gegenuberstellt Das gewohnliche lineare Modell y i a b x i e i displaystyle y i alpha beta x i varepsilon i nbsp wird verstanden als x i m s m i e i displaystyle x i mu sigma m i varepsilon i nbsp wobei s displaystyle sigma nbsp die Steigung der Regressionsgeraden beschreibt und damit der Schatzer b displaystyle b nbsp im Zahler der Teststatistik ist m displaystyle mu nbsp der Schnittpunkt mit der y displaystyle y nbsp Achse und der Schatzer fur den Mittelwert ist m i displaystyle m i nbsp die erwarteten Ordnungsstatistiken aus einer Normalverteilung sind x i displaystyle x i nbsp die Ordnungsstatistiken aus einer Stichprobe sind e i displaystyle varepsilon i nbsp die Storgrosse ist die nichterfassbare Einflusse darstelltMit diesem Ansatz unterscheidet sich der Test von diversen anderen Verfahren wie beispielsweise dem Jarque Bera Test der pruft wie gross die Ubereinstimmung der Stichprobenverteilung mit spezifischen Eigenschaften des Aussehens der Normalverteilung ist die charakterisiert wird durch ihre Momente wie Schiefe und Wolbung Voraussetzungen BearbeitenDie Beobachtungen x 1 x 2 x n displaystyle x 1 x 2 dots x n nbsp der Stichprobe mussen unabhangig voneinander sein Die Stichprobe darf nicht kleiner sein als n 3 displaystyle n 3 nbsp und nicht grosser als n 5000 displaystyle n 5000 nbsp In der Stichprobe sollten gleiche Werte nicht mehrfach vorkommen Ist dies der Fall dann ist es zwar sehr unwahrscheinlich dass es sich uberhaupt um eine kontinuierliche Verteilung handelt Andererseits konnen aber Werte aus der Praxis gerundet sein Das wurde zwar auch gegen eine Normalverteilung sprechen trotzdem konnte man aber die Daten oft dennoch so behandeln als waren sie normal verteilt Viele andere Tests sind diesbezuglich weniger empfindlich Die Zufallsvariable muss ein metrisches Skalenniveau besitzen Berechnung der Teststatistik BearbeitenDer Test uberpruft die Hypothese dass eine Stichprobe aus einer normalverteilten Grundgesamtheit entnommen wurde indem die Teststatistik W displaystyle W nbsp mit einem kritischen Wert fur den Ablehnungsbereich aus der Verteilung der Teststatistik verglichen wird Aufstellen der Hypothesen und Festlegung des Signifikanzniveaus Bearbeiten Es wird die Nullhypothese H 0 displaystyle H 0 nbsp aufgestellt die besagt dass eine Normalverteilung der Grundgesamtheit vorliegt und die Alternativhypothese H 1 displaystyle H 1 nbsp die besagt dass keine Normalverteilung vorliegt Gleichzeitig wird ein Signifikanzniveau gewahlt ublicherweise a 5 displaystyle alpha 5 nbsp H 0 F F 0 und H 1 F F 0 displaystyle H 0 F F 0 quad text und quad H 1 F neq F 0 nbsp Signifikanzniveau a displaystyle text Signifikanzniveau alpha nbsp Erstellung der Ordnungsstatistiken Bearbeiten Alle Beobachtungen der Stichprobe x 1 x 2 x n displaystyle x 1 x 2 dots x n nbsp werden nach aufsteigender Grosse sortiert x 1 x 2 x n displaystyle x 1 leq x 2 leq cdots leq x n nbsp und jedem Wert wird ein Rangplatz zugeordnet So erhalt man die Ordnungsstatistiken der Stichprobe X 1 X 2 X n displaystyle X 1 X 2 ldots X n nbsp mit den Werten x 1 x 2 x n displaystyle x 1 x 2 ldots x n nbsp Wobei X i displaystyle X i nbsp definiert ist als die i displaystyle i nbsp te geordnete Statistik Berechnung der Schatzer b2 und s2 Bearbeiten W b 2 n 1 s 2 displaystyle W frac b 2 n 1 s 2 nbsp mit b displaystyle b nbsp als der Summe aus k displaystyle k nbsp Zahlenpaaren der Ordnungsstatistiken x n 1 i x i displaystyle left x n 1 i x i right nbsp jeweils multipliziert mit einem entsprechenden Koeffizienten a i displaystyle a i nbsp auch als Gewicht bezeichnet Wenn die Anzahl der Beobachtungen in der Stichprobe gerade ist ist k n 2 displaystyle k n 2 nbsp bei ungerader Anzahl ist k n 1 2 displaystyle k n 1 2 nbsp Somit gilt b a 1 x n x 1 a 2 x n 1 x 2 displaystyle b a 1 left x n x 1 right a 2 left x left n 1 right x 2 right cdots nbsp wobei die Koeffizienten a i displaystyle a i nbsp gegeben sind durch die Komponenten des Vektors a m V 1 V 1 m 1 2 m V 1 displaystyle a m top V 1 V 1 m 1 over 2 m top V 1 nbsp mit m i displaystyle m i nbsp stellvertretend fur die erwarteten Ordnungsstatistiken einer Normalverteilung m m 1 m n displaystyle m m 1 dots m n top nbsp wobei m i displaystyle m i nbsp ungefahr gleich F 1 i 3 8 n 1 4 displaystyle Phi 1 left i 3 over 8 over n 1 over 4 right nbsp ist mit F x i 1 s 2 p e x i m 2 2 s 2 displaystyle Phi left x i right 1 over sigma sqrt 2 pi e left x i mu right 2 over 2 sigma 2 nbsp die Formel lasst sich herleiten aus der Inversen Normalverteilung mit den Parametern x i 3 8 n 1 4 displaystyle x left i 3 over 8 over n 1 over 4 right nbsp l gt 0 displaystyle lambda gt 0 nbsp Ereignisrate und m gt 0 displaystyle mu gt 0 nbsp Mittelwert f x m l l 2 p x 3 1 2 exp l x m 2 2 m 2 x displaystyle f x mu lambda left frac lambda 2 pi x 3 right 1 2 exp frac lambda x mu 2 2 mu 2 x nbsp und der Kovarianzmatrix V bestehend aus den erwarteten Ordnungsstatistiken V Cov m 1 m 1 Cov m 1 m n Cov m n m 1 Cov m n m n displaystyle V begin pmatrix operatorname Cov m 1 m 1 amp cdots amp operatorname Cov m 1 m n vdots amp ddots amp vdots operatorname Cov m n m 1 amp cdots amp operatorname Cov m n m n end pmatrix nbsp Die Koeffizienten a 1 a n displaystyle a 1 dots a n nbsp sind auch haufig fur die ersten 50 Zahlenpaare in Tabellen vieler Statistikbucher zu finden Die Varianz s 2 displaystyle s 2 nbsp sowie dem Mittelwert x displaystyle overline x nbsp der Stichprobe werden berechnet durch s 2 i 1 n x i x 2 n 1 mit x i 1 n x i n displaystyle s 2 frac sum i 1 n x i overline x 2 n 1 quad text mit quad overline x frac sum i 1 n x i n nbsp Vergleich der Teststatistik mit einem kritischen Wert Bearbeiten Der Wert der Teststatistik W displaystyle W nbsp wird mit einem kritischen Wert W kritisch displaystyle W text kritisch nbsp fur einen gegebenen Stichprobenumfang n displaystyle n nbsp und das zuvor festgelegte Signifikanzniveau a displaystyle alpha nbsp verglichen Fur die kritischen Werte mit n lt 50 displaystyle n lt 50 nbsp existieren Tabellen die in vielen Statistikbuchern abgedruckt werden Kritische Werte fur Stichproben mit n gt 50 displaystyle n gt 50 nbsp konnen mittels Monte Carlo Simulation ermittelt werden Beurteilung der Ergebnisse BearbeitenWenn der Wert der Teststatistik W displaystyle W nbsp grosser ist als der kritische Wert W kritisch displaystyle W text kritisch nbsp wird die Nullhypothese nicht abgelehnt D h es wird angenommen dass eine Normalverteilung vorliegt Die Teststatistik W displaystyle W nbsp kann wie ein Korrelationskoeffizient interpretiert werden der Werte zwischen 0 und 1 annehmen kann ahnlich dem Bestimmtheitsmass Je naher die Teststatistik an 1 liegt desto weniger Abweichungen zeigt die tatsachliche Varianz von der hypothetischen Varianz unter Annahme von Normalverteilung Gibt es jedoch statistisch signifikante Abweichungen d h die Teststatistik W displaystyle W nbsp ist kleiner als der kritische Wert W kritisch displaystyle W text kritisch nbsp so wird die Nullhypothese zu Gunsten der Alternativhypothese abgelehnt und es wird angenommen dass keine Normalverteilung vorliegt Damit steht der Shapiro Wilk Test im Gegensatz zu vielen anderen Normalitatstests die die Nullhypothese dann ablehnen wenn die jeweilige Teststatistik grosser als der kritische Wert ist Auswertung mittels p Wert BearbeitenZusatzlich oder alternativ zur Teststatistik W displaystyle W nbsp geben viele Computerprogramme den p displaystyle p nbsp Wert an Der p displaystyle p nbsp Wert gibt die Wahrscheinlichkeit an eine solche Stichprobe zu erhalten wie sie gezogen wurde unter der Annahme dass die Stichprobe tatsachlich aus einer normalverteilten Grundgesamtheit stammt Nullhypothese ist wahr Je kleiner der p displaystyle p nbsp Wert ist desto kleiner ist die Wahrscheinlichkeit dass eine solche Stichprobenziehung bei einer normalverteilten Grundgesamtheit vorkame Ein p displaystyle p nbsp Wert von 0 sagt aus dass es 0 wahrscheinlich ist und ein p displaystyle p nbsp Wert von 1 dass es 100 wahrscheinlich ist eine solche Stichprobe zu ziehen wenn sie aus einer Normalverteilung stammte In der Regel wird die Nullhypothese abgelehnt wenn der p displaystyle p nbsp Wert kleiner ist als das vorgegebene Signifikanzniveau Die Methode zur Berechnung des p displaystyle p nbsp Wertes ist abhangig vom Stichprobenumfang n displaystyle n nbsp Fur n 3 displaystyle n 3 nbsp ist die Wahrscheinlichkeitsverteilung von W displaystyle W nbsp bekannt Fur Stichproben mit n gt 3 displaystyle n gt 3 nbsp wird eine Transformation in die Normalverteilung durchgefuhrt Die Werte s l m displaystyle sigma lambda mu nbsp fur die jeweiligen Stichprobengrossen n gt 3 displaystyle n gt 3 nbsp werden per Monte Carlo Simulation errechnet Praktisches Beispiel BearbeitenDie folgenden 10 Beobachtungen n 10 displaystyle n 10 nbsp einer Stichprobe werden auf Normalverteilung uberpruft 200 545 290 165 190 355 185 205 175 255Die geordnete Stichprobe lautet 165 175 185 190 200 205 255 290 355 545Die Anzahl der Stichprobe ist gerade mit n 10 displaystyle n 10 nbsp somit werden k n 2 5 displaystyle k n 2 5 nbsp Zahlenpaare gebildet Die entsprechenden Gewichte a i displaystyle a i nbsp werden einer Tabelle entnommen b 0 5739 545 165 0 3291 355 175 0 2141 290 185 0 1224 255 190 0 0399 205 200 218 08 59 24 22 48 7 96 0 2 307 96Fur die Stichprobe ist s 117 59 displaystyle s 117 59 nbsp Demzufolge ist W 307 96 2 10 1 117 59 2 0 76 displaystyle W frac 307 96 2 left 10 1 right 117 59 2 0 76 nbsp Der kritische Wert fur n 10 displaystyle n 10 nbsp bei einem Signifikanzniveau von a 5 displaystyle alpha 5 nbsp wird einer Tabelle entnommen und lautet W kritisch 0 842 displaystyle W text kritisch 0 842 nbsp Da W W kritisch displaystyle W leq W text kritisch nbsp 0 76 lt 0 842 fallt W displaystyle W nbsp in den Ablehnungsbereich und die Nullhypothese wird abgelehnt Folglich wird angenommen dass die Stichprobe keiner normalverteilten Grundgesamtheit entstammt Die Dichtefunktion der W displaystyle W nbsp Teststatistik ist sehr linksschief und der Ablehnungsbereich des Tests fallt ins kleine Ende der Verteilung Vor und Nachteile BearbeitenVorteile Bearbeiten Gegenuber einer eher subjektiven visuellen Uberprufung auf Normalverteilung mittels eines Histogramms oder eines QQ Diagramms bietet der Shapiro Wilk Test als statistischer Signifikanztest die Moglichkeit eine Betrachtung nach objektiveren Massstaben vorzunehmen In vielen Testsituationen bietet der Test eine hohe Teststarke insbesondere bei kleineren Stichproben mit n lt 50 displaystyle n lt 50 nbsp Mittelwert und Varianz der hypothetischen Normalverteilung mussen vorher nicht bekannt sein Viele gangige Statistik Softwarepakete wie SAS SPSS Minitab und R haben den Test implementiert Nachteile Bearbeiten Mit dem Test kann fur fast jede Verteilung belegt werden dass es sich um eine Normalverteilung handelt indem man a displaystyle alpha nbsp sehr klein wahlt Eigentlich nimmt man als Nullhypothese das Gegenteil der Aussage die man zeigen mochte beispielsweise die Gleichheit der Gruppenmittelwerte bei der Varianzanalyse Dabei legt man durch die Wahl von a displaystyle alpha nbsp fest mit wie hoher Sicherheit die eigentliche Aussage gezeigt werden soll Hier beim Shapiro Wilk Test wird aber verhangnisvollerweise das was eigentlich gezeigt werden soll als Nullhypothese gewahlt was die Testlogik auf den Kopf stellt Je hoher man die scheinbare Sicherheit mittels a displaystyle alpha nbsp schraubt desto grosser ist die Wahrscheinlichkeit fur den Fehler 2 Art also dafur dass man irrtumlich annimmt es handele sich um eine Normalverteilung Dass man aus dem Nichtverwerfen der Nullhypothese schliesst dass diese zutrifft ist ein grundlegender Fehler Der Test kann nur fur Stichproben zwischen 3 n 5000 displaystyle 3 leq n leq 5000 nbsp eingesetzt werden Der Test reagiert sehr sensibel auf Ausreisser sowohl fur einseitige als auch beidseitige Ausreisser Ausreisser konnen das Verteilungsbild stark verzerren so dass dadurch die Normalverteilungsannahme falschlicherweise abgelehnt werden konnte Der Test ist relativ anfallig gegenuber Bindungen Ties d h wenn es viele identische Werte gibt wird die Teststarke stark beeintrachtigt Falls ursprunglich mit gerundeten Daten gearbeitet wurde lasst sich die Teststarke mit der sogenannten Sheppard Korrektur verbessern Die Korrektur von Sheppard produziert ein angepasstes W displaystyle W nbsp gegeben durch W angepasst W x i x 2 i 1 n gt x i x 2 n 1 12 w 2 displaystyle W text angepasst W sum x left i right overline x 2 over left sum i 1 n gt x left i right overline x 2 n 1 over 12 omega 2 right nbsp mit w displaystyle omega nbsp als Rundungsdifferenz Die Funktionsweise des Tests ist sehr mathematisch und daher nicht leicht zu verstehen Der Test erfordert den Gebrauch von speziellen Koeffizienten den Gewichten die nur fur kleinere Stichprobenumfange n lt 50 displaystyle n lt 50 nbsp in Form einer Tabelle vorliegen Bei Berechnung der Teststatistik und der kritischen Werte ohne Computerprogramm ist der Rechenaufwand bei grosseren Stichprobenumfangen sehr hoch Alternative Verfahren BearbeitenAndere Signifikanztests Bearbeiten Neben dem Shapiro Wilk Test existieren mindestens 40 weitere Normalitatstests bzw Modifikationen einzelner Tests 4 Normalitatstests die gewissermassen als Massstabe dienen vergleichen auf die eine oder andere Weise charakteristische Merkmale der modellhaften Standardnormalverteilung mit der Verteilung der Stichprobe Die Tests unterscheiden sich in der Hinsicht welche Massstabe sie als Vergleichskriterium heranziehen Wahrend der Shapiro Wilk Test die Technik der Regression und Korrelation einsetzt und die Korrelation hinsichtlich Varianz analysiert basieren andere Testverfahren auf der Untersuchung der Verteilungsfunktion z B Kolmogorow Smirnow Test Anderson Darling Test Cramer von Mises Test Weitere Tests richten ihr Hauptaugenmerk auf den Vergleich von Schiefe und Kurtosis Eigenschaften z B D Agostino Pearson Test Jarque Bera Test Anscombe Glynn Test Die Teststarke jedes Normalitatstests variiert in Abhangigkeit von Stichprobengrosse tatsachlicher Verteilung und anderen Faktoren wie Ausreissern und Bindungen Es gibt keinen einzelnen Test der fur alle Situationen die hochste Teststarke aufweist Graphische Methoden Bearbeiten Histogramm und Normalwahrscheinlichkeitsplots wie das QQ Diagramm oder das PP Diagramm werden haufig als Werkzeuge zur visuellen Uberprufung der Verteilung auf Normalverteilung eingesetzt und konnen die Aussage eines Signifikanztests entweder bekraftigen oder anfechten Einzelnachweise Bearbeiten J P Royston An Extension of Shapiro and Wilk s W Test for Normality to Large Samples In Journal of the Royal Statistical Society Series C Applied Statistics Band 31 Nr 2 1982 S 115 124 doi 10 2307 2347973 JSTOR 2347973 M Mahibbur Rahman Z Govindarajulu A modification of the test of Shapiro and Wilk for normality In Journal of Applied Statistics Band 24 Nr 2 1997 S 219 236 doi 10 1080 02664769723828 Edith Seier Comparison of Tests for Univariate Normality Department of Mathematics East Tennessee State University 2002 http interstat statjournals net YEAR 2002 articles 0201001 pdf Berna Yazici Senay Yolacan A comparison of various tests of normality In Journal of Statistical Computation and Simulation 77 Nr 2 2007 S 175 183 doi 10 1080 10629360600678310Literatur BearbeitenSam S Shapiro Martin Bradbury Wilk An analysis of variance test for normality for complete samples In Biometrika Band 52 Nr 3 4 1965 S 591 611 doi 10 1093 biomet 52 3 4 591 JSTOR 2333709 D G Rees Essential Statistics Chapman amp Hall Boca Raton 2000 ISBN 0 412 61280 1 Berna Yazici Senay Yolacan A comparison of various tests of normality In Journal of Statistical Computation and Simulation Band 77 Nr 2 2007 S 175 183 doi 10 1080 10629360600678310 Edith Seier Comparison of Tests for Univariate Normality Department of Mathematics East Tennessee State University 2002 Manfred Precht Roland Kraft Martin Bachmaier Angewandte Statistik Oldenbourg 2005 J R Leslie M A Stephens S Fotopoulos Asymptotic Distribution of the Shapiro Wilk W for Testing Normality In The Annals of Statistics Band 14 Nr 4 1986 S 1497 1506 doi 10 1214 aos 1176350172 JSTOR 2241484 Weblinks Bearbeiten nbsp Wikibooks Shapiro Wilk Test mit R Lern und Lehrmaterialien Originaltext zu An Analysis of Variance Test for Normality for complete samples von Shapiro und Wilk von JSTOR englisch PDF 606 kB Analyse der Teststarke verschiedener Normalitatstests von Edith Seier East Tennessee State University englisch PDF 132 kB Online Version des Shapiro Wilk Tests englisch Vorlesungsskript zu Anpassungstests der Humboldt Universitat zu Berlin Skript zu Tests auf Poisson Verteilung bzw Normalverteilung der Universitat Ulm Beispiele fur statistische Tests von Barbara Bredner SAS Anleitung zu Anpassungstests englisch The Science Citation Index Artikel uber An Analysis of Variance Test for Normality von 1985 englisch PDF 236 kB Abgerufen von https de wikipedia org w index php title Shapiro Wilk Test amp oldid 233458420