www.wikidata.de-de.nina.az
Der Run Test auch Runs Test Wald Wolfowitz Test nach Abraham Wald und Jacob Wolfowitz Iterationstest oder Geary Test ist ein nichtparametrischer Test auf Zufalligkeit einer Folge Ausgegangen wird von einem Urnenmodell mit zwei Sorten Kugeln dichotome Grundgesamtheit Es werden n Kugeln entnommen und es soll die Hypothese gepruft werden dass die Entnahme zufallig erfolgt ist Inhaltsverzeichnis 1 Vorgehensweise 1 1 Testverteilung 1 2 Testdurchfuhrung 2 Einfaches Beispiel 3 Erganzungen 3 1 Parameter der Verteilung von R 3 2 Grundgesamtheit mit mehr als zwei Auspragungen des Merkmals 3 3 Normalapproximation 4 Anwendungen 4 1 Beispiel fur ein metrisches Merkmal 5 Literatur 6 Siehe auch 7 Einzelnachweise 8 WeblinksVorgehensweise BearbeitenEs wurden einer dichotomen Grundgesamtheit n displaystyle n nbsp Kugeln entnommen Die Ergebnisse liegen in ihrer chronologischen Abfolge vor Es werden nun alle benachbarten Ergebnisse gleicher Auspragung zu einem Lauf oder Run zusammengefasst Wenn die Folge tatsachlich zufallig ist sollten nicht zu wenige Runs vorliegen aber auch nicht zu viele Es wird die Nullhypothese aufgestellt Die Entnahme erfolgte zufallig Fur die Festlegung der Zahl der Runs bei der die Hypothese abgelehnt wird wird die Verteilung der Runs benotigt Es seien n 1 displaystyle n 1 nbsp die Zahl der Kugeln erster Sorte und n 2 n n 1 displaystyle n 2 n n 1 nbsp der zweiten Sorte es sei r displaystyle r nbsp die Zahl der Runs Nach dem Symmetrieprinzip ist die Wahrscheinlichkeit fur jede beliebige Folge der Kugeln bei zufalliger Entnahme gleich gross Es gibt insgesamt n 1 n 2 n 1 n 2 displaystyle frac n 1 n 2 n 1 n 2 nbsp Moglichkeiten der Entnahme Testverteilung Bearbeiten Die Testverteilung ist die Verteilung der Zahl der Iterationen Runs bei Richtigkeit der Nullhypothese Bezuglich der Verteilung der Zahl der Runs unterscheidet man die Falle 1 Die Anzahl r displaystyle r nbsp der Runs ist geradzahlig Es liegen q 1 2 r displaystyle q tfrac 1 2 r nbsp Runs der Kugeln der ersten Sorte und auch q 1 2 r displaystyle q tfrac 1 2 r nbsp Runs der Kugeln der zweiten Sorte vor Die Wahrscheinlichkeit dass genau r 2 q displaystyle r 2q nbsp Runs eingetreten sind ist dannP R 2 q 2 n 1 1 q 1 n 2 1 q 1 n 1 n 2 n 1 displaystyle P R 2q frac 2 n 1 1 choose q 1 n 2 1 choose q 1 n 1 n 2 choose n 1 nbsp dd 2 Die Anzahl r displaystyle r nbsp der Runs ist ungeradzahlig Es liegen q 1 1 2 r 1 displaystyle q 1 tfrac 1 2 r 1 nbsp Runs der Kugeln der ersten Sorte und q 1 2 r 1 displaystyle q tfrac 1 2 r 1 nbsp Runs der Kugeln der zweiten Sorte vor oder der umgekehrte Fall Die Wahrscheinlichkeit dass genau r 2 q 1 displaystyle r 2q 1 nbsp Runs eingetreten sind berechnet sich dann als Summe aus diesen beiden MoglichkeitenP R 2 q 1 n 1 1 q n 2 1 q 1 n 1 1 q 1 n 2 1 q n 1 n 2 n 1 displaystyle P R 2q 1 frac n 1 1 choose q n 2 1 choose q 1 n 1 1 choose q 1 n 2 1 choose q n 1 n 2 choose n 1 nbsp dd Dabei bezeichnet n k displaystyle n choose k nbsp den Binomialkoeffizienten Zu berucksichtigen ist n k 0 displaystyle n choose k 0 nbsp falls n lt k displaystyle n lt k nbsp Testdurchfuhrung Bearbeiten Als Prufgrosse wird die Zufallsvariable R displaystyle R nbsp verwendet Die Testverteilung d h die Verteilung der Prufgrosse bei Richtigkeit der Nullhypothese wurde zuvor beschrieben Die Nullhypothese wird bei zweiseitigem Testen dann abgelehnt wenn die beobachtete Anzahl von Iterationen r displaystyle r nbsp zu klein oder zu gross ist Bei einem vorgegebenen Signifikanzniveau a displaystyle alpha nbsp wird die Nullhypothese dann abgelehnt wenn r r a 2 displaystyle r leq r alpha 2 nbsp oder r r 1 a 2 displaystyle r geq r 1 alpha 2 nbsp gilt Dabei bezeichnet r p displaystyle r p nbsp das p displaystyle p nbsp Quantil der Testverteilung Da diese Verteilung diskret ist kann das vorgegebene Signifikanzniveau a displaystyle alpha nbsp durch einen nicht randomisierten Test im Allgemeinen nicht exakt erreicht werden Es werden daher die beiden kritischen Wert so gewahlt dass die Fehlerwahrscheinlichkeit 1 Art hochstens so gross wie das vorgegebene Signifikanzniveau a displaystyle alpha nbsp ist Dieses Vorgehen wird auch als konservatives Testen bezeichnet Da die Berechnung der kritischen Werte umstandlich ist bedient man sich haufig einer Tabelle 1 Einfaches Beispiel BearbeitenFur eine Podiumsdiskussion mit zwei politischen Parteien wurden die Sprecher angeblich zufallig ermittelt Es wurde ausgelost dass von der Partei Supi 4 Vertreter und von der Partei Toll 5 Vertreter in der folgenden Reihe sprechen durfen S S T S T T T S T Ein Vertreter von Toll beschwerte sich dass S bevorzugt wurde Es wurde ein Run Test vorgenommen Es ist n1 4 und n2 5 Man erhielt r 6 Runs Deutlich ist dass im Falle vieler Runs kein Verdacht besteht auf Bevorzugung einer der Parteien Die Nullhypothese wird also abgelehnt wenn es zu wenig Runs gibt Nach der Tabelle des Run Testes wird H0 abgelehnt wenn r 2 Also liegt die Prufgrosse r 6 nicht im Ablehnungsbereich man kann nach den Kriterien des Run Testes nicht darauf schliessen dass die Reihenfolge der Sprecher nicht zufallig ist Ubrigens wird auch im nachsten Fall S S S T S T T T T mit r 4 Runs die Nullhypothese nicht abgelehnt obwohl fast jeder einen Verdacht haben wird dass Supi vorgezogen wurde Man kann aber wegen der relativ geringen Anzahl der Beobachtungen nicht ausschliessen dass das Ergebnis auf Zufall beruht Erganzungen BearbeitenParameter der Verteilung von R Bearbeiten Der Erwartungswert von R ist E R 2 n 1 n 2 n 1 displaystyle operatorname E R frac 2n 1 n 2 n 1 nbsp und die Varianz Var R 2 n 1 n 2 2 n 1 n 2 n n 2 n 1 displaystyle operatorname Var R frac 2n 1 n 2 2n 1 n 2 n n 2 n 1 nbsp Grundgesamtheit mit mehr als zwei Auspragungen des Merkmals Bearbeiten Liegt eine endliche Folge reeller Zahlen x i displaystyle x i nbsp eines metrischen Merkmals vor wird die Folge dichotomisiert Man bestimmt zunachst den Median z der Folge Werte x i lt z displaystyle x i lt z nbsp werden dann als Kugeln der ersten Sorte Werte x i gt z displaystyle x i gt z nbsp als Kugeln der zweiten Sorte interpretiert Die entstandene dichotome Folge kann dann wieder auf Zufalligkeit getestet werden siehe Beispiel unten Liegt eine nichtnumerische Symbolsequenz mit mehr als zwei Auspragungen vor muss zunachst eine numerische Reihe erzeugt werden wobei hier das Problem bestehen kann dass die Symbole nicht geordnet werden konnen Normalapproximation Bearbeiten Fur Stichprobenumfange n1 n2 gt 20 ist die Zahl der Runs R annahernd normalverteilt mit Erwartungswert und Varianz wie oben Man erhalt die standardisierte Prufgrosse z r 2 n 1 n 2 n 1 2 n 1 n 2 2 n 1 n 2 n n 2 n 1 n 2 1 displaystyle z frac r frac 2n 1 n 2 n 1 sqrt frac 2n 1 n 2 2n 1 n 2 n n 2 n 1 n 2 1 nbsp Die Hypothese wird abgelehnt wenn z lt z 1 a 2 displaystyle z lt z 1 frac alpha 2 nbsp oder z gt z 1 a 2 displaystyle z gt z 1 frac alpha 2 nbsp mit z 1 a 2 displaystyle z 1 frac alpha 2 nbsp als Quantil der Standardnormalverteilung fur die Wahrscheinlichkeit 1 a 2 displaystyle 1 frac alpha 2 nbsp Anwendungen BearbeitenDer Runtest kann angewendet werden um Stationaritat bzw Nicht Korrelation in einer Zeitreihe oder anderen Sequenz zu uberprufen vor allem wenn die Verteilung des Merkmals unbekannt ist Die Nullhypothese ist hier dass aufeinanderfolgende Werte unkorreliert sind Der Run Test kann mit dem Chi Quadrat Test kombiniert werden da beide Prufgrossen asymptotisch unabhangig voneinander sind Beispiel fur ein metrisches Merkmal Bearbeiten Es liegt die Folge 13 3 14 14 1 14 3 8 14 17 9 14 13 2 16 1 3 12 13 14 vor Sie wird mit dem Median z 13 dichotomisiert Fur die erste Auspragung wird gesetzt fur die zweite Auspragung 0 10 1 1 12 1 10 5 1 4 4 1 0 11 3 12 10 1 0 1 Man erhalt bei n1 11 und n2 9 r 13 Runs R ist annahernd normalverteilt mit dem Erwartungswert E R 2 11 9 20 1 10 9 displaystyle operatorname E R frac 2 cdot 11 cdot 9 20 1 10 9 nbsp und der Varianz Var R 2 11 9 2 11 9 20 20 2 19 4 6 displaystyle operatorname Var R frac 2 cdot 11 cdot 9 cdot 2 cdot 11 cdot 9 20 20 2 cdot 19 4 6 nbsp Die Prufgrosse z errechnet sich dann als 13 10 9 4 6 1 82 displaystyle frac 13 10 9 sqrt 4 6 1 82 nbsp Bei einem Signifikanzniveau von 0 05 wird H0 abgelehnt wenn z gt 1 96 Dies ist nicht der Fall Entscheidung Die Hypothese wird nicht abgelehnt Die Elemente der Stichprobe sind vermutlich zufallig entnommen worden Da der Run Test aber kein parametrischer Test ist ist das Resultat mit Vorsicht zu geniessen Bei einem Konfidenzniveau von 90 konnte z B die Nullhypothese abgelehnt werden Der parametrische Shapiro Wilk Test zeigt namlich dass bei der vorliegenden Zahlenreihe die Normalverteilung nicht gegeben ist Literatur BearbeitenJames V Bradley Distribution Free Statistical Tests 1968 Chapter 12 ISBN 0 13 216259 8 Herbert Buning Gotz Trenkler Nichtparametrische Statistische Methoden 2 vollig neu bearbeitete Auflage Walter de Gruyter Berlin New York 1994 ISBN 3 11 013860 3 Kapitel 4 5 5 2 1 doi 10 1515 9783110902990 Jean Dickinson Gibbons Subhabrata Chakraborti Nonparametric Statistical Inference 6 Auflage Chapman amp Hall CRC Boca Raton 2021 ISBN 978 1 315 11047 9 Kap 3 2 doi 10 1201 9781315110479 P H Muller Hrsg Lexikon der Stochastik Wahrscheinlichkeitsrechnung und mathematische Statistik 5 Auflage Akademie Verlag Berlin 1991 ISBN 978 3 05 500608 1 S 178 179 Interaktionstest Horst Rinne Taschenbuch der Statistik 4 Auflage Harri Deutsch Frankfurt am Main 2008 ISBN 978 3 8171 1827 4 S 561 566 Abraham Wald Jacob Wolfowitz On a Test Whether Two Samples are from the Same Population The Annals of Mathematical Statistics Vol 11 No 2 Jun 1940 S 147 162 doi 10 1214 aoms 1177731909 JSTOR 2235872Siehe auch BearbeitenAutokorrelation Zufallszahlengenerator Pseudozufallszahlen TrendEinzelnachweise Bearbeiten Eine Tabelle fur n 1 n 2 20 displaystyle n 1 n 2 leq 20 nbsp findet sich hier Horst Rinne Taschenbuch der Statistik 4 Auflage Harri Deutsch Frankfurt am Main 2008 ISBN 978 3 8171 1827 4 S 564 Eine weitere Quelle ist Herbert Buning Gotz Trenkler Nichtparametrische Statistische Methoden 2 vollig neu bearbeitete Auflage Walter de Gruyter Berlin New York 1994 ISBN 3 11 013860 3 S 393 doi 10 1515 9783110902990 Weblinks BearbeitenProgrammierung des Run Tests in Gambas Programmiersprache Ein verbluffendes Experiment der RUN Test Wald Wolfowitz Runs Test Abgerufen von https de wikipedia org w index php title Run Test amp oldid 232183645