www.wikidata.de-de.nina.az
Der Vorzeichentest oder Zeichentest 1 2 ist ein nichtparametrischer statistischer Test Der Vorzeichentest ist ein Binomialtest 3 4 Mit seiner Hilfe lassen sich Verteilungshypothesen in Ein und Zweistichprobenproblemen testen Der Vorzeichentest ist auch dann einsetzbar wenn nur ordinales Datenniveau vorliegt 2 5 Inhaltsverzeichnis 1 Einstichprobenproblem 1 1 Test auf Median 1 2 Test auf Symmetrie 1 3 Test auf Mittelwert 1 4 Annahmen 1 5 Hypothesen 1 6 Vorgehen 2 Zweistichprobenproblem 2 1 Annahmen 2 2 Hypothesen 2 3 Vorgehen 3 Teststatistik 3 1 Exakte Verteilung 3 2 Approximation durch die Normalverteilung 4 Bindungen Nulldifferenzen 5 Beispiel fur ein Einstichprobenproblem Median Test 6 Beispiel fur ein Zweistichprobenproblem 7 EinzelnachweiseEinstichprobenproblem BearbeitenTest auf Median Bearbeiten Mit Hilfe des Vorzeichentests konnen Hypothesen uber den Median einer Verteilung gepruft werden 1 Test auf Symmetrie Bearbeiten Der Vorzeichentest ist auch als Test auf Symmetrie einer Verteilung nutzbar Ist das wahre arithmetische Mittel der Grundgesamtheit bekannt oder wird ein Schatzer als wahrer Wert angenommen kann gepruft werden ob das arithmetische Mittel mit dem Median zusammenfallt d h ob 50 der moglichen Werte rechts und 50 links vom arithmetischen Mittel liegen und somit ob die Verteilung symmetrisch ist 6 Test auf Mittelwert Bearbeiten Nimmt man wiederum Symmetrie der Verteilung an dann ist der Populationsmittelwert gleich dem Populationsmedian und der Vorzeichentest bietet die Moglichkeit Hypothesen uber das arithmetische Mittel der Grundgesamtheit zu prufen 7 Annahmen Bearbeiten Die Beobachtungen x i i 1 n displaystyle x i i 1 ldots n nbsp sind unabhangig voneinander 1 2 Die zugrundeliegende Zufallsvariable ist in der Grundgesamtheit stetig verteilt 1 2 Da Grossenvergleiche zwischen Beobachtungen und hypothetischem Median durchgefuhrt werden muss das untersuchte Merkmal mindestens auf ordinalem Niveau erhoben worden sein 2 5 8 Hypothesen Bearbeiten Wird zweiseitig getestet soll die Hypothese gepruft werden dass der Median 8 displaystyle theta nbsp in der Grundgesamtheit gleich einem bestimmten hypothetischen Wert 8 0 displaystyle theta 0 nbsp ist Die Wahrscheinlichkeit dass ein Wert grosser dem hypothetischen Parameter ist sollte dann 0 5 betragen wenn er tatsachlich dem Median entspricht Wird einseitig getestet wird gepruft ob der Median grosser bzw kleiner einem hypothetischen Wert ist d h ob die Wahrscheinlichkeit dass ein Wert grosser dem hypothetischen Parameter ist grosser bzw kleiner 0 5 ist Einseitig ZweiseitigNullhypothese H 0 displaystyle H 0 nbsp P X 8 0 1 2 displaystyle P X geq theta 0 geq 1 2 nbsp P X 8 0 1 2 displaystyle P X geq theta 0 leq 1 2 nbsp P X 8 0 1 2 displaystyle P X geq theta 0 1 2 nbsp Alternativhypothese H 1 displaystyle H 1 nbsp P X 8 0 lt 1 2 displaystyle P X geq theta 0 lt 1 2 nbsp P X 8 0 gt 1 2 displaystyle P X geq theta 0 gt 1 2 nbsp P X 8 0 1 2 displaystyle P X geq theta 0 neq 1 2 nbsp Nullhypothese H 0 displaystyle H 0 nbsp 8 8 0 displaystyle theta geq theta 0 nbsp 8 8 0 displaystyle theta leq theta 0 nbsp 8 8 0 displaystyle theta theta 0 nbsp Alternativhypothese H 1 displaystyle H 1 nbsp 8 lt 8 0 displaystyle theta lt theta 0 nbsp 8 gt 8 0 displaystyle theta gt theta 0 nbsp 8 8 0 displaystyle theta neq theta 0 nbsp Weitere aquivalente Formulierungen der Hypothesen sind moglich Das Testprinzip ist unter Anpassung der Hypothesen und der Parameter der Verteilung der Teststatistik auf beliebige Quantile erweiterbar Beim Test auf ein anderes Quantil als den Median ist die hypothetische Wahrscheinlichkeit hier 1 2 entsprechend anzupassen siehe Binomialtest Vorgehen Bearbeiten Die Stichprobenwerte die grosser als der hypothetische Median 8 0 displaystyle theta 0 nbsp sind bekommen ein zugeordnet Werte die kleiner sind ein Das heisst die Stichprobenvariable wird mediandichotomisiert Die Anzahl der positiven Vorzeichen wird gezahlt und dient als Teststatistik Zweistichprobenproblem BearbeitenDer Vorzeichentest findet Anwendung wenn zwei verbundene Stichproben untersucht werden sollen Verbundene Stichproben liegen vor wenn die Beobachtungen beider Gruppen jeweils paarweise voneinander abhangen zum Beispiel wenn der Gesundheitszustand derselben Person vor und nach einer Behandlung untersucht wird Aus dem Grossenvergleich zwischen den Werten eines jeden Paares werden entsprechende Vorzeichen oder erzeugt Der Vorzeichentest testet auf Gleichheit der Verteilungsfunktion zweier Zufallsvariablen aus verbundenen stetig verteilten Gesamtheiten Unterscheiden sich die Mediane der Stichproben signifikant ist die Verteilung in der Grundgesamtheit unterschiedlich Annahmen Bearbeiten Die n displaystyle n nbsp Beobachtungspaare durfen nicht voneinander abhangen d h das Wertepaar x 1 i x 2 i displaystyle x 1i x 2i nbsp muss unabhangig vom Wertepaar x 1 j x 2 j i j displaystyle x 1j x 2j forall i neq j nbsp sein 1 2 Die zugrundeliegende Zufallsvariable sind in der Grundgesamtheit stetig verteilt 1 2 Da paarweise Grossenvergleiche zwischen den Beobachtungen durchgefuhrt werden muss das untersuchte Merkmal mindestens auf ordinalem Niveau erhoben worden sein 2 5 8 Hypothesen Bearbeiten Besitzen beide Grundgesamtheiten den gleichen Median gilt P X11 gt X12 P X11 lt X12 Folgende Hypothesen konnen mit dem Vorzeichentest gepruft werden Einseitig ZweiseitigNullhypothese H 0 displaystyle H 0 nbsp P X 1 X 2 1 2 displaystyle P X 1 geq X 2 geq 1 2 nbsp P X 1 X 2 1 2 displaystyle P X 1 geq X 2 leq 1 2 nbsp P X 1 X 2 1 2 displaystyle P X 1 geq X 2 1 2 nbsp Alternativhypothese H 1 displaystyle H 1 nbsp P X 1 X 2 lt 1 2 displaystyle P X 1 geq X 2 lt 1 2 nbsp P X 1 X 2 gt 1 2 displaystyle P X 1 geq X 2 gt 1 2 nbsp P X 1 X 2 1 2 displaystyle P X 1 geq X 2 neq 1 2 nbsp Vorgehen Bearbeiten Die Wertepaare der Stichproben bei denen x i 1 gt x i 2 displaystyle x i1 gt x i2 nbsp gilt bekommen ein zugeordnet Wertepaare fur die x i 1 lt x i 2 displaystyle x i1 lt x i2 nbsp gilt ein Die Anzahl der positiven Vorzeichen wird gezahlt und dient als Teststatistik Teststatistik BearbeitenExakte Verteilung Bearbeiten Die Teststatistik entspricht der Anzahl der positiven Vergleiche Differenzen der Werte bzw Range V i 1 n I x i 1 gt x i 2 B p 0 5 n displaystyle V sum i 1 n mathrm I x i1 gt x i2 sim B pi 0 5 n nbsp mit I x i 1 gt x i 2 1 wenn x i 1 gt x i 2 0 sonst displaystyle mathrm I x i1 gt x i2 begin cases 1 quad text wenn x i1 gt x i2 0 quad text sonst end cases nbsp Fur das Einstichprobenproblem sind die Werte der zweiten Stichprobe durch den hypothetischen Median zu ersetzen Bei Gultigkeit der Nullhypothese H 0 displaystyle H 0 nbsp ist die Summe der positiven Differenzen binomialverteilt mit p 0 5 displaystyle pi 0 5 nbsp da der Median dem 50 Quantil entspricht n bezeichnet den nach Behandlung von Ties Nulldifferenzen Rangbindungen verbleibenden Stichprobenumfang Bei Gultigkeit der Nullhypothese ist die Verteilung der Prufgrosse symmetrisch Approximation durch die Normalverteilung Bearbeiten Mit n displaystyle n rightarrow infty nbsp nahert sich die Binomialverteilung einer Normalverteilung mit N n p n p 1 p displaystyle N np np 1 p nbsp Eine Faustregel fur eine brauchbare Approximation lautet n p 1 p 9 displaystyle np 1 p geq 9 nbsp 3 Bei Gultigkeit der Nullhypothese ist p 1 2 displaystyle p 1 2 nbsp Wenn also 1 4 n 9 displaystyle tfrac 1 4 n geq 9 nbsp bzw n 36 displaystyle n geq 36 nbsp gilt ist die z standardisierte Grossez V i 1 n I x i 1 gt x i 2 1 2 n 1 2 n N 0 1 displaystyle z V frac sum i 1 n mathrm I x i1 gt x i2 frac 1 2 cdot n tfrac 1 2 sqrt n approx N 0 1 nbsp naherungsweise standardnormalverteilt und die kritischen Werte zur Testentscheidung konnen aus der Tabelle der Standardnormalverteilung abgelesen werden Bindungen Nulldifferenzen BearbeitenDa stetige Zufallsvariablen in der Regel nur diskret erhoben werden konnen Bindungen auftreten Sind im Zweistichprobenproblem die Werte von Beobachtungen von der ersten zur zweiten Stichprobe unverandert oder sind im Einstichprobenproblem einige Werte gleich dem Median ergeben sich Nulldifferenzen bzw Bindungen Ties Ein Binomialtest kann jedoch nur zwei Kategorien hier und behandeln Deshalb stellt sich die Frage wie Rangbindungen behandelt werden konnen Mogliche Methoden sind Beobachtungen mit Rangbindungen werden eliminiert d h der Stichprobenumfang wird reduziert 9 10 Die Beobachtungen werden zu gleichen Teilen den Gruppen zugeordnet Bei ungerader Anzahl von Bindungen wird ein Beobachtungspaar eliminiert 9 10 Die Beobachtungen werden jeweils mit einer Wahrscheinlichkeit von 0 5 einer der beiden Gruppen oder zugeordnet 9 10 Nulldifferenzen erhalten das seltenere Vorzeichen sehr konservatives Vorgehen 9 Beispiel fur ein Einstichprobenproblem Median Test BearbeitenBei Sprent und Smeeton 11 findet man folgendes Beispiel aus der Biostatistik In einer klinischen Studie wird die Uberlebenszeit in Wochen von 10 Probanden mit Non Hodgkin Lymphom erhoben Die Uberlebenszeiten der Probanden waren wie folgt 49 58 75 110 112 132 151 276 281 362 Der Stern markiert dass der betreffende Proband den Studienzeitraum uberlebt hat Es handelt sich um ein rechtszensiertes Datum Es soll nun festgestellt werden ob der Median der Uberlebenszeit grosser oder kleiner als 8 0 200 displaystyle theta 0 200 nbsp Wochen ist Die Nullhypothese H 0 P X 8 0 1 2 displaystyle H 0 P X geq theta 0 1 2 nbsp besagt dass die mediane Uberlebenszeit 200 Wochen betragt Die Alternativhypothese H 1 P X 8 0 1 2 displaystyle H 1 P X geq theta 0 neq 1 2 nbsp besagt dass die mediane Uberlebenszeit nicht 200 Wochen betragt Dies ist ein zweiseitiger Test Der alternative Median kann grosser oder kleiner als 200 Wochen sein Wenn die Nullhypothese wahr ist also die mediane Uberlebenszeit 200 Wochen betragt dann sollte in einer Zufallsstichprobe ungefahr die Halfte der Probanden weniger als 200 Wochen und die Halfte mehr als 200 Wochen uberleben Beobachtungen unter 200 wird ein Minus zugeordnet Beobachtungen uber 200 ein Plus Fur die Uberlebenszeiten der n 10 displaystyle n 10 nbsp Probanden gibt es 7 Beobachtungen unter 200 Wochen und 3 Beobachtungen uber 200 Wochen Da jede einzelne Beobachtung unter der Nullhypothese mit gleicher Wahrscheinlichkeit uber oder unter dem Median der Grundgesamtheit liegt weist die Anzahl der Pluswerte eine Binomialverteilung mit p 0 5 displaystyle p 0 5 nbsp und n 10 displaystyle n 10 nbsp auf Wir betrachten nun die Wahrscheinlichkeit ein mindestens so extremes Ereignis wie das beobachtete Ereignis zu erhalten d h berechnen den p Wert p P H 0 X 3 X 7 0 3438 gt 0 05 displaystyle p P H 0 X leq 3 cup X geq 7 approx 0 3438 gt 0 05 nbsp Die erwartete Anzahl von Pluszeichen ist 5 wenn die Nullhypothese wahr ist Das Beobachten von 3 oder weniger bzw 7 oder mehr Pluswerten unterscheidet sich nicht signifikant von 5 Die Nullhypothese wird nicht zuruckgewiesen Aufgrund der extrem kleinen Stichprobengrosse hat diese Stichprobe eine zu geringe Teststarke um einen Unterschied zu erkennen Beispiel fur ein Zweistichprobenproblem BearbeitenEine Schulbehorde mochte untersuchen ob sich die Schulleistungen von Schulern durch eine neue Lernmethode zum Beispiel E Learning verbessert haben Die Schulleistungen einer Zufallsstichprobe von 43 Schulern werden anhand eines geeigneten Tests gemessen Danach werden die Schuler mit der neuen Lernmethode konfrontiert Nach der Konfrontation werden die Schulleistungen an denselben Schulern erneut erhoben Die Schulbehorde fuhrt mit den erhaltenen Beobachtungen einen rechtsseitigen Vorzeichentest durch Zur Auswertung werden die Haufigkeiten der Vorzeichen der Differenzen bestimmt Vorzeichen displaystyle nbsp displaystyle nbsp displaystyle nbsp SummeAnzahl 25 11 7 43Bei 25 Schulern haben sich die Leistungen verbessert Bei elf Schulern wurden sie schlechter und bei sieben blieben sie gleich Konnen wir aus diesem Ergebnis schliessen dass die neue Lernmethode in der Grundgesamtheit einen positiven Effekt besitzt BindungenDer Stichprobenumfang n displaystyle n nbsp wird um die Anzahl der Bindungen auf n n n 25 11 36 displaystyle n n n 25 11 36 nbsp reduziert BinomialtestBei Verwendung der Binomialverteilung als Testverteilung ergibt sich auf einem maximalen Signifikanzniveau von 0 05 ein kritischer Wert von 23 0 95 Quantil der Binomialverteilung p Wert 0 01441 Da 25 gt 23 ist die Nullhypothese keine Verbesserung abzulehnen Die Schulbehorden konnen also nach einem solchen Ergebnis schliessen dass E Learning einen positiven Einfluss auf die Schulleistungen hat NormalverteilungsapproximationDer kritische Wert der Standardnormalverteilung fur a 0 05 ist 1 6449 0 95 Quantil der Standardnormalverteilung Die Naherung der Verteilung der Teststatistik durch die Normalverteilung ergibtz 25 1 2 36 1 2 36 7 3 2 33 gt 1 644 9 displaystyle z frac 25 frac 1 2 cdot 36 tfrac 1 2 sqrt 36 frac 7 3 approx 2 33 gt 1 6449 nbsp mit einem zugehorigen p Wert also die Wahrscheinlichkeit dass der erhaltene Prufwert oder ein grosserer unter der Nullhypothese auftritt von 1 0 990 2 0 009 8 displaystyle 1 0 9902 0 0098 nbsp Die Schulbehorden konnen auch hier auf einem Signifikanzniveau von 5 schliessen dass E Learning einen positiven Einfluss auf die Schulleistungen hat Einzelnachweise Bearbeiten a b c d e f Bernd Ronz Hans G Strohe Lexikon Statistik Gabler Wirtschaft 1994 S 412 a b c d e f g h J Hartung Statistik Lehr und Handbuch der angewandten Statistik 8 Auflage Oldenbourg 1991 S 242 a b Horst Rinne Taschenbuch der Statistik 3 Auflage Verlag Harri Deutsch 2003 S 530 Werner Voss Taschenbuch der Statistik 1 Auflage Fachbuchverlag Leipzig 2000 S 463 a b c Werner Voss Taschenbuch der Statistik 1 Auflage Fachbuchverlag Leipzig 2000 S 470 J L Gastwirth On the Sign Test for Symmetry Vol 66 Nr 336 Journal of the American Statistical Association 1971 S 821 823 Jurgen Bortz Gustav A Lienert Klaus Boehnke Verteilungsfreie Methoden in der Biostatistik 3 Auflage Springer 2008 S 258 a b Jurgen Bortz Gustav A Lienert Klaus Boehnke Verteilungsfreie Methoden in der Biostatistik 3 Auflage Springer 2008 S 256 a b c d Jurgen Bortz Gustav A Lienert Klaus Boehnke Verteilungsfreie Methoden in der Biostatistik 3 Auflage Springer 2008 S 257 a b c K Bosch Statistik Taschenbuch Oldenbourg 1992 S 675 676 Peter Sprent Nigel C Smeeton Applied Nonparametric Statistical Methods Chapman amp Hall CRC 2001 ISBN 978 1 58488 145 2 S 6 7 Abgerufen von https de wikipedia org w index php title Vorzeichentest amp oldid 232024432