www.wikidata.de-de.nina.az
Trennscharfe eines Tests 1 2 3 beschreibt die Entscheidungsfahigkeit eines statistischen Tests Andere Ausdrucke hierfur sind Gute 4 Macht 5 Power 6 Scharfe eines Tests Teststarke 7 8 oder Testscharfe Das entsprechende Fachgebiet ist die Testtheorie ein Teilgebiet der mathematischen Statistik Im Kontext der Beurteilung eines binaren Klassifikators wird die Trennscharfe eines Tests auch als Sensitivitat recall bezeichnet Die Trennscharfe eines Tests ist genauso wie das Niveau eines Tests ein Begriff der aus der Gutefunktion Trennscharfefunktion abgeleitet ist Die Trennscharfe eines Tests gibt die Fahigkeit eines Tests an Unterschiede Effekte zu erkennen wenn sie in Wirklichkeit vorhanden sind Genauer gesagt gibt die Trennscharfe an mit welcher Wahrscheinlichkeit ein statistischer Test die abzulehnende Nullhypothese H 0 displaystyle H 0 Es gibt keinen Unterschied korrekt zuruckweist wenn die Alternativhypothese H 1 displaystyle H 1 Es gibt einen Unterschied wahr ist Unter der Annahme dass die Nullhypothese die Abwesenheit einer bestimmten Krankheit nicht krank die Alternativhypothese das Vorhandensein der Krankheit krank und die Ablehnung der Nullhypothese einen positiven diagnostischen Test darstellt ist die Trennscharfe des Tests aquivalent 9 zur Sensitivitat des Tests der Wahrscheinlichkeit dass ein Kranker ein positives Testergebnis aufweist Zugleich stellt diese Tatsache einen Bruckenschlag zwischen der Testtheorie und der Theorie diagnostischen Testens dar 10 Die Trennscharfe des Tests kann also als Ablehnungskraft des Tests interpretiert werden 11 Hohe Trennscharfe des Tests spricht gegen niedrige Trennscharfe fur die Nullhypothese H 0 displaystyle H 0 Es wird versucht den Ablehnbereich A displaystyle A so zu bestimmen dass die Wahrscheinlichkeit fur die Ablehnung einer falschen Nullhypothese H 0 displaystyle H 0 d h fur Beibehaltung der Alternativhypothese H 1 displaystyle H 1 unter der Bedingung dass H 1 displaystyle H 1 wahr ist moglichst gross ist Pr T A H 1 1 b displaystyle operatorname Pr T in A mid H 1 1 beta Um die Trennscharfe eines Tests berechnen zu konnen muss die Alternativhypothese in Form einer konkreten Punkthypothese spezifiziert sein Sie bildet das Komplement zur Typ II Fehlerwahrscheinlichkeit b displaystyle beta d h der Wahrscheinlichkeit bei Gultigkeit von H 1 displaystyle H 1 falschlich zugunsten der Nullhypothese H 0 displaystyle H 0 zu entscheiden Die Trennscharfe selbst ist also die Wahrscheinlichkeit einen ebensolchen Fehler zu vermeiden Inhaltsverzeichnis 1 Beschreibung 2 Trennscharfe Analysen 2 1 Faustregel Stichprobengrosse 3 Wahl des b Fehler Niveaus 4 Bestimmungsfaktoren der Trennscharfe 5 Entgegengesetzte Notation 6 Siehe auch 7 Literatur 8 Weblinks 9 EinzelnachweiseBeschreibung Bearbeiten nbsp Darstellung der Trennscharfe und des Signifikanzniveaus eines statistischen Tests bei gegebener Nullhypothese sampling distribution 1 und Alternativhypothese sampling distribution 2 Eingezeichnet ist ebenso der kritische Wert der meist durch die Wahl des Signifikanzniveaus festgelegt wird Fur eine Fehlerwahrscheinlichkeit vom Typ II b displaystyle beta nbsp betragt die entsprechende Trennscharfe 1 b displaystyle 1 beta nbsp Wenn beispielsweise Experiment E eine Trennscharfe von 0 7 displaystyle 0 7 nbsp und Experiment F eine Trennscharfe von 0 95 displaystyle 0 95 nbsp hat besteht eine hohere Wahrscheinlichkeit dass Experiment E einen Typ II Fehler aufweist als Experiment F und Experiment F ist aufgrund seiner geringeren Wahrscheinlichkeit eines Fehlers vom Typ II zuverlassiger als Experiment E Aquivalent kann die Trennscharfe eines Tests als die Wahrscheinlichkeit angesehen werden dass ein statistischer Test die abzulehnende Nullhypothese H 0 displaystyle H 0 nbsp Es gibt keinen Unterschied korrekt zuruckweist wenn die Alternativhypothese H 1 displaystyle H 1 nbsp Es gibt einen Unterschied wahr ist d h Trennscharfe Pr ablehnen H 0 H 1 ist wahr 1 b displaystyle text Trennscharfe Pr left text ablehnen H 0 mid H 1 text ist wahr right 1 beta nbsp Sie kann also als Fahigkeit eines Tests angesehen werden einen bestimmten Effekt zu erkennen wenn dieser bestimmte Effekt tatsachlich vorliegt Wenn H 1 displaystyle H 1 nbsp keine Gleichheit ist sondern lediglich die Negation von H 0 displaystyle H 0 nbsp so hatte man zum Beispiel fur H 0 m 0 displaystyle H 0 mu 0 nbsp mit einem nicht beobachtbaren Populationsparameter m displaystyle mu nbsp als Negation einfach H 1 m 0 displaystyle H 1 mu neq 0 nbsp dann kann die Trennscharfe des Tests nicht berechnet werden es sei denn die Wahrscheinlichkeiten fur alle moglichen Werte des Parameters die die Nullhypothese verletzen sind bekannt Man bezieht sich also allgemein auf die Trennscharfe eines Tests gegen eine spezifische Alternativhypothese Punkthypothese Mit zunehmender Trennscharfe nimmt die Wahrscheinlichkeit eines Fehlers vom Typ II ab da die Trennscharfe gleich 1 b displaystyle 1 beta nbsp ist Ein ahnliches Konzept ist die Fehlerwahrscheinlichkeit vom Typ I Je kleiner bei vorgegebenem Fehler 1 Art a displaystyle alpha nbsp die Wahrscheinlichkeit b displaystyle beta nbsp ist desto scharfer trennt der Test H 0 displaystyle H 0 nbsp und H 1 displaystyle H 1 nbsp Ein Test heisst trennscharf wenn er im Vergleich zu anderen moglichen Tests bei vorgegebenem a displaystyle alpha nbsp eine relativ hohe Trennscharfe aufweist Wenn H 0 displaystyle H 0 nbsp wahr ist ist die maximale Trennscharfe eines Tests gleich a displaystyle alpha nbsp 12 WirklichkeitH0 ist wahr H1 ist wahrEntscheidungdes Tests fur H0 Richtige Entscheidung Spezifitat Wahrscheinlichkeit 1 a Fehler 2 ArtWahrscheinlichkeit b fur H1 Fehler 1 ArtWahrscheinlichkeit a richtige EntscheidungWahrscheinlichkeit 1 b Trennscharfe des Tests Trennscharfe Analysen BearbeitenTrennscharfe Analysen bzw Power Analysen konnen verwendet werden um die erforderliche minimale Stichprobengrosse zu berechnen bei der mit hinreichender Wahrscheinlichkeit Trennscharfe 1 b displaystyle 1 beta nbsp ein Effekt einer bestimmten Grosse Effektstarke erkannt werden kann Beispiel Wie oft muss ich eine Munze werfen um zu dem Schluss zu kommen dass sie um ein gewisses Ausmass manipuliert ist Im Kontext der Beurteilung eines binaren Klassifikators wird die Trennscharfe eines Tests auch als Sensitivitat bezeichnet Trennscharfe Analysen sind in vielen Software Bibliotheken implementiert beispielsweise im Python Paket statsmodels 13 in der Software G power und in der statistischen Umgebung R 14 Faustregel Stichprobengrosse Bearbeiten Die grobe Faustregel von Lehr 15 16 besagt dass die Stichprobengrosse n displaystyle n nbsp fur einen zweiseitigen Zweistichproben t Test mit Trennscharfe 80 b 0 2 displaystyle beta 0 2 nbsp und Signifikanzniveau a 0 05 displaystyle alpha 0 05 nbsp folgendes gilt n 16 s 2 d 2 displaystyle n 16 frac s 2 delta 2 nbsp wobei s 2 displaystyle s 2 nbsp die geschatzte Populationsvarianz ist und d m 1 m 2 displaystyle delta mu 1 mu 2 nbsp die zu detektierenden Unterschiede der Mittelwerte beider Stichproben Um die Trennscharfe auf 90 zu erhohen muss statt mit 16 mit 21 multipliziert werden Fur einen Einstichproben t Test wird 16 mit 8 ersetzt Eine intuitive Erklarung ist laut Lehr dass bei einer Standardnormalverteilung circa 80 der Flache unter der Wahrscheinlichkeitsdichte rechts von z 0 84 displaystyle z 0 84 nbsp liegt Daher sollte bei b 20 displaystyle beta 20 nbsp am kritischen Wert d c 1 96 S E displaystyle delta c 1 96S E nbsp folgendes gelten d 0 84 S E d c d d c S E 0 84 displaystyle delta 0 84S E delta c Leftrightarrow frac delta delta c S E 0 84 nbsp wobei S E 2 s n displaystyle S E sqrt 2 s sqrt n nbsp der mit 2 displaystyle sqrt 2 nbsp multiplizierte Standardfehler des Mittelwertes ist wobei der Faktor 2 displaystyle sqrt 2 nbsp auftritt da die Standardabweichung der Schatzung der Differenz zweier Mittelwerte betrachtet wird Auflosen nach n displaystyle n nbsp liefert n 15 68 s 2 d 2 16 s 2 d 2 displaystyle n approx 15 68 frac s 2 delta 2 approx 16 frac s 2 delta 2 nbsp Der Wert der Faustregel liegt in der einfachen Form welche auch nach d displaystyle delta nbsp umgestellt werden kann und der leichten Merkbarkeit Bei genauen Aussagen sollte man eine Trennscharfen Analyse mit einer Software Bibliothek durchfuhren Wahl des b Fehler Niveaus Bearbeiten nbsp Einfluss des Stichprobenumfangs auf die Gutefunktion bzw Trennscharfe eines einseitigen in diesem Fall linksseitigen Tests nbsp Einfluss des Stichprobenumfangs auf die Gutefunktion bzw Trennscharfe eines zweiseitigen TestsFur Wirksamkeitsstudien medizinischer Behandlungen schlagt Cohen 1969 56 fur b displaystyle beta nbsp einen 4 mal so hohen Wert wie fur das Signifikanzniveau a displaystyle alpha nbsp vor Wenn a 5 displaystyle alpha 5 nbsp ist sollte das b displaystyle beta nbsp Fehler Niveau also 20 betragen Liegt in einer Untersuchung die b displaystyle beta nbsp Fehler Wahrscheinlichkeit Wahrscheinlichkeit fur einen Fehler 2 Art unter dieser 20 Grenze so ist die Trennscharfe 1 b displaystyle 1 beta nbsp damit grosser als 80 Es sollte dabei bedacht werden dass b displaystyle beta nbsp Fehler bei vorgegebenem festem Signifikanzniveau a displaystyle alpha nbsp im Allgemeinen nicht direkt kontrolliert werden konnen So ist der b displaystyle beta nbsp Fehler bei vielen asymptotischen oder nichtparametrischen Tests schlechthin unberechenbar oder es existieren nur Simulationsstudien Bei einigen Tests dagegen zum Beispiel dem t Test kann der b displaystyle beta nbsp Fehler kontrolliert werden wenn der statistischen Auswertung eine Stichprobenumfangsplanung vorausgeht Ein aus den Parametern des t Tests induzierter Aquivalenztest kann verwendet werden um den t Test b displaystyle beta nbsp Fehler unabhangig von der Fallzahlplanung zu kontrollieren In diesem Fall ist das t Test Signifikanzniveau a displaystyle alpha nbsp variabel Bestimmungsfaktoren der Trennscharfe BearbeitenEs gibt verschiedene Moglichkeiten zur Erhohung der Trennscharfe eines Tests Die Trennscharfe 1 b displaystyle 1 beta nbsp wird grosser 17 mit wachsender Differenz von m 0 m 1 displaystyle mu 0 mu 1 nbsp das bedeutet ein grosser Unterschied zwischen zwei Teilpopulationen wird seltener ubersehen als ein kleiner Unterschied mit kleiner werdender Merkmalsstreuung s displaystyle sigma nbsp mit grosser werdendem Signifikanzniveau a displaystyle alpha nbsp sofern b displaystyle beta nbsp nicht festgelegt ist mit wachsendem Stichprobenumfang da der Standardfehler dann kleiner wird s x s n displaystyle sigma overline x frac sigma sqrt n nbsp Kleinere Effekte lassen sich durch einen grosseren Stichprobenumfang trennen bei einseitigen Tests im Vergleich zu zweiseitigen Tests Fur den zweiseitigen Test braucht man einen etwa um 25 displaystyle 25 nbsp grosseren Stichprobenumfang um dieselbe Trennscharfe wie fur den einseitigen Test zu erreichen durch die Verwendung des besten bzw trennscharfsten englisch most powerful Tests 12 durch die Reduktion von Streuung in den Daten z B durch den Einsatz von Filtern oder die Wahl von homogenen Untergruppen Stratifizierung 12 durch die Erhohung der Empfindlichkeit des Messverfahrens Verstarken der Effekte z B durch hohere Dosierung 12 Wichtig fur die Trennscharfe bzw Power ist auch die Art des statistischen Tests Parametrische Tests wie zum Beispiel der t Test haben falls die Verteilungsannahme stimmt bei gleichem Stichprobenumfang stets eine hohere Trennscharfe als nichtparametrische Tests wie zum Beispiel der Wilcoxon Vorzeichen Rang Test Weichen die angenommene und die wahre Verteilung jedoch voneinander ab liegt also beispielsweise in Wahrheit eine Laplace Verteilung zugrunde wahrend eine Normalverteilung angenommen wurde konnen nichtparametrische Verfahren jedoch auch eine wesentlich grossere Trennscharfe aufweisen als ihre parametrischen Gegenstucke Entgegengesetzte Notation BearbeitenIn manchen Quellen wird was fur Verwirrung sorgen kann fur den Fehler 2 Art und die Trennscharfe die genau entgegengesetzte Notation verwendet also die Wahrscheinlichkeit einen Fehler 2 Art zu begehen mit dem Wert 1 b displaystyle 1 beta nbsp bezeichnet die Trennscharfe dagegen mit b displaystyle beta nbsp 18 Siehe auch BearbeitenOperationscharakteristik G Power Software zur Durchfuhrung von Poweranalysen Literatur BearbeitenJacob Cohen Statistical Power Analysis for the Behavioral Sciences Erlbaum Hillsdale NJ 1969 ISBN 0 8058 0283 5 Weblinks Bearbeiten nbsp Wiktionary Power Bedeutungserklarungen Wortherkunft Synonyme Ubersetzungen G Power 3 frei verfugbares Programm zur Trennscharfeanalyse Interaktive VeranschaulichungEinzelnachweise Bearbeiten Ludwig Fahrmeir Rita Kunstler Iris Pigeot Gerhard Tutz Statistik Der Weg zur Datenanalyse 8 uberarb und erg Auflage Springer Spektrum Berlin Heidelberg 2016 ISBN 978 3 662 50371 3 S 460 Otfried Beyer Horst Hackel Wahrscheinlichkeitsrechnung und mathematische Statistik 1976 S 154 Bernd Ronz Hans G Strohe 1994 Lexikon Statistik Gabler Verlag S 147 Otfried Beyer Horst Hackel Wahrscheinlichkeitsrechnung und mathematische Statistik 1976 S 154 Bernd Ronz Hans G Strohe 1994 Lexikon Statistik Gabler Verlag S 147 Lothar Sachs Jurgen Hedderich Angewandte Statistik Methodensammlung mit R 8 uberarb und erg Auflage Springer Spektrum Berlin Heidelberg 2018 ISBN 978 3 662 56657 2 S 460 Lothar Sachs Jurgen Hedderich Angewandte Statistik Methodensammlung mit R 8 uberarb und erg Auflage Springer Spektrum Berlin Heidelberg 2018 ISBN 978 3 662 56657 2 S 460 Bernd Ronz Hans G Strohe 1994 Lexikon Statistik Gabler Verlag S 147 Dies gilt da 1 b 1 f n f n r p f n r p f n r p f n f n r p r p f n r p Sensitivitat displaystyle 1 beta 1 frac f text n f text n r text p frac f text n r text p f text n r text p frac f text n f text n r text p frac r text p f text n r text p text Sensitivitat nbsp Fur die Bedeutung der Notation siehe Wahrheitsmatrix Richtige und falsche Klassifikationen F J Dorey Statistics in brief Statistical power what is it and when should it be used In Clinical orthopaedics and related research Band 469 Nummer 2 Februar 2011 S 619 620 doi 10 1007 s11999 010 1435 0 PMID 20585913 PMC 3018227 freier Volltext Ludwig von Auer Okonometrie Eine Einfuhrung 6 durchges u aktualisierte Auflage Springer 2013 ISBN 978 3 642 40209 8 S 128 a b c d Lothar Sachs Jurgen Hedderich Angewandte Statistik Methodensammlung mit R 8 uberarb und erg Auflage Springer Spektrum Berlin Heidelberg 2018 ISBN 978 3 662 56657 2 S 461 Statistics stats power and sample size calculations statsmodels Abgerufen am 24 Oktober 2021 Marco Perugini Marcello Gallucci und Giulio Costantini A Practical Primer To Power Analysis for Simple Experimental Designs Band 31 Nr 1 9 Juli 2018 S 20 doi 10 5334 irsp 181 rips irsp com abgerufen am 10 Februar 2023 Robert Lehr SixteenS squared overD squared A relation for crude sample size estimates In Statistics in Medicine Band 11 Nr 8 1992 ISSN 0277 6715 S 1099 1102 doi 10 1002 sim 4780110811 Gerald van Belle Statistical Rules of Thumb Second Edition Wiley Series in Probability and Statistics John Wiley amp Sons Inc Hoboken NJ USA 2008 ISBN 978 0 470 37796 3 J Bortz Statistik fur Sozialwissenschaftler Springer Berlin 1999 ISBN 3 540 21271 X Erwin Kreyszig Statistische Methoden und ihre Anwendungen 7 Auflage Gottingen 1998 S 209ff Abgerufen von https de wikipedia org w index php title Trennscharfe eines Tests amp oldid 239365370