www.wikidata.de-de.nina.az
Aquivalenztests sind eine Variation von Hypothesentests mit denen statistische Schlussfolgerungen aus beobachteten Daten gezogen werden konnen In Aquivalenztests wird die Nullhypothese definiert als ein Effekt der gross genug ist um als interessant angesehen zu werden spezifiziert durch eine Aquivalenzgrenze Die alternative Hypothese ist jeder Effekt der weniger extrem ist als die gebundene Aquivalenz Die beobachteten Daten werden statistisch mit den Aquivalenzgrenzen verglichen Wenn der statistische Test zeigt dass die beobachteten Daten uberraschend sind unter der Annahme dass wahre Effekte mindestens so extrem wie die Aquivalenzgrenzen sind kann ein Neyman Pearson Ansatz fur statistische Schlussfolgerungen verwendet werden um Effektgrossen die grosser als die Aquivalenzgrenzen sind mit einer im Voraus festgelegten Typ 1 Fehlerrate abzulehnen Aquivalenztests konnen zusatzlich zu Signifikanztests mit Nullhypothese durchgefuhrt werden 1 Dies konnte haufige Fehlinterpretationen von p Werten die grosser als der Alpha Wert sind verhindern um das Fehlen eines wahren Effekts zu unterstutzen Daruber hinaus konnen Aquivalenztests statistisch signifikante aber praktisch unbedeutende Effekte identifizieren wenn die Effekte statistisch von Null verschieden sind aber auch statistisch kleiner als jede als sinnvoll erachtete Effektgrosse siehe erste Abbildung 2 Inhaltsverzeichnis 1 Motivation 2 TOST Verfahren 3 Vergleich zwischen t Test und Aquivalenztest 4 Weiterfuhrende Literatur 5 EinzelnachweiseMotivation BearbeitenAquivalenztests stammen aus dem Bereich der Pharmakodynamik bzw der Medikamentenentwicklung 3 Eine Anwendung besteht darin zu zeigen dass ein neues Medikament das billiger ist als verfugbare Alternativen genauso gut funktioniert wie ein bestehendes Medikament Im Wesentlichen bestehen Aquivalenztests darin ein Konfidenzintervall um eine beobachtete Effektgrosse herum zu berechnen und Effekte abzulehnen die extremer sind als die Aquivalenzgrenze wenn sich das Konfidenzintervall nicht mit der Aquivalenzgrenze uberschneidet Bei zweiseitigen Tests wird eine obere und untere Aquivalenzgrenze angegeben In Nicht Unterlegenheitsstudien in denen das Ziel darin besteht die Hypothese zu testen dass eine neue Behandlung nicht schlechter ist als bestehende Behandlungen ist nur eine niedrigere Aquivalenzgrenze im Voraus festgelegt nbsp Mittlere Differenzen schwarze Quadrate und 90 Konfidenzintervalle horizontale Linien mit Aquivalenzgrenzen DL 0 5 und DU 0 5 fur vier Kombinationen von Testergebnissen die statistisch aquivalent sind oder nicht und sich statistisch von Null oder nicht unterscheiden Das Muster A ist statistisch aquivalent das Muster B ist statistisch verschieden von 0 das Muster C ist praktisch unbedeutend und das Muster D ist nicht schlussig weder statistisch verschieden von 0 noch aquivalent TOST Verfahren BearbeitenEin sehr einfacher Aquivalenztestansatz ist das Verfahren der zwei einseitigen t Tests englisch two one sided tests kurz TOST 4 Im TOST Verfahren wird eine obere DU und eine untere DL Aquivalenzgrenze basierend auf der kleinsten Effektgrosse von Interesse z B eine positive oder negative Differenz von d 0 3 angegeben Zwei zusammengesetzte Nullhypothesen werden getestet H01 D DL und H02 D DU Wenn beide einseitigen Tests statistisch abgelehnt werden konnen konnen wir zu dem Schluss kommen dass DL lt D lt DU oder dass der beobachtete Effekt innerhalb der Aquivalenzgrenzen liegt und statistisch kleiner ist als jeder als sinnvoll erachtete und praktisch gleichwertige Effekt 5 Alternativen zum TOST Verfahren wurden ebenfalls entwickelt 6 Eine kurzlich erfolgte Modifikation von TOST macht den Ansatz bei wiederholten Messungen und der Bewertung mehrerer Variablen moglich 7 Vergleich zwischen t Test und Aquivalenztest BearbeitenDer Aquivalenztest kann zu Vergleichszwecken aus dem t Test induziert werden 8 Bei einem t Test zum Signifikanzniveau at Test und welcher fur eine Effektgrosse dr eine Power von 1 bt Test erreicht fuhren beide Tests zu der gleichen Schlussfolgerung wenn die Parameter D dr sowie aequiv test bt test und bequiv test at test zusammenfallen d h die Fehler Typ I und Typ II zwischen dem t Test und dem Aquivalenztest sind vertauscht Um dies fur den t Test zu gewahrleisten muss entweder die Fallzahlplanung korrekt durchgefuhrt werden oder durch Anpassung des Signifikanzniveaus at test ein korrigierter Test bestimmt werden 8 Beide Ansatze haben praktische Probleme da die Fallzahlplanung auf nicht uberprufbaren Annahmen hinsichtlich der Standardabweichung beruht und beim Anpassen von at test sogenannter revised t Test numerische Probleme auftreten 8 Diese Einschrankungen treten bei Anwendung des Aquivalenztests nicht auf Die zweite Abbildung ermoglicht einen Vergleich des Aquivalenztests und des t Tests wenn die Fallzahlplanung von Differenzen zwischen der A priori Standardabweichung s textstyle sigma nbsp und der Standardabweichung aus der Stichprobe s textstyle hat sigma nbsp betroffen ist Die Verwendung eines Aquivalenztests anstelle eines t Tests stellt sicher dass aequiv test bzw bt test beschrankt ist was der t Test nicht tut Insbesondere im Fall s gt s textstyle hat sigma gt sigma nbsp kann im t Test der Typ II Fehler beliebig gross werden Demgegenuber fuhrt s lt s textstyle hat sigma lt sigma nbsp dazu dass der t Test strenger ausfallt als der fur dr geplante was zu zufalligen Nachteilen z B eines Gerateherstellers fuhren kann Dies macht den Aquivalenztest sicherer in der Anwendung nbsp Wahrscheinlichkeit den t Test a bzw den Aquivalenztest b zu bestehen abhangig vom tatsachlichen Fehler 𝜇 vgl 9 Weiterfuhrende Literatur BearbeitenEsteban Walker Amy S Nowacki Understanding Equivalence and Noninferiority Testing In Journal of General Internal Medicine 26 Jahrgang Februar 2011 S 192 6 doi 10 1007 s11606 010 1513 8 PMID 20857339 PMC 3019319 freier Volltext Einzelnachweise Bearbeiten James L Rogers Kenneth I Howard John T Vessey Using significance tests to evaluate equivalence between two experimental groups In Psychological Bulletin 113 Jahrgang Nr 3 1993 S 553 565 doi 10 1037 0033 2909 113 3 553 Daniel Lakens Equivalence Tests In Social Psychological and Personality Science 8 Jahrgang Nr 4 5 Mai 2017 S 355 362 doi 10 1177 1948550617697177 PMID 28736600 englisch Walter W Hauck Sharon Anderson A new statistical procedure for testing equivalence in two group comparative bioavailability trials In Journal of Pharmacokinetics and Biopharmaceutics 12 Jahrgang Nr 1 1 Februar 1984 ISSN 0090 466X S 83 91 doi 10 1007 BF01063612 PMID 6747820 englisch Donald J Schuirmann A comparison of the Two One Sided Tests Procedure and the Power Approach for assessing the equivalence of average bioavailability In Journal of Pharmacokinetics and Biopharmaceutics 15 Jahrgang Nr 6 1 Dezember 1987 ISSN 0090 466X S 657 680 doi 10 1007 BF01068419 englisch Michael A Seaman Ronald C Serlin Equivalence confidence intervals for two group comparisons of means In Psychological Methods 3 Jahrgang Nr 4 1998 S 403 411 doi 10 1037 1082 989x 3 4 403 Stefan Wellek Testing statistical hypotheses of equivalence and noninferiority Chapman and Hall CRC 2010 ISBN 978 1 4398 0818 4 Evangeline M Rose Thomas Mathew Derek A Coss Bernard Lohr Kevin E Omland A new statistical method to test equivalence an application in male and female eastern bluebird song In Animal Behaviour 145 Jahrgang 2018 ISSN 0003 3472 S 77 85 doi 10 1016 j anbehav 2018 09 004 a b c Michael Siebert David Ellenberger Validation of automatic passenger counting introducing the t test induced equivalence test In Transportation 10 April 2019 ISSN 0049 4488 doi 10 1007 s11116 019 09991 9 englisch Michael Siebert David Ellenberger Validation of automatic passenger counting introducing the t test induced equivalence test In Transportation 10 April 2019 ISSN 0049 4488 doi 10 1007 s11116 019 09991 9 englisch Abgerufen von https de wikipedia org w index php title Aquivalenztest amp oldid 237764813