www.wikidata.de-de.nina.az
Die Testtheorie ist neben der Schatztheorie ein zentrales Teilgebiet der mathematischen Statistik und beschaftigt sich mit der Konstruktion und Untersuchung von statistischen Tests Solche Tests versuchen aufgrund vorliegender Daten Fragen wie Wirkt ein neues Medikament wirklich besser als das altere gut untersuchte Praparat Ist der Klimawandel anthropogen verursacht oder nicht Wird sich der Bau einer Fabrik an einem neuen Standort innerhalb von zehn Jahren rechnen oder nicht zu beantworten Dabei spielt einerseits die Modellierung und Konstruktion eines Tests eine Rolle andererseits auch die Frage welchen Qualitatsanspruchen ein Test genugen sollte und ob ein solcher Test uberhaupt existiert Fur die folgenden Ausfuhrungen beachte man dass in den Testsituationen eine Asymmetrie zwischen den zu treffenden Entscheidungen fur oder gegen eine Hypothese vorliegt Im Falle des genannten Medikamententests hatte eine Entscheidung fur das neue Medikament obwohl dieses schlechter als ein bereits vorhandenes ist wesentlich dramatischere Folgen schwere Schadigungen von Patienten hohe Kosten fur mogliche Entschadigungsanspruche vergeblicher Kostenaufwand fur die Neueinfuhrung Imageverlust als eine umgekehrte Fehlentscheidung verpasste Marktchance Diese Asymmetrie spiegelt sich in der Modellierung wider ein Fehler der ersten Art sollte moglichst vermieden werden das heisst dessen Wahrscheinlichkeit sollte beschrankt sein Das motiviert die folgenden Begriffsbildungen Inhaltsverzeichnis 1 Grundbegriffe 1 1 Nullhypothese und Alternative 1 2 Statistischer Test 1 3 Fehler 1 und 2 Art 1 4 Gutefunktion Niveau und Trennscharfe 2 Optimalitatsbegriffe fur Tests 2 1 Gleichmassig beste Tests 2 2 Maximin Tests 2 3 Strenge Tests 3 Reduktionsprinzipien 4 Testtheorie als Entscheidungsproblem 5 LiteraturGrundbegriffe BearbeitenNullhypothese und Alternative Bearbeiten Gegeben ist ein nicht notwendigerweise parametrisches statistisches Modell X A P ϑ ϑ 8 displaystyle X mathcal A P vartheta vartheta in Theta nbsp Dabei formalisiert X displaystyle X nbsp die Werte welche die Daten annehmen konnen A displaystyle mathcal A nbsp ist eine s Algebra die beschreibt welchen Teilmengen von X displaystyle X nbsp eine Wahrscheinlichkeit zugeordnet wird P ϑ ϑ 8 displaystyle P vartheta vartheta in Theta nbsp ist eine Familie von Wahrscheinlichkeitsmassen Die Indexmenge 8 displaystyle Theta nbsp wird dann disjunkt in zwei Mengen 8 0 displaystyle Theta 0 nbsp und 8 1 displaystyle Theta 1 nbsp zerlegt Dabei bedeutet 8 0 displaystyle Theta 0 nbsp die Nullhypothese und steht fur die Menge aller gunstigen Testfalle 8 1 displaystyle Theta 1 nbsp die Alternativhypothese oder kurz Alternative und vereint alle ungunstigen Testfalle Die zentrale Frage der Testtheorie lautet nun Angenommen es liegt irgendeine unbekannte Wahrscheinlichkeitsverteilung P ϑ displaystyle P vartheta nbsp mit ϑ 8 displaystyle vartheta in Theta nbsp vor und Daten x X displaystyle x in X nbsp sind gegeben Wie kann man eine moglichst gute Aussage daruber treffen ob ϑ 8 0 displaystyle vartheta in Theta 0 nbsp ist oder ϑ 8 1 displaystyle vartheta in Theta 1 nbsp ist Zu beachten ist dass sich die Rolle der Nullhypothese und die der Alternative auch umkehren kann wenn sich die Fragestellung andert Statistischer Test Bearbeiten Hauptartikel Statistischer Test Der statistische Test formalisiert die zu treffende Entscheidung Dabei wird 0 Annahme der Nullhypothese und 1 Annahme der Alternative gesetzt Werte zwischen 0 und 1 entsprechen dann der Wahrscheinlichkeit sich fur die Alternative zu entscheiden Mathematisch ist ein Test eine messbare Funktion F X A 0 1 B 0 1 displaystyle Phi X mathcal A to 0 1 mathcal B 0 1 nbsp die bei Vorliegen der Daten x displaystyle x nbsp eine Entscheidung F x displaystyle Phi x nbsp liefert Man spricht dann auch von einem Test von 8 0 displaystyle Theta 0 nbsp gegen 8 1 displaystyle Theta 1 nbsp Die Menge x X F x 1 displaystyle x in X mid Phi x 1 nbsp heisst der Ablehnungsbereich des Tests und enthalt alle Daten bei deren Vorliegen man sich fur die Alternative entscheidet Ein Test heisst ein nichtrandomisierter Test wenn F x 0 1 f u r a l l e x X displaystyle Phi x in 0 1 quad mathrm f ddot u r alle x in X nbsp Ansonsten heisst der Test ein randomisierter Test Nichtrandomisierte Tests liefern also immer eine eindeutige Entscheidung Fehler 1 und 2 Art Bearbeiten Hauptartikel Fehler 1 und 2 Art Ist ein ϑ 8 displaystyle vartheta in Theta nbsp gegeben so kann man auf zwei verschiedene Arten einen Fehler begehen Als Fehler 1 Art bezeichnet man die Entscheidung fur 8 1 displaystyle Theta 1 nbsp obwohl ϑ 8 0 displaystyle vartheta in Theta 0 nbsp ist Mit Ruckgriff auf die Notation der bedingten Wahrscheinlichkeit ist dann a P E n t s c h e i d u n g f u r 8 1 ϑ 8 0 displaystyle alpha P mathrm Entscheidung f ddot u r Theta 1 mid vartheta in Theta 0 nbsp die Wahrscheinlichkeit fur einen Fehler 1 Art Analog spricht man von einem Fehler 2 Art wenn man sich fur 8 0 displaystyle Theta 0 nbsp entscheidet aber ϑ 8 1 displaystyle vartheta in Theta 1 nbsp ist Die Wahrscheinlichkeit fur einen Fehler 2 Art ist somit b P E n t s c h e i d u n g f u r 8 0 ϑ 8 1 displaystyle beta P mathrm Entscheidung f ddot u r Theta 0 mid vartheta in Theta 1 nbsp Gutefunktion Niveau und Trennscharfe Bearbeiten Fur einen vorliegenden Test heisst die Funktion G F ϑ E ϑ F displaystyle G Phi vartheta operatorname E vartheta Phi nbsp die Gutefunktion des Tests Dabei bezeichnet E ϑ displaystyle operatorname E vartheta nbsp den Erwartungswert bezuglich des Wahrscheinlichkeitsmasses P ϑ displaystyle P vartheta nbsp Ist ein a 0 1 displaystyle alpha in 0 1 nbsp gegeben so dass G F ϑ a f u r a l l e ϑ 8 0 displaystyle G Phi vartheta leq alpha quad mathrm f ddot u r alle vartheta in Theta 0 nbsp so nennt man a displaystyle alpha nbsp das Niveau des Tests Gilt sogar sup ϑ 8 0 G F ϑ a displaystyle sup vartheta in Theta 0 G Phi vartheta alpha nbsp so heisst a displaystyle alpha nbsp das effektive Niveau des Tests Das effektive Niveau des Tests ist somit eine obere Schranke fur einen Fehler 1 Art Fur ein ϑ 8 1 displaystyle vartheta in Theta 1 nbsp heisst G F ϑ displaystyle G Phi vartheta nbsp die Trennscharfe des Tests an der Stelle ϑ displaystyle vartheta nbsp Sie entspricht der Wahrscheinlichkeit einen Fehler 2 Art nicht zu machen wenn der Parameter ϑ displaystyle vartheta nbsp vorliegt Optimalitatsbegriffe fur Tests BearbeitenFur Tests lassen sich verschiedene Optimalitatsbegriffe formulieren die sich in ihrer Starke unterscheiden Je starker der Optimalitatsbegriff umso starker die Voraussetzungen unter denen ein optimaler Test existiert Neben Optimalitatsbegriffen formuliert man oft auch Reduktionsprinzipien siehe unten um optimale Tests nur innerhalb kleinerer Mengen von Tests suchen zu mussen Gleichmassig beste Tests Bearbeiten Hauptartikel Gleichmassig bester Test Ein gleichmassig bester Test ist ein Test dessen Trennscharfe immer grosser als die aller anderen Tests zu einem vorgegebenen Niveau Somit ist die Wahrscheinlichkeit fur einen Fehler 2 Art bei gleichmassig besten Tests immer kleiner als fur einen beliebigen weiteren Test Zentrale Existenzaussage fur gleichmassig beste Tests ist das Neyman Pearson Lemma Es besagt dass der Neyman Pearson Test ein gleichmassig bester Test ist Dieses Resultat kann unter geeigneten Voraussetzungen z B bei monotonen Dichtequotienten auf allgemeinere Testprobleme ausgeweitet werden Maximin Tests Bearbeiten Hauptartikel Maximin Test Maximin Tests sind Tests bei denen die Worst Case Wahrscheinlichkeit fur einen Fehler 2 Art kleiner ist als bei allen anderen Tests zu einem vorgegebenen Niveau Grosser Vorteil von Maximin Tests ist dass sie unter weitaus allgemeineren Voraussetzungen existieren als gleichmassig beste Tests Strenge Tests Bearbeiten Hauptartikel Strenger Test Strenge Tests sind Tests bei denen die maximale Abweichung der Trennscharfe von der Trennscharfe des lokal besten Tests bzw der envelope power function kleiner ist als bei allen anderen Tests zum vorgegebenen Niveau Wie auch Maximin Tests existieren strenge Tests bereits unter schwachen Voraussetzungen Reduktionsprinzipien BearbeitenAls Reduktionsprinzipien bezeichnet man Vorgehensweisen die es erlauben in kleinere Klassen von Tests nach optimalen Elementen zu suchen Ein wichtiges Reduktionsprinzip ist die Einschrankung auf unverfalschte Tests Dies sind diejenigen Tests zu einem vorgegebenen Niveau bei denen die Trennscharfe des Tests immer uber dem Niveau liegt Somit sind unverfalschte Tests immer besser als der naive Test der eine rein zufallige Entscheidung auslost Ein wichtiges Hilfsmittel zum Auffinden von gleichmassig besten unverfalschten Tests sind die ahnlichen Tests Bei diesen nimmt die Gutefunktion auf dem Ubergang von Nullhypothese zu Alternative genau den Wert des Niveaus an Testtheorie als Entscheidungsproblem BearbeitenViele Optimalitats und Reduktionsprinzipien der Testtheorie lassen sich im Rahmen der Entscheidungstheorie in ein statistisches Entscheidungsproblem einordnen und miteinander vergleichen Grundlage des statistischen Entscheidungsproblems ist wie in der Testtheorie ein statistisches Modell E X A P ϑ ϑ 8 displaystyle mathcal E X mathcal A P vartheta vartheta in Theta nbsp sowie ein Entscheidungsraum der in der Testtheorie stets 0 1 B 0 1 displaystyle 0 1 mathcal B 0 1 nbsp ist Entscheidungsfunktionen sind dann genau die statistischen Tests wobei die randomisierten Tests den randomisierten Entscheidungsfunktionen entsprechen die nichtrandomisierten Tests entsprechend den nichtrandomisierten Entscheidungsfunktionen Typische Wahl fur die Verlustfunktion ist die Neyman Pearson Verlustfunktion die bei gleicher Gewichtung fur den Fehler 1 und 2 Wahl die Risikofunktion R ϑ F a ϑ falls ϑ 8 0 b ϑ falls ϑ 8 1 displaystyle R vartheta Phi begin cases alpha vartheta amp text falls quad vartheta in Theta 0 beta vartheta amp text falls quad vartheta in Theta 1 end cases nbsp fur einen statistischen Test F displaystyle Phi nbsp liefert Hierbei bezeichnen a displaystyle alpha nbsp bzw b displaystyle beta nbsp die Wahrscheinlichkeit fur einen Fehler 1 bzw 2 Art wenn ϑ displaystyle vartheta nbsp vorliegt Schrankt man die Menge der Tests nun auf die Menge der Tests zum Niveau a displaystyle alpha nbsp ein und verwendet obige Risikofunktion so sind die gleichmassig besten Tests genau die zulassigen Entscheidungsfunktionen die Maximin Tests genau die Minimax Entscheidungsfunktionen Literatur BearbeitenHans Otto Georgii Stochastik Einfuhrung in die Wahrscheinlichkeitstheorie und Statistik 4 Auflage Walter de Gruyter Berlin 2009 ISBN 978 3 11 021526 7 doi 10 1515 9783110215274 Ludger Ruschendorf Mathematische Statistik Springer Verlag Berlin Heidelberg 2014 ISBN 978 3 642 41996 6 doi 10 1007 978 3 642 41997 3 Claudia Czado Thorsten Schmidt Mathematische Statistik Springer Verlag Berlin Heidelberg 2011 ISBN 978 3 642 17260 1 doi 10 1007 978 3 642 17261 8 Abgerufen von https de wikipedia org w index php title Testtheorie Statistik amp oldid 182669791