www.wikidata.de-de.nina.az
Die Klassische Testtheorie KTT ist die meistverbreitete psychometrische Testtheorie Der Schwerpunkt des Modells der klassischen Testtheorie liegt auf der Genauigkeit einer Messung bzw auf der Grosse des jeweiligen Messfehlers Daher wird sie oft auch als Messfehlertheorie bezeichnet Die klassische Testtheorie versucht zu klaren wie ausgehend von einem Testwert einer Person auf die wahre Auspragung des zu messenden Personlichkeitsmerkmals geschlossen werden kann Inhaltsverzeichnis 1 Axiome 2 Reliabilitat 2 1 Schatzverfahren zur Ermittlung der Reliabilitat 3 Objektivitat 4 Validitat 4 1 Schatzverfahren zur Ermittlung der Validitat 5 Vorteile 6 Kritik 7 Alternative psychometrische Modelle 8 Literatur 9 Weblinks 10 EinzelnachweiseAxiome BearbeitenJeder Testwert X displaystyle X nbsp ist zusammengesetzt aus einem wahren Merkmalsanteil T displaystyle T nbsp und einem zufalligen Messfehleranteil E displaystyle E nbsp X T E displaystyle X T E nbsp 1 Der Erwartungswert der Fehler ist null E E 0 displaystyle mathbb E E 0 nbsp Der Messfehler ist mit dem wahren Wert unkorreliert r T E 0 displaystyle rho T E 0 nbsp Wahrer Wert und Fehlerwert zweier verschiedener Tests sind unabhangig und damit unkorreliert r T Test1 E Test2 0 displaystyle rho T text Test1 E text Test2 0 nbsp Fehlerwerte von zwei verschiedenen Tests sind unabhangig und damit unkorreliert r E Test1 E Test2 0 displaystyle rho E text Test1 E text Test2 0 nbsp Je grosser der Messfehler desto geringer ist der wahre Merkmalsanteil und desto weniger zuverlassig misst ein Test Aus den ersten beiden Axiomen folgt zudem E T E X displaystyle mathbb E T mathbb E X nbsp Dies besagt dass der Messfehler verschwindet wenn entweder ein Test an vielen Individuen angewandt wird oder ein Test mehrfach bei ein und derselben Person angewandt wird Reliabilitat BearbeitenDas zentrale Konzept der klassischen Testtheorie ist die Reliabilitat das ist die Zuverlassigkeit bzw Genauigkeit Freiheit von Messfehlern mit der ein Testwert den wahren Wert erfasst Die Reliabilitat wird theoretisch als das Verhaltnis der Varianz der wahren Werte zur Varianz der Testwerte definiert Reliabilitat s T 2 s X 2 s T 2 s T 2 s E 2 displaystyle text Reliabilitat frac sigma T 2 sigma X 2 frac sigma T 2 sigma T 2 sigma E 2 nbsp 1 mit s T 2 displaystyle sigma T 2 nbsp als Varianz des messfehlerfreien Testwerts und s E 2 displaystyle sigma E 2 nbsp als Varianz des Messfehlers Aus dieser Darstellung wird eine zunachst paradoxe Schlussfolgerung anschaulich Eine Erhohung der Variabilitat systematischer Fehler Verzerrungen fuhrt zu einer Erhohung der Reliabilitat da sie nicht zu s E 2 displaystyle sigma E 2 nbsp sondern zu s T 2 displaystyle sigma T 2 nbsp hinzugerechnet werden Schatzverfahren zur Ermittlung der Reliabilitat Bearbeiten Die Reliabilitat kann da man die wahren Werte nicht kennt nur geschatzt werden Ein Verfahren ist die sogenannteSplit Half Reliabilitat bei der der Test auf Itemebene in zwei gleich grosse Teile aufgespalten wird die dann jeweils miteinander korreliert werden Dieses Verfahren ist im Grunde genommen nur noch von historischer Bedeutung 1 Wesentlich gelaufiger ist heutzutage eine Methode die als Verallgemeinerung der Split Half Reliabilitat beschrieben werden kann Jedes Item wird als eigener Testteil aufgefasst und mit den anderen Items der Subskala korreliert Man verwendet hierfur haufig das Cronbachsche Alpha das auch als Masszahl fur die interne Konsistenz gilt Der Alpha Koeffizient gilt hierbei als Untergrenze der Reliabilitatsschatzung Das Cronbachsche Alpha setzt Homogenitat der Items voraus ohne diese Annahme zu prufen Deswegen wird statt diesem Koeffizienten zunehmend die kongenerische Reliabilitat bestimmt die diese Homogenitat nicht voraussetzt Ein weiteres wichtiges Schatzverfahren ist die Test Retest Reliabilitat die die Korrelation desselben Tests zu zwei unterschiedlichen Zeitpunkten darstellt Die Test Retest Reliabilitat ist wertlos wenn nicht das Intervall zwischen den beiden Testzeitpunkten angegeben ist Unsinnig ist die Anwendung der Retest Reliabilitat bei sich verandernden Konstrukten so wurde die Retest Reliabilitat eines Tests der Hunger als Konstrukt erfasst nicht die Reliabilitat des Tests erfassen sondern nur die Fluchtigkeit des Hungergefuhls Dies fuhrt zu einer Unterschatzung der Reliabilitat Problematisch sind ebenso zu kurze Zeitraume zwischen den Tests da Erinnerungseffekte zu einer Uberschatzung der Reliabilitat fuhren konnen Ein weiteres Verfahren ist die Konstruktion von parallelen Tests Das sind Tests von denen man annimmt dass sie die gleichen wahren Werte messen Die Reliabilitat kann dann durch die Korrelation zweier paralleler Tests X1 und X2 geschatzt werden Man nennt dies auch Paralleltest Reliabilitat Der Vorteil der Paralleltest Reliabilitat liegt darin dass weder Item Homogenitat wie beim Cronbachschen Alpha noch eine zeitliche Stabilitat wie bei der Retest Reliabilitat vorausgesetzt wird weshalb man sie von der Theorie her als Konigsweg bezeichnen konnte Praktisch gesehen ist es jedoch ausserst schwierig parallele Testformen zu konstruieren die voraussetzen dass die korrespondierenden Items sich in Mittelwert Itemschwierigkeit Trennscharfe und sogar Fremdtrennscharfe nicht unterscheiden Das tragt dazu bei dass diese Form der Reliabilitatsschatzung recht selten angewandt wird Bei gewissen Leistungstests wie z B IQ Tests mussen jedoch aufgrund der Gefahr des Abschreibens ohnehin parallele Testformen vorliegen Hier kann als gunstiger Nebeneffekt die Paralleltest Reliabilitat mitberichtet werden Erwahnenswert ist noch die Interrater Reliabilitat Sie wird insbesondere bei den Messverfahren Interviewund Beobachtungzur Schatzung der Reliabilitat eingesetzt Fur nominalskalierte Daten steht hierfur Cohens Kappa zur Verfugung Fur metrisch skalierte Daten wird die Intraklassen Korrelation verwendet Fur ordinalskalierte Daten ist der Spearman sche Rangkorrelationskoeffizient Spearman sches Rho ein anwendbares Mass Objektivitat BearbeitenDie Objektivitat spielt in der klassischen Testtheorie eine untergeordnete Rolle Die KTT ist eine Theorie deren Axiome sich hauptsachlich auf Messfehler beziehen Sie ist damit eine Theorie der Messfehler und damit indirekt eine Theorie der Reliabilitat die ja als Freiheit von unsystematischen Messfehlern definiert ist Objektivitat lasst sich hierbei als Unteraspekt von Reliabilitat auffassen da Objektivitat das Ausmass betrifft in dem sich die Varianz des Testwerts nicht auf eine Varianz ausgehend vom Versuchsleiter bzw den Testbedingungen zuruckfuhren lasst z B Versuchsleitereffekt Objektivitat schliesst also Messfehler die durch den Untersuchungsleiter und die bedingungen zustande kommen aus ebenso wie die Reliabilitat und lasst sich in verschiedene Aspekte unterteilen Durchfuhrungsobjektivitat Testergebnisse variieren nicht aufgrund unterschiedlicher Untersuchungsbedingungen in verschiedenen MessgelegenheitenAuswertungsobjektivitat Die Testscores bzw Ergebnisse in einem Test variieren nicht aufgrund unterschiedlicher Auswerter Interpretationsobjektivitat Die Schlussfolgerungen die aus dem Testergebnis gezogen werden variieren nicht aufgrund unterschiedlicher AuswerterBesonders bei den letzten beiden Punkten wird die Verwandtschaft zur Reliabilitat deutlich Theoretisch liessen sich die beiden Aspekte durchaus quantitativ durch die Interrater Ubereinstimmung erfassen In der Praxis werden jedoch uberwiegend Bedingungen sichergestellt von denen man ausgeht dass sie Objektivitat herbeifuhren So wird ein moglichst standardisierter Test mit festen Interpretationshilfen im Manual als Garant fur Auswertungs und Interpretationsobjektivitat betrachtet Standardisierte Untersuchungsbedingungen hingegen sollen Durchfuhrungsobjektivitat gewahrleisten Hier wird meist nur unterschieden zwischen gegeben und nicht gegeben Validitat BearbeitenAnalog zur Reliabilitat kann die Validitat in der klassischen Testtheorie aufgefasst werden als der Anteil der Varianz der ausschliesslich auf das zu messende Konstrukt und nicht auf unsystematische zufallige Fehler oder systematische Verzerrungen zuruckgeht Validitat s C 2 s X 2 s C 2 s C 2 s B 2 s E 2 displaystyle text Validitat frac sigma C 2 sigma X 2 frac sigma C 2 sigma C 2 sigma B 2 sigma E 2 nbsp mit s C 2 displaystyle sigma C 2 nbsp als Varianz die ausschliesslich auf das zu untersuchende Konstrukt zuruckzufuhren ist s B 2 displaystyle sigma B 2 nbsp als Varianz der systematischen Verzerrungen englisch bias und s E 2 displaystyle sigma E 2 nbsp als Varianz des Messfehlers Im Gegensatz zur Reliabilitat fuhrt hier eine Erhohung des systematischen Fehlers zu einer Verminderung was intuitiv nachvollziehbar ist Schatzverfahren zur Ermittlung der Validitat Bearbeiten Die Validitat eines Tests ist ungleich schwieriger zu schatzen als die Reliabilitat Das liegt zum einen daran dass Validitat anders als die Reliabilitat ein sehr uneinheitlicher Begriff ist der in der Praxis durch sehr viele verschiedene Arten von Kennziffern geschatzt werden kann Auf der anderen Seite gibt es aber auch Aspekte der Validitat die sich quantitativ nicht erfassen lassen bzw dies ist in der Praxis der Testkonstruktion so nicht ublich Fur die Testkonstruktion relevant sind drei Oberformen der psychometrischen Validitat Inhaltsvaliditat Betrifft u a die Frage ob Items wirklich dazu geeignet sind ein bestimmtes Konstrukt zu erfassen Wird in der Praxis durch Expertenurteile entweder als gegeben oder nicht gegeben angenommen Zumindest besteht die theoretische Moglichkeit sie z B uber Interrater Ubereinstimmungsmasse bezuglich Expertenurteile zu Items zu erfassen Konstruktvaliditat Ist verwandt mit der Inhaltsvaliditat Hier geht es jedoch mehr als bei der Inhaltsvaliditat um intersubjektiv empirisch quantitativ nachprufbare Hinweise darauf dass tatsachlich das relevante Konstrukt gemessen wird und kein anderes Dies geschieht auf verschiedene Arten Interne Struktur Faktorielle Validitat Prufbar mit EFA CFA und SEM Diskriminante und Konvergente Validitat mit artfremden artverwandten Tests die dasselbe ein anderes Konstrukt messen Ermittelbar z B durch bivariate Korrelationen MTMM anwendbar konfirmatorische Prufung z B durch CFA Kriteriumsvaliditat In der Praxis mit das wichtigste Gutekriterium Gibt an wie gut sich beispielsweise Ergebnisse anderer Tests oder Verhaltensweisen durch das Testergebnis vorhersagen lassen und entspricht der Korrelation mit dem Aussenkriterium z B Korrelation zwischen Intelligenz und Berufserfolg Dabei kann anhand der zeitlichen Relation zwischen Testergebnis und Kriterium unterschieden werden Retrospektive Validitat Wie hoch korreliert eine aktuelle Messung mit Messungen in der Vergangenheit die durch dasselbe Konstrukt bedingt sind Konkurrente Validitat Wie hoch korreliert eine aktuelle Messung mit aktuellen anderen Messungen die durch dasselbe Konstrukt bedingt sind Pradiktive Validitat Wie hoch korreliert eine Messung mit Messungen die spater vollzogen worden sind und durch dasselbe Konstrukt bedingt sindVorteile BearbeitenDie Annahmen der klassischen Testtheorie sind einfach gehalten und mathematisch recht anspruchslos im Gegensatz zur Probabilistischen Testtheorie Die KTT wurde bereits in vielen Tests umgesetzt und hat sich dadurch praktisch bewahrt Kritik BearbeitenMoglicherweise ist die Annahme X T E displaystyle X T E nbsp zu grob da verschiedene Arten von Fehlern berucksichtigt werden mussten Hier bietet das erweiterte Latent State Trait Modell Steyer und andere einen weiterfuhrenden Ansatz Die Stichprobenabhangigkeit von Reliabilitat Itemschwierigkeit und Itemtrennscharfe wird in der KTT nicht oder nur ungenugend beachtet 2 Die Homogenitat von Items kann im Rahmen der KTT nicht gepruft werden Nach dem Verdunnungsparadox sinkt die kriterienbezogene Validitat eines Tests mit wachsender Reliabilitat von Kriterium und validiertem Test 3 Die klassische Testtheorie kann nur stabile Personlichkeitsmerkmale messen Wurde sich namlich der wahre Wert verandern stunde dies im Widerspruch zum zweiten Axiom dass Erwartungswert und Mittelwert der Fehler beziehungsweise die Summe uber die Fehler gleich null sind 4 Es werden Daten auf dem Niveau einer Intervallskala vorausgesetzt denn es werden Mittelwerte und Varianzen berechnet 2 Alternative psychometrische Modelle BearbeitenDie Auswertung psychometrischer Daten kann auch durch Latent Trait Theorien z B Rasch Modell erfolgen Diese konnen einige der Probleme die mit der KTT einhergehen losen schaffen aber auch neue siehe auch Probabilistische Testtheorie Literatur BearbeitenGustav A Lienert Ulrich Raatz Testaufbau und Testanalyse 6 Auflage Beltz Verlags Union Weinheim 1998 ISBN 3 621 27424 3 Helfried Moosbrugger Augustin Kelava Hrsg Testtheorie und Fragebogenkonstruktion 2 aktualis Auflage Springer Medizin Verlag Heidelberg 2012 ISBN 978 3 642 20071 7 Frederic M Lord Melvin R Novick Statistical theories of mental test scores Addison Wesley Reading MA u a 1968 ISBN 0 201 04310 6 Weblinks Bearbeitenvideoonline edu lmu deEinzelnachweise Bearbeiten a b c Schmitz Atzert Amelang Psychologische Diagnostik 5 vollstandig uberarbeitete und erweiterte Auflage Springer Berlin Heidelberg 2012 ISBN 978 3 642 17000 3 S 40 ff a b Hermann Josef Fisseni Lehrbuch der psychologischen Diagnostik 3 uberarbeitete und erweiterte Auflage Hogrefe Gottingen 2004 ISBN 3 8017 1756 9 S 81 Hermann Josef Fisseni Lehrbuch der psychologischen Diagnostik 3 uberarbeitete und erweiterte Auflage Hogrefe Gottingen 2004 ISBN 3 8017 1756 9 4 3 3 4 Hermann Josef Fisseni Lehrbuch der psychologischen Diagnostik 3 uberarbeitete und erweiterte Auflage Hogrefe Gottingen 2004 ISBN 3 8017 1756 9 S 50 Abgerufen von https de wikipedia org w index php title Klassische Testtheorie amp oldid 207507867