www.wikidata.de-de.nina.az
Eine Itemanalyse verwendet ein Bundel statistischer Verfahren um die Eignung einzelner Items derer Werte beispielsweise durch Fragen einer schriftlichen Umfrage generiert wurden im Hinblick auf die Zielsetzung der Befragung zu untersuchen Eindimensionales kongenerisches Messmodell mit k displaystyle k ItemsZiel ist es dabei die Qualitat einer Skala Skala bedeutet hier ein Instrument zur Messung bestimmter Variablen z B der politischen Grundeinstellung oder des Umweltbewusstseins der Versuchsperson durch Uberprufung der Items zu testen und gegebenenfalls zu verbessern Aufgabe der Itemanalyse ist es somit die Brauchbarkeit einzelner Items fur einen bestimmten Test zu uberprufen Die Itemanalyse ist ein zentrales Instrument fur die Testkonstruktion und Testbewertung und kommt per Definition dem Wesen der Reliabilitat als Testgutekriterium am nachsten Entscheidend fur den Test als Gesamtes sind dagegen dessen Gutekriterien und insbesondere die Frage der Validitat d h was der Test d h alle Items zusammengenommen eigentlich messen soll Inhaltsverzeichnis 1 Definition 2 Analyse der Rohwertverteilung 3 Statistische Kennwerte 3 1 Itemschwierigkeit 3 2 Trennscharfe 3 3 Homogenitat 4 Dimensionalitat 5 Literatur 6 EinzelnachweiseDefinition BearbeitenEine genaue Definition des Begriffs Itemanalyse ist in der Literatur nicht festgelegt Sie dient zur Bestimmung empirischer psychometrischer Kriterien einzelner Testaufgaben Meist zahlen zur Itemanalyse bei der klassischen Testkonstruktion die Analyse der Rohwertverteilungdie Berechnung statistischer Kennwerte Itemschwierigkeit Trennscharfe Homogenitat sowie dieDimensionalitatsprufung Die Analyse wird an einer Stichprobe durchgefuhrt die ein Abbild der Population darstellen soll fur die der Test konzipiert wurde Die Daten der Itemanalyse werden fur die Auswahl und Uberarbeitung von Items zu deren Reihung innerhalb des Tests und evtl fur die Konzeption eines Paralleltests verwendet Analyse der Rohwertverteilung BearbeitenEs besteht die Moglichkeit die Testwerte graphisch darzustellen z B Histogramm Hierdurch wird ein erster Uberblick uber die Verteilung der Werte ermoglicht Im Hauptinteresse steht hierbei die Streuung und die Beantwortung der Frage ob die Rohwertverteilung einer Normalverteilung entspricht Da viele inferenzstatistische Verfahren eine Normalverteilung voraussetzen ist eine dementsprechende Verteilung erwunscht Statistische Kennwerte BearbeitenItemschwierigkeit Bearbeiten Die Itemschwierigkeit wird durch einen Index gekennzeichnet der dem Anteil derjenigen Personen entspricht die das Item richtig losen oder bejahen Bortz amp Doring 2005 Fruher wurde dieser Index darum auch Popularitatsindex genannt Zweck des Schwierigkeitsindexes ist die Unterscheidung von Probanden mit hoher Merkmalsauspragung und Probanden mit niedriger Merkmalsauspragung Die Fahigkeit eines Items zu dieser Unterscheidung nennt man Trennscharfe Bei klassischer Testkonstruktion haben Items mit mittlerer Itemschwierigkeit in der Regel die beste Trennscharfe 1 Unbrauchbar sind extrem ausgedruckt demzufolge alle Items die von allen Probanden bzw Items die von keinem Probanden gelost werden konnten oder bejaht wurden Mit dem Schwierigkeitsindex sollten demnach die Items selektiert werden die nicht diesen beiden Klassen zugehoren Optimal wird eine Itemschwierigkeit von 50 angesehen wobei Items unter 20 und uber 80 in der Regel ausgeschieden werden 1 Wurde man allerdings nur Items mit einer Itemschwierigkeit von 50 wahlen hatte man keine gute Differenzierung von Probanden mit niedriger Merkmalsauspragung und auch keine Differenzierung im Bereich hoher Merkmalsauspragungen Deckeneffekt 1 Das bedeutet beispielsweise dass uberdurchschnittlich Intelligente alle Aufgaben eines Intelligenztests losen konnten wenn er keine so schwierigen Aufgaben enthalten wurde dass nur noch besonders hochbegabte sie losen konnen Es ware dann nicht mehr moglich Unterschiede in der Gruppe der Hochbegabten festzustellen Bei Niveautests sollten die Schwierigkeitsindices uber moglichst den ganzen Bereich des gemessenen Merkmals streuen um einen moglichst grossen Anwendungsbereich fur den Test zu erhalten Sind die Itemschwierigkeiten aber sehr unterschiedlich leidet auch die interne Konsistenz der Skala sprich durch die Beantwortung eines leichten Items lasst sich nicht vorhersagen ob ein schwieriges beantwortet wird Deshalb ist die Konstruktion von Niveautests mit klassischer Testtheorie schwierig Schwierigkeitsberechnung bei zweistufigen Antworten z B stimmt stimmt nicht p N R N displaystyle p frac N R N nbsp N R displaystyle N R nbsp Zahl der Richtigloser N Zahl der Probanden p Schwierigkeitsindex nur bei zweistufigen Antworten Dies stellt eine Losung fur den einfachsten Fall dar Sollten Probanden die Aufgabe nicht gelost haben oder wird vermutet dass die Antworten teilweise nur richtig erraten wurden so muss auf andere Losungsalternativen zuruckgegriffen werden vgl Fisseni 1997 41 42 Schwierigkeitsberechnung bei mehrstufigen Antworten In diesem Fall ist p nicht definiert Mogliche Losung des Problems Dichotomisierung der Item Scores z B 0 und 1 dann Berechnung als zweistufig mit p Berechnung von Mittelwert und Streuung Mittelwert aquivalent zu p jedoch muss die Streuung beachtet werden p m displaystyle p m nbsp Index fur mehrstufige Antworten vereinfachte Formel p m Erreichte Wertepunkte Erreichbare Wertepunkte displaystyle p m frac text Erreichte Wertepunkte text Erreichbare Wertepunkte nbsp zur exakteren Berechnung liegen von verschiedenen Autoren verschiedene Berechnungsvorschlage vor vgl Fisseni 2004 43 45 Schwierigkeitsunterschiede zwischen zwei Items konnen uber eine Mehrfeldertafel gepruft werden Diese Formeln gelten streng genommen nur fur reine Niveautests d h solchen die keine Testzeitbegrenzung vorschreiben und oder bei denen Probanden alle Aufgaben bearbeiten konnten Ist Letzteres nicht erfullt wie es oftmals bei Leistungstests der Fall ist darf die Anzahl der richtigen Antworten nicht in Beziehung zur Gesamtzahl der Probanden gesetzt werden sondern nur der Zahl die die jeweilige Aufgabe uberhaupt bearbeitet hat vgl Lienert 1989 Trennscharfe Bearbeiten Hauptartikel Trennscharfe eines Items Der Trennscharfe eines Items ist zu entnehmen wie gut das gesamte Testergebnis aufgrund der Beantwortung eines einzelnen Items vorhersagbar ist Bortz amp Doring 2005 Eine hohe Trennscharfe bedeutet also dass das Item zwischen den Probanden im Sinne des Gesamttests zu differenzieren vermag d h Probanden mit hoher Merkmalsauspragung losen ein Item richtig Probanden mit niedriger dagegen nicht Die Trennscharfe wird durch den Trennscharfekoeffizienten dargestellt Dieser Korrelationskoeffizient zwischen einem Einzelitem und dem Gesamttestscore als Kriterium wird fur jedes einzelne Item berechnet und richtet sich nach dem Skalenniveau der Testwerte Ist der Test Score intervallskaliert und normalverteilt so wird als Trennscharfe r i t displaystyle r it nbsp die Produkt Moment Korrelation zwischen den Werten je Item i und dem korrigierten Gesamtwert t gewahlt r i t c o v i t s i s t displaystyle r it frac cov i t s i cdot s t nbsp Ist r i t displaystyle r it nbsp 0 wird ein Item von Probanden mit hoher wie niedriger Merkmalsauspragung gleichermassen gelost Sofern negative Trennscharfen nicht mit einer Bedeutungsumkehr der Itemformulierung oder Skala gerechtfertigt sind gelten diese Items als unbrauchbar A priori sind moglichst hohe absolute Trennscharfen wunschenswert insbesondere aber fur Niveautests Die Trennscharfe eines jeden Items ist abhangig von seiner Schwierigkeit der Homogenitat bzw Dimensionalitat des Tests der Stellung des Items innerhalb des Tests und der Reliabilitat des Kriteriums Als Kriterium kann neben dem Testwert auch ein Aussenkriterium herangezogen werden dann handelt es sich gleichzeitig um einen Validitatskoeffizienten Die hochsten Trennscharfen findet man bei Items mit mittlerer Schwierigkeit vgl Lienert 1989 Homogenitat Bearbeiten Die Homogenitat r i t displaystyle bar r it nbsp gibt an wie hoch die einzelnen Items eines Tests im Durchschnitt miteinander korrelieren Bei hoher Homogenitat erfassen die Items eines Tests ahnliche Informationen Bortz amp Doring 2005 Werden alle k Testitems paarweise miteinander korreliert ergeben sich k k 1 2 displaystyle k k 1 2 nbsp Korrelationskoeffizienten r i i displaystyle r ii nbsp deren via Fisher scher Z Transformation errechneter Mittelwert r i i displaystyle bar r ii nbsp die Homogenitat des Tests beschreibt Die Hohe der Iteminterkorrelationen r i i displaystyle r ii nbsp ist abhangig von der Schwierigkeit Je grosser die Schwierigkeitsunterschiede zwischen den Items desto geringer wird die Interkorrelation die wiederum die Reliabilitat eines Tests beeinflusst In der Regel werden daher fur einen Sub Test entweder unkorrelierte d h heterogene Items gleicher Schwierigkeit oder positiv korrelierte d h homogene Items unterschiedlicher Schwierigkeit genutzt vgl Lienert 1989 Dimensionalitat BearbeitenDie Dimensionalitat eines Tests gibt an ob er nur ein Merkmal bzw Konstrukt erfasst eindimensionaler Test oder ob mit den Testitems mehrere Konstrukte bzw Teil Konstrukte operationalisiert werden mehrdimensionaler Test Bortz amp Doring 2005 Literatur BearbeitenBortz amp Doring 2005 Forschungsmethoden und Evaluation Heidelberg Springer Verlag ISBN 3 540 41940 3 Fisseni H J 1997 Lehrbuch der psychologischen Diagnostik Gottingen Hogrefe ISBN 3 8017 0982 5 Lienert G A 1989 Testaufbau und Testanalyse 4 Aufl Munchen PVU ISBN 3 621 27086 8Einzelnachweise Bearbeiten a b c Hans Dieter Mummendey Ina Grau Die Fragebogen Methode Grundlagen und Anwendung in Personlichkeits Einstellungs und Selbstkonzeptforschung Hogrefe Verlag 2014 ISBN 978 3 8409 2577 1 S 97 98 eingeschrankte Vorschau in der Google Buchsuche Abgerufen von https de wikipedia org w index php title Itemanalyse amp oldid 176985264