www.wikidata.de-de.nina.az
Die Methodik der PISA Studien ist die der PISA Studien zugrundeliegende Vorgehensweise PISA wird im Auftrag der OECD und unter Mitwirkung verschiedener Beratergremien von einem Unternehmenskonsortium der Testindustrie durchgefuhrt In den Teilnehmerstaaten sind nationale Projektzentren beteiligt In jedem Staat werden ca 5000 Schuler getestet Der Test umfasst eine zweistundige kognitive Testsitzung gefolgt von einer knapp einstundigen Fragebogensitzung Im kognitiven Test bearbeiten nicht alle Schuler dieselben Aufgaben 2003 wurden dreizehn verschiedene Testhefte sowie in manchen Landern in Sonderschulen ein Kurzheft eingesetzt von insgesamt 165 verschiedenen Aufgaben hatte jeder einzelne Schuler nur ca 50 zu bearbeiten Die Schulerlosungen werden von angelernten Hilfskraften codiert digital erfasst und ans internationale Projektzentrum nach Australien zur weiteren Auswertung ubermittelt Die meisten Aufgaben werden letztlich nur als entweder falsch oder richtig bewertet Je nachdem wie viele Schuler eine Aufgabe richtig gelost haben wird der Aufgabe ein bestimmter Schwierigkeitswert zugeordnet Je nachdem wie viele Aufgaben ein Schuler gelost hat wird dem Schuler eine bestimmte Spanne plausibler Kompetenzwerte zugeordnet Schwierigkeits und Kompetenzwerteskala werden nachtraglich so skaliert dass die Kompetenzwerte im OECD Staatenmittel den Mittelwert 500 und die Standardabweichung 100 haben Um auszugleichen dass die Testhefte unterschiedlich schwierig waren und dass einzelne Aufgaben in einzelnen Staaten zum Beispiel wegen Druckfehlern nicht gewertet werden konnten wird die gesamte Skalierung der Schwierigkeits und Kompetenzwerte unter Zuhilfenahme eines komplexen mathematischen Modells des Schulerantwortverhaltens der sogenannten Item Response Theorie berechnet Die Aufgabenschwierigkeitswerte erlauben ansatzweise eine didaktische Interpretation der Testergebnisse wenn ein Schuler beispielsweise 530 Kompetenzpunkte erzielt hat dann kann er mit 62 iger Wahrscheinlichkeit die Zahl 62 ist willkurlich festgelegt worden eine Aufgabe der Schwierigkeit 530 losen Wenn man sich nun veroffentlichte Aufgabenbeispiele anschaut deren Schwierigkeitswert in der Nahe von 530 liegt anschaut dann bekommt man einen Eindruck was ein Kompetenzwert von 530 bedeutet Allerdings muss man dabei bedenken dass der Test unter erheblichem Zeitdruck stattfindet knapp uber 2 Minuten pro Aufgabe Fast alle weiterfuhrenden Auswertungen beruhen darauf dass die statistische Verteilung der Schulerkompetenzwerte in den Teilnehmerstaaten oder feiner aufgeschlusselten Populationen untersucht wird Vorbereitung Durchfuhrung und Auswertung sind in vielhundertseitigen technischen Berichten und Auswertungshandbuchern beschrieben Inhaltsverzeichnis 1 Projektleitung 2 Vorbereitung 3 Testdurchfuhrung 4 Datenerfassung und aufbereitung 5 Aufgaben 6 Auswertung 7 Offizielle Interpretation Kompetenzstufen 8 EinzelnachweiseProjektleitung BearbeitenPISA ist eines von mehreren Projekten mit denen sich die OECD seit den 1990er Jahren verstarkt im Bereich Bildungsmonitoring engagiert Die Koordination und die Endredaktion der internationalen Berichte obliegen einer kleinen Arbeitsgruppe am Hauptsitz der OECD in Paris unter Leitung des Deutschen Andreas Schleicher Politisch wird das Projekt von einem Rat aus Regierungsvertretern gesteuert wissenschaftlich wird es von einem Expertengremium nebst Unterausschussen begleitet diese Experten Didaktiker und Bildungsforscher arbeiten insbesondere bei der Auswahl von Testaufgaben mit Die Erstellung und Auswertung der Testaufgaben wurde ausgeschrieben und an ein Konsortium aus mehreren Unternehmen der Testindustrie vergeben Die Federfuhrung wurde dem Australian Council for Educational Research ACER ubertragen dem Institut an dem sich Schleicher vom Physiker zum Bildungsstatistiker fortgebildet hat In den einzelnen Teilnehmerstaaten werden Testdurchfuhrung Auswertung und Ergebnisveroffentlichung von einem nationalen Projektpartner getragen In kleinen Staaten sind das kleine Arbeitsgruppen die oft weniger als funf Mitglieder umfassen in Deutschland sind einige zehn Personen mit PISA befasst nicht zuletzt weil fur die Erganzungsstudie PISA E ein wesentlich grosserer Aufwand getrieben wird als fur den deutschen Beitrag zu PISA im engeren Sinne mit I international In Deutschland wurde PISA 2000 1 vom Max Planck Institut fur Bildungsforschung MPIB unter Leitung von Jurgen Baumert in Berlin koordiniert Fur PISA 2003 und 2006 2 lag die Projektleitung beim Leibniz Institut fur die Padagogik der Naturwissenschaften IPN unter Leitung von Manfred Prenzel in Kiel Ab 2009 wurde PISA vom Deutschen Institut fur Internationale Padagogische Forschung DIPF in Frankfurt am Main unter Leitung von Eckhard Klieme durchgefuhrt Ab 2012 wird PISA von dem neu gegrundeten Zentrum fur internationale Bildungsvergleichsstudien ZIB unter der Leitung von Manfred Prenzel 3 und spater Kristina Reiss ubernommen 4 Fur Liechtenstein und die Schweiz wird PISA vom eidgenossischen Statistikamt in Neuenburg koordiniert Dort kann man auch nachlesen dass die nationale Durchfuhrung einer Dreijahresstudie 3 Mio SFr Projektkosten verursacht Personalkosten Honorare Reisekosten Beitrage zur internationalen Koordination nicht eingerechnet aber die Gehaltsanteile der Festangestellten die einen Teil ihrer Arbeitszeit auf PISA verwenden In Osterreich wird PISA vom Projektzentrum fur vergleichende Bildungsforschung ZVB in Salzburg unter Leitung von Gunter Haider koordiniert Sudtirol ubernimmt die Testhefte aus Salzburg und lasst sie nach dem Test dort auch codieren bevor die Daten dann an das italienische Projektzentrum in Frascati weitergeleitet werden Im internationalen Bericht werden die Ergebnisse Sudtirols wie die einiger anderer kaum zufallig ausnahmslos wirtschaftlich gutgestellter nordlicher italienischer Regionen separat ausgewiesen obwohl die dafur eigentlich geforderte Stichprobengrosse nicht erreicht wurde In Luxemburg konnten die Schuler ab 2003 zwischen einem deutsch und einem franzosischsprachigen Testheft wahlen die grosse Mehrheit liess sich auf Deutsch testen Die Projektleitung besteht aus einer winzigen Arbeitsgruppe im Bildungsministerium Vorbereitung BearbeitenDer Prozess der Evaluation der Testaufgaben wurde von jedem teilnehmenden Land begleitet und beeinflusst und reichte von der Entwicklung durch das internationale PISA Entwicklungsteam Ubersetzung in die Sprachen der Teilnehmerlander uber die Bewertung jedes Einzelitems durch Lehrplanexperten und Vortestungen in jedem Teilnehmerstaat bis hin zur Rasch Skalierung Der komplette Prozess der Evaluation ist im technischen Bericht nachzulesen Die Schul und Schulerstichproben wurden so gewahlt dass sie nach heutigem Forschungsstand bestmoglich reprasentativ fur die jeweilige Landesbevolkerung stehen 5 Testdurchfuhrung BearbeitenAn PISA 2000 nahmen 43 Staaten teil 6 in den offiziellen Veroffentlichungen werden jedoch nur Daten fur 32 Staaten berichtet In diesen Staaten wurden rund 180 000 Schuler getestet zwischen 4 500 und 10 000 pro Staat In Liechtenstein Luxemburg und Island umfasste die Stichprobe die gesamte funfzehnjahrige Bevolkerung Die Schuler bearbeiten nicht alle die gleichen Aufgaben Zur Verbesserung der Datenqualitat und um den Preis einer zusatzlichen Skalierung umfasst eine Studie neun Aufgabenhefte test booklets von denen jeder Schuler nur vier bearbeitet rotated test design Im Anschluss an die vier dreissigminutigen Aufgabenbearbeitungen fullt jeder Schuler einen umfangreichen Fragebogen questionnaire vor allem zu seinem soziookonomischen Hintergrund aus Die Zusatzuntersuchung zum selbstregulierten Lernen erfolgte 2000 uber Fragebogen Die Untersuchung zur Problemlosung bezog 2003 auch Testaufgaben ein Datenerfassung und aufbereitung BearbeitenSamtliche Antworten eines Schulers werden von speziell geschulten Kraften in Codebuchstaben oder ziffern ubersetzt und in einen Computer eingegeben Samtliche Datensatze werden einem Subkontraktor dem australischen Statistikinstitut ACER zur Skalierung ubergeben Aus den Schulerantworten und zwar nur denen aus den OECD Mitgliedsstaaten wird zunachst der Schwierigkeitsgrad der einzelnen Teilaufgaben Items bestimmt Anschliessend werden die skalierten Daten an die nationalen Projektgruppen zuruckgegeben die die Daten ausfuhrlich auswerten OECD und nationale Projektgruppen publizieren erste Ergebnisse jeweils im Folgejahr der Testdurchfuhrung Nach Veroffentlichung der ersten Ergebnisse werden die Datensatze mit Ausnahme einiger Schlussel in Deutschland zum Beispiel Bundesland und Schulform auch externen Forschern zuganglich gemacht Originale Schulerantworten und skalierte Schulerdaten konnen bei ACER heruntergeladen werden 7 sind aber wie aus dem zugehorigen Handbuch 8 ersichtlich nur fur Spezialisten nutzbar Eine unabhangige didaktische Interpretation ist nicht moglich da die Schulerantworten im veroffentlichten Datensatz nur als lt richtig falsch nicht bearbeitet gt codiert und die Aufgaben nicht erhaltlich sind Die veroffentlichten Aufgabenlosungen suggerieren dass bei der Erfassung von Schulerantworten auf Multiple Choice Frage im Gegensatz zu Aufgaben mit anderem Antwortformat zwischen falsch und nicht bearbeitet nicht unterschieden wird Das Codierungshandbuch deutet jedoch darauf hin dass diese Information falsch ist und im internationalen Rohdatensatz sehr wohl codiert ist ob eine Antwort gegeben wurde und wenn ja welche Mangels klarer Aussagen muss man jedoch vermuten dass in der offiziellen Datenaufbereitung siehe nachsten Abschnitt zwischen falschen also moglicherweise geratenen und nicht gegebenen Antworten nicht unterschieden wurde im Gegensatz zu anderen standardisierten Tests z B SAT wo falsche MC Antworten mit Punktabzug sanktioniert werden Aufgaben BearbeitenMit Hilfe des Urheberrechts schafft es das PISA Konsortium die weltweit gestellten Aufgaben geheim zu halten Die Geheimhaltung ist notig um einzelne Aufgaben in Folgestudien wiederverwenden zu konnen was wiederum notig ist um die Schwierigkeitsskalen aufeinander zu beziehen Veroffentlicht wurden nur einige Beispielaufgaben und zwar in allen Sprachen die gleichen Zum Teil stammen die freigegebenen Aufgaben aus Voruntersuchungen die wegen bestimmter Mangel nicht im Hauptdurchgang verwendet wurden eine Aufgabe Antarktis hat sich 2000 erst im Hauptdurchgang als mangelhaft erwiesen Auswertung BearbeitenDie Auswertung der PISA Studie beruht auf mathematischen Modellen die es erlauben Aufgabenschwierigkeiten und Schulerkompetenzen auf ein und derselben Leistungsskala zu beschreiben Rasch Modell siehe auch Rost J 2004 Testtheorie Bern Huber Diese Skala wurde willkurlich so gewahlt dass die Schulerkompetenzen der gesamten OECD Stichprobe ohne Partnerlander den Mittelwert 500 und die Standardabweichung 100 haben Das heisst Schuler mit der Leistungsfahigkeit 400 500 600 sind leistungsfahiger als 15 9 50 oder 84 1 aller OECD Schuler Durch die erstmalige Einbeziehung der Turkei mit ihren niedrigen Werten in die Berechnung des OECD Mittelwertes im Jahre 2003 hat sich der Wert aller anderen Lander gegenuber 2000 um 3 Punkte verbessert ohne dass in diesen Landern irgendetwas Inhaltliches zu dieser Verbesserung beigetragen worden ist Wurde man die Lander entsprechend ihren Schulerzahlen im getesteten Jahrgang bei der Mittelwertsbildung gewichten liessen sich weitere derartige Verbesserungen erreichen Eine ahnliche Skalenkonstruktion ist von IQ Tests bekannt deren Mittelwert 100 und deren Standardabweichung zumeist 15 ist der Umrechnungsfaktor demnach 100 zu 15 6 67 fur die Abweichungen vom PISA Mittelwert 500 Nach Meinung der Bildungsforscher haben die Aufgaben aus den PISA Tests allerdings nichts mit IQ Tests zu tun und sie strauben sich deshalb gegen eine Umrechnung in IQ Werte Kritik nbsp Die Leistungsskala der PISA Studien ist so konstruiert dass die Schulerfahigkeiten normalverteilt sind mit Mittelwert 500 und Standardabweichung 100 Eine solche Normierung mit Mittelwert 100 und Standardabweichung von zumeist 15 ist seit langem in IQ Tests ublich Tatsachlich verwendet PISA nicht eine sondern drei Leistungsskalen fur die drei Kompetenzfelder Lesen Mathematik Naturwissenschaften Fur dasjenige Kompetenzfeld das in einem Durchgang vertieft untersucht wird werden uberdies Subskalen gebildet In PISA 2000 wurde die Lesekompetenz aufgegliedert in Informationen ermitteln textbezogen Interpretieren und Reflektieren und Bewerten in PISA 2003 gibt es fur den Schwerpunkt Mathematik vier Subskalen Raum und Form Veranderung und Beziehung Quantitat und Unsicherheit Alle Kompetenzen und Subkompetenzen sind jedoch hoch miteinander korreliert und es lasst sich aus ihnen leicht ein Mittelwert bilden Eine zusammenfassende Bewertung auf einer Skala findet sich zwar in keiner der offiziellen Publikationen sie wurde jedoch von einigen Presseorganen hergestellt um PISA noch plakativer als einen quasi olympischen Landervergleich darstellen zu konnen Es wird postuliert dass Aufgabenschwierigkeit und Schulerkompetenz die Losungswahrscheinlichkeit festlegen Eine Aufgabe i hat zum Beispiel die Schwierigkeit 3i 550 wenn ein Schuler n mit der Leistungsfahigkeit sn 550 diese Aufgabe mit hinreichender Sicherheit losen kann In willkurlicher Weise wird definiert dass hinreichende Sicherheit eine Losungswahrscheinlichkeit von 62 bedeutet Im Rahmen der Auswertung mussen aus den Schulerdatensatzen sowohl die Aufgabenschwierigkeiten als auch die Schulerkompetenzen ermittelt werden Diese Auswertung ist von Modellannahmen Item Response Theory abhangig uberaus kompliziert und schlecht dokumentiert Die offizielle Beschreibung im technischen Bericht S 99ff ist sehr allgemein gehalten Es werden keine konkreten Zahlenwerte fur die Modellparameter angegeben es ist nicht einmal moglich die Dimension wichtiger Vektoren zu erschliessen Folgendes lasst sich einigermassen zuverlassig herauslesen 9 Es werden je 500 Schuler aus 27 OECD Landern ausgelost Es wird angenommen dass die latenten Fahigkeiten fur PISA 2000 also die Leistungsmasse fur Mathematik Naturwissenschaft und dreimal Lesen unter den 13 500 Schulern der Stichprobe multivariat normalverteilt sind Unter dieser Annahme kann man die Koeffizienten eines Item Response Modells berechnen das beschreibt wie schwer einem Probanden mit bestimmtem Fahigkeitsprofil eine bestimmte Teilaufgabe fallt Das Fahigkeitsprofil des Schulers n ist ein Vektor sn dessen funf Komponenten gerade die Teilkompetenzen in Mathematik Naturwissenschaft und dreimal Lesen sind Die Aufgabenschwierigkeit 3i wird in diesem Teil des technischen Berichts als ein Vektor mit unbekannter Dimension p uberall sonst aber als ein Skalar beschrieben dd Man weiss nun mit welcher Wahrscheinlichkeit ein bestimmter Fahigkeitsvektor ein bestimmtes Antwortverhalten zur Folge hat Die Aufgabe lautet aber umgekehrt aus dem tatsachlichen Antwortmuster auf die Fahigkeiten zuruckschliessen Das geht nicht in eindeutiger Weise In den skalierten Schulerdatensatzen werden zwei Wege beschritten um in approximativer Weise Schulerfahigkeiten mitzuteilen 1 Es werden die wahrscheinlichsten Fahigkeitswerte Maximum Likelihood Estimates angegeben Diese Werte sind jedoch nicht geeignet um grossere Populationen zu charakterisieren 2 Es werden sogenannte plausible values angegeben fur jeden der 180 000 Probanden werden mit Hilfe von Zufallszahlen funf beispielhafte Fahigkeitsvektoren ausgelost wobei die Auslosung so gesteuert wird dass bei Mittelung uber eine hinreichend grosse Population die gemessenen Antwortmuster reproduziert werden Alle weiterfuhrenden Analysen die auf diesem Datensatz aufbauen zieht man sinnvollerweise funfmal mit je einer Instanz des Fahigkeitsvektors pro Schuler durch durch Vergleich der funf numerischen Endergebnisse kann man am Ende beurteilen welche Unsicherheit durch die Verwendung von Zufallszahlen verursacht wird Zur Charakterisierung bestimmter Teilpopulationen zum Beispiel nach Land nach Geschlecht oder nach soziookonomischen Kriterien bildet man einfach Mittelwerte uber die plausible value Fahigkeitswerte der einzelnen Schuler Offizielle Interpretation Kompetenzstufen BearbeitenDie offiziellen Veroffentlichungen legen grossen Wert darauf die quantitativen Ergebnisse mit Hilfe sogenannter Kompetenzstufen qualitativ zu interpretieren Das ist notwendig weil die Punktwerte uns noch nichts Inhaltliches erzahlen Wir wissen ja zum Beispiel nicht wie viele und welche Aufgaben mehr ein finnischer Schuler im Vergleich zum deutschen Schuler gelost hat Diese Kompetenzstufen beruhen auf A priori Charakterisierungen der Aufgaben und auf Verarbeitung gemessenen Losungshaufigkeiten In der Mathematikdidaktik ist mittlerweile ein heftiger Streit daruber entbrannt ob so eine Konstruktion uberhaupt moglich ist Die Argumentationslinie ist dabei die dass die unterschiedlichen Losungswege der Aufgaben es unmoglich machen einer Aufgabe eine inhaltliche Schwierigkeit eindeutig zuzuweisen Die Kompetenzstufen seien damit inhaltlich nicht konstruierbar vergleiche z B Journal fur Mathematik Didaktik Heft 3 4 2004 1 2005 3 4 2005 Einzelnachweise Bearbeiten PISA 2000 PISA 2003 und 2006 Memento des Originals vom 17 Juni 2007 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot pisa ipn uni kiel de Pressemitteilung 182 2010 des BMBF vom 14 Oktober 2010 Memento des Originals vom 26 Oktober 2010 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www bmbf de Zentrum fur internationale Bildungsvergleichsstudien ZIB Kultusministerkonferenz 17 Januar 2017 abgerufen am 12 November 2017 ebenfalls Technischer Bericht 1 Archivierte Kopie Memento des Originals vom 13 Juni 2007 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot pisaweb acer edu au 2 PISA 2000 Technical Report OECD archiviert vom Original am 15 Juli 2009 abgerufen am 9 September 2019 englisch Abgerufen von https de wikipedia org w index php title Methodik der PISA Studien amp oldid 237268083