Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
PISA-StudieAusgewählte Aspekte der Wirtschafts- und Sozialstatistik
Jenny Steindl
LMU München, Institut für Statistik
22.05.2015
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 1 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 2 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 3 / 60
Einführung
PISA = Programme for International Student AssessmentOECD = Organisation for Economic Co-Operation and DevelopmentKMK = Ständige Konferenz der Kultusminister der Länder in derBundesrepublik Deutschland
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 4 / 60
Einführung
Was ist PISA?
Internationale Schulleistungsstudie der OECDNationaler sowie internationaler Vergleich der Leistungen von Schülernin verschiedenen KompetenzbereichenZyklisches Programm (alle 3 Jahre)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 5 / 60
Einführung
Teilnehmer:
2012: 65 Staaten (2000: 32 Staaten)34 OECD Mitgliedsstaaten und 31 Partnerstaatenca. 500.000 Schülerinnen und Schüler stellvertretend für ca. 28 Mio.15-jährigeDeutschland: 5001 Schüler in 230 Schulen
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 6 / 60
Einführung
Teilnehmer:
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 7 / 60
Einführung
Durchführung:
Schriftliche Tests mit Multiple Choice Fragen und offenen Fragen)erstmals HintergrundfragebögenErhebung im Zeitraum 01. März bis 30. Juni 20122 Stunden / Test
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 8 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 9 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 10 / 60
Kompetenzbereiche
LesekompetenzMathematische GrundbildungNaturwissenschaftliche Grundbildung
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 11 / 60
Kompetenzbereiche
Grundbildungen:
Mathematische Grundbildung als Schwerpunkt von PISA 2012 (zuletztPISA 2003)Naturwissenschaftliche Grundbildung (zuletzt PISA 2006)Lesen als Grundbildung (zuletzt PISA 2009)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 12 / 60
Kompetenzbereiche
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 13 / 60
Kompetenzbereiche
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 14 / 60
Kompetenzbereiche
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 15 / 60
Kompetenzbereiche
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 16 / 60
Kompetenzbereiche
CBA:Auswahl aus 3 Kompetenzbereichen Problemlösung, Lesen undMathematikDeutschland entscheidet sich für ProblemlösungTestungen sind am PC durchzuführenDurchführung im Anschluss an schriftliche Tests
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 17 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 18 / 60
Übersicht
1 Einführung2 Kompetenzbereiche3 Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 19 / 60
Methodik
Stichprobenerhebung:Vollerhebung aus finanziellen und zeitlichen Gründen nichtdurchführbarSystematische TeilerhebungZwei- oder mehrstufige Auswahlverfahren bei Large-Scale-Assessments
Stichprobenplan und Ziehung der Stichprobe:Grundgesamtheit: Kohorte der 15-jährigen Schülern ab der 7. Klasse(geboren zwischen dem 01.01.1996 und dem 31.12.1996)Zweistufiges Auswahlverfahren in Deutschland eingesetzt
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 20 / 60
Methodik
1. Schritt: Erstellung eines Sampling-Frame:Bestimmung aller Schulen, die potentiell von 15-jährigen besuchtwerdenkeine Schule darf mehrfach, fehlerhaft oder unvollständig in denSampling-Frame aufgenommen werdenInformationen von 14 statistischen Landesämtern
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 21 / 60
Methodik
Eingeholte Informationen auf Basis der Schulstatistik 2010/2011:offizielle SchulnummerSchulartAnzahl der Schüler (geb. 1993-1996)Anzahl der Schüler in den 8.-10. KlassenAnzahl der Klassen 8.-10.Informationen über SchulveränderungenFörderschwerpunkte von Förderschulen
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 22 / 60
Methodik
2. Schritt: Ziehung der SchülerstichprobeUnterteilung des Sampling-Frames anhand mehrererStratifizierungskriterienVorteile: Erhöhung der Effizienz des Sampling-FramesPopulationsparameter kann verlässlicher geschätzt werdenverlässliche Ergebnisse auch mit kleineren Stichproben
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 23 / 60
Methodik
Stratifizierung ermöglicht Überprüfung, ob die Charakteristika derStichprobe mit jenen des Sampling-Frames übereinstimmenAnalyse nach bestimmten Kriterien möglich, so dass beispielsweiseErgebnisse einer Hauptschule mit jenen einer Realschule vergleichbarsind
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 24 / 60
Methodik
Unterscheidung zwischen expliziter und impliziter Stratifizierung:Explizite Stratifizierung:
Zunächst Unterteilung anhand bestimmter Charakteristika inunabhängige GruppenZiehung separater Stichproben aus den unabhängigen Gruppen
Implizite Stratifizierung:Die aus den expliziten Strata gezogenen Stichproben werden ineinzelne Merkmalsklassen unterteilt
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 25 / 60
Methodik
In Deutschland wird die Grundgesamtheit aller Schulen mittels zweierexpliziter und zweier impliziter Stratifizierungsverfahren gezogen:
1 Unterteilung der Schulen in allgemeinbildende Schulen, Förderschulenund Berufsschulen (explizites Stratifizierungsverfahren)
2 Aufteilung der Schulen nach Bundesländern (explizitesStratifizierungsverfahren)
3 Aufteilung der Berufs- und Förderschulen nach Bundesländern(implizites Stratifizierungsverfahren)
4 Aufteilung der Allgemeinbildenden Schulen nach Hauptschulen,Realschulen und Gymnasien (implizites Stratifizierungsverfahren)
→ Aufteilung der Schulen in 18 explizite Strata (16 Bundesländer undBerufs- und Förderschulen)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 26 / 60
Methodik
Ziehung der Stichproben der jeweiligen Strata duch das internationalePISA Konsortium247 in die Stichprobe gezogene SchulenProportionaler Anteil der Schüler in den Stichproben soll approximativjenem in der Grundgesamtheit des Staates entsprechen
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 27 / 60
Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 28 / 60
Methodik
3. Schritt: Ziehung der Schülerstichprobe:
Beschaffung von Informationen der Schüler vor Stichprobenziehung:Vor- und Nachname, Geschlecht, Geburtsdatum, Klassenbezeichnung,möglicher FörderbedarfVerwendung von Pseudonymen, um Datenschutz zu gewährleisten
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 29 / 60
Methodik
Ziehung einer Stichprobe von 25 Schülern pro Schule aus den 247ausgewählten Schulen (allgemeinbildende Schule)Stichprobe von zwei 9. Klassen (allgemeinbildende Schulden), dievollständig in die Stichprobe mit aufgenommen werdenZiehung von 14 Schülern aus den 25 gezogenen, die am TestprogrammCBA teilnehmenVollerhebung bei allen ausgewählten Berufs- und Förderschulen
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 30 / 60
Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 31 / 60
Methodik
Realisierte Stichproben: Unterscheidung zwischen Brutto- undNettostichproben
Bruttostichprobe: Alle für die PISA-Studie 2012 ausgewähltenSchülerNettostichprobe: Alle Schüler, die tatsächlich an der Studieteilgenommen haben
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 32 / 60
Methodik
Bei Nicht-Teilnahme wurden Ersatzschulen bestimmtAusfälle von 17 Schulen
→ 230 Schulen nahmen tatsächlich an der PISA-Studie teil→ Mindestvorgabe der OECD Standards erfüllt→ Teilnehmerquote: Schulen: 98,3%, Schüler: 93,2%
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 33 / 60
Methodik
Gewichtung: Einzelne Ziehungswahrscheinlichkeiten werden durchmehrstufiges Ziehungsverfahren beeinflusst
Unterteilung der Gewichte in:
SchulbasisgewichteSchülerbasisgewichte und Schülergesamtgewicht
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 34 / 60
Methodik
Schulbasisgewicht:
Durch Aufteilung der Sampling-Frames in 18 Strata und die Sortierungder Schulen nach Bundesland haben einige Schulen eine niedrigereWahrscheinlichkeit in die Stichprobe zu gelangen als andereUngleichheit wird durch umgekehrt proportionale Gewichtungausgeglichen
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 35 / 60
Methodik
Schülerbasisgewichte und Schülergesamtgewicht
Ziehungswahrscheinlichkeiten der einzelnen Schüler je nach Größe derSchule unterscheidlichDamit Aussage auf Ebene der Grundgesamtheit möglich, wurde jedemSchüler post hoc die selbe Ziehungswahrscheinlichkeit zugeordnet(umgekehrt proportional)Berechnung des Gesamtgewichts aus einzelnen Schülerbasisgewichten
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 36 / 60
Methodik
Notwendigkeit einer Gewichtung: Verzerrung der Schätzungen sollenvermieden werden→ Korrekturfaktoren
Kompensierung von SchulausfällenGewichtung auf StaatsebeneAusgleich durch Nicht-Teilnahme von SchülernTrimming Factors
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 37 / 60
Methodik
Skalierung von Leistungstests zu Modellierung von Kompetenzen:Konflikt zwischen praktischer Durchführbarkeit und psychosomatischenAnforderungen
Erfassung latenter Eigenschaften in den drei KompetenzbereichenMöglichst große Anzahl an Fragen (Items)begrenzte Testzeit
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 38 / 60
Methodik
Bei Large-Scale-Assessments wird zur Gestaltung solcher Fragebögen einsog. Balanced Incomplete Block Design verwendet.Grundüberegung:
Nicht jeder Schüler erhält alle entwickelten FragenErstellung mehrerer TesthefteUnterschiedliche Auswahl von Aufgabengruppen in den einzelnenTestheften
→ Multi-Matrix-Design
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 39 / 60
Methodik
Das PISA-Multi-Matrix-Design und IRT-Skalierung:Beschreibung der PISA-Items als manifestierte Indikatoren kognitiverKompetenz
Gruppierung der einzelnen Items um einen Aufgabenstamm in denKompetenzbereichen (Testlet oder Unit)Testlets oder Units enthalten Textelemente, Grafiken, Tabellen oderKombinationen hieraus
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 40 / 60
Methodik
Zwischen einer und sieben Items pro UnitInsgesamt 87 Units (=207 Items)Link-Unit: Übernommene Aufgaben aus früheren PISA ErhebungenAusschließliche Verwendung von Link-Units in denKompetenzbereichen Lesen und NaturwissenschaftenÜber 50% der Aufgaben für den Schwerpunkt Mathematik neu erstellt
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 41 / 60
Methodik
Eingesetzte Units und Items
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 42 / 60
Methodik
Aufbau der Testhefte:
Unterteilung der Units für die drei Kompetenzbereiche in 15 ClusterFür den Schwerpunkt Mathematik wurden 9 Cluster erstellt (PM1 -PM5, PM6a+b, PM7a+b)PM6a und PM7a wurde in allen Staaten eingesetzt, die im BereichMathematik in PISA 2009 mindestens 480 Punkte erreichten; PM6bund PM7b in allen anderen Staaten (leichter)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 43 / 60
Methodik
Kompetenzbereiche Lesen und Naturwissenschaften:
Erstellung von 3 Clustern (PR1 - PR3 bzw. PS1 - PS3)Bearbeitungszeit für jedes Cluster ca. 30 Minuten von insgesamt 120Minuten
Insgesamt bei der Haupterhebung 15 Cluster in 13 Standardheften, wobeijedes der Testhefte vier Aufgabengruppen enthielt
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 44 / 60
Methodik
Aufbau der Testhefte
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 45 / 60
Methodik
Vergleichbarkeit der Schülerleistungen untereinander:
Jeder Schüler erhält unterschiedliches Testheft mit unterschiedlichenAufgabenSchwierigkeit der Testhefte weitestgehend gleich, Aufgaben dennochunterschiedlich schwerAnzahl der gelösten Aufgaben kann nicht als Vergleichswertherangezogen werden
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 46 / 60
Methodik
Latente (kontinuierliche) Personenvariable:
Item-Response-Theory (IRT) zur Auswertung der PISA-StudieLatente und individuelle Personeneigenschaften sind anhand desAntwortverhaltens gegebenZusammenhang zwischen Ausprägungen auf der latenten Variable undder beobachtbaren Lösung mittels Rasch-Modellund dessenErweiterung dem Partial-Credit-Modell
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 47 / 60
Methodik
Das Rasch-Modell:
Modellierung der Wahrscheinlichkeit, dass ein Schüler eine Aufgaberichtig beantwortetWahrscheinlichkeit wird durch folgenden Parameter modelliert:Personenparameter: gibt Fähigkeit der getesteten Person anItemparameter: beschreibt den Schwierigkeitsgrad der Aufgabebeschreibt neben den beiden genannten PArametern zusätzlich einepsychologisch plausible, stochastisch probabilisierte Beziehung derbeiden ParameterBeziehung der Parameter fließt als logistische Funktion in das ModelleinGrafische Darstellung mittels Item-Characteristic Curve(ICC)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 48 / 60
Methodik
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 49 / 60
Methodik
Interpretation der Item-Characteristic Curve:
Mit zunehmender positiver Differenz zwischen dem Personenparameterund dem Itemparameter nimmt die Wahrscheinlichkeit der Lösung eineAufgabe oberhalb der 50% Lösungswahrscheinlichkeit zuLösungswahrscheinlichkeit des betreffenden Items ist größer 50%,wenn Personenparameter > Itemparameter
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 50 / 60
Methodik
Formal:σ Itemparameterθ Personenparameterp(X) Lösungswsk.Person vItem i
wobei X ∈ 0, 1
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 51 / 60
Methodik
Wenn Xvi = 0: Es wurde eine falsche Antwort gegebenWenn Xvi = 1: Es wurde eine richtige Antwort gegebenkeine teilweise richtigen Antworten zugelassen
→ Partial-Credit-Modell als Erweiterung des Rasch-Modells
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 52 / 60
Methodik
Das Partial-Credit-Modell:
Mehrstufige Antwortformate zugelassen(richtig / teilweise richtig / falsch)Zerlegung des Itemparameters in einzelne Schwellenwerte
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 53 / 60
Methodik
σ Itemparameter, θ Personenparameter, s Schwellenwerte, σix realisierterSchwellenparameter, σis möglicher Schwellenparameter, p(X) Lösungswsk.,Person v, Item i, m + 1 mögliche Kategorien
wobei x ∈ 0, 1, ...,m
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 54 / 60
Methodik
Methoden zur Parameterschätzung
3 Verfahren zur5 ParameterschätzungStützung auf die Likelihood der Daten (wie gut passen bestimmteWerte der Parameter zu den Daten?)Ziel: Bestmögliche Erklärung der empirisch beobachteten Daten
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 55 / 60
Methodik
Methoden zur Parameterschätzung
JML (Joint-Maximum-Likelihood-Schätzung)CML (Conditional-Maximum-Likelihood-Schätzung)MML (Marginal-Maximum-Likelihood-Schätzung)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 56 / 60
Methodik
Methoden zur ParameterschätzungJML- Methode:
σ und θ werden gleichzeitig bestimmtAufstellen und Nullsetzen der Likelihood um Maximum zu bestimmenMehrere unbekannte Größen → Iterative LösungSchätzung des Itemparameters in der Praxis genauer als Schätzungdes PersonenparametersProblematik: zusätzliche Person in der Stcihprobe → zusätzlicher zuschätzender Parameter
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 57 / 60
Methodik
Methoden zur ParameterschätzungCML-Methode:
Parameter werden in zwei Schritten getrennt geschätztZuerst Schätzung des Itemparameter, auf dessen Basis dannSchätzung des Personenparameterskonsistente und unverzerrte Item- & Parameterschätzung möglichkeine a-priori-Annahmen über die Verteilung der latentenPersonenvariable→ Verwendung dieses Designs, wenn sämtliche Personen in derStichprobe dieselbe Auswahl an Items bearbeiten→ Schätzung über Scoregruppe (Anzahl gelöster Items)
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 58 / 60
Methodik
Methoden zur ParameterschätzungMML-Methode:
Parameterschätzung über Normalverteilungsannahme mit Mittelwertund Streuunggetrennte Schätzung der Parameter um unverzerrte Schätzwerte zuerhaltenPersonenparameter werden über die Verteilungsannahmeherauskonditioniert→ Populationsmodell→ komplexere Modelle
Vorteil: Stabile Schätzung, da die Anzahl der geschätzten Parameter nichtso extrem ansteigt
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 59 / 60
Vielen Dankfür Ihre
Aufmerksamkeit!
Jenny Steindl (LMU München, Institut für Statistik) PISA-Studie 22.05.2015 60 / 60