DAS EVALUIEREN WIR MAL EBEN - degeval.org · Experiment und Quasi-Experiment im Feld. In J.-L....

Begrenzungen / Voraussetzungen (quasi-)experimentalgesteuerter Evaluationen

21. Jahrestagung der DeGEval in Dresden

Jutta Wolff, 14. September 2018

DAS EVALUIEREN WIR MAL EBEN

Bild: Jutta Wolff

ÜBERBLICK

Auslöser: Evaluation Fortbildungsprogramm

(Quasi)-Experiment und zentrale Schwierigkeiten

Checkliste… ein erster Versuch

Diskussion

1 AUSLÖSER: EVALUATION FORTBILDUNGSPROGRAMM

FORTBILDUNGSPROGAMM SCHULE / LEHRKRÄFTE • großes Programm („Individualisierter Unterricht“), teuer, hohe Reichweite • langfristig angelegt; standardisierte Durchführung der Werkstätten

FORTBILDUNGSPROGAMM SCHULE / LEHRKRÄFTE Wirken die Didaktischen Werkstätten? Lassen sich Zuwächse der Kenntnisse und der unterrichtlichen Umsetzung feststellen – und kausal auf die Intervention zurückführen?

Vergleichsgruppe

2 (QUASI-)EXPERIMENT: ZENTRALE SCHWIERIGKEITEN

WIRKSAMKEITSNACHWEIS PER EXPERIMENT Zur Erinnerung: Grundprinzip Vergleich; verschiedenste Designvarianten

Zuordnung zu Gruppen per Zufall

Vortest

Programm Nachtest

Versuchsgruppe

Vergleichsgruppe

RANDOMISIERUNG …oftmals nicht möglich: Intervention „vorenthalten“ vs. „zwangsbeglücken“???

Suche nach möglichst äquivalenter Vergleichsgruppe • Wartegruppe • Matching

ABER: • Welche Merkmale beeinflussen die abhängige Variable? Welche sollen bei

Gruppenvergleich kontrolliert, bei Matching berücksichtigt werden? THEORIE FEHLT i.d.R.

• Voraussetzung experimentelles Design: Programmstabilität • Programmstabilität ist im pädagogischen Kontext fast unmöglich

( „hard-to-do-science“ (Berliner 2002) • lokaler Kontext bestimmt Ausführung (power of context)

• Vielzahl von Interaktionen führen zu verschiedenen Verläufen (ubiquity of interactions)

unvermeidbar Voraussetzung für Wirkung

Störfaktor für Wirksamkeitsnachweise

Externe Validität Generalisierbarkeit

Interne Validität Nachweis Kausalität

PROGRAMM: Was wirkt?

Berliner, D. C. (2002). Educational Research: The Hardest science of All. Educational Researcher, 31 (8), S. 18–20. Kelle, U. (2006). Qualitative Evaluationsforschung und das Kausalitätsparadigma. In U. Flick (Hrsg.), Qualitative Evaluationsforschung. Konzepte Methoden Umsetzungen (Rowohlts Enzyklopädie, Orig.-Ausg, S. 117–134). Reinbek bei Hamburg: Rowohlt-Taschenbuch-Verlag.

Programmvariabilität

MESSUNG Generell: Wie lassen sich Wirkungen messen? • Empirische Erfassung der zu messende Variable möglich? Theorie notwendig… • Welches Messinstrument?

Vorhandenes Instrument: ressourcenschonend; bildet AV evtl. nicht ab Neukonstruktion: Abbildung der AV; aufwendig; Vorkenntnisse

• Ist das theoretisch gewünschte Messinstrument praktikabel (z.B. Akzeptanz…)?

Experimentelles Design: • Mehrere Messzeitpunkte (z.B. sechs bei Prä-Post-Follow-up mit

Vergleichsgruppen hoher Aufwand, falls Daten nicht ohnehin anfallen

Frey, S. & Frenz, H.-G. (1982). Experiment und Quasi-Experiment im Feld. In J.-L. Patry (Hrsg.), Feldforschung. Methoden und Probleme sozialwissenschaftlicher Forschung unter natürlichen Bedingungen (S. 229–258). Bern: H. Huber.

3 CHECKLISTE… EIN ERSTER VERSUCH

IDEE: CHECKLISTE … … im Dienste der Qualitätsentwicklung von Evaluationen „Wenn Checklisten sorgfältig entwickelt und auf Gültigkeit geprüft sowie tatsächlich angewendet werden, sind sie wertvolle Evaluationswerkzeuge“. (D. Stufflebeam)

Evaluations-Checklisten … • helfen, alle wichtigen Kriterien zu bedenken • sind nützlich bei der Planung, Überwachung und Umsetzung einer Evaluation • bestehen aus Checkpunkt, Definition und Begründung • werden von Experten erstellt und evaluiert (Rückmeldungen) sowie überarbeitet

Stufflebeam, D. L. (2000): Richtlinien zur Entwicklung von Evaluations-Checklisten: Die CHECKLISTE ZUR ENTWICKLUNG VON CHECK-LISTEN (CEC). Verfügbar unter: http://www.univation.org/download/01checkliste_entwicklungcl.pdf [Zugriff 30.08.2018]

CHECKLISTE zur Entscheidungsfindung bei quasi-experimentellem Design

Das Programm…

beinhaltet beschriebene Kernelemente, deren Wirkungsweise expliziert ist (Wirkmodell).

ist schriftlich fixiert und „ausgereift“ so dass es von verschiedenen Personen ähnlich durchgeführt wird (Programmstabilität).

ist möglichst „immun“ gegen (wechselnde) äußere Rahmenbedingungen.

ist so umfangreich, dass nennenswerte Wirkungen erwartbar sind (Umfang).

ist so teuer, dass eine Wirkungsanalyse bedeutsam ist (Ressourcen).

betrifft viele Menschen und ist langfristig vorgesehen (Reichweite).

CHECKLISTE zur Entscheidungsfindung bei (quasi)-experimentellem Design

Die Evaluation…

kann rechtzeitig beginnen (Erhebung Ausgangslage).

ist so langfristig angelegt, dass Wirkungen in dem Zeitraum eingetreten sein können.

verfügt über ausreichende Ressourcen (Zeit, Geld; TEUER!).

kann auf ein zuverlässiges Messinstrument zur Wirkungsmessung zugreifen (oder Ressourcen zur Eigenentwicklung).

wird durch datenschutzrechtliche Bestimmungen hinsichtlich des zu erwartenden Erkenntnisgewinns nicht übermäßig eingeschränkt.

4 DISKUSSION

DISKUSSION

• Erscheint eine solche Checkliste grundsätzlich sinnvoll?

• Wenn ja: Wie könnte es weiter gehen? Gemeinsam statt allein…

Wolff, J. (2016). Das evaluieren wir (mal eben). Was Auftraggebende über Wirksamkeitsnachweise wissen sollten. Die Deutsche Schule, 108 (2), 136-148.

E-Mail: Jutta.Wolff@ifbq.hamburg.de

VIELEN DANK!

DAS EVALUIEREN WIR MAL EBEN - degeval.org · Experiment und Quasi-Experiment im Feld. In J.-L....

Documents

Ein moralisches Gedanken-Experiment

A09 Millikan-Experiment

PHENIX experiment @ RHIC, BNL · 2016-08-30 · PHENIX experiment @ RHIC, BNL RHIC (상대론적중이온가속기) 미국뉴욕주브룩해븐국립연구소(BNL)에위치한대형입자가속기로서,

Demographische Standards - GESIS · Demographische Standards Eine gemeinsame Empfehlung des Arbeitskreises Deutscher Marktforschungsinstitute (ADM), der Arbeitsgemeinschaft Sozialwissenschaftlicher

LHCb - Experiment

Das psychologische Experiment · amj AP ws10/11 1 Das psychologische Experiment Problem / Fragestellung / Hypothese Methode Interpretation / Ausblick Befunde / Auswertung Das Experiment

Kinder- und Jugendarmut Feldforschung an Studenten zum Thema Armut Referentinnen: Julia Rollheiser und Anika Gumtz

Das Oranur Experiment II

Soziale Feldforschung an der University For Development Studies

Inclusive Societies Soziale Integration im Spiegel sozialwissenschaftlicher Forschung in der Schweiz Pasqualina Perrig-Chiello

Vorlesung Statistik I Grundlagen sozialwissenschaftlicher Datenanalyse (B.MZS.11: Statistik I) LE 6: Streuungsmaße und weitere Kenngrößen LE 7: Lineartransformationen

Das BELLE Experiment: Resultate und Zukunftsperspektiven ÖPG-Fakt G.Leder 28.September 2005 Das BELLE Experiment Das Experiment B-Physik : Ausgewählte

methodologiesowi - Grundlagen sozialwissenschaftlicher ... · Die Methode der Erklärung[5] dient der Überprüfung von Hypothesen über Ursache- Wirkungs- Relationen, sie ermöglicht

Forschungsdatenmanagement sozialwissenschaftlicher ... · 98 Evelyn Brislinger und Meinhard Moschner und Behandlung von Datenfehlern (Kapitel 6.4), als Kernaufgaben der Datenaufbereitung,

9. Experiment 3 - GWDG

Willkommen zum Experiment

VIRGO experiment Gravitational waves detector

HERSTELLUNG VON PRIZM - press.oakley.compress.oakley.com/prizm/downloads/Oakley_PRIZM-How_Its_Made-GERMAN.pdf · schritt 01 feldforschung in diesem schritt werden mithilfe der von

Feldforschung Im Praktikum

B.Sc. Volkswirtschaftslehre sozialwissenschaftlicher RichtungUniversität zu Köln -1 B.Sc. Volkswirtschaftslehre sozialwissenschaftlicher Richtung Studienstart Wintersemester 2016/17