26
121 Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 Empirische Sonderpädagogik, 2011, Nr. 2, S. 121-146 Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1: Inventar zur Erfassung der Lesekompetenz von Erstklässlern Kirsten Diehl, Bodo Hartke Institut für Sonderpädagogische Entwicklungsförderung und Rehabilitation, Universität Rostock Eine sich zunehmend auf Prävention und Integration hin entwickelnde (Sonder-)Pädagogik benötigt Messverfahren, die fehlende Lernvoraussetzungen und im Lernprozess entstehende Lernlücken früh- zeitig erfassen. Gelingt es zudem mittels eines Messverfahrens Einblick in den Lernverlauf zu be- kommen, erhalten Lehrkräfte Informationen zu Lernfortschritten, stagnierenden oder ggf. auch rück- läufigen Leistungsentwicklungen. Solche Daten sind eine gute Grundlage für einen adaptiven Unter- richt und eine passende Förderung. Das Inventar zur Erfassung der Lesekompetenzen von Erstkläss- lern (IEL-1) wurde als pädagogisches Instrumentarium zur Leistungserfassung über drei Messzeit- punkte entwickelt. Sollte sich das Inventar als objektiv, reliabel und valide sowie geeignet für die Do- kumentation von Lernfortschritten erweisen, liegt ein schulalltagstaugliches Verfahren zur formati- ven Evaluation des Erstleseunterrichts und präventiver Förderung innerhalb des Schriftspracher- werbs vor. Im vorliegenden Beitrag werden die Konzeption des IEL-1, das Design der Überprüfungs- studie mit N = 1649 Erstklässlern und Ergebnisse zur Güte des Verfahrens vorgestellt. Schlüsselwörter: Lesekompetenz, Lernverlaufsdiagnostik, niederländisches Leerlingsonder- wijsvolgsysteem, Überwachung der Lernentwicklung, Dokumentation von Lernfortschritt, formative Bewertungssysteme, RTI (response-to-intervention) Reliability and Validity of the Formative Evaluation System IEL-1: Inventary for the Assesment of the Reading Proficiency of First Graders Developing more and more towards prevention and integration, education needs innovative me- thods of measurement to recognize missing learning prerequisites and learning gaps which occur- red in the process of learning at an early stage. If a measurement method could provide insight in- to the learning process, teachers could get feedback on advancements, stagnations or even regres- sive learning developments. Such data are a valid foundation for an adaptive teaching and advance- ment. The inventory for measuring the reading competence of first grade children (IEL-1) was deve- loped as a pedagogic instrument for the facility recording over three measurement moments. Should the developed and verified inventory prove objective, reliable and valid as well as appropria- te to show learning advancements, then it is a procedure for the formative evaluation of learning processes for successful preventive actions in the process of learning to read and write that is suit- able for everyday school life. This paper presents the concept of the IEL-1, the design of the valida- tion-study with N=1649 first grade children and results concerning the quality of the procedure. Key words: reading competence, curriculum-based measurement, Dutch Leerlingsonderwijsvolgsys- teem, student monitoring progress, documentation of learning progress, formative evaluation sys- tem, RTI (response-to-intervention)

Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

121Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

Empirische Sonderpädagogik, 2011, Nr. 2, S. 121-146

Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1: Inventar zur Erfassung derLesekompetenz von ErstklässlernKirsten Diehl, Bodo Hartke

Institut für Sonderpädagogische Entwicklungsförderung und Rehabilitation, Universität

Rostock

Eine sich zunehmend auf Prävention und Integration hin entwickelnde (Sonder-)Pädagogik benötigtMessverfahren, die fehlende Lernvoraussetzungen und im Lernprozess entstehende Lernlücken früh-zeitig erfassen. Gelingt es zudem mittels eines Messverfahrens Einblick in den Lernverlauf zu be-kommen, erhalten Lehrkräfte Informationen zu Lernfortschritten, stagnierenden oder ggf. auch rück-läufigen Leistungsentwicklungen. Solche Daten sind eine gute Grundlage für einen adaptiven Unter-richt und eine passende Förderung. Das Inventar zur Erfassung der Lesekompetenzen von Erstkläss-lern (IEL-1) wurde als pädagogisches Instrumentarium zur Leistungserfassung über drei Messzeit-punkte entwickelt. Sollte sich das Inventar als objektiv, reliabel und valide sowie geeignet für die Do-kumentation von Lernfortschritten erweisen, liegt ein schulalltagstaugliches Verfahren zur formati-ven Evaluation des Erstleseunterrichts und präventiver Förderung innerhalb des Schriftspracher-werbs vor. Im vorliegenden Beitrag werden die Konzeption des IEL-1, das Design der Überprüfungs-studie mit N = 1649 Erstklässlern und Ergebnisse zur Güte des Verfahrens vorgestellt.

Schlüsselwörter: Lesekompetenz, Lernverlaufsdiagnostik, niederländisches Leerlingsonder-wijsvolgsysteem, Überwachung der Lernentwicklung, Dokumentation von Lernfortschritt, formativeBewertungssysteme, RTI (response-to-intervention)

Reliability and Validity of the Formative Evaluation System IEL-1: Inventary for the Assesment ofthe Reading Proficiency of First Graders

Developing more and more towards prevention and integration, education needs innovative me-thods of measurement to recognize missing learning prerequisites and learning gaps which occur-red in the process of learning at an early stage. If a measurement method could provide insight in-to the learning process, teachers could get feedback on advancements, stagnations or even regres-sive learning developments. Such data are a valid foundation for an adaptive teaching and advance-ment. The inventory for measuring the reading competence of first grade children (IEL-1) was deve-loped as a pedagogic instrument for the facility recording over three measurement moments.Should the developed and verified inventory prove objective, reliable and valid as well as appropria-te to show learning advancements, then it is a procedure for the formative evaluation of learningprocesses for successful preventive actions in the process of learning to read and write that is suit-able for everyday school life. This paper presents the concept of the IEL-1, the design of the valida-tion-study with N=1649 first grade children and results concerning the quality of the procedure.

Key words: reading competence, curriculum-based measurement, Dutch Leerlingsonderwijsvolgsys-teem, student monitoring progress, documentation of learning progress, formative evaluation sys-tem, RTI (response-to-intervention)

Page 2: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Forschungsstand

Die Entwicklung und die Anwendung vonformativen Messverfahren sind in den USAgegenwärtig hoch aktuelle Themen. Sowohlin der Praxis als auch in der Forschung fokus-siert dieser Trend insbesondere auf den Be-reich Lesen (Bamonto Graney & Shinn, 2005;Deno, 2003a,b; Fuchs, 2004; Fuchs, Fuchs, &Compton, 2004; Fuchs & Fuchs, 2005; Haa-ger, Klingner & Vaughn, 2007; Stecker &Fuchs, 2000). Ein wesentlicher Teil der hierzuin den USA verfassten Studien zentriert sichum die Frage, ob ein formatives Evaluations-system zur Verbesserung der Wirksamkeitpädagogischen Handelns bei Schülern mitLernstörungen führt (Deno, 2003a). Scrivenprägte (1972) den Begriff „formative Evalua-tion“. Bereits vor über 35 Jahren setzte ersich mit den verschiedenen Möglichkeitender Einschätzung von pädagogischen Prozes-sen auseinander und führte unter anderemdie Begriffe „formative“ und „summative“Evaluation ein. Bei der Beschreibung der Be-griffe bezieht er sich auf eine Unterschei-dung von Cronbach: „Evaluation, used to im-prove the course while it is still fluid, contri-butes more to improvement of educationthan evaluation used to appraise a product al-ready placed on the market“ (Cronbach zit.n. Scriven, 1972, S.43). Bezogen auf dieseUnterscheidung nennt Scriven als ein charak-teristisches Merkmal formativer Evaluation,dass während eines Entwicklungsprozesseseine laufende Überprüfung dieses Prozessesstattfindet, welche wiederum Einfluss auf dieweitere Gestaltung des Prozesses habe. Un-ter summativer Evaluation versteht Scriven ei-ne abschließende Wertung der Ergebnisse ei-nes Prozesses (ebd.). Übertragen auf denLernprozess von Kindern bedeutet dieses,dass bei der formativen Evaluation nicht dasEndergebnis des Lernens abgeprüft wird, son-dern der Lernprozess im Sinne des „respon-se-to-intervention“ bzw. „response-to-instruc-tion“-Paradigmas (RTI) kontinuierlich beob-achtet und ausgewertet wird. Im Unterschied

122 K. Diehl, B. Hartke

zur summativen wird bei der formativen Eva-luation „der LehrLernprozess in der Schuleals von den Unterrichts- und Förderergebnis-sen abhängiger datenbasierter Problemlöse-prozess verstanden“ (Walter, 2008a, S. 206).Es wird dementsprechend nicht nur der aktu-elle Lernstand erfasst, sondern der Lernver-lauf über einen längeren Zeitraum dokumen-tiert und evaluiert. In diesem Sinne sprecheneinige Autoren anstelle von Lernprozessdiag-nostik auch von Lernverlaufsdiagnostik(Strathmann & Klauer, 2008). Formative Be-wertungssysteme dienen der Beantwortungder Fragen: Was hat der Schüler unter demEinfluss des gegenwärtigen Unterrichts undvon aktuell praktizierten Fördermaßnahmenbereits gelernt? Wo hat er noch Schwierigkei-ten? Formative Bewertungssysteme werdenparallel zum Lernprozess, also wiederholtdurchgeführt. Sie sind Grundlage für Feed-backs, spezifische Fördermaßnahmen unddie Verbesserung von Unterricht. Im Ver-gleich dazu unterstützen summative Bewer-tungssysteme dabei, vorhandenes Wissenbeim Schüler zu ermitteln und dessen Leis-tung fair und präzise zu beurteilen. Sie kom-men am Ende eines Lernprozesses zum Tra-gen und unterstützen die Zensurengebungsowie Selektions- und Platzierungsentschei-dungen. Formative Bewertungen können denLernerfolg noch beeinflussen, summative Be-wertungen stellen ihn im Nachhinein fest(Stern, 2004).

Formative Bewertungssysteme sind einwesentlicher Baustein innerhalb des Respon-se-to-Intervention-Konzepts. Als ein aus For-schungsbemühungen in den USA resultieren-des Rahmenkonzept integriert das Response-to-Intervention-Konzept formative Messver-fahren und spezifische Interventionen inner-halb eines Mehrebenenpräventionssystems.Dieses zielt darauf ab, Schulleistungen zuverbessern und Schwierigkeiten im Verhaltender Kinder zu mindern. Untersuchungen(Compton, Fuchs, Fuchs & Bryant, 2006;Smith, Pepler & Rigby, 2004) haben gezeigt,dass selbst Kinder mit massiven Lernstörun-

Page 3: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

gen von diesem gestuften System der Förde-rung profitieren. Mit dem RTI-Konzept wer-den den Schulen in den USA Informationenund Materialempfehlungen zu folgendenSchwerpunkten offeriert:1. Identifikation von Kinder mit einem erhöh-

ten Risiko für die Entwicklung von Schwie-rigkeiten im Lernen,

2. Überwachung des Lernfortschritts derSchüler (monitor student progress),

3. evidenzbasierte Interventionen (welcheVerfahren in welcher Intensität?),

4. Identifikation von Kindern mit einer Lern-behinderung oder anderen Beeinträchti-gungen (National Center of Response toIntervention, 2010).

Handlungsleitend bei der Entwicklungdes hier vorgestellten Inventars zur Erfassungder Lesekompetenzen von Erstklässlern (IEL-1) waren Erkenntnisse, die sich auf die Be-deutung der Identifikation von Kindern miteinem erhöhten Risiko für die Entwicklungvon Schwierigkeiten im Lernen und die Über-wachung des Lernfortschritts der Schüler(monitor student progress) innerhalb des RTI-Konzeptes beziehen (Diehl & Hartke, 2007).

In den USA wird zur Überwachung desLernfortschritts insbesondere auf curriculum-basierte Kurztests, so genannte CBMs (curri-culum-based measurement) zurückgegriffen,die in relativ kurzen Abständen eingesetztwerden (vierwöchig, wöchentlich oder teil-weise mehrmals die Woche). Curriculum-

based hebt darauf ab, dass es in den Verfah-ren um schulische, lehrplanorientierte Aspek-te der Entwicklung von Kindern geht. Die In-halte der Messungen sind dem Unterrichts-material entnommen und beziehen sich aufschulisch vermittelte Fertigkeiten, Wissens-systeme und Kompetenzen. Erste CBMs wur-den innerhalb eines Forschungsprogrammsan der Universität Minnesota (Deno, 1985)entwickelt. Ziel des Forschungsprogrammswar es, ein praktikables, leicht durchführba-res und wirkungsvolles formatives Bewer-tungssystem als Grundlage für Entscheidun-

123Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

gen zur besseren Abstimmung des Unter-richts auf Bedürfnisse der Kinder zu entwi-ckeln. Neben CBMs werden in den Schulenin den USA vielfältige curriculumbasierte di-agnostische Verfahren verwendet, die wie-derholt eingesetzt werden, um Einblicke inLernverläufe zu erzielen. Sie werden als curri-culum based assessment (CBA) bezeichnetund dienen ebenfalls der Adaption von Un-terricht und Förderung an die Lernausgangs-lage der Schüler. Auch in den Niederlandenwird an den Schulen bereits seit mehrerenJahren kontinuierlich der Lernverlauf derSchüler mit Hilfe eines Monitoringsystems,dem Leerlingonderwijsvolgsysteem (LOVS),erfasst und dokumentiert. Wesentlicher Un-terschied zu den US-amerikanischen CBMsist die Anzahl der Messungen, die sich in derRegel auf zwei Messungen pro Jahr be-schränken, und der zeitliche Aufwand derDurchführung. Während die CBMs durch-schnittlich ein bis drei Minuten in der Durch-führung beanspruchen, dauern die niederlän-dischen Verfahren bis zu zwei Schulstunden.Das LOVS zielt darauf ab, die Lernverläufebei der Aneignung komplexer Lerninhalteüber mehrere Schuljahre abzubilden. Im Ge-gensatz dazu zielen CBMs auf zeitnahe Ab-bildungen von Lernverläufen bezogen aufeinzelne Fähigkeiten oder auch umfassendeKompetenzen ab (Diehl & Hartke, 2007). Imdeutschsprachigen Raum finden sich seit ge-raumer Zeit Veröffentlichungen über Lernver-laufsdiagnostik im Kontext formativer Bewer-tungssysteme (Diehl & Hartke, 2007; Hart-mann, 2008; Klauer, 2006; Strathmann, Klau-er & Greisbach, 2010; Strathmann & Klauer,2010; Walter, 2008a,b; Walter, 2009a,b). Ers-te Forschungsergebnisse zur Güte von CBMsim deutschsprachigen Raum bestätigen, wasdie US-amerikanische Forschung seit mehrals 20 Jahren zeigt: Die Entwicklung vonCBMs ist außerordentlich aufwendig, willman den hohen Standards, die mit diesenVerfahren verbunden sind, gerecht werden.

Mit den beiden hier kurz skizzierten Mo-nitoringverfahren, den CBMs bzw. CBAs und

Page 4: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

dem LOVS wurden Möglichkeiten von Lern-verlaufsdiagnostik beschrieben, die mehroder minder zeitnah Veränderungen im Lern-verlauf aufzeigen können. Abhängig von derMethode der Aufgabengestaltung und Ziel-stellung der Verfahren zur Lernverlaufsdiag-nostik können Lücken in der Entwicklung vonWissen und Fertigkeiten aufgezeigt werden.Forschungsergebnisse aus den USA (Fuchs &Fuchs, 1986) und Praxiserfahrungen in denNiederlanden sprechen dafür, derartige Ver-fahren auch für den deutschsprachigen Raumzu entwickeln. Gerade in Hinblick auf denAnfangsunterricht in Deutsch und Mathema-tik besteht ein deutlicher Handlungsbedarf.Studien konnten aufzeigen, dass sich insbe-sondere frühe Lernlücken gravierend auf denweiteren Lernerfolg in höheren Klassenstufenauswirken (Balzer, Fritz, Ricken & Jäger,2007; Grube & Hasselhorn, 2006; MoserOpitz, 2007). Das IEL-1 wurde mit dem An-spruch entwickelt, eine präzise Beschreibungdes Lesestands von Erstklässlern im Lesen zudrei Messzeitpunkten (Schuljahresmitte, Mit-te zweites Halbjahr, Schuljahresende) zu er-möglichen. Die Messwiederholungen solleneinen Einblick in die Leistungsentwicklungbieten und bei ausbleibenden LernerfolgenVeränderungen innerhalb der Förderung an-regen.

Das Inventar zur Erfassung derLesekompetenzen (IEL-1)Mit dem IEL-1 soll ein Spektrum an Lesefähig-keiten erfasst werden, wie es zum Ende desSchuljahres von Erstklässlern erwartet wer-den kann. Die wiederholten Messungen er-möglichen es, den Lernstand einzelner Lese-fähigkeiten und genereller Lesekompetenzzum entsprechenden Messzeitpunkt zu be-schreiben und ggf. Lernlücken aufzudecken.Diese Zielstellung erfordert ein dem Verfah-ren zugrunde gelegtes Modell des Schrift-spracherwerbs sowie eine hohe Reliabilitätund Validität der Messungen. Das Inventar

124 K. Diehl, B. Hartke

soll zum einen prüfen, ob aktuell in der Schu-le vermitteltes Wissen tatsächlich erworbenwurde. Zum anderen werden innerhalb desVerfahrens curriculare Inhalte der gesamtenersten Klassenstufe berücksichtigt, um denStand der Aneignung der in der Klassenstufegeforderten Kenntnisse und Fertigkeiten zuerfassen.

Die sieben Aufgabenbereiche des Inven-tars (Gruppentest s. Tabelle 1) und derenItems (insgesamt 135) basieren auf einerAnalyse gängiger Fibeln und Arbeitsmateria-lien sowie des pädagogisch-didaktischen undentwicklungs- und kognitionspsychologi-schen Wissensstandes zur Entwicklung derLesefähigkeiten (Büttner, 2003a,b; Dehn &Sjölin, 1996; Groeben & Hurrelmann, 2006;Meiers, 1996; Klicpera & Gasteiger-Klicpera,1995; Scheerer-Neumann, 1995). Der Zu-satztest Eine-Minute-Lese-Aufgabe enthält 60Wörter. Mit dieser zusätzlichen Eine-Minute-

Lese-Aufgabe (Einzeltest) wird erfasst, wie vie-le Wörter ein Kind innerhalb einer Minutelaut und korrekt vorlesen kann. Die Ergebnis-se lauten Vorlesens unter Zeit, wie in der Ei-

ne-Minute-Lese-Aufgabe, korrelieren erfah-rungsgemäß hoch mit den Ergebnissen kom-plexerer Lesetestungen (Deno, 2003a; Fuchs,2004). Deshalb eignet sich die Eine-Minute-

Lese-Aufgabe, wenn entsprechende Normenvorliegen, als wenig zeitaufwendiges Scree-ningverfahren zur Identifikation schwacherLeser. Liegen die Leseleistungen eines Kindesin der Eine-Minute-Lese-Aufgabe im unterenQuartil, ist dies ein Hinweis darauf, dass eineumfassendere und differenziertere Diagnos-tik des Lesestandes mit den sieben Subtestsdes IEL-1 angezeigt ist.

Aufgabenbereich 1(A): Buchstaben-Laut-Zuordnungen

Untersuchungen im Bereich von Präventionund Frühförderung im Schriftspracherwerb(zusammenfassend Walter, 2001) zeigen diezentrale Rolle des Konzepts der phonologi-

Page 5: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

schen Bewusstheit. Es konnte gezeigt wer-den, dass leseschwache Schüler besondersbei Aufgaben auffällig sind, die eine Analyseund/oder Synthese des Lautstroms gespro-chener Sprache erfordern. Auch wenn einigewenige schrifterfahrene Kinder diese Leis-tung schon vor dem Beginn des bewusstenSchriftspracherwerbs zeigen, differenziertsich die Fähigkeit der phonologischen Be-wusstheit mit der Einführung der Buchstaben-Laut-Zuordnungen aus.

Aufgabenbereich II (B): Wörter in Silben segmentieren (Analyse)

Im Aufgabenbereich II wird erfasst, inwieweitdie Schüler Wörter in ihre einzelnen Silbensegmentieren können. Bereits Vorschulkindersind in der Lage, Wörter in ihre Silben zu zer-legen und zeigen somit eine Fähigkeit derphonologischen Bewusstheit im weiterenSinn. Als prosodische Einheit (Betonungsmus-ter) ist ihnen die Silbe vertraut und kann ent-sprechend erkannt werden. Die Schwierig-keit bei diesem Aufgabenbereich besteht da-rin, dass die Schüler die Silben des Wortes

125Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

durch Silbenbögen genau kennzeichnenmüssen. Das setzt voraus, dass sie die Bin-nenstrukturen der Silben kennen. Als Lese-strategie innerhalb der alphabetischen Phaseerhöht das gekonnte silbenweise Lesen dieLesegeschwindigkeit.

Aufgabenbereich III (C): Silben zu Wörtern verbinden

Bei diesem Aufgabenbereich wird erfasst, in-wieweit die Schüler in vier unterschiedlichenAufgabengruppen Silben zu Wörtern verbin-den können. Der Schwierigkeitsgrad steigtvon einer zur nächsten Aufgabengruppe. DasSegmentieren oberhalb der Buchstabenebe-ne und unterhalb der Wortebene ist eine Le-sestrategie, die es den Schülern ermöglicht,die Lesegeschwindigkeit zu erhöhen. Studien(Scheerer-Neumann, 1981; Walter, 1996)zeigen, dass gute Leser im Gegensatz zuschwächeren Lesern Gliederungsmöglichkei-ten oberhalb der Buchstabenebene und un-terhalb der Wortebene von sich aus beim Le-sen nutzen. Leseschwache Kinder sind weni-ger gut in der Lage, die Binnenstruktur der Sil-be zu erkennen. Das wiederum hindert sie,

Tab. 1: Aufgabenbereiche/Subtests des IEL-1

Aufgabenbereich(I-VII)

Subtest(A-G)

Anzahl der Items

I Buchstaben-Laut-Zuordnungen (A) 43

II Wörter in Silben segmentieren (B) 25

III Silben zu Wörtern verbinden (C) 19

IV Wortebene: Buchstaben analysieren und synthetisieren (D)

21

V Wörter lesen und schreiben (E) 13

VI Satzlesen (sinnverstehend) (F) 9

VII Textlesen (sinnverstehend) (G) 5

Zusatztest Eine-Minute-Lesen (Lesegeschwindigkeit und -genauigkeit)

60

Page 6: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

die Einheit der Silbe leseunterstützend zunutzen. Sie wählen die vermeintlich einfache-re Strategie innerhalb der alphabetischenPhase, indem sie die Buchstaben eines Wor-tes in Laute umsetzen und diese sukzessiveaneinanderreihen.

Aufgabenbereich IV (D): Buchstaben zu Wörtern verbinden

Der Aufgabenbereich IV beinhaltet zwei Auf-gabengruppen. Bei Aufgabengruppe 1 (Setzedie fehlenden Buchstaben ein!) gilt es, zu vor-gegebenen Wörtern mit Bildunterstützunglautgetreu die fehlenden Grapheme einzuset-zen. Gesucht sind einfache Konsonanten undDiphthonge sowie schwierigere Buchstabenbzw. Buchstabenverbindungen wie <x>, <Z>und <Qu> an unterschiedlichen Positionenim Wort. Die Aufgabe gilt als korrekt gelöst,wenn die Schüler die fehlenden Laute lautge-treu bestimmen (für <Qu> kann <Kw> oderfür <x> auch <ks> eingesetzt werden). Aufga-bengruppe 2 (Setze die fehlenden Buchsta-ben ein!) unterscheidet sich dahingehend,dass die Wörter nicht bildlich dargebotenund somit nur durch korrektes phonologi-sches Rekodieren zu identifizieren sind. Beiden Wörtern <Banane> und <Telefon> sindzwei Grapheme einzutragen, allerdings han-delt es sich jeweils um das gleiche (<e> bei<T _ l _ f o n>; <a> bei <B _ n _ n e>). Mit die-sen Aufgaben wird erfasst, inwieweit dieSchüler die Buchstaben-Laut-Zuordnungen,das Durchgliedern von Wörtern und das Er-kennen von Buchstabenclustern, wie z. B.Signalgruppen, beherrschen.

Aufgabenbereich V (E): Wörter lesen und schreiben

Im Aufgabenbereich V wird in unterschiedli-chen Aufgabengruppen das sinnverstehendeLesen auf Wortebene erfasst. Aufgabenbe-reich V Wörter lesen, schreiben und identifi-

126 K. Diehl, B. Hartke

zieren beinhaltet drei Aufgabengruppen aufWortebene. In der Aufgabengruppe 1 (Ver-binde das Bild mit dem richtigen Wort!) müs-sen die Kinder anfänglich einfach strukturier-te Wörter entsprechenden Bildern zuordnen.Auch die später komplexeren Wörter (viersil-big, Konsonantenhäufung am Wortanfang)innerhalb dieser Aufgabengruppe ähnelnsich am Wortanfang und zwingen somit dieSchüler, die Wörter über die ersten Buchsta-ben hinaus zu lesen. Aufgabengruppe 2(Schreibe die Wörter!) prüft, ob die Schülerzu einem vorgegebenen Bild das passendeWort schreiben können. Die Ergebnisse las-sen eine quantitative und qualitative Analysezu. Eine qualitative Analyse ließe auf derGrundlage des Kompetenzentwicklungsmo-dells von Klicpera et al. (2003) Rückschlüsseauf die bevorzugte Lese- und Schreibstrategiezu. Die quantitative Analyse zeigt auf, wieviele Buchstaben die Schüler richtig verschrif-tet haben. Bis auf die letzten zwei Items han-delt es sich um lautgetreu zu schreibendeWörter. Mit der Aufgabengruppe 3 (WelcheWörter findest du? Kreise die Wörter ein!)soll erfasst werden, inwieweit die Schüler inder Lage sind, einfache und komplexe Wör-ter simultan zu erfassen.

Aufgabenbereich VI (F): Satzlesen (sinnverstehend)

Im Aufgabenbereich VI wird erfasst, inwie-weit die Schüler Einzelinformationen auf derBasis von Wörtern in größeren Sinneinheitenerfassen können. Auf Grund einer zu hohenBelastung der Kapazität des Arbeitsgedächt-nisses erschwert eine defizitäre Wortlesefä-higkeit (langsames und fehlerhaftes Rekodie-ren und Dekodieren), Informationen aus Sät-zen oder kleineren Texten sinnerfassend auf-zunehmen und für den weiteren Leseprozesszu nutzen. Willson und Rupley (1997) konn-ten in Untersuchungen mit Schülern der ers-ten bis sechsten Klasse zeigen, dass in erstenKlassen sehr starke kausale Beziehungen zwi-

Page 7: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

schen Wortlesen und Dekodierstrategienund dem Sinnverständnis zu beobachtensind. Diese Beziehung nimmt in den höherenKlassenstufen ab. Zunehmend beeinflussensprachunspezifische Aspekte – wie Motivati-on, Strategiewissen – über die Art und Wei-se, wie man einen Text liest und allgemeinesVorwissen das Leseverständnis. Alle Aufga-bengruppen des Aufgabenbereichs VI unter-liegen einer zeitlichen Begrenzung. Insofernerweist sich das Lesetempo ausschlaggebendfür das Lösen der Aufgaben.

Aufgabenbereich VII (G): Textlesen (sinnverstehend)

Mit den Aufgabengruppen aus dem Aufga-benbereich VII soll erfasst werden, inwieweitdie Schüler in der Lage sind, aus Texten mitund ohne Bildunterstützung Informationensinnverstehend zu entnehmen. Erst nachdemdie Schüler Wortleseprozesse relativ automa-tisch vollziehen, wird Arbeitsgedächtniskapa-zität für höhere Formen der Informationsver-arbeitung frei. Zu ihnen zählen z. B. das Ver-knüpfen der Informationen mit Vorwissenund Weltwissen, Strategiewissen und Strate-gieanwendung. Buchstaben-Laut-Zuordnun-gen spielen in dieser Phase eine sekundäreRolle, die Wörter werden größtenteils simul-tan erfasst. Weniger das einzelne Wort, son-dern die Beziehungen der Wörter zueinan-der rücken beim sinnverstehenden Lesen inden Vordergrund. Ein Text ist in diesem Sinneauch nicht als Summe vieler Einzelwörter zuverstehen, sondern als Abbildung von Spra-che mit unterschiedlichen funktionalen Syste-men (Semantik, Morphologie, Syntax). DieseAufgabe ist vermutlich nur von Schülern zulösen, die fortgeschrittene Lesefertigkeitenbesitzen.

127Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

Screening Eine-Minute-Lese-Aufgabe

Lesen als komplexer Prozess umfasst unter-schiedliche Teilfertigkeiten. Eine wesentlicheVoraussetzung, um das eigentliche Ziel derSinnerfassung zu erreichen, ist die technischeLesefertigkeit. In einigen Untersuchungenkonnte aufgezeigt werden, dass die entschei-dende Beeinträchtigung des lese-recht-schreibschwachen Kindes eine schwacheWortlesefähigkeit ist. Beeinträchtigtes sinner-fassendes Textlesen ist hiernach eine Folgedes langsamen und mühevollen Wortlesens.Dinges (2002) konnte mit einem Verfahrenzur Erfassung der Lesefertigkeit in einer Minu-te zeigen, dass sich das „Eine-Minute-Lesen“von einzelnen Wörtern zu mehreren Mess-zeitpunkten zur Dokumentation des Lernfort-schritts sehr gut eignet. In Anlehnung an Din-ges (2002) wurde die Eine-Minute-Lese-Aufga-

be für Erstklässler entwickelt. Ebenso wie beiDinges wurden die Wörter hierbei nachSchwierigkeitsgraden geordnet. Die Eine-Mi-

nute-Lese-Aufgabe hebt sich von den anderenAufgabenbereichen ab, da sie in der Einzelsi-tuation mit dem Schüler durchzuführen ist.Laut Aufgabenstellung sollen die Schüler in-nerhalb einer Minute so viele Wörter wiemöglich laut vorlesen. Jeweils fünf Wörtersind in einer Folge mit annähernd gleichenSchwierigkeitsmerkmalen gebündelt. Bei denWörtern handelt es sich um Nomen aus un-terschiedlichen Inhaltsbereichen, lediglichder erste Block beinhaltet Präpositionen wie<mit>, <am>, das Kopula <und>, eine gebeug-te Verbform <ist> und das Adverb <da>. Die-se Wörter entstammen dem üblichen Sicht-wortschatz für die erste Klasse. Die Lehrkraftprotokolliert während des Vorlesens die An-zahl der richtig und falsch gelesenen Wörter,was Rückschlüsse auf die Lesegeschwindig-keit und die Lesegenauigkeit zulässt.

Das IEL-1 enthält Aufgaben, die unter un-terschiedlichen Zeitvorgaben gelöst werdenmüssen. Es liegt für die Durchführung einewortwörtliche Anleitung vor. Die Auswertungder Aufgabenbereiche erfolgt quantitativ mit-

Page 8: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

tels der erreichten Punktzahl. Eine qualitativeAuswertung kann individuell für jeden Schü-ler vorgenommen werden. Zwecks Klärungder Fragestellungen dieser Untersuchungwurden lediglich die auf den einzelnen Ska-len erreichten Punkte ermittelt. Sie ergebendie Rohwerte für die statistische Analyse. Ins-gesamt werden für die Durchführung des IEL-1 zwei Unterrichtsstunden benötigt, die ent-weder auf einem Tag mit einer dazwischenliegenden Pause oder auch auf zwei aufei-nanderfolgenden Tagen liegen sollten. DasIEL-1 liegt in einer Version vor. Testwiederho-lungseffekte sind nicht zu erwarten, da dasVerfahren aus schulisch gängigen Aufgaben-formaten besteht, vergleichbare „Item“ täg-lich im Erstleseunterricht vorkommen. Gera-de die Fähigkeit zur Bewältigung schulischerLeseanforderungen wird mit Hilfe des IEL-1geprüft.

Fragestellung

Hauptziel der Erhebung mit dem Messverfah-ren IEL-1 ist die Überprüfung der mit demVerfahren verbundenen Annahmen in derPraxis. Es soll geklärt werden, ob das entwi-ckelte Messverfahren den gängigen testtheo-retischen Gütekriterien (Objektivität, Reliabi-lität und Validität) genügt. Weiterhin gilt es zuprüfen, ob mit dem IEL-1 eine Schätzung desLernzuwachses möglich ist. Folgende Frage-stellungen sollen durch die Datenerhebungund -auswertung beantwortet werden.– Können mit dem IEL-1 Leistungsunterschie-

de in der Lesekompetenz zu den unter-schiedlichen Messzeitpunkten abgebildetwerden?

– Wie zuverlässig misst das IEL-1 die Lese-kompetenzen der Erstklässler (Reliabilität)?

– Welche Korrelationen zeigen sich mit an-deren Testverfahren (WLLP) und dem Leh-rerurteil (Validität)?

– Können mit Hilfe der wiederholten Mes-sungen über drei Messzeitpunkte Leis-tungsunterschiede mit dem IEL-1 abgebil-

128 K. Diehl, B. Hartke

det werden? (1. Messzeitpunkt = Ende desersten Schulhalbjahres, 2. Messzeitpunkt =Mitte des zweiten Schulhalbjahres, 3.Messzeitpunkt = Ende des Schuljahres)?

MethodeUntersuchungsplan und verwendeteVerfahren

Die durchgeführte Untersuchung stellt einengeschlossenen Teilbereich der wissenschaftli-chen Begleitung des Modellprojektes „Pri-marstufe“ dar. Eine genauere Beschreibungdes Projektes findet sich bei Koch, Hartke,Blumenthal (2008). Der zeitliche Ablauf dereigenen Untersuchung wird in der nachfol-genden Abbildung 1 mitgeteilt.

Zum 1., 2. und 3. Messzeitpunkt wurdenDaten über die Entwicklung der Lesekompe-tenz aller Erstklässler in Rostock und auf Rü-gen mit dem IEL-1 erhoben. In Mecklenburg-Vorpommern können Erstklässler in Grund-schulklassen oder Diagnoseförderklassen(DFK) eingeschult werden (Koch, 2007). Inden DFK haben Schüler, die vermutlich auf-grund einer stark verzögerten allgemeinenEntwicklung im Anfangsunterricht der Grund-schule nicht erfolgreich lernen können, dieMöglichkeit, die ersten beiden Grundschul-jahre in drei Jahren zu absolvieren. Zusätzlichzum IEL-1 wurden andere Diagnoseverfahrenzur Bestimmung der Lernausgangslage derSchüler in Grundschul- und Diagnoseförder-klassen eingesetzt. Mit ihnen wurden u. a.Bereiche wie sprachliche Fähigkeiten, Kon-zentration, Motorik, Verhalten oder pränu-merisches Wissen (Zahlbegriff) näher unter-sucht. Die Untersuchung wurde in Rostockvon studentischen Hilfskräften und auf Rü-gen durch Sonderschullehrkräfte durchge-führt. Die Testleiter wurden vorab auf ihreAufgabe vorbereitet. Die Testung fand im re-gulären Unterricht als Gruppentest statt. Re-levant für die eigene Untersuchung zur Prü-fung der Gütekriterien des IEL-1 sind der Ein-

Page 9: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

satz der Würzburger Leise Leseprobe vonKüspert und Schneider (1998) und eine Leh-rerbefragung zum dritten Messzeitpunkt. AlleKlassenlehrer der untersuchten Populationwurden gebeten, in Form eines Fragebogensdie Lesefertigkeit und das Leseverständnisder Schüler ihrer Klassen auf einer sechsstufi-gen Skala (1 = sehr gut, 2 = gut, 3 = befriedi-gend, 4 = ausreichend, 5 = mangelhaft, 6 =ungenügend) zu bewerten.

Stichprobe

Von den insgesamt 1688 Erstklässlern bear-beiteten zum 1. Messzeitpunkt (MZP) 1508,zum zweiten 1461 und zum dritten MZP1377 Schüler das IEL-1. Es gab Erstklässler,die zu keinem der drei MZP an der Studieteilnahmen, andere, die nur zu einem MZPmitarbeiteten und weitere, die an zwei bzw.allen drei MZP partizipierten. Auffallend istdie Reduzierung der Gesamtuntersuchungs-gruppe vom MZP 1 bis zum MZP 3 um ins-gesamt 131 Schüler. Neben Gründen wie z.B. Krankheit, Umzug und entschuldigtes bzw.unentschuldigtes Fehlen sind die Ausfälle aufSchwierigkeiten bei der Datenerhebung zu-rückzuführen. Ein gerichteter Einfluss er-scheint ausgeschlossen. Die Verteilung derGeschlechter ist nahezu ausgeglichen. Von1168 Kindern liegen Daten zu allen MZP vor.

129Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

ErgebnisseVerteilungsformen und Kennwerteder Verteilung

Bevor die Verteilungsformen der Gesamtroh-punkte des IEL-1 zu den Messzeitpunkten nä-her betrachtet wurden, wurde überprüft, in-wieweit die IEL-Testitems in einem korrelati-ven Zusammenhang miteinander stehen. DieErgebnisse dieser Analysen zeigen, dass sichdas Verfahren durch eine hohe innere Konsis-tenz auszeichnet. Der Wert für CronbachsAlpha ist mit r = .97 sehr hoch. Die Subtestskorrelieren zu den drei MZP mit dem Ge-samttestergebnis zwischen .75 und .87 (Pear-son). Nur bei Subtest VII „Textlesen“ liegt dieKorrelation mit dem Gesamttest mit .41 (ers-ter MZP) niedriger. Insofern erscheint es ver-tretbar, einen IEL-1-Gesamtwert als Indikatorfür Lesekompetenz zu bilden. Die Eine-Minu-

te-Lese-Aufgabe korreliert mit dem IEL-1Ge-samttest zu den drei MZP zwischen r = .65und r = .74. (p < .01). Im Folgenden werdenzunächst die Verteilungsformen und Kenn-werte der Verteilung für den Gesamttest vor-gestellt. Angaben zu der Verteilung der Wer-te der Untertests finden sich bei Diehl(2009a).

Die Häufigkeitsverteilungen der richtigenLösungen zu den drei Messzeitpunkten imIEL-1 werden in Abbildung 2, 3 und 4 darge-stellt. Abbildung 2 – sie bezieht sich auf den

10 Schulwochen 10 Schulwochen

1. MZP

15.1.- 6.2. 2007

IEL-1

N = 1508

2. MZP

23.4.- 4.5. 2007

IEL-1

N = 1461

3. MZP

25.6.- 6.07. 2007

IEL-1

WLLP

Lehrerbefragung

N = 1377

Abb. 1: Übersicht zur Datenerhebung

Erläuterung: MZP = Messzeitpunkt, N = Anzahl der einbezogenen Schüler, WLLP = Würzburger

Leise Leseprobe

Page 10: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

ersten Messzeitpunkt – zeigt eine symmetri-sche, eingipflige Verteilungsform. Die Vertei-lung kann als glockenförmig und damit au-genscheinlich normal verteilt angesehen wer-den, wobei die Ergebnisse des Kolmogorov-Smirnov-Anpassungstests diese Annahme fürdiese und weitere MZP negieren (p < .01, 2-seitig). Im Mittel wurden von 135 Aufgaben64.3 Aufgaben zum 1. Messzeitpunkt bei ei-ner Standardabweichung von SD = 24.7 rich-tig gelöst. Auch zum 2. Messzeitpunkt (s.

130 K. Diehl, B. Hartke

Abb. 3) ist die Verteilung symmetrisch undeingipflig, wobei sich ein Deckeneffekt an-deutet. Im Mittel wurden von den 135 Aufga-ben 87.7 bei einer Standardabweichung vonSD = 25.2 richtig gelöst. Abbildung 4 zeigtdie Verteilung der absoluten Häufigkeit derAnzahl richtig gelöster Aufgaben zum 3.Messzeitpunkt. Die Verteilung ist eingipfligund rechtssteil. Von den 135 Aufgaben wur-den im Mittel 96.0 Aufgaben bei einer Stan-dardabweichung von 25.0 richtig gelöst. Die

1251007550250

Anzahl richtig gelöster Aufgaben

120

100

80

60

40

20

0

An

zah

l d

er

Sch

üle

r

Mittelwert=64,3 Standardabweichung=24,7 N=1508

Abb. 2: Absolute Häufigkeiten der

Anzahl richtig gelöster Items zum 1.

MZP

1251007550250

Anzahl richtig gelöster Aufgaben

120

100

80

60

40

20

0

An

zah

l d

er

Sch

üle

r

Mittelwert=87,8 Standardabweichung=25,2N=1461

Abb. 3: Absolute Häufigkeiten der

Anzahl richtig gelöster Items zum 2.

MZP

Page 11: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Abbildung 4 verdeutlicht wie erwartet eineVerschiebung der Verteilung nach rechts. DieVerteilungskurve zeigt hingegen links einenleichten stetigen Anstieg.

In Tabelle 2 sind die Mittelwerte und Stan-dardabweichungen für die Gesamtzahl rich-tig gelöster Aufgaben für die Gesamtuntersu-chungsgruppe zu allen drei Messzeitpunktenaufgeführt. Es wird deutlich, dass die Stan-dardabweichung bei steigender Anzahl rich-tig gelöster Aufgaben über die drei Messzeit-punkte etwa konstant bei 25 liegt. Auchwenn sich damit die Streuung über die Zeitder drei Messzeitpunkte im Verhältnis zumansteigenden Mittelwert verringert, ist festzu-halten, dass der Wert der Standardabwei-chung zu den einzelnen Messzeitpunktenhoch ist, d. h. dass die Untersuchungsgruppe

131Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

hinsichtlich des gemessenen Merkmals hete-rogen zusammengesetzt ist.

Analog zum Gruppentest des IEL-1 wer-den für den Individualtest Eine-Minute-Lese-Aufgabe zunächst die Häufigkeitsverteilun-gen, Mittelwerte und die Standardabwei-chungen relevanter Kennwerte betrachtet.Die Abbildungen 5, 6 und 7 zeigen die Ver-teilungen der Anzahl richtig gelesener Wör-ter innerhalb von einer Minute zu den dreiMesszeitpunkten.

Aus Abbildung 5 wird ersichtlich, dass dieVerteilung der absoluten Häufigkeit richtiggelesener Wörter zum 1. Messzeitpunkt desSubtests Eine-Minute-Lesen einer Normalver-teilung ähnlich sind. Die Kinder haben imMittel 12.4 von 60 Wörtern bei einer Stan-dardabweichung von SD = 8.2 richtig gele-

1251007550250

Anzahl richtig gelöster Aufgaben

120

100

80

60

40

20

0

An

zah

l d

er

Sch

üle

r

Mittelwert=96,0 Standardabweichung=25,0 N=1377

Abb. 4: Absolute Häufigkeiten der

Anzahl richtig gelöster Items zum 3.

MZP

Tab. 2: Mittelwerte und Standardabweichung der Rohwerte für die Gesamtuntersuchungsgrup-

pe zu den drei Messzeitpunkten

N M SD Min Max

1.MZP 1508 64.3 24.7 0 129

2.MZP 1461 87.8 25.2 6 135

3.MZP 1377 96.0 25.0 3 135

Page 12: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

sen. Die Verteilung zeigt am linken Vertei-lungsende einen leichten Bodeneffekt.

Der Abbildung 6 ist zu entnehmen, dassdie absoluten Häufigkeiten richtig gelesenerWörter im Subtest Eine-Minute-Lesen zum 2.Messzeitpunkt glockenförmig verteilt sind.Die Kinder haben im Mittel 21.2 Wörter beieiner Standardabweichung von SD = 11.4richtig gelesen. Die Gruppe der untersuchtenKinder hat sich also im Vergleich zum 1.Messzeitpunkt deutlich in ihrer Lesefertigkeit

132 K. Diehl, B. Hartke

gesteigert. Die linkssteile Verteilung, wie siesich beim 1. Messzeitpunkt zeigte, hebt sichzu Gunsten einer in etwa glockenförmigenVerteilung auf.

Die Abbildung 7 zeigt, dass sich die Ver-teilung der absoluten Häufigkeiten richtig ge-lesener Wörter des Subtests Eine-Minute-Le-sen zum 3. Messzeitpunkt augenscheinlichals annähernd normal verteilt darstellt, wobeiauch hier die Ergebnisse des Kolmogorov-Smirnov-Anpassungstests diese Annahme zu-

60 50 40 30 20 10 0 Anzahl der richtig gelesenen Wörter

200

150

100

50

0

VIII Eine-Minute-Lesen 1.

Messzeitpunkt

Mittelwert = 12,4

Häu

fig

keit

Standardabweichung = 8,2

N = 1493

6050403020100

Anzahl richtig gelesener Wörter

140

120

100

80

60

40

20

0

VIII Eine-Minute-Lesen 2. Messzeitpunkt

Mittelwert = 21,2 Standardabweichung = 11,4 N = 1450

Häu

fig

keit

Abb. 5: Absolute Häufigkeiten der Anzahl

richtig gelesener Wörter 1. Messzeitpunkt

Abb. 6: Absolute Häufigkeiten der Anzahl

richtig gelesener Wörter 2. Messzeitpunkt

Page 13: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

rückweisen (p < .01, 2-seitig). Die Kinder le-sen im Mittel 26.7 Wörter bei einer Standard-abweichung von SD = 13.2 in einer Minutekorrekt. In der vorgegebenen Zeit wurden imVergleich zum 1. Messzeitpunkt 14.2 Wörterund im Vergleich zum 2. Messzeitpunkt 5.5Wörter mehr richtig gelesen. Auffallend ist zuallen drei Messzeitpunkten eine relativ hoheStreuung von SD = 8.2 bis SD = 13.2. Dienachfolgende Tabelle 3 gibt die bereits ge-nannten Mittel- und Streuungswerte der dreiMesszeitpunkte wieder. Zusätzlich werdender Median, Angaben zu Minima und Maxi-

133Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

ma der richtig, falsch und gesamt gelesenenWörter (Summe aus richtig und falsch gelese-nen Wörtern) sowie deren Standardabwei-chung mitgeteilt.

Auffallend an den Werten in Tabelle 3 istdie relativ hohe Standardabweichung unterBerücksichtigung der zu jedem Messzeit-punkt im Mittel erreichten Rohwertpunkteund die breite Spannweite zwischen Minimaund Maxima. Das bestätigt den Befund einer,hinsichtlich ihrer Leistungen, heterogenenUntersuchungsgruppe.

6050403020100

Anzahl richtig gelesener Wörter

125

100

75

50

25

0

Häu

fig

keit

VIII Eine-Minute-Lesen 3. Messzeitpunkt

Mittelwert = 26,7 Standardabweichung = 13,2 N = 1335

Abb. 7: Absolute Häufigkeiten der Anzahl

richtig gelesener Wörter 3. Messzeitpunkt

Tab. 3: Eine-Minute-Lesen. Richtig, falsch und gesamt gelesene Wörter: Median. Mittelwerte. Mi-

nimum/Maximum und Standardabweichung über die gesamte Stichprobe zu den drei Messzeit-

punkten

1. MZPN = 1493

2. MZPN = 1450

3. MZPN = 1335

Medi-an

M Min/Max

SD Medi-an

M Min/Max

SD Medi-an

M Min/Max

SD

richtig gelese-ne Wörter

11 12.4 0/60 8.2 20 21.2 0/60 11.4 25 26.7 0/60 13.2

falsch geleseneWörter

2 2.4 0/18 2.4 2 2.5 0/32 2.5 2 3.0 0/21 2.7

gesamt gelese-ne Wörter

14 14.8 0/60 8.4 22 23.7 0/60 11.3 28 29.7 0/60 13.1

Page 14: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Itemanalyse, innere Konsistenz, Testhalbierungsreliabilität und Retestreliabilität Gesamttest IEL-1und Zusatztest Eine-Minute-Lesen

Im Folgenden werden die einzelnen Testauf-gaben des IEL-1 mittels der Bestimmung derSchwierigkeitsgrade, der Trennschärfe sowiedurch die Prüfung der inneren Konsistenz be-schrieben. Zudem wird der Standardmessfeh-ler des Verfahrens abgeschätzt. Eine Itemana-lyse für den Zusatztest Eine-Minute-Lese-Auf-

gabe wurde aus forschungsökonomischenGründen im Rahmen dieser Erhebung nichtdurchgeführt. Um dennoch Angaben zur Re-liabilität des Zusatztests geben zu können,wurden Korrelationen über die drei Messzeit-punkte berechnet.

In Tabelle 4 werden die genannten Kenn-werte für den 1. Messzeitpunkt auf Subtestni-veau und für das gesamte Messverfahren dar-gestellt.

134 K. Diehl, B. Hartke

Insgesamt ist anhand der Werte zur Item-schwierigkeit zum 1. MZP festzustellen, dassin jedem Subtest, mit Ausnahme des SubtestsG, sehr leichte und sehr schwere Aufgabenenthalten sind. Der Gesamttest beinhaltetmittelschwere Aufgaben mit einem gemittel-ten Schwierigkeitsgrad von .41. Bei einem Al-pha von .97 und einem Split-Half-Reliabilitäts-koeffizienten von .88 für das gesamte Inven-tar kann das IEL-1 zum 1. Messzeitpunkt 1 alsreliables Messverfahren eingeschätzt wer-den.

Die Tabelle 5 zeigt, dass sich die Werteerwartungsgemäß zum 2. Messzeitpunkt da-hingehend verändern, dass die Aufgaben ins-gesamt für die Kinder leichter zu lösen wa-ren. Der gemittelte Schwierigkeitsgrad für dasgesamte Verfahren liegt nun bei P = .60. DieReliabilität des IEL-1 zum 2. Messzeitpunkt istbei einem α = .97 und einem Split-Half-Relia-bilitätskoeffizienten von .88 als sehr hoch ein-zuschätzen. Subtest A beinhaltet die leichtes-

Erläuterung: α = Cronbachs Alpha, Split-Half (Spearman-Brown-Koeffizient)

Tab. 4: Kennwerte für die Items des IEL-1, MZP 1

Items aus Subtest Itemschwierig-keit

Trennschärfe Schätzungen derReliabilität

Min-Max / M Min-Max / M αα Split-Half

Buchstaben-Laut-Zuordnung(Subtest A)

.03-.96 / .74 -.08-.56 / .40 .92 .85

Wörter in Silben segmentieren(Subtest B)

.01-.85 / .25 .17-.54 / .33 .84 .71

Silben zu Wörtern verbinden(Subtest C)

.06-.74 / .45 .29-.59 / .47 .88 .71

Buchstaben analysieren undsynthetisieren (Subtest D)

.07-.80 / .33 .25-.62 / .47 .89 .86

Wörter lesen, schreiben undidentifizieren (Subtest E)

.13-.82 / .49 .42-.65 / .54 .88 .81

Satzlesen (Subtest F) .06-.82 / .47 .14-.53 / .41 .70 .65

Textlesen (Subtest G) .11-.17 / .13 .20-.31 / .26 .65 .64

Gesamttest .01-.96 / .41 -.08-.65 / .41 .97 .88

Page 15: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

ten Aufgaben mit einem gemittelten Schwie-rigkeitsindex von .84. Demgegenüber bein-haltet Subtest G, mit einem gemitteltenSchwierigkeitsindex von .33, die schwierigs-ten Aufgaben. Die innere Konsistenz ist beiallen Subtests, mit Ausnahme der Subtests Fund G, als gut bis sehr gut zu bewerten. DieSubtests A, B und G zeigen recht niedrigeTrennschärfekoeffizienten.

Der Tabelle 6 ist zu entnehmen, dass sichzum 3. Messzeitpunkt eine weitere Verände-rung hinsichtlich der gemittelten Schwierig-keitsindizes der Subtests zeigt. Diese erhö-hen sich in allen Subtests und folglich auchim Gesamtwert. Die Reliabilitäten der Sub-tests F und G sind mit einem α = .73 als hin-reichend zuverlässig einzuschätzen. Alle an-deren Subtests zeigen eine hohe Reliabilitätmit Werten zwischen .88 - .92. Die Reliabili-tät für den Gesamttest ist zum 3. Messzeit-punkt mit einem α = .97 und einem gemittel-

135Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

ten Split-Half-Reliabilitätskoeffizienten von.87 als hoch einzuschätzen.

Die Tabelle 7 zeigt die Werte zur Retest-reliabiltät. Es wird deutlich, dass zwischenden Ergebnissen zu den drei Messzeitpunk-ten (p < 0,01) signifikante Zusammenhängebestehen. Auch wenn die Werte zur Retestre-liabilität eher niedrig ausfallen, können sie inAnbetracht der Tatsache, dass zwischen denMesszeitpunkten mehr als 10 Wochen liegen,als erwartungsgemäß und damit zufriedenstellend eingeschätzt werden. Sie bieten ei-nen weiteren Hinweis darauf, dass das IEL-1als reliabel eingeschätzt werden kann.

Nachfolgend werden Angaben zum Stan-dardmessfehler gemacht. Für den erstenMesszeitpunkt beträgt der Standardmessfeh-ler Se = 8.4, zum zweiten Messzeitpunkt Se =8.5 und zum dritten Messzeitpunkt bei Se =8.6.

Tab. 5: Kennwerte für die Items des IEL-1, MZP 2

Items aus Subtest Itemschwierig-keit

Trennschärfe Schätzung derReliabilität

Min-Max / M Min-Max / M αα Split-Half

Buchstaben-Laut-Zuordnung(Subtest A)

.02-.98 / .84 -.16-.55 / .34 .89 .82

Wörter in Silben segmentieren(Subtest B)

.11-.93 / .40 .24-.58 / .39 .90 .83

Silben zu Wörtern verbinden(Subtest C)

.26-.89 / .67 .36-.59 / .50 .89 .75

Buchstaben analysieren und syn-thetisieren (Subtest D)

.03-.93 / .58 .39-.65 / .53 .91 .82

Wörter lesen, schreiben undidentifizieren (Subtest E)

.42-.92 / .74 .30-.63 / .54 .88 .80

Satzlesen (Subtest F) .31-.93 / .67 .03-.57 / .42 .73 .71..

Textlesen (Subtest G) .28-.42 / .33 .33-.41 / .37 .69 .63

Gesamttest .02-.98 / .60 -.16-.65 / .49 .97 .88

Erläuterung: α = Cronbachs Alpha, Split-Half (Spearman-Brown-Koeffizient)

Page 16: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Angaben zur Retestreliabilität des Zusatz-tests Eine-Minute-Lesen über die drei Mess-zeitpunkte werden in Tabelle 8 dargestellt.

Wie aus Tabelle 8 ersichtlich wird, beste-hen zwischen den Ergebnissen zu den dreiMesszeitpunkten signifikante Zusammenhän-ge (p < .01). Auch hier sind die Werte zur Re-testreliabilität aufgrund der relativ langenZeiträume zwischen den Messzeitpunktenerwartungsgemäß eher niedrig und damitaber dennoch zufrieden stellend. Zwar lie-fern die Angaben zur Retestreliabilität nachüber 10 Wochen nur Hinweise zur Einschät-zung der Zuverlässigkeit der Messergebnisse

136 K. Diehl, B. Hartke

mit diesem Zusatztest, diese sprechen aberfür eine ausreichende Reliabilität des Verfah-rens.

Ergebnisse zur Validität

Die kriteriumsbezogene Validität wurdedurch Berechnungen der Korrelation zwi-schen den Testwerten des IEL-1 bzw. des Zu-satztests Eine-Minute-Lesen und der WLLP(Küspert & Schneider, 1998) sowie dem Leh-rerurteil zur Lesefertigkeit/Leseverständniszum dritten Messzeitpunkt geprüft. Die so er-

Tab. 6: Kennwerte für die Items des IEL-1, MZP 3

Subtests Itemschwierig-keit

Trennschärfe Schätzung derReliabilität

Min-Max / M Min-Max / M αα Split-Half

Buchstaben-Laut-Zuordnung (Sub-test A)

.01-.98 / .86 -.09-.54 / .37 .91 .84.

Wörter in Silben segmentieren(Subtest B)

.25-.96 / .46 .21-.58 / .41 .92 .85

Silben zu Wörtern verbinden(Subtest C)

.41-.93 / .74 .35-.62 / .51 .89 .79

Buchstaben analysieren und syn-thetisieren (Subtest D)

.38-.94 / .68 .40-.69 / .54 .92 .84

Wörter lesen, schreiben und iden-tifizieren (Subtest E)

.53 .94 / .80 .30-.61 / .53 .88 .80

Satzlesen (Subtest F) .46-.97 / .75 .01-.57 / .40 .73 .73

Textlesen (Subtest G) .39-.55 / .46 .28-.44 / .37 .70 .64

Gesamttest .01-.98 / .67 -.09-.69 / .45 .97 .87

Erläuterung: α = Cronbachs Alpha, Split-Half (Spearman-Brown-Koeffizient)

Tab. 7: Retestreliabilität des IEL-1 Gesamttests über die drei Messzeitpunkte

IEL Gesamt MZP 1 IEL Gesamt MZP 2 IEL Gesamt MZP 3

IEL Gesamt MZP 1

IEL Gesamt MZP 2 .79**

IEL Gesamt MZP 3 .74** .83**

Page 17: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

mittelten mittleren (.62 bis .70) signifikanten(p < .01) Zusammenhänge zwischen den un-terschiedlichen Erhebungsverfahren weisendarauf hin, dass es sich bei dem IEL-1 um einextern valides Verfahren handelt.

Die interne Validität des IEL-1 wurdedurch einen Vergleich der Werte der Grund-schulklassen mit den Werten der Diagnose-förderklassen (Extremgruppenvergleich) ab-geschätzt. Die Entwicklung der Werte inGrundschulklassen im Vergleich zu den Wer-ten in DFK über die drei Messzeitpunkte ver-läuft relativ parallel auf unterschiedlichenLeistungsniveaus. Insgesamt sprechen dieDaten des Extremgruppenvergleichs für dieValidität des Verfahrens. Tatsächliche Unter-schiede in der Lesekompetenz von Schülernaus Grundschulklassen und DFK werdendurch Messergebnisse mit dem IEL-1 abgebil-det. Vergleicht man die Mittelwerte der Schü-ler aus DFK und aus Grundschulklassen mit-tels t-Test (zweiseitig, p < .05) zeigen sich zuallen drei Messzeitpunkten signifikante Mit-telwertsdifferenzen.

Um Aussagen zur prognostischen Validi-tät des IEL-1 treffen zu können, wurden dieKorrelationen zwischen dem Gesamtwertdes IEL-1 zum 1. Messzeitpunkt und den

137Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

Werten der WLLP (Rohwertbasis) sowie demLehrerurteil zum 3. Messzeitpunkt ermittelt.Die bestehenden mittleren Korrelationenzwischen den Werten des IEL-1 zum 1. Mess-zeitpunkt und der WLLP (r = .58) sowie demLehrerurteil/Lesefertigkeit (r = .56) und demLehrerurteil/Leseverständnis (r = .62) zum 3.Messzeitpunkt zeigen, dass zwischen denVerfahren ein Zusammenhang besteht. Zu-dem wurde, als weitere Möglichkeit, dieprognostische Validität des Verfahrens einzu-schätzen, eine Regressionsanalyse durchge-führt. Das Gütemaß für die Anpassung derDaten an die lineare Funktion steigerte sichvom 1. zum 3. MZP von R2 = 55 über R2 =.68 vom 2. auf den 3. Messzeitpunkt auf R2 =.70 unter Berücksichtigung sowohl des 1.und des 2. MZP. Daraus lässt sich schließen,dass die beste Vorhersage auf spätere Leis-tungen durch eine gemeinsame Betrachtungder Werte des 1. und 2. Messzeitpunktes er-folgt.

Die Korrelationen der inhaltlich und curri-cular begründeten Subskalen liegen (bis aufdie Korrelation des Subtests VII (Textlesen)mit anderen Subtests zum ersten MZP)durchgängig im mittleren Bereich. Diesspricht neben inhaltlichen Überlegungen (je-

Tab. 8: Retestreliabilität des Zusatztests Eine-Minute-Lesen (richtig gelesene Wörter) über die drei

Messzeitpunkte

Eine-Minute-LesenMZP 1

N = 1493

Eine-Minute-LesenMZP 2

N = 1329

Eine-Minute-LesenMZP 3

N = 1210

Eine-Minute-LesenMZP 1 N = 1493

Eine-Minute-LesenMZP 2 N = 1329

.76**

Eine-Minute-LesenMZP 3 N = 1210

.70** .86**

Erläuterung: ** p < .01

Page 18: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

der Subtest prüft einen Lernzielbereich inner-halb des Leselehrganges) für eine Betrach-tung der Ergebnisse im IEL-1 auf Subtestebe-ne. Trotz der hohen Korrelationen der Sub-tests mit dem Gesamtwert messen die Aufga-benbereiche I bis VII unterschiedliche Teilfer-tigkeiten, die im Leselernprozess vermitteltwerden. Das Verfahren erweist sich als curri-cular valide. Hierfür sprechen auch die be-richteten Veränderungen in den Schwierig-keitsgraden der Aufgaben in den genanntenAufgabenbereichen. Zunächst schwierigeAufgaben nehmen im Schwierigkeitsgrad ab.

Ergebnisse zu Messungen von Lernstandsveränderungen

Entsprechend dem Untersuchungsdesignwiederholen die Schüler im Verlauf des ers-ten Schuljahres die Bearbeitung des IEL 1 inidentischer Form dreimal. Ohne der abschlie-ßenden Diskussion vorgreifen zu wollen,kann an dieser Stelle bereits festgehalten wer-den, dass die bisherigen Ergebnisse nahe le-gen, das IEL-1 als reliables und valides Verfah-ren zur Messung von Lesekompetenzen zudrei Messzeitpunkten anzusehen. Zudem dif-ferenziert es insbesondere im unteren Leis-tungsbereich, d. h. tatsächliche Leistungsun-terschiede zwischen relativ schwachen Schü-lern werden zu allen drei Messzeitpunktenaufgezeigt. Notwendige Voraussetzungen fürAussagen zu Veränderungen des Lernstandeszu den drei Messzeitpunkten sind also gege-ben. Durch den Vergleich der Mittelwerteund die Darstellung der Verteilung der abso-luten Häufigkeiten der „richtig-Differenzen“

138 K. Diehl, B. Hartke

von Messzeitpunkt zu Messzeitpunkt sollenweitere Hinweise zur Einschätzung der An-wendungsmöglichkeit „Lernfortschrittsdoku-mentation“ gewonnen werden. In den folgen-den Berechnungen wurden die Schüler (N =1171) berücksichtigt, die an allen drei Durch-führungen teilgenommen haben. Der Lern-fortschritt im Lesen soll durch den Vergleichzwischen den Gesamtwerten, zusammenge-setzt aus den Subtests A bis G (Gruppentes-tung) zu den drei Messzeitpunkten beschrie-ben werden. Die Tabelle 9 zeigt den Lernfort-schritt der Gesamtgruppe zu den drei Mess-zeitpunkten. Sie basiert auf den Mittelwertendes Gesamtwertes des IEL-1.

Die konstante Standardabweichung vonetwa SD = 24 Rohwertpunkten über alleMesszeitpunkte führt dazu, dass die Varianzim Verhältnis zum ansteigenden Mittelwertvon Durchführung zu Durchführung ab-nimmt. Die Gruppe weist insgesamt einenLernfortschritt auf, sie wird hinsichtlich derMerkmalsausprägung homogener.

Die Mittelwertunterschiede sind signifi-kant (t-Test, zweiseitig, α = .05). Es kann da-von ausgegangen werden, dass sich die Lese-kompetenzen der Schüler vom 1. über den 2.bis zum 3. Messzeitpunkt stetig steigern.

Das Messverfahren IEL-1 ist aus siebenAufgabenbereichen zusammengesetzt. Einebereichsspezifische Auswertung der richtiggelösten Aufgaben bietet die Möglichkeit,Aussagen über den Lernverlauf eines Schü-lers innerhalb der einzelnen Bereiche zu tref-fen. In der nachfolgenden Abbildung 8 wer-den die Mittelwerte der richtig gelösten Auf-gaben für jeden Aufgabenbereich pro Durch-führung aufgezeigt.

Tab. 9: Vergleich absolute Gesamtmittelwerte zu den drei Messzeitpunkten

M SD N

IEL-1 Gesamt MZP 1 66 24,1 1171

IEL-1 Gesamt MZP 2 88 24,4 1171

IEL-1 Gesamt MZP 3 96 24,3 1171

Page 19: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Abbildung 8 zeigt sehr deutlich, dass dieKinder im Mittel in jedem Bereich von Mess-zeitpunkt zu Messzeitpunkt mehr Aufgabenrichtig lösen konnten. Demnach ist davonauszugehen, dass alle gewählten Aufgaben-bereiche einen Beitrag zur Abbildung vonLernfortschritten durch das Gesamtergebnisleisten. Der Lernfortschritt je Bereich verläuft– ersichtlich durch die parallele Anordnungder Verbindungslinien – nahezu identisch.Die Kurven der Aufgabenbereiche F und Gzeigen die geringsten Steigerungen. Generellist zu beobachten, dass die Kurven aller Auf-gabebereiche vom 1. zum 2. Messzeitpunktsteiler verlaufen und vom 2. zum 3. Messzeit-punkt nur geringfügig steigen.

Durch die Berechnung der Differenzenzwischen der Anzahl der richtig gelösten Auf-gaben (richtig-Differenzen) im Einzelfall zwi-schen den Messzeitpunkten werden Lern-standsveränderungen sichtbar. Für die Ge-samtgruppe wurde die Häufigkeitsverteilungdieser „richtig-Differenzen“ berechnet. DieTabelle 10 stellt die Verteilung der Lernzu-wächse zwischen den Messzeitpunkten dar.

139Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

Diskussion der Ergebnisse

Können mit dem IEL-1 Leistungsunterschie-de in der Lesekompetenz zu den unter-schiedlichen Messzeitpunkten abgebildetwerden?Bevor auf diese Frage eingegangen wird, solldie Repräsentativität der Stichprobe disku-tiert werden. Da sich die Stichprobe aus allenErstklässlern der Hansestadt Rostock und derInsel Rügen zusammensetzt und sich die Er-gebnisse der ländlichen und der städtischenRegionen nicht unterscheiden, ist davon aus-zugehen, dass die Häufigkeitsverteilungender Ergebnisse und deren Kennwerte fürMecklenburg-Vorpommern repräsentativsind. Auch ist auf Grund der Größe der Stich-probe und der Einbeziehung städtischer undländlicher Gebiete zu vermuten, dass eineVerallgemeinerung der Werte auf andereBundesländer zumindest hypothetisch zuläs-sig ist. Zudem sprechen die zufrieden stellen-den Werte hinsichtlich der externen Validität(gemessen mit der WLLP) für eine überregio-nale Aussagekraft von Messergebnissen mit

Richtig gelöste Aufgaben der Subskalen A bis G

0

5

10

15

20

25

30

35

40

1. MZP 2. MZP 3. MZP

Mit

telw

ert

Bere

ich

sle

istu

ng

Reihe1

Reihe2

Reihe3

Reihe4

Reihe5

Reihe6

Reihe7

Abb. 8: Bereichsmittelwerte (Rohwertbasis) pro Durchführung

Reihe 1 = Aufgabenbereich A Buchstaben-Laut-Zuordnungen, Reihe 2 = Aufgabenbereich B

Wörter in Silben segmentieren, Reihe 3 = Aufgabenbereich C Silben zu Wörtern verbinden, Rei-

he 4 = Aufgabenbereich D Buchstaben zu Wörtern verbinden, Reihe 5 = Aufgabenbereich E

Wörter lesen und schreiben, Reihe 6 = Aufgabenbereich F Sätze, Reihe 7 = Aufgabenbereich G

Texte

Page 20: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

dem IEL-1. Demgegenüber zeigen die Ergeb-nisse der PISA-Studien, dass es zwischen deneinzelnen Bundesländern auffallende Leis-tungsunterschiede in der Lesekompetenz der15-jährigen gibt. Daher wird empfohlen, wei-tere Überprüfungen der Kennwerte des IEL-1in anderen Bundesländern und hier insbeson-dere in Ländern mit einem höheren Anteilvon Kindern nichtdeutscher Herkunft durch-zuführen.

Die Verteilungsformen für den Gesamt-test IEL-1 bestätigen die Annahme eingipfli-ger und tendenziell normal verteilter Werte.Die Verteilungen verschieben sich erwar-tungsgemäß zum 2. und 3. Messzeitpunktauf der x-Achse leicht nach rechts. Am linkenRand der Verteilung (unterer Leistungsbe-reich) steigen die Häufigkeiten von nächsthö-heren Werten kontinuierlich an. Die Kinderlösen von Messzeitpunkt zu Messzeitpunktzunehmend mehr Aufgaben des IEL-1 richtig.Bei Mittelwerten und Standardabweichungenvon M = 64 und SD = 25.0 zum 1. Messzeit-punkt, von M = 88 und SD = 25.0 zum 2.Messzeitpunkt und M = 96 und SD = 25.0zum 3. Messzeitpunkt lassen die Ergebnissezudem auf Grund einer relativ hohen Streu-ung der Werte auf Unterscheidungsmöglich-keiten mittels des IEL-1 zwischen unterschied-lich leistungsstarken Schülern schließen. Die-se liegen, so wie es von der Konzeption herintendiert war, zu allen drei Messzeitpunktenim unteren Leistungsbereich vor. Die Kon-zeption des Inventars zielt auf eine objektiveund valide Beurteilung früher Lesekompeten-zen ab, um Rückstände im Leselernprozessfrühzeitig zu erkennen und gezielt Förder-maßnahmen einleiten zu können. Aus son-

140 K. Diehl, B. Hartke

derpädagogischer Sicht ist es besonderswichtig, Kinder mit Lernschwierigkeiten hin-sichtlich ihrer Leistungen präzise einschätzenzu können. Es liegen zum 1. Messzeitpunktin etwa 16.5 % der Kinder eine und 1.7 %der Kinder zwei Standardabweichungen un-ter dem Durchschnitt. Beim 2. Messzeitpunktsind es 15.8 % der Kinder, die eine und 5.5% der Kinder, die zwei Standardabweichun-gen unter dem Durchschnitt liegen. Zum 3.Messzeitpunkt zeigen sich die Werte ähnlichwie zum 2. Messzeitpunkt. Diese Ergebnisseweisen darauf hin, dass ein doch erheblicherTeil der Kinder im Vergleich zur Gesamtun-tersuchungsgruppe Schwierigkeiten im Le-senlernen hat und diese durch den IEL-1-Ge-samtwert zu den verschiedenen Messzeit-punkten abgebildet werden können. AufGrund der erwartungsgemäßen Häufigkeits-verteilungen des IEL-1 ist eine Differenzie-rung insbesondere im unteren Leistungsbe-reich zu allen drei Messzeitpunkten gewähr-leistet. Die Werte des 1. Messzeitpunktes las-sen zudem eine gute Differenzierung im obe-ren Leistungsbereich zu. Das Gesamtergeb-nis des IEL-1 bietet den Lehrkräften also auchHinweise darauf, welche Kinder mit sehr gu-ten Ergebnissen im Leselernprozess zu die-sem Zeitpunkt stärker zu fordern sind, um beiihnen den Prozess des Lesenlernens ange-messen voranzubringen. Ergebnisse einerkleineren Untersuchungsgruppe (N = 107)zum Messzeitpunkt 2 (rekrutiert aus der Ge-samtstichprobe), die das IEL-1 zum erstenMal durchgeführt haben, erlauben, einenTestwiederholungseffekt zu vernachlässigen.Im Mittel liegt diese Gruppe mit 26 Rohwert-punkten lediglich um einen Rohwertpunkt

Tab. 10: Deskriptive Statistik Differenzen der Messzeitpunkte

N M SD

IEL-1 Gesamt MZP 2 - MZP 1 1171 22,6 15,3

IEL-1 Gesamt MZP 3 - MZP 2 1171 8,0 14,1

IEL-1 Gesamt MZP 3 - MZP 1 1171 30,5 17,8

Page 21: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

niedriger als die Gesamtstichprobe bei einervergleichbaren Standardabweichung von SD

= 27 (Gesamtuntersuchungsgruppe SD =25). Das Ergebnis spricht gegen einenÜbungseffekt durch ein wiederholtes Bear-beiten der Aufgaben des IEL-1, und für dieAnnahme, dass die unterrichtsnahe Art derIEL-Aufgaben und deren Menge zu aussage-kräftigen Messergebnissen führen, unabhän-gig davon, ob das IEL-1 bereits vorher bear-beitet wurde. Dennoch empfiehlt es sich, die-se Annahme mit einer unabhängigen Unter-suchungsgruppe auch zum 3. Messzeitpunktzu prüfen. Eine Untersuchung dazu mit einervergleichbaren Untersuchungsgröße (N =100) findet derzeit statt. Ergebnisse sind imAugust dieses Jahres zu erwarten.

Mit dem Zusatztest Eine-Minute-Lesensind zum 1. und 2. Messzeitpunkt gute Diffe-renzierungen im oberen Leistungsbereichmöglich, zum 3. Messzeitpunkt lassen dieWerte Aussagen sowohl zu Leistungsunter-schieden im unteren als auch oberen Bereichzu. Die Werte zeigen, dass zum 1. Messzeit-punkt 12.8 % der Kinder eine Standardab-weichung unter dem Durchschnitt liegen und12.4 % der Kinder eine Standardabweichungsowie 3.1 % der Kinder zwei Standardabwei-chungen über dem Leistungsdurchschnitt lie-gen. Zum 2. Messzeitpunkt sind es 14.2 %der Kinder, die eine Standardabweichung un-ter dem Durchschnitt und 13.2 %, die einesowie 5.7 %, die zwei Standardabweichun-gen über dem Durchschnitt liegen. Zum 3.Messzeitpunkt liegen 17 % eine und 0.8 %der Kinder zwei Standardabweichungen un-ter dem Durchschnitt. 15.1 % der Kinder lie-gen bei der 3. Messung eine und 5.5 % derKinder zwei Standardabweichungen überdem Durchschnitt.

Wie reliabel misst das IEL-1 die Lesekompe-tenzen der Erstklässler?Die ermittelten Reliabilitätswerte zur innerenKonsistenz (Cronbachs-Alpha) der einzelnenSubtests sind sehr unterschiedlich. Sieschwanken zwischen α = .65 und α = .92.

141Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

Der Gesamttest weist eine hohe innere Kon-sistenz auf (α = .97). Während die Reliabilitätdes Gesamttests als sehr gut einzuschätzenist, erweisen sich die Subtests VI und VII alsnicht zufriedenstellend reliabel, hingegen dieSubtests II, III, IV, V als zufriedenstellendmessgenau. Die Werte zur Retestreliabilitätsind trotz der relativ langen Zeitspanne (10Schulwochen) zwischen den Messungen alszufrieden stellend einzuschätzen (rtt = .74 bisrtt = .83). Vergleicht man die Werte zurRetestreliabilität mit anderen standardisiertenMessverfahren, bei denen die Zeitspannezwischen den Messwiederholungen annä-hernd gleich ist (z. B. der WLLP Retestmes-sung nach vier Monaten rtt = .75), weisen dieWerte der Retestreliabilität des IEL-1 auf einals zuverlässig einzuschätzendes Messverfah-ren hin. Zieht man alle ermittelten Kennwer-te zur Reliabilität in Betracht, erweist sich dasIEL-1 als zuverlässig. Der Wert zur innerenKonsistenz (Cronbachs-Alpha) auf Gesamt-wertebene mit einem Wert von .97 gilt alssehr hoch. Ebenso untermauern die Split-Half-Werte von .87 bis .88 für den Gesamt-test IEL-1 zu den drei Messzeitpunkten unddie Retestreliabilitätswerte die Zuverlässigkeitdes Inventars.

Wie valide misst das IEL-1 die Lesekompe-tenz der Erstklässler?Die Validität des IEL-1 begründet sich zu-nächst durch die spezifische Auswahl derItems. In die Aufgabengestaltung des IEL-1wurden solche Items einbezogen, die ausgängigen Arbeitsheften und Fibeln der Klasse1 bekannt sind, und es ist somit davon auszu-gehen, dass sie Lesefertigkeiten überprüfen.Demnach kann das IEL-1 als inhaltsvalide inBezug auf das zu messende Merkmal Lese-kompetenz eingeschätzt werden. Die Itemsdes IEL-1 sind zu inhaltlich begründeten Sub-tests gebündelt. Die Subtests sollen dabei un-terschiedliche Teilfertigkeiten, also möglicheMerkmalsfacetten von Lesekompetenz, abbil-den. Die Items sind so angelegt, dass sie ba-sierend auf der Theorie des Kompetenzmo-

Page 22: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

dells von Klicpera et al. (2003) einzelne Fer-tigkeiten, von denen angenommen wird, dasssie zum erfolgreichen Lesen führen, in einemSubtest bündeln. Die durchgeführten Zusam-menhangsanalysen bestätigen im Wesentli-chen, dass mit dem IEL-1 hauptsächlich eineFähigkeit gemessen wird, aber auch dass dieinhaltlich begründete Zusammensetzung derSubtests vertretbar ist. Die Subtests zeigenmit Ausnahme des Aufgabenbereichs G(Textlesen) untereinander sowie zur Gesamt-skala wie erwartet mittlere Korrelationen.Dass der Subtest G eher niedrige Korrelatio-nen mit den weiteren Subtests zeigt, könntedaran liegen, dass die Aufgabenstellung fürdie Kinder zum 1. und 2. Messzeitpunkt zuschwer war. Es handelt sich um den letztenAufgabenbereich im Test, möglicherweisebeeinflussen Faktoren wie Konzentration undAufmerksamkeitsspanne die Ergebnisse. Zu-dem könnte die relativ hohe Ratewahrschein-lichkeit (multiple-choice mit drei Auswahl-möglichkeiten) die Ergebnisse verfälschen.

Dass es sich bei der gemessenen Fähig-keit um Lesekompetenz handelt, bestätigtauch die mittlere Korrelation zwischen demIEL-1 und der WLLP von Küspert und Schnei-der (1998) sowie dem Lehrerurteil. Das IEL-1erweist sich hiernach als extern valide. Esmag sich die Frage stellen, warum ein rechtzeitintensives Verfahren entwickelt wurde,wenn das ökonomischere Verfahren, dieWLLP, zu ähnlichen Ergebnissen kommt. DieWLLP ist ein Speed-Test und für die Überprü-fung der Lesefertigkeit konzipiert. Die Datender WLLP geben keinerlei Hinweis darauf,welche Teilfertigkeit möglicherweise unzurei-chend ausgebildet ist. Die Stärken der WLLPliegen in der sehr ökonomischen Durchfüh-rung und Auswertung. Das Verfahren führteffizient zu einer validen Einschätzung derLesefertigkeit. Mit dem IEL-1 sollen nebendem Erfassen der Lesefertigkeit auf Wortebe-ne auch andere Teilfertigkeiten wie z. B. diephonematische Differenzierungsfähigkeit,das Silbensegmentieren und die Synthesevon Silben zu Wörtern sowie das Satz- und

142 K. Diehl, B. Hartke

Textlesen erfasst werden. Darüber hinaus galtes, die Leistungsstände in den genannten Teil-bereichen über drei Messzeitpunkte abzubil-den. Die konzeptionellen Unterschiede derWLLP und des IEL-1 könnten als Erklärung fürdie ‚nur’ mittleren Korrelationen zwischenden Tests herangezogen werden.

Zwischen der WLLP und dem ZusatztestEine-Minute-Lesen besteht ebenfalls einemittlere Korrelation. Auf Grund der Konzepti-on beider Verfahren, die Lesefertigkeit überdie Geschwindigkeit zu messen, könnte einenoch höhere Korrelation vermutet werden.Eine Erklärung für die dennoch nur mittlerenZusammenhänge wird in der unterschiedli-chen Auswahl und Reihenfolge der Items ge-sehen. Bei dem Zusatztest Eine-Minute-Lesenwurden die Items nach linguistischen Merk-malen ausgewählt und entsprechend einerSchwierigkeitssteigerung angeordnet. DasWortmaterial der WLLP stammt größtenteilsaus dem bayerischen Grundwortschatz. DieReihenfolge der Items wurde per Zufall er-stellt. Zudem ist zu beachten, dass die Aufga-benstellung bei der WLLP, neben der Anfor-derung, ein Wort zu lesen, auch eine opti-sche Diskriminationsleistung beinhaltet. Die-se zusätzliche Anforderung kann ein weitererGrund für unterschiedliche Leistungen in derWLLP und der Eine-Minute-Lesen-Aufgabesein. Die Korrelationen des Zusatztests Eine-Minute-Lesen mit dem Lehrerurteil liegenebenfalls im mittleren Bereich und sind alszufrieden stellender Hinweis auf die Validitätdes Verfahrens (hier: externe Validität) anzu-sehen.

Können mit Hilfe der wiederholten Messun-gen über drei Messzeitpunkte Veränderun-gen des Lernstandes mit dem IEL-1 abgebil-det werden?Die Häufigkeitsverteilungen zu den dreiMesszeitpunkten, ihre Kennwerte sowie diedeutlichen Mittelwertunterschiede zwischenden Messzeitpunkten legen die Vermutungnahe, dass mit den IEL-1-Ergebnissen zu meh-reren Messzeitpunkten Hinweise auf eine

Page 23: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Abschätzung der Lernfortschritte gegebensind. Methodenkritisch betrachtet, kann aller-dings nur von Annäherungen an eine Mes-sung des Lernfortschritts mittels des IEL-1 aus-gegangen werden. Auch wenn die Vorausset-zungen für eine valide Erfassung der Ist-Stän-de gewährleistet sind, ist das Verfahren alssolches, auf Grund messtheoretischer Ein-wände, nicht als ausreichend reliabel für Ver-änderungsmessungen einzuschätzen (Rost,2004, S. 272). Es können somit lediglich Aus-sagen darüber getroffen werden, wie die Leis-tung des einzelnen Schülers oder einer Schü-lergruppe im Vergleich zur Eichstichprobe zueinem bestimmten Zeitpunkt ausfällt. Zudemkann im Einzelfall das Antwortverhalten desKindes zu den einzelnen Messzeitpunktenqualitativ analysiert und verglichen werden.Hierbei können quantitative Aspekte berück-sichtigt werden. Durch Berechnungen der„richtig Differenzen“ können Leistungsverän-derungen im Lesen eingeschätzt werden. Ein-schränkend ist anzumerken, dass es sich hier-bei lediglich um Annäherungen zur Einschät-zung von Leistungsveränderungen handelt.Präzise Aussagen über Lernfortschritte wür-den eine messtheoretische Fundierung desIEL-1 auf Basis von Rasch-Modellen voraus-setzen (Rost, 2004, S. 272). Es kann nicht da-von ausgegangen werden, dass es sich beidem IEL-1 um ein valides Verfahren zur Lern-fortschrittsmessung handelt. Mit dem IEL-1können Lernstandsveränderungen über dreiMesszeitpunkte valide dokumentiert werden.

Fazit

Zusammenfassend kann das IEL-1 als objek-tiv sowie ausreichend reliabel und valide ein-geschätzt werden. Mit dem IEL-1 ist es dem-nach möglich, valide Aussagen über die Lese-kompetenz von Erstklässlern zu drei Mess-zeitpunkten zu treffen. Insbesondere im unte-ren Leistungsbereich differenziert das IEL-1zu allen drei Messzeitpunkten. In Relation zueiner Eichstichprobe kann der Lehrer mit

143Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

dem IEL-1 erstmals zum Ende des erstenSchulhalbjahres Kinder mit geringen Leseleis-tungen identifizieren. Durch die wiederhol-ten Ist-Stand-Messungen und deren Vergleichmit einer Eichstichprobe gewinnt der Anwen-der des IEL-1 einen ersten Hinweis darauf, obLernfortschritte bei den Kindern auftreten.Als theoriegeleitetes und curricularbasiertesMessverfahren bietet es den Lehrkräftenwichtige Informationen über den Leistungs-stand in unterschiedlichen Teilfertigkeiten desLeselernprozesses zu mehreren Messzeit-punkten. Im Kontext von Förderdiagnostiksollten nach einer weiteren Prüfung der Ge-neralisierbarkeit der hier ermittelten DatenForschungsbemühungen zur Entwicklungund Evaluation von Fördermaterialen anset-zen, die auf durch das IEL-1 erfasste Teilfertig-keiten abheben. So ein „whole-in-one-Paket“

(Hartke, Diehl & Vrban, 2008) könnte maß-geblich dazu beitragen, Kinder mit Schwierig-keiten im Lesenlernen angemessen und sinn-voll zu unterstützen. Als Teil eines MultipleAssessments innerhalb des RTI-Ansatzes, ver-standen als Mehrebenen-Präventions-Pro-gramm (Diehl & Hartke, im Druck), kann essowohl wertvolle Daten zur formativen Eva-luation bisheriger Förderung, zur Bestim-mung der Präventionsebene, auf dem das je-weilige Kind gefördert werden sollte, und zurIndikation evidenzbasierter Fördermaßnah-men bieten.

LiteraturBalzer, L., Fritz, A., Ricken, G. & Jäger, R.S.

(2007). Der Rechenschwäche auf der Spur– eine Re-Analyse von Mathematik-Leis-tungsdaten eines kompletten Schülerjahr-gangs der achten Klassenstufe in Rheinland-Pfalz. Psychologie in Erziehung und Unter-richt, 54, 177-190.

Bamonto Graney, S. & Shinn, M. (2005). Effectsof Reading Curriculum-Based Measurement(R-CBM) Teacher Feedback in General Edu-cation Classrooms. School Psychology Re-view, 34, 184-201.

Page 24: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Büttner, G. (2003a). Gedächtnis: Neurowissen-schaftliche Grundlagen – Störungen undTherapie – Aspekte der Entwicklung – Funk-tionsweise des Arbeitsgedächtnisses. Spra-che – Stimme – Gehör, 27, 1-2.

Büttner, G. (2003b). Gedächtnisentwicklung imKindes- und Jugendalter. Sprache – Stimme– Gehör, 27, 24-30.

Compton, D.L., Fuchs,D., Fuchs, L.S. & Bryant,J.D. (2006). Selecting at-risk readers in firstgrade for early intervention: A two-year lon-gitudinal study of decision rules and proce-dures. Journal of Educational Psychology,98, 394-409.

Dehn, M. & Sjölin, A. (1996). Frühes Lesen undSchreiben. In H. Günther & O. Ludwig(Hrsg.), Schrift und Schriftlichkeit. Handbü-cher zur Sprach- und Kommunikationswis-senschaft (Band 10, Halbband 2, S. 1141-1152). Berlin: de Gruyter.

Deno, S.L. (1985). Curriculum-based measure-ment: The emerging alternative. ExceptionalChildren, 52, 219-232.

Deno, S.L. (2003a). Curriculum-Based Measu-res: Development and Perspectives. Assess-ment for Effective Intervention, 28, 3-12.

Deno, S.L. (2003b). Developments in Curricu-lum-Based Measurement. The Journal ofSpecial Education, 37, 184-192.

Diehl, K. & Hartke, B. (2007). CurriculumnaheLernfortschrittsmessungen. Sonderpädago-gik, 37, 195-211.

Diehl, K. & Hartke, B. (im Druck). SchulischePrävention im Bereich Lernen. Stuttgart:Kohlhammer.

Diehl, K. (2009a). Schriftspracherwerb undLernfortschrittsdokumentation. Saarbrü-cken: svh.

Diehl, K. (2009b). Das Inventar zur Erfassungder Lesekompetenzen von Erstklässlern (IEL-1) – theoretische Grundlagen sowie empiri-sche Befunde zur Validität. Die Sprachheil-arbeit. Fachzeitschrift für Sprachheilpädago-gik und Sprachtherapie, 54, 87-107.

Dinges, E. (2002). Systematische Beurteilungund Förderung schulischer Leistungen. Hor-neburg: Persen.

Fuchs, D., Fuchs, L.S. & Compton, D.L. (2004).Identifying reading disabilities by responsi-veness-to-instruction: specifying measures

144 K. Diehl, B. Hartke

and criteria. Learning Disabilities Quarterly,27, 216-227.

Fuchs, L.S. (2004). The Past, Present, and Futureof Curriculum-Based Measurement Re-search, School Psychology Review, 33, 188-192.

Fuchs, D. & Fuchs, L.S. (2005). Peer-AssistingLearning Strategies: Promoting Word Reco-gnition, Fluency, and Reading Comprehensi-on in Young Children. The Journal of Speci-al Education, 39, 34-44.

Fuchs, L. S. & Fuchs, D. (1986). Effects of syste-matic formative evaluation: A meta-analysis.Exceptional Children, 53 (3), 199-208.

Groeben, N. & Hurrelmann, B. (2006). Empiri-sche Unterrichtsforschung in der Literatur-und Lesedidaktik. Ein Weiterbildungspro-gramm. Weinheim: Juventa.

Grube, D. & Hasselhorn, M. (2006). Längs-schnittliche Analysen zur Lese-, Recht-schreib- und Mathematikleistung im Grund-schulalter: zur Rolle von Vorwissen, Intelli-genz, phonologischem Arbeitsgedächtnisund phonologischer Bewusstheit. In I. Ho-senfeld & F.-W. Schrader (Hrsg.), SchulischeLeistung. Grundlagen, Bedingungen, Per-spektiven (S.87-105). Münster: Waxmann.

Haager, D., Klingner, J. K. & Vaughn, S. (Eds.)(2007). Validated reading practices for threetiers of intervention. Baltimore, MD: Broo-kes.

Hartke, B., Diehl, K. & Vrban, R. (2008). Pla-nungshilfen zur schulischen Prävention –Früherkennung und Intervention bei Lern-und Verhaltensproblemen. In J. Borchert, B.Hartke & P. Jogschies (Hrsg.), Frühe Förde-rung entwicklungsauffälliger Kinder und Ju-gendlicher (S. 218-234). Stuttgart: Kohlham-mer.

Hartmann, E. (2008). Konzeption und Diagnos-tik von schriftsprachlichen Lernstörungen imResponsiveness-to-Intervention-Modell: einekritische Würdigung. In: VHN 77, 123-137.

Klauer, K.J. (2006). Erfassung des Lernfort-schritts durch curriculum-basierte Messung.Heilpädagogische Forschung, 32, 16-26.

Klicpera, C. & Gasteiger-Klicpera, B. (1995). Psy-chologie der Lese- und Schreibschwierigkei-ten. Beltz: Weinheim.

Klicpera, C., Schabmann, A. & Gasteiger-Klicpe-ra, B. (2003). Legasthenie. Modelle, Diagno-

Page 25: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

se, Therapie und Förderung. München:Reinhardt.

Koch, K. (2007). Die wissenschaftliche Beglei-tung des Projektes Primarstufe in Mecklen-burg-Vorpommern – Bilanz, ausgewählte Er-gebnisse und Zukunft der Studie. In K. Diehl& K. Koch (Hrsg.), Neues aus Forschungund Lehre. 2. Fachtagung des Instituts fürSonderpädagogische Entwicklungsförde-rung und Rehabilitation (ISER) (S. 34-51).Universität Rostock.

Koch, K., Hartke, B. & Blumenthal, Y. (2008).Die Lernausgangslage von Kindern mit be-sonderem Förderbedarf in Grundschulklas-sen 1 und Diagnoseförderklassen. Rostock:Universität, Institut für SonderpädagogischeEntwicklungsförderung und Rehabilitation.

Küspert, P. & Schneider, W. (1998). WürzburgerLeise Leseprobe (WLLP). Ein Gruppentestfür die Grundschule. Göttingen: Hogrefe.

Lenhard, W. & Schneider, W. (2006). Elfe 1-6.Ein Leseverständnistest für Erst- bis Sechs-klässler. Göttingen: Hogrefe.

Meiers, K. (1996). Aspekte und Probleme desLeseunterrichts: Erstlesen. In H. Günther &O. Ludwig (Hrsg.), Schrift und Schriftlich-keit. Handbücher zur Sprach- und Kommu-nikationswissenschaft (Band 10, Halbband2, S. 1217-1224). Berlin: de.

Moser Opitz, E. (2007). Rechenschwäche/Dys-kalkulie. Theoretische Klärungen und empi-rische Studien an betroffenen Schülerinnenund Schülern. Bern: Verlag Paul Haupt.

National Center on Response to Intervention.www.rti4success.org. Zugriff am 14.12.2010.

Rost, J. (2004). Lehrbuch Testtheorie – Testkon-struktion (2. überarbeitete und erweiterteAuflage). Bern: Hans Huber.

Scheerer-Neumann, G. (1981). Prozessanalyseder Leseschwäche. In R. Valtin, U. Jung & G.Scheerer-Neumann (Hrsg.), Legasthenie inWissenschaft und Unterricht (S. 183-209).Darmstadt: Wissenschaftliche Buchgesell-schaft.

Scheerer-Neumann, G. (1995). Lesenlernen:Entwicklungsprozesse und Probleme (Pots-damer Studien zur Grundschulforschung(Heft 4). Potsdam: Universität.

Scriven, M. (1972). The Methodology of Evalua-tion, M. Scriven, In R.W. Tyler, R.M. Gagné

145Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1

& M. Scriven (Hrsg.), Perspectives of Curri-culum Evaluation (5. Aufl., S. 39-83). USA:Rand McNally & Company.

Smith, P.K., Pepler, D. & Rigby, K. (2004). Bully-ing in schools: How successful can interven-tions be? Cambridge: Cambridge UniversityPress.

Stecker, P. M. & Fuchs, L. S. (2000). Effecting su-perior outcomes using curriculum-basedmeasurement: The importance of individualprogress monitoring. Learning DisabilitiesResearch and Practice, 15, 128-143.

Stern, T. (2004). Neue Wege zu einer förderli-chen Leistungsbewertung. Eine neue Lern-kultur braucht eine neue Prüfungskultur.Lernende Schule, 7 (28), 16-21.

Strathmann, A. & Klauer, K. J. (2008). Diagnos-tik des Lernverlaufs. Eine Pilotstudie am Bei-spiel der Entwicklung der Rechtschreibkom-petenz. Sonderpädagogik, 38, 5-25.

Strathmann, A. & Klauer, K. J. (2010). Lernver-laufsdiagnostik: Ein Ansatz zur längerfristi-gen Lernfortschrittsmessung. Zeitschrift fürEntwicklungspsychologie und PädagogischePsychologie, 42, 111-122.

Strathmann, A., Klauer, K. J. & Greisbach, M.(2010). Lernverlaufsdiagnostik. Dargestelltam Beispiel der Rechtschreibkompetenz inder Grundschule. Empirische Sonderpäda-gogik, 2, 64-77.

Walter, J. (1996). Förderung bei Lese- undRechtschreibschwäche. Göttingen: Hogre-fe.

Walter, J. (2001). Förderung bei Lese- undRechtschreibschwäche (2. unveränderteAuflage). Göttingen: Hogrefe.

Walter, J. (2008a). Adaptiver Unterricht erneutbetrachtet: Über die Notwendigkeit syste-matischer formativer Evaluation von Lehr-und Lernprozessen und die daraus resultie-rende Diagnostik und Neudefinition vonLernstörungen nach dem RTI-Paradigma.Zeitschrift für Heilpädagogik, 59, 202-215.

Walter, J. (2008b). Curriculumbasiertes Messen(CBM) als lernprozessbegleitende Diagnos-tik: Erste deutschsprachige Ergebnisse zurValidität, Reliabilität und Veränderungssensi-bilität eines robusten Indikators zur Lernfort-schrittsmessung beim Lesen. Heilpädagogi-sche Forschung, 34, 62-79.

Page 26: Zur Reliabilität und Validität des formativen ...€¦ · Zur Reliabilität und Validität des formativen Bewertungssystems IEL-1 121 Empirische Sonderpädagogik, 2011, Nr. 2, S

Walter, J. (2009a). Theorie und Praxis Curricu-lumbasierten Messens (CBM) in Unterrichtund Förderung. Zeitschrift für Heilpädago-gik, 60, 162-170.

Walter, J. (2009b). Eignet sich die Messtechnik„MAZE“ zur Erfassung von Lesekompeten-zen als lernprozessbegleitende Diagnostik?Heilpädagogische Forschung, 35, 62-75.

Willson, V.L. & Rupley, W.H. (1997). A Structu-ral Equation Model for Reading Compre-hension Based on Background, Phonemic,and Strategy Knowledge. Scientific Studiesof Reading, 1, 45-63.

146 K. Diehl, B. Hartke

Anschriften der Autoren:

DR. KIRSTEN DIEHL

Institut für sonderpädagogische

Entwicklungsförderung und Rehabilitation

August-Bebel-Str. 28

18051 Rostock

[email protected]

PROF. DR. BODO HARTKE

Institut für sonderpädagogische

Entwicklungsförderung und Rehabilitation

August-Bebel-Str. 28

18051 Rostock

[email protected]