132
„Lehrerurteile im Lebensverlauf“ Abschlussbericht an die DFG zum Projekt DO 325 4/1 Klaus Birkelbach und Rolf Dobischat (Hrsg.) Essen im Januar 2010 Fakultät für Bildungswissenschaften

„Lehrerurteile im Lebensverlauf“ - iss-wiso.uni-koeln.de · duate School in Management, Economics and Social Sciences weiter zusammen mit Klaus Birkelbach an den Publikationen

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

„Lehrerurteile im Lebensverlauf“

Abschlussbericht an die DFG zum Projekt DO 325 4/1

Klaus Birkelbach und Rolf Dobischat (Hrsg.)

Essen

im

Januar 2010

Fakultät für Bildungswissenschaften

Vorbemerkungen

In dem Projekt „Lehrerurteile im Lebensverlauf“, zu dem jetzt der Abschlussbericht vorgelegt

wird, wurden Daten einer Lehrerzusatzbefragung der Primärerhebung des Kölner Gymna-

siasten-Panels (KGP), das 1969/70 mit einer Befragung von 15-jährigen Gymnasiasten, ihren

Eltern und Lehrer begann und bis heute fortgesetzt wird, erstmalig elektronisch aufbereitet

und ausgewertet.

Ausgewertet wurden in dem Projekt Fragebögen, in denen die damaligen Lehrer um eine Be-

urteilung der Eignung ihrer Schüler für ein Studium gebeten wurden. Die nur in Schriftform

vorliegenden Fragebögen mussten zunächst erfasst und mit den Daten des KGP verknüpft

werden. Dem Kölner Datenarchiv von GESIS, wo auch alle anderen zum KGP gehörigen Da-

tensätze verfügbar sind, werden zwei Datensätze übergeben, die (1.) Auswertungen auf Ebene

der Schüler und (2.) Auswertungen auf Lehrerebene ermöglichen. Die gesamte Aufbereitung

und Verknüpfung der Daten wurde in dem Beitrag „Aufbereitung der Daten der Lehrerzu-

satzerhebung und deren Integration in die Daten des Kölner Gymnasiasten-Panels (KGP)“

dokumentiert.

Inhaltlich werden mit diesem Bericht zunächst Analysen vorgelegt, in denen der Hintergrund

der Lehrerurteile analysiert wird. Der Beitrag „Teacher Evaluations and the Definition of the

Situation in the Classroom“ (Becker/Birkelbach) untersucht auf der Basis eines handlungs-

theoretischen Modells mit Hilfe von Strukturgleichungsmodellen die Zusammenhänge zwi-

schen Intelligenz, Schulleistungen, sozialer Herkunft, Aspirationen und Lehrerurteilen. Der

Beitrag „Lehrerurteile im Klassenkontext. Eine Mehrebenen-Analyse von Lehrerurteilen“

(Becker/Birkelbach) geht der Frage nach, inwieweit die Lehrer sich bei der Beurteilung ein-

zelner Schüler mangels anderer Maßstäbe an dem Leistungsniveau der Klasse orientieren.

Dieser Artikel erscheint in stark gekürzter Form in dem von Tilo Beckers, Klaus Birkelbach,

Jörg Haganah und Ulrich Rosar im VS Verlag herausgegebenen Reader „Komparative empi-

rische Sozialforschung“. Ein weiterer Beitrag beschäftigt sich mit der Frage, inwieweit Leh-

rerurteile als valide Prognosen zukünftiger Erfolge im Lebensverlauf betrachtet werden kön-

nen oder ob sie in Form einer Self-Fulfilling Prophecy den weiteren Lebensverlauf zu beein-

flussen vermögen (Birkelbach: „Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-

Fulfilling Prophecy?“). Der Aufsatz befindet sich im Begutachtungsprozess bei der Kölner

Zeitschrift für Soziologie und Sozialpsychologie. Diesen Artikeln wird ein Beitrag vorange-

stellt, der die wesentlichen Ergebnisse der im Projekt durchgeführten Analysen aus der Per-

spektive der Frage der Bedeutung von individueller Leistung im gesellschaftlichen Statuszu-

weisungsprozess zusammenfasst: „Lehrerurteile und meritokratisches Prinzip. Empirische

Ergebnisse aus einem Langfristpanel 1969/70-1996/97“ (Birkelbach). Dieser Aufsatz wird in

dem vom Klaus Birkelbach, Axel Bolder und Karl Düsseldorff herausgegebenen Reader „Be-

rufliche Bildung in Zeiten beschleunigten Wandels“ publiziert.

Die in dem hier vorgelegten Bericht beschriebenen Arbeiten wurden ermöglicht durch die

Bewilligung einer wissenschaftlichen Hilfskraft für die Dauer eines Jahres durch die Deutsche

Forschungsgemeinschaft, der an dieser Stelle ausdrücklich gedankt sei. Diese Stelle wurde für

6 Monate von Dominik Becker ausgefüllt, der auch nach seinem Weggang zur Cologne Gra-

duate School in Management, Economics and Social Sciences weiter zusammen mit Klaus

Birkelbach an den Publikationen gearbeitet hat. Unser Dank gebührt Heiner Meulemann, der

das KGP seit Mitte der 70er Jahre bis heute unermüdlich vorantreibt und gemeinsam mit

Klaus Birkelbach eine weitere Wiederbefragung der inzwischen 55-jährigen ehemaligen

Schüler bei der DFG beantragt und bewilligt bekommen hat, für die Bereitstellung der Frage-

bögen und seine kontinuierliche Unterstützung während des Projektes. Wer Daten auswerten

möchte, deren Erhebung derart lange zurückliegt, der muss „Projektarchäologie“ betreiben.

Zu danken ist daher an dieser Stelle besonders Maria Wieken-Mayser, die an der Konzeption

und Durchführung der Primärerhebung 1969/70 beteiligt war, für ihre Gesprächsbereitschaft

und die Bereitstellung wichtiger Unterlagen, die das Verständnis der Datenstruktur sehr er-

leichtert haben, sowie den Kollegen am Kölner Datenarchiv. Die Projektarbeiten wären ohne

eine Reduzierung des umfangreichen Stundendeputats einer Lehrkraft für besondere Aufga-

ben für Klaus Birkelbach durch die Fakultät für Bildungswissenschaft der Universität Duis-

burg-Essen nicht möglich gewesen, bei deren Dekan, Herrn Prof. Horst Bossong, wir uns für

die Unterstützung bedanken möchten.

Essen im Januar 2010

Klaus Birkelbach und Rolf Dobischat

Inhaltsübersicht

Lehrerurteile und meritokratisches Prinzip. Empirische Ergebnisse 1 aus einem Langfristpanel 1969/70-1996/97

(Klaus Birkelbach)

Teacher Evaluations and the Definition of the Situation in the Classroom 23

(Dominik Becker & Klaus Birkelbach)

Lehrerurteile im Klassenkontext. Eine Mehrebenen-Analyse von Lehrerurteilen 59

(Dominik Becker & Klaus Birkelbach)

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 87

(Klaus Birkelbach)

Aufbereitung der Daten der Lehrerzusatzerhebung und deren Integration in die 115 Daten des Kölner Gymnasiasten-Panels (KGP)

(Dominik Becker & Klaus Birkelbach)

  

 

 

 

Lehrerurteile und meritokratisches Prinzip 

 

Empirische Ergebnisse aus einem Langfristpanel 1969/70-1996/97

 

 

 

Arbeitspapier Nr. 5 der Projektgruppe „Lehrerurteile im Lebensverlauf“

 

 

Klaus Birkelbach (Fakultät für Bildungswissenschaften, Universität Duisburg-Essen)

 

 

 

Universität Duisburg-Essen, Dezember 2009

 

Lehrerurteile und meritokratisches Prinzip 2

1 Einleitung

Das auf individueller Leistung basierende meritokratische Prinzip gilt in modernen Gesell-schaften als zentraler Allokations- und Selektionsmechanismus für den Erwerb sozialer Posi-tionen und von sozialem Status. Die funktionalistische Schichtungstheorie betont, dass jede Gesellschaft darauf angewiesen sei, eine Anreizstruktur und legitime Allokationsmechanis-men zu entwickeln, um die Positionen in der Gesellschaft mit den leistungsfähigsten, begab-testen und am besten qualifizierten Personen zu besetzen: „Social inequality is thus an unconsciously evolved device by which societies insure that the most important positions are conscientiously filled by the most qualified persons“ (Davis / Moore 1945: 243). Soziale Un-gleichheit ist als Belohnungssystem aus dieser Perspektive eine funktionale Notwendigkeit um die individuellen Akteure in der Gesellschaft durch prestigeträchtige Belohnungen zu Leistungen und zur Übernahme von Pflichten und Positionen zu motivieren, die für die Ge-sellschaft notwendig sind. Die Belohnungen sind dabei an individuell zurechenbare Leistun-gen geknüpft, so wie es das meritokratische Prinzip (vgl. Young 1961; Hadjar 2008; Becker, R. / Hadjar 2009) postuliert. In Youngs satirischem Essay „The Rise of Meritocracy“ (1961: 94) wird dieses Prinzip folgendermaßen zusammengefasst: „Intelligence and effort together make up merit (I + E = M)“.

Das Bildungswesen hat im meritokratischen Modell eine herausgehobene Stellung. Schon Ende der 50er Jahre des vergangenen Jahrhunderts hat Helmut Schelsky (1957: 18) die Schule als „erste und damit entscheidende zentrale Dirigierungsstelle für die künftige soziale Sicher-heit, für den künftigen sozialen Rang und für das Ausmaß künftiger Konsummöglichkeiten“ bezeichnet. In den gestuften und an jeder Schwelle selektiven Institutionen des Bildungswe-sens erwerben die Schüler mit ihren spezifischen Begabungen und ihren individuellen Leis-tungen die notwendigen Qualifikationen und Kompetenzen für bestimmte berufliche Tätigkei-ten und Positionen. Diese werden in Zeugnissen und Bildungszertifikaten dokumentiert, die ihrerseits wiederum den Weg auf die nächsthöhere Stufe der „hierarchisch gegliederten Aus-bildungsleiter“ (Ziegenspeck 1999: 111) ermöglichen und letztlich auf dem Arbeitsmarkt als Indikatoren entsprechender Qualifikationen und Kompetenzen dienen und so Karrierepfade in mehr oder weniger prestige- und einkommensträchtige gesellschaftliche Positionen eröffnen.

„Jeder ist seines Glückes Schmied“ lautet daher das Credo moderner, an meritokratischen Prinzipien orientierter Gesellschaften. Über die Verteilung von knappen und begehrten Gütern und Positionen – oder allgemeiner: von Lebenschancen – soll allein die individuelle Leistung entscheiden, während leistungsfremde Kriterien – etwa die soziale Herkunft, das Geschlecht, der Migrationshintergrund oder unterschiedliche institutionelle Gelegenheitsstrukturen – in keine Rolle spielen dürfen. Das erscheint dann auch als „gerecht“, weil es dem Reziprozitäts-gedanken gleich doppelt verpflichtet erscheint: Einerseits dem meritokratischen Leistungs-prinzip, nach dem Leistung und Gegenleistung (also Belohnung) unmittelbar verknüpft sein sollten, andererseits sollen nach der funktionalistischen Schichtungstheorie die unterschiedli-chen Leistungen – und damit die daraus resultierende sozialen Ungleichheiten – auf lange Sicht wiederum der Gesellschaft insgesamt zugutekommen (vgl. zu soziologischen Diskussi-on des Gerechtigkeitsbegriffs: Arts 1995; Koller 1995; Müller / Wegener 1995; Hadjar 2008: 31-44). Als Konsequenz des meritokratischen Prinzips erscheint soziale Ungleichheit gerecht-fertigt und wird gesellschaftlich akzeptiert, weil sie der individuellen Leistung zugerechnet wird (Mayer 1975: 72; Solga 2005; Hadjar 2008; Becker, R. / Hadjar 2009). Die funktionalis-tische Schichtungstheorie hebt denn auch besonders die Bedeutung der Legitimität der An-reiz- und Belohnungsstruktur für die Integration der Gesellschaft hervor.

Der Glaube an das meritokratische Prinzip ist auch in der Bundesrepublik weitgehend ungebrochen, wenngleich insbesondere in den jüngeren, gut ausgebildeten Kohorten auch

Lehrerurteile und meritokratisches Prinzip 3

kritische Töne zu vernehmen sind, wie Hadjar (2008) anhand der Daten des kumulierten ALLBUS zu zeigen vermag. Nach wie vor gilt eine gute Ausbildung als wichtigster Erfolgs-faktor. Einen Überblick über verschiedene Studien, die Fragen der Legitimation von sozialer Ungleichheit durch das meritokratische Prinzip im Bewusstsein der Bevölkerung aus ver-schiedenen Perspektiven thematisieren, geben Becker / Hadjar (2009, 47-49). Dagegen weisen eine Vielzahl empirischer Untersuchungen seit den 60-er Jahren des vorigen Jahrhunderts (z.B. Dahrendorf 1965; Peisert 1967) bis heute (einen Überblick vermitteln Blossfeld et al. 2007) immer wieder darauf hin, dass die Zugänge zu höheren Bildungsgängen, Bildungser-folge und die berufliche Positionierung in Deutschland von der sozialen Herkunft abhängen.

Wie Breen & Goldthorpe (2001) sowie Goldthorpe (2003) am Beispiel Großbritanniens zeigen, lassen sich im Zeitverlauf keine Veränderungen im Prozess des gesellschaftlichen Statuserwerbs nachweisen, wie sie bei zunehmender Geltung des meritokratischen Prinzips auftreten sollten. Weder schwächt sich der Zusammenhang zwischen der Klassenlage der El-tern und der Bildungsbeteiligung ab, noch nimmt der Zusammenhang zwischen dem Bil-dungserfolg und dem eigenen Berufserfolg zu. Der stabile Zusammenhang zwischen der so-zialen Herkunft und dem Bildungserfolg wird vor allem als sekundärer Herkunftseffekt (Bou-don 1974; Esser 1999: 265-275; Maaz et al. 2006; Becker, R. / Lauterbach 2007) interpretiert: „It may well be that children of working-class origins are more ‘risk averse’ than children from more advantaged backgrounds but this might be merely rational, given differences in security and stability of parental income and income prospects – which are in fact the most immediate manifestations of social class.“ Der zweite Zusammenhang zeigt, dass über Bil-dung erworbene Qualifikationen und Kompetenzen offenbar nicht das zentrale Kriterium der Arbeitgeber für den Berufseintritt und die Karriere sind, so wie es dem meritokratischen Prin-zip zufolge sein sollte. Vielmehr scheinen insbesondere unter der Bedingung der Bildungsex-pansion bei der Vergabe prestige- und einkommensträchtiger Positionen andere Kriterien, die vielleicht am besten mit Bourdieus Konzept des Habitus (Bourdieu / Passeron 1971; Bourdieu 1987) verstanden werden können, an Bedeutung noch zu gewinnen. In diese Richtung weisen für Deutschland z.B. die Ergebnisse von Hartmanns Untersuchungen zur Eliterekrutierung (Hartmann 2001; Hartmann / Kopp 2001).

Die theoretische Kritik (Solga 2005; Hadjar 2008) am meritokratischen Prinzip zielt vor allem auf dessen legitimatorische Funktion, die als gesellschaftliche Ideologie den privilegier-ten Zugang zu Bildungszertifikaten und in der Folge soziale Ungleichheiten rechtfertigt, aber sie geht auch darüber hinaus und kritisiert die mangelnde Berücksichtigung struktureller Be-dingungen im Bildungswesen und der Gesellschaft insgesamt. Hadjar (Hadjar 2008) über-schreibt seine Untersuchungen den auch mit dem beziehungsreichen Titel: „Meritokratie als gesellschaftlicher Legitimationsmythos“. Darüber hinaus wird auch die Zirkularität des Leis-tungsbegriffs im meritokratischen Modell kritisiert. So stellt Heid (2003: 41) heraus: „Zur Leistung wird ein Handeln erst durch die Bewertung und Anerkennung dieses Handelns als Leistung“ und weiter unten: „Hinsichtlich ihrer Definitions- und Sanktionsmacht sind die Menschen außerordentlich ungleich.“ Damit wird das Problem der Definition und Messung von Leistungen problematisiert, das auch in den vorliegenden Untersuchungen in Form von Lehrerurteilen – allerdings weniger fundamental – thematisiert wird.

Eine besondere Rolle spielen in einer bildungsbasierten Meritokratie die Beurteilungen von Leistungsfähigkeit und erbrachten Leistungen der Schüler durch ihre Lehrer, da diese die Basis der Allokations- und Selektionsprozesse bilden (vgl. z.B. Avenarius et al. 2003: 153ff). Lehrer fungieren in einer bildungsbasierten Meritokratie als „Gatekeeper“ (Heinz 1996), da ihre Beurteilungen der Schülerleistungen bestimmte Pfade eröffnen oder verschließen können. Tent (2001: 580) spricht daher auch von einer „Weichenstellfunktion“ von Schulnoten, die die übliche Form der Beurteilung von Schülerleistungen darstellen. Was Schulnoten wirklich messen wird spätestens seit dem von Ingenkamp (1971) herausgegebenen Reader „Die Frag-würdigkeit der Zensurengebung“ kritisch diskutiert. Die Kritik setzt an allen drei Gütekriteri-

Lehrerurteile und meritokratisches Prinzip 4

en (Validität, Reliabilität und Objektivität) der Zensuren an (Ziegenspeck 1999: 133ff; Tent 2001: 582f). So zeigt eine Reihe von Untersuchungen (zusammenfassend: Ingenkamp 1989: 58; Ziegenspeck 1999: 136-142), dass in unterschiedlichen Fächern unterschiedliche Beurtei-lungsmaßstäbe angelegt werden. Schwerwiegender erscheint, dass sich die Lehrer bei der Be-urteilung und Zensurengebung von Schülerleistungen an einem klasseninternen Bezugssystem orientieren (Ingenkamp 1971: 156-163; 1989: 59; Klauer 1989; Ziegenspeck 1999: 142f; Weinert 2001: 50). Lehrer sind danach zwar in der Lage, die Rangfolge der Leistungen inner-halb einer Klasse einzuschätzen, aber jenseits dieser Bezugsgröße fehlt ein allgemein verbind-licher Maßstab für Leistungsbeurteilungen. Das hat zur Folge, dass Schüler der gleichen Schulform und Klassenstufe für objektiv gleiche Leistungen unterschiedlich bewertet werden. Häufig werden darüber hinaus Zusammenhänge der Benotung mit der sozialen Schicht be-richtet (zusammenfassend: Ziegenspeck 1999-238).

Ähnliche Zweifel, wie sie an Schulnoten geäußert werden, bestehen auch für andere Formen der Beurteilung von Schülerleistungen. Insbesondere beim Übergang von der Grund-schule in die verschiedenen Schulformen der Sekundarstufe spielen allgemeinere Lehrerurtei-le mit einem über die einzelne Note hinausweisenden prognostischen Anspruch eine besonde-re Rolle. Die je nach Bundesland unterschiedlich verbindlichen Übergangsempfehlungen sind wegen ihrer weitreichenden Folgen in der Vergangenheit häufiger untersucht worden (Ingen-kamp 1968; Rauh 1977; Sauer / Gamsjäger 1986; Paulus / Lauermann 2004). Auch in aktuel-len Schulleistungsstudien, wie der Grundschulstudie IGLU / PIRLS (Bos et al. 2004; Bos et al. 2007), den Hamburger Studien KESS 4 (Bos / Pietsch 2004) und LAU (Lehmann et al. 1997) wird auf Diskrepanzen zwischen gemessenen Kompetenzen, Noten und Lehrerurteilen hingewiesen. Gleichzeitig werden enge Zusammenhänge zwischen Übergangsempfehlungen und der sozialen Herkunft der Schüler nachgewiesen (z.B. Ditton / Krüsken 2006).

Gegenstand des Projektes „Lehrerurteile im Lebenslauf“, dessen Ergebnisse hier zusam-menfassend dargestellt werden sollen, waren Beurteilungen von Schülerinnen und Schülern der 10. Klasse bezüglich ihrer Eignung für ein Studium durch ihre Lehrer. Untersucht wurde, inwieweit (1.) die Lehrerurteile auf Leistungsfähigkeit und aktuellen Leistungen beruhen, also sich an den Kriterien einer bildungsbasierten Meritokratie orientieren, und inwiefern andere, dem meritokratischen Prinzip widersprechende Faktoren, wie z.B. die soziale Herkunft oder der spezifische Kontext der Klasse, die Beurteilungen beeinflussen. Darüber hinaus wurden (2.) die langfristigen Zusammenhänge der Lehrerurteile mit dem weiteren Ausbildungsverlauf und dem Berufserfolg untersucht. Dabei ist vordergründig die langfristige prognostische Vali-dität der Lehrerurteile angesprochen, aber es geht zugleich um Prozesse der gesellschaftlichen Statuszuweisung und deren Orientierung an meritokratischen Prinzipien. In den Analysen wurden theoretische Ansätze der Lebensverlaufsforschung (Mayer 1990; Mayer / Blossfeld 1990; Mayer 2004) mit den handlungstheoretischen Ansätzen einer Wert-Erwartungstheorie (Esser 1993, 1999-2001; Blossfeld / Huinink 2001; Huinink / Schröder 2008) verknüpft.

Im Folgenden wird zunächst die Datenbasis, das Kölner Gymnasiastenpanel (KGP) kurz vorgestellt. Anschließend werden Ergebnisse von Analysen zum Hintergrund der Lehrerurtei-le berichtet: Zunächst werden Zusammenhangs- und Pfadanalysen beschrieben, inwieweit die Lehrer sich bei der Urteilsbildung an der kognitiven Leistungsfähigkeit der Schüler und an ihren durch Noten dokumentierten schulischen Leistungen als legitimen meritokratischen Kri-terien orientieren und in welchem Maße darüber hinaus die soziale Herkunft und die über die soziale Herkunft vermittelten Aspirationen der Schüler in diesem Zusammenhang eine eigen-ständige Rolle spielen (Becker, D. / Birkelbach 2009a). Mithilfe von Mehrebenenanalysen wird anschließend der Frage nachgegangen, ob und wie die Lehrer sich bei der Beurteilung am Klassenkontext orientieren (Becker, D. / Birkelbach 2009c). Anschließend werden Unter-suchungen vorgestellt, die der Frage nachgehen, inwieweit Lehrerurteile sich langfristig als valide Urteile erweisen und ob sie möglicherweise auch darüber hinaus den weiteren Bil-

Lehrerurteile und meritokratisches Prinzip 5

dungsverlauf und den Berufserfolg im Sinne einer Self-fulfilling Prophecy (Merton 1948) zu beeinflussen vermögen (Birkelbach 2009).

2 Das Kölner Gymnasiasten-Panel

In einer klassenweisen schriftlichen Befragung wurden 1969/70 nordrhein-westfälischen Gymnasiasten des 10. Schuljahres (n=3240) in einer schriftlichen klassenweisen Befragung u.a. über ihre schulischen Interessen, Leistungen und Pläne, ihre soziale Herkunft und ihre Einstellungen zu Elternhaus und Schule befragt. Dabei wurde auch ein Intelligenz-Struktur-Test mit vier Subskalen des IST (Amthauer 1953) durchgeführt. Parallel zur Erhebung bei den Schüler/innen1 wurden Befragungen bei deren Eltern (n=2646) und Lehrern (n=2680) durch-geführt. Gegenstand der Elternbefragung war u.a. die soziale Herkunft, der Erziehungsstil und die Aspirationen für die Kinder (ZA-Studien-Nr. 639). Bei der Lehrerbefragung ging es u.a. um deren pädagogisches Selbstverständnis und das Schulklima (ZA-Studien-Nr. 640).2 In einem Zusatzbogen wurden die Lehrer, die in den befragten Klassen unterrichtet haben, zu-sätzlich um Beurteilungen ihrer Schüler gebeten. Diese Lehrerzusatzbögen wurden erstmals im Rahmen des Projektes „Lehrerurteile im Lebensverlauf“ ausgewertet.3 Die Datenaufberei-tung der Lehrerzusatzbögen ist in einem gesonderten Bericht dokumentiert (Becker, D. / Bir-kelbach 2009b). Mithilfe einer Aktenanalyse konnten 1981/82 die Zeugnisnoten des 10. Schuljahres und die Noten im Abitur ermittelt und den Daten hinzugefügt werden. Zwischen September 1984 und Juni 1985 wurde eine erste Wiederbefragung (WB1, n=1987) durchge-führt, in der die damals rund 30-jährigen ehemaligen Gymnasiasten in standardisierter Form detailliert über ihren beruflichen und privaten Werdegang zwischen dem 15. und dem 30. Le-bensjahr Auskunft gegeben haben.4 Ergebnisse der ersten Wiederbefragung werden in den Berichten an die DFG (Meulemann et al. 1987; Meulemann et al. 1993) vorgestellt. Weiter-führende Analysen zu verschiedenen Bereichen des beruflichen und privaten Lebenslaufes werden u.a. von Meulemann (1995) und Birkelbach (1998a) zusammengefasst.

Eine zweite Wiederbefragung 1996/97 (WB2, n=1596) knüpft unmittelbar an die Daten der ersten Wiederbefragung an und ergänzt die privaten und beruflichen Lebensverläufe um den Zeitraum zwischen dem 30. und 43. Lebensjahr. Wie schon in der Primärerhebung wur-den auch in den beiden Wiederbefragungen neben den mit monatlicher Genauigkeit erhobe-nen privaten und beruflichen Lebensverläufen eine Vielzahl von Indikatoren zu verschiedenen

                                                       1 Aus Gründen der Lesbarkeit wird im Folgenden nur noch geschlechtsneutral von „Schülern“ und „Lehrern“

geschrieben; damit sind selbstverständlich weibliche und männliche Schüler bzw. Lehrer gemeint. 2 Die Primärerhebung 1969/70 wurde an dem von René König geleiteten Forschungsinstitut für Soziologie der

Universität zu Köln in einem vom Land NRW finanzierten Projekt unter der Leitung von Hans-Joachim Hummell, Michael Klein, Maria Wieken-Mayser und Rolf Ziegler durchgeführt. Die Daten der Schülerbefra-gung liegen unter der ZA-Studiennummer 600, die der Elternbefragung unter der Nummer 639, die der Leh-rer unter der Nummer 640. Der Datensatz zu den Lehrerzusatzbögen wird ebenfalls dem Kölner Datenarchiv zur Verfügung gestellt.

3 Die DFG hat die Datenaufbereitung und die Analysen durch die Finanzierung einer wissenschaftlichen Hilfs-kraft für die Dauer eines Jahres gefördert. Für die Unterstützung bei der Beschaffung der Zusatzbögen und der Aufbereitung der Daten ist Maria Wieken-Mayser, Heiner Meulemann und den Kollegen am Zentralar-chiv in Köln ganz herzlich zu danken. Rolf Dobischat danke ich für seine Unterstützung des Projektes und die Bereitstellung vorzüglicher Arbeitsbedingungen.

4 WB1 wurde von der DFG drei Jahre gefördert und am ZA in Köln durchgeführt. Projektleiter waren Hans-Joachim Hummell, Heiner Meulemann, Maria Wieken-Mayser und Rolf Ziegler. Die Daten sind im Zentral-archiv unter der ZA-Studiennummer 1441 verfügbar. Zusätzlich zur Erhebung hat die Deutsche Forschungs-gemeinschaft von 1991 bis 1993 eine zweijährige Auswertungsphase finanziert, die von Heiner Meulemann geleitet und von Stephan Blaneck und Klaus Birkelbach bearbeitet wurde.

Lehrerurteile und meritokratisches Prinzip 6

Themen (u.a. biographische Selbstdefinition und -reflexion, Kausalattributionen, Zentralität von Lebensbereichen, Einstellungen zu Familie, Arbeit und Politik) erfragt. Die Daten von WB1 und WB2 wurden zusammen mit ausgewählten Variablen der Primärerhebung zu the-matisch differenzierten Datensätzen verknüpft und dem Zentralarchiv zur Verfügung gestellt. Ergebnisse von Analysen mit den Daten von WB2 werden u.a. in dem Ergebnisbericht an die DFG (Birkelbach et al. 1998, 2000b, a) sowie zusammenfassend von Meulemann et al. (2001) berichtet.5 Im Frühjahr 2010 wird eine dritte Wiederbefragung (WB3) ins Feld gehen, die an die beruflichen und privaten Lebensverläufe bis zum 43. Lebensjahr anknüpfen und sie bis zum 55. vervollständigen soll. Es werden viele Fragen der früheren Erhebungen repliziert; neues Thema ist darüber hinaus die Vorbereitung auf das Alter.6

Mögliche Verzerrungen durch Panelmortalität wurden sowohl bei der ersten (Meulemann et al. 1987) als auch bei der zweiten Wiederbefragung (Birkelbach 1998b) ausführlich unter-sucht. Die Analysen haben gezeigt, dass die Ausfallneigung wesentlich stärker durch die Kooperationsbereitschaft und das Interesse am Thema beeinflusst wird als durch biographi-sche Erfolgskriterien. Dennoch ist an den Variablen zum Bildungsverlauf ein schwacher Er-folgsbias ablesbar, der bei Analysen zum Erfolg im Lebensverlauf zu berücksichtigen ist, denn er schränkt die Varianz der Bildungsverläufe etwas ein – führt aber gerade deshalb zu einer strengeren Überprüfung möglicher Effekte der Lehrerurteile auf die Erfolge im Ausbil-dungs- und Berufsverlauf.

3 Hintergrund der Lehrerurteile zur Studieneignung

3.1 Lehrerurteile In dem Lehrerzusatzbogen7 wurden die Lehrer in zwei Fragen gebeten, eine Einschätzung abzugeben, welche ihrer Schüler am besten zur Aufnahme eines Hochschulstudiums geeignet seien und welche nicht:

1. Wen aus der Klasse halten Sie unabhängig vom derzeitigen Leistungsstand für besonders geeignet, ein Studium zu ergreifen?

2. Von welchen Schülern der Klasse glauben Sie, dass sie auf keinen Fall zum Studium ge-eignet sind?

Fasst man beide Fragen in einer Variablen mit zwei Ausprägungen zusammen, dann bleibt ein großer Anteil von Schülern, der weder ein positives noch ein negatives Urteil erhalten hat: Von ihrem Klassenlehrer wurden 751 Schüler als geeignet (30,9%) und 616 Schüler als nicht geeignet (25,4%) beurteilt, während 1060 Schüler keine Beurteilung (43,7%) erhielten.8 Es ist zu erwarten, dass die Lehrer sich ihres Urteils vor allem bei besonders leistungsstarken und

                                                       5 WB2 wurde von Heiner Meulemann beantragt, und gemeinsam mit Klaus Birkelbach, der die Feldarbeit

leitete, und Jörg-Otto Hellwig als Projektmitarbeiter sowie Werner Hemsing am Institut für Angewandte So-zialforschung der Universität zu Köln (IFAS) durchgeführt und von der DFG insgesamt vier Jahre gefördert. Die Daten sind im Kölner Datenarchiv für Sozialforschung der GESIS unter der Studiennummer 4228 ver-fügbar.

6 WB3 wurde von Klaus Birkelbach (Duisburg-Essen) und Heiner Meulemann (Köln) gemeinsam bei der DFG beantragt und für eine Laufzeit von zunächst 30 Monaten bewilligt. Projektmitarbeiterinnen sind in Essen Christiane Reinelt und Anne Weber; die Projektstellen in Köln konnten noch nicht endgültig besetzt werden.

7 Der gesamte Lehrerzusatzbogen wird im Anhang von Becker, D. / Birkelbach (2009b) dokumentiert. 8 Die Schüler wurden von allen Lehrern, von denen sie zum Zeitpunkt der Befragung unterrichtet wurden,

beurteilt. Die Analysen wurden auf die Urteile der Klassenlehrer beschränkt, da anzunehmen ist, dass die Klassenlehrer i.d.R. einen intensiveren Kontakt zu ihren Schülern haben und sie sie daher valider als einzelne Fachlehrer beurteilen können.

Lehrerurteile und meritokratisches Prinzip 7

bei besonders leistungsschwachen Schülern so sicher sind, dass sie eine explizite Prognose wagen, während sie bei durchschnittlichen Schülern eher darauf verzichten.

3.2 Individualebene9

3.2.1 Hypothesen und Variablen In einem meritokratischen System sollte das Lehrerurteil ausschließlich auf der kognitiven Leistungsfähigkeit und den aktuellen Schulleistungen der Schülerinnen und Schüler basieren. Als Indikator der Leistungsfähigkeit wurde in den Analysen auf die durch vier Subskalen des Intelligenz-Struktur-Tests (Amthauer 1953) gemessene Intelligenz (IST) zurückgegriffen, Indikator der Schulleistungen war der Notendurchschnitt der 10. Klasse. Schulnoten haben als offensichtlicher Indikator für Schulleistungen deutlichen Einfluss auf die Lehrerurteile (Kris-ten 2006; Arnold et al. 2007: 283). Die soziale Herkunft, gemessen durch das Berufsprestige (Treiman 1977) und den höchsten Bildungsabschluss der Eltern, sollte dagegen in einem me-ritokratischen System keine Rolle spielen.10 Während der Zusammenhang zwischen der sozia-len Herkunft und den Leistungen der Schüler als primärer Effekt sozialer Ungleichheit be-trachtet werden, kann zusätzlich ein über die Aspirationen der Eltern bzw. Schüler vermittel-ter sekundärer Effekt sozialer Ungleichheit erwartet werden (Boudon 1974; Erikson et al. 2005; Müller-Benedict 2007; Becker, R. 2009). Versteht man Bildung als Investitionsgut (Goldthorpe 1996: 494), dann wollen höhere Schichten einen sozialen Abstieg vermeiden, in dem sie sich für entsprechende Bildungsgänge entscheiden. Für Eltern mit niedrigerem sozia-lem Status reicht dagegen nicht nur eine niedrigere Schulform für die Statusreproduktion aus, sondern jeder misslungene Versuch, eine höhere Schulform zu besuchen, ist mit hohen Kos-ten verbunden (Meulemann 1979: 23ff; Breen / Goldthorpe 1997; Esser 1999: 265-275; Erik-son et al. 2005; Maaz et al. 2006; Stocké 2007). Dies wird auch den Kindern vermittelt, so dass die Aspirationen der Kinder eng mit denen ihrer Eltern zusammenhängen (Meulemann 1979: 159). Es ist zu erwarten, dass durch unterschiedliche Aspirationen definierte sekundäre Effekte sozialer Ungleichheit unabhängig von dem Zusammenhang zwischen sozialer Her-kunft und kognitiven Kompetenzen von Schülern nicht nur die Übergangsentscheidungen beeinflussen, sondern bereits zuvor einen Einfluss auf Lehrerurteile besitzen, weil sie in den Interaktionen zwischen Schülern bzw. ihren Eltern und den Lehrern alltäglich kommuniziert werden. Darüber hinaus sind die Aspirationen aber natürlich auch durch die Leistungen beein-flusst. Über die verbale Kommunikation hinaus dürften sich soziale Herkunft und höhere As-pirationen auch in einem spezifischen Habitus (Bourdieu 1987) widerspiegeln, der mit den entsprechenden Normen und Erwartungen der Lehrer übereinstimmt und dadurch eher zu po-sitiven Beurteilungen führen dürfte. Die Aspirationen wurden in den Analysen durch die Antworten der Schülerinnen auf die Frage erhoben, ob das Abitur notwendig sei, das Lebens-ziel zu erreichen. Diese Merkmale der Schüler prägen die Erwartungen der Lehrer, ein Studi-um erfolgreich zu bewältigen. Bei ihrer Prognose werden sich die Lehrer in ihrer professio-nellen Rolle primär an der Leistungsfähigkeit und den Leistungen als den im Rahmen einer Bildungsmeritokratie legitimen Mitteln der Schüler, ein Studium erfolgreich zu bewältigen, orientieren. Zugleich aber werden auch (eher unbewusste) Mechanismen bei der Urteilsbil-dung wirksam, die davon abweichen, indem sie vor allem die soziale Herkunft der Schüler

                                                       9 Die im Folgenden präsentierten Ergebnisse basieren vor allem auf (Becker, D. / Birkelbach 2009a). 10 Es wurde jeweils das höchste Berufsprestige bzw. der höchste Bildungsabschluss beider Elternteile ermittelt.

Lehrerurteile und meritokratisches Prinzip 8

berücksichtigen. Aus diesen Überlegungen lässt sich die in Abbildung 1 dargestellte Zusam-menhangsstruktur ableiten:

Abbildung 1 Zusammenhänge zwischen sozialer Herkunft, Leistung und Lehrerurteilen (Hypothetisches Modell)

3.2.2 Ergebnisse Bivariate Analysen belegen signifikante Zusammenhänge (p < ,001) sowohl der Leistungsin-dikatoren als auch der Variablen zu sozialen Herkunft und der Aspirationen mit den Lehrerur-teilen (Becker, D. / Birkelbach 2009a: 13-15). In einer logistischen Regression (geeignet vs. ungeeignet als abhängiger Variable), bei der neben den genannten Variablen auch das Ge-schlecht kontrolliert wurde, hat die Durchschnittsnote den stärksten Effekt, gefolgt von den Aspirationen und der Intelligenz, während die soziale Herkunft nur einen schwachen (Bil-dungsniveau) bzw. keinen (Berufsprestige) signifikanten Effekt mehr hat (Becker, D. / Bir-kelbach 2009a: 17; vgl. auch Becker, D. / Birkelbach 2009c: Tab. 2). Offen bleibt dabei, in-wieweit bereits die Leistungen im Sinne eines primären Effektes durch die soziale Herkunft beeinflusst werden. Ein sekundärer Effekt der sozialen Herkunft ist an dem starken Einfluss der Aspirationen auf das Lehrerurteil ablesbar. Die Zusammenhangsstruktur der Lehrerurur-teile mit den Leistungsindikatoren, den beiden Indikatoren zur sozialen Herkunft und der As-pirationen wurde in einer Reihe von Pfadanalysen auf der Basis polychorischer Korrelationen (Jöreskog 1990; Fox 2006), die sich an dem theoretischen Modell in Abbildung 1 orientieren, untersucht.11 Getestet wurde eine Vielzahl von Modellen12, den besten Fit ergab das in Abbil-dung 2 wiedergegebene Strukturgleichungsmodell.

                                                       11 Für die Analysen wurden die Subskalen des IST, die Durchschnittsnote und das Elternprestige am Median

dichotomisiert, die Lehrerurteile wurden als dreistufige ordinale Variable operationalisiert: (1) nicht geeignet, (2) nicht genannt und (3) geeignet. Zur Begründung dieser Operationalisierung siehe Becker / Birkelbach (2009a: 26).

12 Die verschiedenen Modelle werden von Becker / Birkelbach (2009a) vorgestellt und ausführlich diskutiert.

Soziale Herkunft

Noten-durchschnitt

Intelligenz

Aspirationen Lehrerurteile

Lehrerurteile und meritokratisches Prinzip 9

Abbildung 2 Strukturgleichungsmodell

CHI2 = 22,75 (11 DF), p (> CH2) = 0,019 AGFI = 0,995; RMSEA = 0,018; CFI= 0,994; SRMR = 0,013

Das Strukturgleichungsmodel bestätigt die zentralen Ergebnisse der logistischen Regression: Auch hier erweist sich die Kovarianz zwischen dem Notendurchschnitt und dem Lehrerurteil als der stärkste Zusammenhang, schon etwas schwächer ist der direkte Effekt der Intelligenz auf die Lehrerurteile, allerdings werden die Schulnoten erwartungsgemäß positiv durch die Intelligenz beeinflusst.13 In unserer sozial hochselektiven Gymnasiastenstichprobe hat die soziale Herkunft weder auf die Noten noch auf die Intelligenz einen signifikanten Einfluss, aber sie beeinflusst die Ergebnisse eines der vier Indikatoren des IST, den Analogietest. Der wiederum hat einen signifikanten Effekt auf den Notendurchschnitt und darüber hinaus auch einen direkten Effekt auf das Lehrerurteil. Offenbar sind es in der vorliegenden Stichprobe vor allem die sprachliche Fähigkeiten, über die sich der primäre Effekt der sozialen Herkunft auf die Leistungen der Schüler und das Lehrerurteil manifestiert. Der sekundäre Effekt der sozialen Herkunft wird über die Aspirationen der Schüler vermittelt, die einerseits signifikant von der sozialen Herkunft beeinflusst werden und ihrerseits die Lehrerurteile beeinflussen. Darüber hinaus hat die soziale Herkunft auch einen direkten, in keiner Weise über Leistungen moderierten Einfluss auf das Lehrerurteil. Der Effekt ist deutlich schwächer als die Koeffi-zienten des Notendurchschnitts, der Intelligenz und der Aspirationen, aber er zeigt, dass auch völlig leistungsfremde Schülermerkmale das Lehrerurteil beeinflussen.

Insgesamt belegt das Modell, dass die Lehrer sich bei ihrer Urteilsbildung primär am me-ritokratischen Modell orientieren und kognitive Leistungsfähigkeit (Intelligenz) und Schul-leistungen (Notendurchschnitt) die wichtigsten Grundlagen des Lehrerurteils sind. Darüber

                                                       13 Die Pfade zwischen dem Notendurchschnitt, den Aspirationen und dem Lehrerurteil werden hier als Kova-

rianzen beschrieben, da hier von Wechselwirkungen auszugehen ist: Gute Noten begünstigen hohe Aspirati-onen, umgekehrt werden hohe Aspirationen auch auf einem entsprechend positivem Selbstkonzept basieren und dadurch gute Noten begünstigen. Eine positive Beurteilung basiert teilweise auf guten Noten, umgekehrt wird ein Lehrer einem von ihm positiv beurteilten Schüler auch eher eine gute Note geben.

Soziale Herkunft: Bildungsniveau

Eltern

Noten-durchschnitt

Intelligenz

Aspirationen,09 Lehrerurteile,20

,12

,08

,28

,40

Wort-TestAnalogie-

TestZahlen-

TestWürfel-

Test

,46 ,46,50,37

,12

,14

,09

,16

Lehrerurteile und meritokratisches Prinzip 10

hinaus zeigt das Modell aber auch, dass die soziale Herkunft ersten indirekt sowohl als primä-rer Effekt über die Leistungen als auch als sekundärer Effekt über die Aspirationen vermittelt das Lehrerurteil beeinflusst. Zweitens besteht ein zwar schwächerer, aber dem meritokrati-schen Modell völlig fremder direkter Effekt der sozialen Herkunft auf die Beurteilung der Studierfähigkeit der Schüler durch ihre Lehrer.

3.3 Lehrerurteile im Klassenkontext14

3.3.1 Vorüberlegungen und Hypothesen Wie von vielen Autoren betont wird, orientieren sich Lehrer bei der Beurteilung der Leistun-gen ihrer Schüler mangels anderer Maßstäbe häufig an einem klasseninternen Bezugssystem (z.B. Ingenkamp 1971: 156-163; Ingenkamp 1989: 59; Klauer 1989: 142f; Fickermann 1999; Ziegenspeck 1999: 142f; Schrader / Helmke 2001; Weinert 2001: 50). Nicht nur die Beurtei-lungen sondern auch die Leistungen der Schüler selbst hängen nicht nur von Individualmerk-malen ab, sondern werden – vermittelt über das jeweilige Selbstkonzept – auch durch Merk-male der Schulklasse beeinflusst. Derartige Referenzgruppeneffekte werden unter der Be-zeichnung „Big-Fish-Little-Pond-Effekt“ (BFLPE) und alternativ als „Reflected-Glory-Effekt (RGE) diskutiert (Marsh / Parker 1984; Marsh 1987; Marsh et al. 2000; Rindermann / Heller 2005; Marsh et al. 2007; Dai / Rinn 2008; Marsh et al. 2008; Trautwein et al. 2009). Aufgrund der klassenbezogenen Maßstäbe der Lehrer bei der Beurteilung der Leistungen sollten sich vergleichbare Effekte auch beim Lehrerurteil zeigen.

Der BFLPE nimmt an, dass ein Schüler mit einer gegebenen Begabung sich in einer ver-gleichsweise leistungsschwachen Klasse als „big fish“, also als vergleichsweise gut aufgestellt wahrnehmen, während er in einer leistungsstärkeren Klasse ein geringeres Selbstkonzept auf-weisen wird, was sich negativ auf seine Leistungen auswirkt. Mit dem BFLPE wird also ein negativer Effekt des Leistungsniveaus der Klasse auf die individuelle Leistung erwartet. Diese Überlegungen lassen sich auf die Leistungsbeurteilungen durch die Lehrer übertragen: Ein Schüler mit gegebener kognitiver Leistungsfähigkeit wird in einer vergleichsweise leistungs-schwachen Klasse aufgrund der insgesamt niedrigeren Ansprüche der Lehrer an die Klasse bessere Beurteilungen erhalten als in einer leistungsstärkeren Klasse, wo er eher negativ beur-teilt wird.

Eine alternative Hypothese lautet, dass eine über das hohe Leistungsniveau der Klasse vermittelte positive Einstellung der Lehrer gegenüber der gesamten Klasse auf die einzelnen Schüler – auch unabhängig von der individuellen Leistungen – ausstrahlt, so dass ein positiver Effekt leistungsstarker Klassen auf die Lehrerurteile angenommen werden kann. Das Argu-ment sollte auch umgekehrt gelten: Eine insgesamt als schlecht beurteilte Klasse kann in ähn-licher Weise die Beurteilung der einzelnen Schüler negativ beeinflussen. Als „Reflected Glo-ry-Effekt“ wird hier also eine spezifische Form des Halo-Effektes (Thorndike 1920) bezeich-net.

Weiterhin wurde untersucht, ob in Klassen mit hohem Leistungsniveau die individuelle Leistung als distinktives Merkmal bei der Formation der Lehrerurteile in den Hintergrund tritt und der Effekt der Noten bzw. Intelligenz auf das Lehrerurteil an Stärke verliert. Umgekehrt würde das bedeuten, dass andere Merkmale, wie ein über die soziale Herkunft15 vermittelter

                                                       14 Die folgenden Ausführungen zu Kontexteffekten der Klasse auf das Lehrerurteil basieren auf (Becker, D. /

Birkelbach 2009a, im Erscheinen). 15 Die soziale Herkunft wurde hier durch einen dreidimensionalen Schichtindex (Meulemann 1979: 49) opera-

tionalisiert.

Lehrerurteile und meritokratisches Prinzip 11

Habitus, der mit den Erwartungen der Lehrer mehr oder weniger übereinstimmt, an Bedeu-tung zunehmen. Es wurde daher untersucht, ob in leistungsstarken Klassen der Effekt der so-zialen Herkunft und der Aspirationen auf das Lehrerurteil an Stärke zunimmt. Da es sich um Effekte handelt, bei der eine Kontextvariable die Effektstärke zwischen zwei Variablen auf Mikroebene beeinflusst, spricht man von Cross-Level-Interaktionen (Hox 2002: 19, 53).

Für die Schätzung von Effekten auf Individual- und Kontextebene ist eine Mehrebenen-analyse das angemessene Verfahren (Hox 2002; Raudenbush / Bryk 2002; Langer 2004; Snijders / Bosker 2004). Da sowohl Hypothesen untersuchen wurden, die einen Effekt von Makrovariablen auf das Lehrerurteil in den einzelnen Schulklassen postulieren als auch Hypo-thesen, die einen Einfluss von Makrovariablen auf Effektgrößen auf Individualebene anneh-men, entspricht das angestrebte Endmodell einem Random-Slope-Random-Intercept-Modell (Langer 2004: 131ff). Wegen der dichotomen abhängigen Variablen (positives vs. negatives Lehrerurteil) liegt den Analysen ein Mehrebenen-Logit-Modell (Hox 2002: 114f) zugrunde.16

3.3.2 Ergebnisse Zur Überprüfung der Hypothesen wurden 13 Modelle gerechnet, von denen in Tabelle 1 die beiden Modelle, die zur Überprüfung der BFLPE- und der RGE-Hypothesen neben den Effek-ten auf Individualebene auch die Kontexteffekte enthalten, sowie ein Gesamtmodell, das alle signifikanten Effekte der verschiedenen Modelle enthält, wiedergegeben werden. Über die Effekte der Individualmerkmale wurde oben schon ausführlich diskutiert, daher reicht hier der Hinweis, dass in einem hier nicht dokumentierten Modell mit den vier Individualmerkmalen diese – wie zu erwarten – allesamt hochsignifikante Effekte auf die Lehrerurteile haben (Be-cker, D. / Birkelbach 2009c: Tab. 2).

Es ergeben sich signifikante positive Effekte der beiden Kontextmerkmale in den Model-len 1 und 2, die eindeutig für die Reflected-Glory- und gegen die BFLPE-Hypothese spre-chen. Lehrer orientieren sich bei der Beurteilung einzelner Schüler an einem klasseninternen Maßstab. Die Ergebnisse zeigen, dass das Leistungsniveau der Klasse insgesamt in Form ei-nes Halo-Effektes auf die Beurteilung der einzelnen Schüler in der Klasse ausstrahlt. Das gilt auch bei Kontrolle der aktuellen Leistungen und der kognitiven Leistungsfähigkeit auf Indivi-dualebene. Schüler erhalten bei gleicher Leistung in guten Klassen eher eine positive Beurtei-lung, während sie in schlechteren Klassen eher negativ beurteilt werden. Dies zeigt, dass Leh-rer – wie in der Reflected-Glory-Hypothese angenommen, ihre Erwartungen, die sie an die Klasse als Ganzes haben, auch auf die einzelnen Schüler übertragen. Die positiven Cross-Level-Interaktionen im Endmodell lassen vermuten, dass die individuellen Noten als sozial sichtbare Leistungsindikatoren in leistungsstarken Klassen noch an Bedeutung zunehmen. Allerdings gilt dies – wenn auch weniger eindeutig – auch für die soziale Herkunft. Mangels anderer diskriminierender Indikatoren scheinen die Lehrer in diesen Klassen die Herkunft bei der Urteilsbildung stärker zu berücksichtigen.

                                                       16 Weitere technische Details zu den Variablen und zum Schätzverfahren werden von Becker, D. / Birkelbach

(2009c) beschrieben.

Lehrerurteile und meritokratisches Prinzip 12

Tabelle 1: Mehrebenenmodelle (M9 bis M13) inklusive Cross-Level-Interaktionen.

Modell 1 Modell 2 Gesamtmodell log-odds z-Wert log-odds z-Wert log-odds z-Wert Interzept -2,27*** -6,10 -2,36*** -6,28 -2,41*** -6,07 Individualmerkmale Intelligenz -,08* -2,11 ,04*** 5,10 -,07 -1,88 Durchschnittsnote 4,51*** 15,60 2,55** 3,17 2,70** 3,52 Schicht ,23*** 3,45 ,23*** 3,44 ,23** 3,19 Aspirationen 1,47*** 5,31 1,51*** 5,41 1,51*** 4,96 Kontextmerkmale INTELLIGENZ ,13** 3,28 ,11** 3,06 DURCHSCHNITTSNOTE 1,98* 2,50 1,59* 2,12 Cross-Level-Interaktionen Intelligenz* INTELLIGENZ Durchschnittsnote*DURCHSCHNITTSNOTE 1,29** 3,17 Schicht* INTELLIGENZ Aspirationen* INTELLIGENZ Schicht* DURCHSCHNITTSNOTE ,46* 2,51 Aspirationen * DURCHSCHNITTSNOTE Varianz innerhalb der Schulklassen ,75*** 21,55 ,76*** 21,56 ,79*** 21,49 zwischen Schulklassen 1,54*** 4,25 1,65*** 4,35 1,51*** 4,02

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

3.4 Fazit zum Hintergrund der Lehrerurteile Die Ergebnisse der Pfadanalysen und der Mehrebenenanalysen belegen, dass Lehrer sich bei allgemeinen Beurteilungen von Schülern mit einem prognostischen Gehalt, wie der Frage, ob ein Schüler für ein Studium geeignet sei, nicht nur an meritokratischen Kriterien, also an den aktuellen Leistungen und der langfristigen kognitiven Leistungsfähigkeit orientieren. Daneben spielen auch der sozioökonomische Status der Eltern und die individuellen Aspirationen eine signifikante Rolle. Das ist nicht weiter überraschend und bestätigt nur einmal mehr die ein-gangs angesprochenen Untersuchungen zu Übergangsempfehlungen von der Grundschule in die Sekundarstufe I. Im Gegensatz zu dem oben vorgestellten Pfadmodell (Abbildung 2) ver-liert die Intelligenz als Indikator der langfristigen kognitiven Leistungsfähigkeit der Schüler an direktem Einfluss auf das Lehrerurteil, wenn in den Mehrebenenanalysen neben den No-ten, den Aspirationen und der sozialen Herkunft auch das Leistungsniveau der Klasse kontrol-liert wird (Tabelle 1). Können Lehrer also das kognitive Potenzial ihrer Schüler überhaupt unabhängig von deren aktuellen Leistungen und dem Leistungsniveau der Klasse als Refe-renzrahmen einschätzen? Die Ergebnisse legen zumindest Zweifel nahe. Dies gilt insbesonde-re, wenn man sich noch einmal vor Augen führt, in welcher Form das Leistungsniveau der Klasse die Lehrerurteile beeinflusst: Die Erwartungen, die Lehrer an eine Klasse als Ganzes haben, strahlen auf die Beurteilungen der einzelnen Schüler aus – auch unabhängig von deren individuellen Leistungen und ihrem Leistungsvermögen.

Lehrerurteile und meritokratisches Prinzip 13

4 Lehrerurteile im Lebensverlauf17

4.1 Hypothesen und Vorüberlegungen Die Lehrerurteile, die hier betrachtet werden, sind - anders als die Übergangsempfehlungen der Lehrer in den meisten Bundesländern – nicht unmittelbar mit Berechtigungen für den wei-teren Bildungsverlauf verknüpft. Es handelt sich im Grunde um Prognosen, die sich aber auf-grund des meritokratischen Anspruchs der Institution Schule primär an den Kriterien Leis-tungsfähigkeit und Leistung orientieren sollten. Oben wurde gezeigt, dass dies nur teilweise der Fall ist und auch die soziale Herkunft eine eigenständige Rolle spielt. Wie eingangs disku-tiert, ist der Anspruch dennoch aufrecht zu erhalten. Meritokratische Prinzipien sollten auch den weiteren Bildungsverlauf, insbesondere die Bewältigung der verschiedenen Übergänge vom Abitur über den Studieneintritt und dessen erfolgreichen Abschluss bis hin zum Erfolg im Beruf prägen.

Zeigen sich im weiteren Bildungsverlauf und der Berufskarriere entsprechenden Zusam-menhänge mit dem Lehrerurteil, so scheint dies zunächst einmal für die Validität des Lehrer-urteils – gleichgültig, worauf es sich stützt – zu sprechen. Die Einschätzungen von Lehrern werden im Schulalltag auf vielfältige Weise kommuniziert (Brophy / Good 1974; Brattesani et al. 1984; Good / Brophy 2003) und beeinflussen die Selbstwahrnehmung und Erwartungen der Schüler. Lehrerurteile werden so zum Element der subjektiven Situationsdefinition der Schüler und zum Bestandteil ihres Selbstkonzeptes (Dalbert / Stöber 2008). Insbesondere Schüler aus unteren sozialen Schichten werden sich mangels anderer Maßstäbe an den Beur-teilungen der Lehrer orientieren. Während Schulnoten und Abschlüsse die objektiven Über-gangsmöglichkeiten der Schüler bestimmen, haben Einstellungen und Erwartungen der Leh-rer, indem sie für die Schüler zum Element der Situation werden, Einfluss auf die Entschei-dungen der Schüler, ihre durch Noten und Abschlüsse eröffneten Möglichkeitsräume auch tatsächlich zu nutzen. Eigentlich leistungsfähige Schüler werden sich auf der Basis der Leh-rerurteile gegen ein Studium entscheiden und umgekehrt werden auch weniger leistungsfähige Schüler sich für ein Studium entscheiden, wenn ihre Lehrer ihnen vermitteln, sie seien geeig-net. Durch diesen Mechanismus kann das Lehrerurteil zur Self-Fulfilling Prophecy werden und den weiteren Lebensverlauf beeinflussen.

“The Self-Fulfilling Prophecy is, in the beginning, a false definition of the situation evoking a new behavior which makes the originally false conception come true. The specious validity of the Self-Fulfilling Prophecy perpetuates a reign of error. For the prophet will cite the ac-tual course of events as proof that he was right from the very beginning. (...) Such are the perversities of social logic.“ (Merton 1948: 195f)

Für die Analyse wird versucht, die von Merton beschriebene Logik aufzubrechen, indem die Validität des Lehrerurteils nicht allein am Kriterium des Eintreffens der Prognose (predictive validity) überprüft wird, sondern auch an einem im Rahmen des meritokratischen Modells legitimen Kriterium konkurrierenden Kriterium (concurrent validity), wie es die durch den IST gemessene kognitive Leistungsfähigkeit darstellt.18 Fällt beides auseinander, bestehen also entsprechende Zusammenhänge zwischen dem Urteil und den Ereignissen im weiteren Ausbildungs- und Berufsverlauf, obwohl Lehrerurteil und die im Rahmen eines Tests nach-                                                       17 Die Ausführungen in diesem Abschnitt basieren auf den in Birkelbach (2009) vorgestellten Analysen. 18 Schulnoten haben einen stärkeren Effekt auf die Lehrerurteile, aber anders als ein objektiver Test können sie

durch die gleichen Beurteilungsfehler, wie das Lehrerurteil beeinflusst sein. Da Intelligenz allgemein als ein guter Indikator der Leistungsfähigkeit im Bildungswesen gilt und auch die berufliche Leistungsfähigkeit gut prognostiziert (Schmidt / Hunter 1998; Schmidt 2002) wird in den Analysen auf den IST als konkurrierendes Kriterium zurückgegriffen.

Lehrerurteile und meritokratisches Prinzip 14

gewiesene kognitive Leitungsfähigkeit des Schülers nicht übereinstimmen, dann kann dies ein Hinweis auf die Wirkung einer Self-fulfilling Prophecy sein. Durch Kreuztabellierung der Lehrerurteile mit dem am Median dichotomisierten IST lassen sich sechs Gruppen bilden (vgl. Birkelbach 2009: Tab. 2). Gemessen am Kriterium der kognitiven Leistungsfähig unter-schätzen die Lehrer eine starke Minderheit von rund 40 Prozent, denen sie nicht zutrauen, ein Studium erfolgreich abzuschließen und sie überschätzen ein gutes Drittel der Schüler, die sie als geeignet für ein Studium bezeichnet, während jeweils eine Mehrheit valide beurteilt wird.

Anhand von vier Hypothesen wurde der Einfluss der Lehrerurteile auf die Entscheidung zum Abitur und zur Studienaufnahme sowie auf den Erfolg im Studium und das Berufspresti-ge mit 43 Jahren in Regressionsmodellen ermittelt. Nach der am meritokratischen Modell orientierten (1) Intelligenzhypothese sollten sich Schüler mit überdurchschnittlicher kogniti-ver Leistungsfähigkeit häufiger für das Abitur entscheiden und ein Studium aufnehmen, sie sollten das Studium häufiger erfolgreich abschließen und beruflich erfolgreicher sein als die Kontrollgruppen mit unterdurchschnittlicher Intelligenz. Die (2) WV-Hypothese einer wech-selseitigen Validierung erwartet, dass bei den Personen, bei denen sich Lehrerurteil und Intel-ligenz wechselseitig validieren, das Ergebnis mit der höchsten Sicherheit prognostiziert wer-den kann und daher die Schüler mit einem bezogen auf das konkurrierende Kriterium Intelli-genz validen Lehrerurteil am erfolgreichsten sind, während umgekehrt die Schüler mit einem validen negativen Urteil an allen vier Punkten am wenigsten erfolgreich sind. Nach der (3) Hypothese einer Self-Fulfilling Prophecy (SFP-Hypothese) sollten unterschätze Schüler bei gleicher kognitiver Leistungsfähigkeit weniger erfolgreich sein, während die Gruppe der Überschätzten erfolgreicher als die Vergleichsgruppen sein sollte. Die (4) Kontroll-Hypothese geht schließlich davon aus, dass der erwartete Mechanismus einer Self-Fulfilling-Prophecy bei Kontrolle der Entscheidungen für das Abitur und den Studieneintritt seine Bedeutung ver-liert. Er sollte daher in der Gruppe verschwinden, die sich – unabhängig vom Lehrerurteil – für das Abitur und ein Studium entschieden hat. Sollten sich in dieser Gruppe Effekte des Lehrerurteils auf den Studienerfolg und das Berufsprestige zeigen, dann wäre dies umgekehrt ein Beleg der prognostischen Validität der Lehrerurteile. In ähnlicher Weise sollte auch der Effekt der Lehrerurteile auf den beruflichen Erfolg 28 Jahre später verschwinden, wenn die Entscheidungen und der Erfolg im Studium kontrolliert sind, auch wenn er bivariat sichtbar ist.

4.2 Ergebnisse Die bivariate Analysen der sechs Gruppen mit den vier Erfolgsvariablen (Tabelle 2) macht deutlich, dass die prognostische Validität eines negativen Lehrerurteils eher gering einzu-schätzen ist: Gut 60 Prozent der ehemaligen Schüler, denen die Eignung für ein Studium ab-gesprochen wurde, nehmen dennoch ein Studium auf und schließen es ganz überwiegend auch erfolgreich ab. Daran haben sicherlich auch die durch die Bildungsexpansion der 70er Jahre eröffneten Gelegenheitsstrukturen ihren Anteil. Die Rangfolge der durch Kreuztabellierung der Lehrerurteile mit dem am Median dichotomisierten IST gebildeten sechs Gruppen hin-sichtlich ihres Erfolges begründet Zweifel an der Validität der Lehrerurteile gemessen an der kognitiven Leistungsfähigkeit. So wird die am meritokratischen Ideal orientierte Intelligenz-hypothese widerlegt: Empirisch wird die Rangfolge stärker durch das Lehrerurteil als durch die kognitive Leistungsfähigkeit bestimmt. Dies gilt beim Abitur, beim Studieneintritt, aller-dings – wie in der SFP-Hypothese erwartet – nur sehr eingeschränkt beim Studienerfolg, wo in allen Gruppen eine deutliche Mehrheit von insgesamt knapp 80 Prozent der Schüler, die ein Studium begonnen haben, dies auch mit einem Abschluss beenden. Dagegen ist der Zusam-

Lehrerurteile und meritokratisches Prinzip 15

menhang beim Berufserfolg mit 43 Jahren wieder eindeutig: ehemalige Schüler mit einem positiven Lehrerurteil erreichen ein deutlich höheres Berufsprestige als Befragte mit ver-gleichbarer kognitiver Leistungsfähigkeit, aber negativem Urteil. Wie in der SFP-Hypothese vermutet, entscheiden sich die von ihren Lehrern positiv beurteilten Panelteilnehmer bei glei-cher kognitiver Leistungsfähigkeit häufiger für Abitur und Studium, während die negativ be-urteilten Schüler häufiger auf diesen Weg verzichten. Wenn sie aber ein Studium aufgenom-men haben, spielt das Lehrerurteil für den Erfolg im Studium so gut wie keine Rolle mehr.

Tabelle 2 Erfolge im Ausbildungs- und Berufsverlauf

Entscheidungen als Voraussetzungen

Gegenstand der Prognose

Langfristige Folgen

(a) Abi-

tur

(b) Studien-eintritt

(c) Studienerfolg

(d) Berufsprestige mit 43 J. (MPS)

NAnteil(*) Anteil(*) N Anteil(*) N MW (*)

IST+/LU+: Valides positives LU 239 95,8 (1) 92,0 (1) 220 88,2 (1) 213 111,9 (1)

IST–/LU+: Überschätzt 132 85,6 (2) 81,8 (2) 108 87,0 (2) 109 107,0 (2)

IST+/LU 0: IST hoch, kein LU 248 78,2 (3) 78,6 (3) 195 86,7 (3) 216 96,4 (3)

IST–/LU 0: IST niedrig, kein LU 225 69,8 (4) 71,5 (4) 161 81,4 (5) 198 95,7 (4)

IST+/LU –: Unterschätzt 119 50,4 (5) 62,2 (5) 74 75,7 (6) 106 90,6 (6)

IST–/LU–: Valides negatives LU 169 43,2 (6) 60,9 (6) 103 85,4 (4) 137 94,4 (5)

Gesamt 1384 73,9 77,6 861 85,0 979 99,9

* Rangfolge, LU: Lehrerurteil

Diese Ergebnisse konnten in multivariaten Regressionsanalysen der vier Erfolgsvariablen, in denen neben den Lehrerurteilen auch für die Leistungen im bisherigen Bildungsverlauf, die Aspirationen, die soziale Herkunft sowie private und biographische Verlaufsumstände kon-trolliert wurden, weitgehend bestätigt werden (Birkelbach 2009: Tab. 3-5). Insbesondere stüt-zen die Ergebnisse der Regressionen der beiden Entscheidungen im Vorfeld (Abitur, Studien-aufnahme)19 die SFP-Hypothese des Lehrerurteils, denn verglichen mit der Gruppe, bei der das positive Lehrerurteil durch den IST validiert ist, bestehen hinsichtlich der Entscheidung keine signifikanten Unterschiede zur Gruppe der Überschätzten. Auch beim Abitur unter-scheiden sich umgekehrt die Koeffizienten für die Unterschätzten kaum von denen der Grup-pe, in der eine unterdurchschnittliche kognitive Leistungsfähigkeit mit einem negativen Leh-rerurteil kombiniert ist. Hinsichtlich der Studienaufnahme gibt es eine kleine Abweichung, die schon bei der Darstellung der bivariaten Zusammenhänge als möglicher Effekt für eine Studi-enaufnahme günstiger Gelegenheitsstrukturen während der Bildungsexpansion interpretiert wurde. An beiden Übergängen wird also deutlich, dass die Lehrerurteile die Entscheidungen über den weiteren Bildungsverlauf im Sinne eine Self-Fulfilling-Prophecy zu beeinflussen vermögen.

Darüber hinaus haben in den Modellen sowohl die Leistungen in der Schule (gemessen durch die Durchschnittsnote und eine Selbsteinschätzung) als auch die Aspirationen einen hochsignifikanten und starken Effekt auf beide Übergangsentscheidungen. Beides beeinflusst bereits das Lehrerurteil (vgl. Abb. 1 und Tab. 1), aber es hat darüber hinaus auch einen eigen-

                                                       19 Bei diesen beiden Übergängen wurden, um die mit monatlicher Genauigkeit erhobenen Ereignisinformatio-

nen zu nutzen, Cox-Regressionen (Blossfeld / Rohwer 2002) gerechnet. Es werden also Ereignisse – Über-gänge – betrachtet, aber diese Übergänge setzen entsprechende Entscheidungen im Lebensverlauf, um die es hier gehen soll, voraus.

Lehrerurteile und meritokratisches Prinzip 16

ständigen Effekt auf die Entscheidungen in der Bildungslaufbahn. Dies gilt auch für die durch das väterliche Berufsprestige (Wegener 1985, 1988) gemessene soziale Herkunft, die ihrer-seits ja bereits die Aspirationen beeinflusst. Dabei dürften sowohl das Statuserhaltungsmotiv der höheren Schichten als auch die Erwartung, das Studium durch die Unterstützung des El-ternhauses erfolgreich abzuschließen, eine Rolle spielen. Darüber hinaus wurden mit dem Auszug aus dem Elternhaus bereits vor dem Abitur oder der Elternschaft vor einem mögli-chen Studium konkurrierende private Lebenspläne bzw. Verlaufsumstände (Birkelbach 1998a) berücksichtigt, die die Wahrscheinlichkeit eines entsprechenden Bildungsübergangs erwartungsgemäß deutlich senken.

Sind die Entscheidungen erst einmal zugunsten der Aufnahme eines Studiums gefallen, dann hat das Lehrerurteil, wie in der Kontrollhypothese erwartet, keinen signifikanten Effekt mehr auf den Studienerfolg (Birkelbach 2009: Tab. 4).20 Auch dies stützt die Hypothese der Wirkung einer Self-Fulfilling Prophecy auf die Entscheidungen, denn eine valide Prognose sollte sich gerade hinsichtlich des Kriteriums, auf die sie gerichtet ist, bestätigen. Tatsächlich aber lassen sich keine signifikanten Effekte nachweisen. Kontrolliert wurden in der Gleichung die Leistungen in der Schule und der Studiengang, die Aspirationen, die soziale Herkunft so-wie die private Lebenssituation durch die Elternschaft und ein Interaktionseffekt (Frau*Kind). Signifikante Effekte haben nur der Notendurchschnitt der Klasse 10 als Leistungsindikator und die durch das Berufsprestige des Vaters erhobene soziale Herkunft. Dies relativiert die Kritik an (Einzel-)Noten: Zum Notendurchschnitt aggregiert sind sie offenbar auch langfristig ein guter Indikator der individuellen Leistungsfähigkeit und Leistungsbereitschaft. Der Effekt der sozialen Herkunft weist auf die ökonomische Absicherung durch das Elternhaus und auf im Studium verwertbares kulturelles Kapital (Bourdieu 1983) hin. Auch dürfte die Entschei-dung, ein Studium auch bei Schwierigkeiten nicht abzubrechen (vgl. Meulemann 1995: 186), wiederum durch das Statuserhaltungsmotiv und die durch die Unterstützungspotenziale des Elternhauses geprägten Erfolgserwartungen beeinflusst sein.

In der bivariaten Analyse konnten Zusammenhänge zwischen den Lehrerurteilen mit 15 Jahren und dem Berufsprestige der Befragten am Ende des Beobachtungszeitraumes mit 43 Jahren gezeigt werden. Da angenommen wird, dass die Lehrerurteile vor allem die Entschei-dungen im Bildungsverlauf beeinflussen und der Berufserfolg eine Folge dieser Entscheidun-gen ist, sollte der Einfluss des Lehrerurteils auf das Berufsprestige mit 43 auch in der Ge-samtgruppe verschwinden, wenn die Entscheidungen und Erfolge im Bildungsverlauf in einer OLS-Regression kontrolliert werden. Das ist tatsächlich der Fall. In dem Modell (Birkelbach 2009: Tab. 5), bei dem neben den Leistungen und Erfolgen im Bildungsverlauf die Aspiratio-nen, die soziale Herkunft sowie private und berufliche Verlaufsumstände kontrolliert wurden, haben die Lehrerurteile keinen eigenständigen Effekt, während der Studienerfolg erwartungs-gemäß das Prestige am stärksten beeinflusst. Schwächer zwar, aber noch immer hochsignifi-kant, ist auch der Einfluss des Notendurchschnitts in Klasse 10 auf das Prestige, was noch einmal auf den prognostischen Wert der Schulnoten in aggregierter Form hinweist. Ebenfalls hochsignifikant ist nach wie vor der Einfluss der sozialen Herkunft auf das Berufsprestige der Befragten. Möglicherweise sind hier Prozesse der Statusvererbung wirksam, wie sie Blaneck (1994) beschreibt. Darüber hinaus aber dürfte generell das im Elternhaus erworbene kulturelle und soziale Kapital (Bourdieu 1983) nicht nur beim Einstieg in einen prestigeträchtigen Be-ruf, sondern auch in der Berufskarriere hilfreich sein (vgl. Meulemann 1995: 240-254; Breen /

                                                       20 Gerechnet wurde in der Gruppe der Panelteilnehmer, die ein Studium begonnen haben, eine logistische Re-

gression des Studienerfolgs.

Lehrerurteile und meritokratisches Prinzip 17

Goldthorpe 2001; Hartmann 2001; Goldthorpe 2003). Sowohl die Elternschaft (auch als Inter-aktion mit dem Geschlecht) als auch Erwerbsunterbrechungen (Dauer) haben in dem Modell dagegen keinen eigenständigen Effekt.

5 Resümee

Lehrerurteile haben in einer bildungsbasierten Meritokratie eine zentrale Weichenstellungs-funktion. Als formale Zugangsberechtigungen mit den Lehrern als Gatekeepern eröffnen oder versperren sie in Form von Noten, Zeugnissen und generalisierenden Beurteilungen die Zu-gänge zu bestimmten Pfaden des Bildungs- und Berufsverlaufs, die in die unterschiedlichen gesellschaftlichen Positionen führen. Aber auch, wenn mit ihnen keine direkte Zugangsbe-rechtigung verknüpft ist, können sie weitreichende Folgen haben, indem sie über die Erfolgs-erwartungen die Bildungsentscheidungen der Schüler beeinflussen und diese in eine bestimm-te Richtung lenken. Das Resultat – soziale Ungleichheit – erscheint legitim, solange individu-elle Leistungsfähigkeit und aktuelle Leistungen die alleinige Grundlage der Beurteilungen und der so entstehenden sozialen Ungleichheit bilden.

Die Leistungsfähigkeit und die Leistungen spielen tatsächlich eine bedeutsame Rolle während des gesamten Prozesses: Die Noten, aber auch die Intelligenz bilden eine wichtige Basis für die Lehrerurteile. Insbesondere die Noten scheinen in der aggregierten Form des Notendurchschnitts darüber hinaus auch losgelöst von der Situation der Schule langfristig ein guter Indikator für Leistungsfähigkeit und Leistungswillen zu sein, wie die Effekte auf das Abitur, den Studieneintritt, den Studienerfolg und selbst den Berufserfolg mit 43 Jahren bele-gen. Hinzu kommen im Berufsverlauf weitere spezifische Leistungsindikatoren, wie z.B. der Studienerfolg.

Aber schon die kognitive Leistungsfähigkeit (Intelligenz) und die Leistungen in der Schu-le (Noten) sind nicht unabhängig von der sozialen Herkunft, was als primärer Effekt der so-zialen Herkunft bezeichnet werden kann. In der vorliegenden sozial selegierten Stichprobe wirkt der primäre Effekt vor allem indirekt über die durch den Analogietest gemessenen sprachlichen Fähigkeiten der Schüler. Hinzu kommt ein sekundärer Effekt der sozialen Her-kunft, der sich vor allem über die Aspirationen auch auf die Lehrerurteile auswirkt. Einem meritokratischen Modell völlig fremd ist darüber hinaus der direkte Effekt der sozialen Her-kunft auf das Lehrerurteil. Der muss nicht als bewusste Diskriminierung von Kindern aus unteren Schichten interpretiert werden. Er könnte vielmehr darauf hinweisen, dass die Lehrer in ihrem Urteil unabhängig von der individuellen Leistungsfähigkeit größere Schwierigkeiten von Schülern aus unteren Schichten im Studium antizipieren und bei ihrer Urteilsbildung aus (falsch verstandener) Fürsorge vom meritokratischen Prinzip abweichen.

Eine weitere Abweichung vom meritokratischen Prinzip stellen die Kontexteffekte des Leistungsniveaus der Klasse auf die Lehrerurteile dar. Der nachgewiesene Reflected-Glory-Effekt belegt, dass die Lehrer bei ihren Urteilen über einzelne Schüler das Leistungsniveau der Klasse als Maßstab heranziehen und dabei ihre Einschätzung der Klasse auch auf den ein-zelnen Schüler übertragen. Durch diesen Halo-Effekt sind die Lehrerurteile nicht zwischen verschiedenen Klassen oder gar Schulen zu vergleichen.

Gemessen an dem Kriterium Leistung sind Lehrerurteile also mehr oder wenig valide. Sie beeinflussen aber über die Erfolgserwartungen vermittelt die individuellen Bildungsentschei-dungen. Dadurch wird dem Ausbildungs- und Berufsverlauf eine spezifische Richtung gege-ben, die später nur noch schwer zu korrigieren ist und über den beruflichen Erfolg die soziale Position beeinflusst. Das gilt auch für Lehrerurteile, die gemessen am Kriterium der kogniti-

Lehrerurteile und meritokratisches Prinzip 18

ven Leistungsfähigkeit als invalide bezeichnet werden können. Solche Beurteilungen können unabhängig von der tatsächlichen Leistungsfähigkeit in Form einer Self-Fulfilling Prophecy eine eigenständige Wirkung auf Entscheidungen und Entwicklung im Lebensverlauf nehmen.

Die soziale Herkunft als ein völlig meritokratiefremder Faktor verliert auch nach der Schule bei Kontrolle der Leistungen nicht an Einfluss auf den weiteren Ausbildungs- und Be-rufserfolg, ja ihr Einfluss scheint im Beruf wieder zuzunehmen. Während Erfolg in Schule und Studium stärker an formalisierte Leistungskriterien gebunden ist, so häufig das Leis-tungsprinzip auch durchbrochen sein mag, gelten im Beruf – zumindest auf höheren Positi-onsniveaus – offenbar andere, stärker auf der sozialen Herkunft und einem entsprechenden Habitus basierende Kriterien.

Literatur Amthauer, Rudolf, 1953: Intelligenz-Struktur-Test (2. erw. Auflage). Göttingen: Hogrefe. Arnold, Karl-Heinz, Wilfried Bos, Peggy Kichert & Tobias C. Stubbe, 2007: Schullaufbahnpräferenzen am

Ende der vierten Klassenstufe. S. 271-297 in: Bos, Wilfried, Sabine Hornberg, Karl-Heinz Arnold, Gabriele Faust, Lilian Fried, Eva-Maria Lankes, Knut Schwippert & Renate Valtin (Hg.), IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster u.a.: Wachsmann.

Arts, Wil, 1995: Prinzipien der Verteilungsgerechtigkeit. Die theoretische Rekonstruktion der soziologi-schen Zugangsweisen. S. 107-131 in: Müller, Hans-Peter & Bernd Wegener (Hg.), Soziale Ungleich-heit und Gerechtigkeit. Opladen: Leske+Budrich.

Avenarius, Hermann, Hartmut Ditton, Hans Döbert, Klaus Klemm, Eckhard Klieme, Matthias Rürup, Heinz-Elmar Tenorth, Horst Weißhaupt & Manfred Weiß, 2003: Bildungsbericht für Deutschland. Erste Befunde. Opladen: Leske + Budrich.

Becker, Dominik & Klaus Birkelbach, 2009a: Teacher evaluations and the definition of the social situation in the classroom. Arbeitspapier Nr. 3 der Projektgruppe „Lehrerurteile im Lebensverlauf“. Essen. Uni-versität Duisburg-Essen.

Becker, Dominik & Klaus Birkelbach, 2009b: Aufbereitung der Daten der Lehrerzusatzerhebung und deren Integration in die Daten des Kölner Gymnasiasten-Panels. Arbeitspapier Nr. 2 der Projektgruppe „Lehrerurteile im Lebensverlauf“. Essen. Universität Duisburg-Essen.

Becker, Dominik & Klaus Birkelbach, 2009c: Lehrerurteile im Klassenkontext. Eine Mehrebenen-Analyse von Lehrerurteilen. Arbeitspapier Nr. 4 der Projektgruppe „Lehrerurteile im Lebensverlauf“. Essen. Universität Duisburg-Essen.

Becker, Dominik & Klaus Birkelbach, im Erscheinen: Intelligenz und Schulleistung als Kontextmerkmale: Big Fish – Little Pond- oder Reflected-Glory-Effekt? Eine Mehrebenen-Analyse von Lehrerurteilen S. in: Beckers, Tilo, Klaus Birkelbach, Jörg Hagenah & Ulrich Rosar (Hg.), Komparative Sozialfor-schung. Wiesbaden: VS-Verlag.

Becker, Rolf, 2009: Entstehung und Reproduktion dauerhafter Bildungsungleichheiten. S. 86-129 in: Becker, Rolf (Hg.), Lehrbuch der Bildungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaf-ten.

Becker, Rolf & Wolfgang Lauterbach, 2007: Bildung als Privileg – Ursachen, Mechanismen, Prozesse und Wirkungen. S. 9-36 in: Becker, Rolf & Wolfgang Lauterbach (Hg.), Bildung als Privileg? Erklärungen und Befunde zu den Ursachen der Bildungsungleichheit. Wiesbaden: VS Verlag für Sozialwissen-schaften.

Becker, Rolf & Andreas Hadjar, 2009: Meritokratie - Zur gesellschaftlichen Legitimation ungleicher Bildungs-, Erwerbs- und Einkommenschancen S. 35-59 in: Becker, Rolf (Hg.), Lehrbuch der Bil-dungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaften.

Birkelbach, Klaus, 1998a: Berufserfolg und Familiengründung. Lebensläufe zwischen institutionellen Bedingungen und individueller Konstruktion. Opladen: Westdeutscher Verlag.

Birkelbach, Klaus, 1998b: Befragungsthema und Panelmortalität: Ausfälle in einer Lebenslauferhebung. ZA-Informationen 42: S. 128-147.

Lehrerurteile und meritokratisches Prinzip 19

Birkelbach, Klaus, 2009: Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? Im Begutachtungsprozess der Kölner Zeitschrift für Soziologie und Sozialpsychologie.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 1998: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 1: Arbeitsbericht zur Vorlage bei der DFG. Köln: Institut für Angewandte Sozial-forschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000a: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 2: Ergebnisbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000b: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 1: Arbeitsbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Blaneck, Stephan, 1994: Der Berufseinstieg in Professionen. Berlin: VWF. Blossfeld, Hans-Peter & Johannes Huinink, 2001: Lebensverlaufsforschung als sozialwissenschaftliche

Forschungsperspektive. Themen, Konzepte, Methoden und Probleme. BIOS - Zeitschrift für Biogra-phieforschung und Oral History 14: S. 5-31.

Blossfeld, Hans-Peter & Götz Rohwer, 2002: Techniques of Event History Modelling. New Approaches to Causal Modelling (2nd Edition). Mahwah (New Jersey): Lawrence Erlbaum Associates.

Blossfeld, Hans-Peter, Wilfried Bos, Dieter Lenzen, Detlef Müller-Böling, Jürgen Oelkers, Manfred Prenzel & Ludger Wößmann, 2007: Bildungsgerechtigkeit. Jahresgutachten 2007 des Aktionsrat Bil-dung. Wiesbaden: VS Verlag für Sozialwissenschaften.

Bos, Wilfried & Marcus Pietsch, 2004: Erste Ergebnisse aus KESS 4. Kurzbericht. Hamburg. Freie und Hansestadt Hamburg (http://www.li-hamburg.de/fix/files/doc/kurzbericht.pdf).

Bos, Wilfried, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin & Gerd Walther (Hg.), 2004: IGLU. Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Ver-gleich. Münster: Wachsmann.

Bos, Wilfried, Sabine Hornberg, Karl-Heinz Arnold, Gabriele Faust, Lilian Fried, Eva-Maria Lankes, Knut Schwippert & Renate Valtin, 2007: IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Zusammenfassung. S. in: Bos, Wilfried, Sabine Hornberg, Karl-Heinz Arnold, Gabriele Faust, Lilian Fried, Eva-Maria Lankes, Knut Schwippert & Renate Valtin (Hg.), IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationa-len Vergleich. Münster: Waxmann.

Boudon, Raymond, 1974: Education, opportunity, and social inequality: Changing prospects in Western Society. New York: Wiley.

Bourdieu, Pierre, 1983: Ökonomisches Kapital, kulturelles Kapital, soziales Kapital. S. 183-198 in: Kreckel, Reinhard (Hg.), Soziale Ungleichheiten. Soziale Welt. Sonderband 2. Göttingen: Otto Schwartz & Co.

Bourdieu, Pierre, 1987: Die feinen Unterschiede. Kritik der gesellschaftlichen Urteilskraft. Frankfurt/Main: Suhrkamp.

Bourdieu, Pierre & Jean-Pierre Passeron, 1971: Die Illusion der Chancengleichheit. Untersuchungen zur Soziologie des Bildungswesens am Beispiel Frankreichs. Heilbronn: Klett.

Brattesani, Karen A., Rhona S. Weinstein & Marshall Hermine H, 1984: Student Perceptions of Differen-tial Teacher Treatment as Moderators of Teacher Expectation Effects. Journal of Educational Psychol-ogy 76: S. 236-247.

Breen, Richard & John H. Goldthorpe, 1997: Explaining Educational Differentials. Towards a Formal Rational Action Theory. Rationality and Society 9: S. 275-305.

Breen, Richard & John H. Goldthorpe, 2001: Class, Mobility and Merit. The Experience of Two British Birth Cohorts. European Sociological Review 17: S. 81-100.

Brophy, Jere E. & Thomas L. Good, 1974: Teacher - Student Relationships. Causes and Consequences. New York u.a.: Holt, Rhinehart and Winston.

Dahrendorf, Ralf, 1965: Arbeiterkinder an deutschen Universitäten. Tübingen: J.C.B. Mohr (Paul SIebeck). Dai, David Yun & Anne N. Rinn, 2008: The Big-Fish-Little-Pond Effect: What Do We Know and Where

Do We Go from Here? Educational Psychological Review 20: S. 283–317.

Lehrerurteile und meritokratisches Prinzip 20

Dalbert, Claudia & Joachim Stöber, 2008: Forschung zur Schülerpersönlichkeit. S. 905-925 in: Helsper, Werner & Jeanette Böhme (Hg.), Handbuch der Schulforschung (2., durchgesehene und erweiterte Auflage). Wiesbaden: VS Verlag für Sozialforschung.

Davis, Kingsley & Wilbert E. Moore, 1945: Some Principles of Stratification. American Sociological Review 10: S. 242-249.

Ditton, Hartmut & Jan Krüsken, 2006: Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft 9: S. 348-372.

Erikson, Robert, John H. Goldthorpe, Michelle Jackson, Meir Yaish & D. R. Cox, 2005: On class differen-tials in educational attainment. Proceedings of the National Academy of Sciences of the USA (PNAS) 102: S. 9730–9733.

Esser, Hartmut, 1993: Soziologie. Allgemeine Grundlagen. Frankfurt/Main und New York: Campus. Esser, Hartmut, 1999: Soziologie. Spezielle Grundlagen. Band 1: Situationslogik und Handeln. Frank-

furt/Main und New York: Campus. Esser, Hartmut, 1999-2001: Soziologie. Spezielle Grundlagen. 6 Bände. Frankfurt/Main und New York:

Campus. Fickermann, Detlef, 1999: Grundschulzeugnis und Schulformwahlverhalten. Untersuchungen zur Leis-

tungsselektivität beim Übergang in die Sekundarstufe I. S. 113-155 in: Weishaupt, Horst (Hg.), Zum Übergang auf weiterführende Schulen. Statistische Analysen und Fallstudien. Erfurt: Pädagogische Hochschule.

Fox, John, 2006: Structural Equation Modeling with the SEM Package in R. Structural Equation Modeling 13: S. 465–486.

Goldthorpe, John H., 1996: Class Analysis and the reorientation of class theory: the case of persisting differentials in educational attainment. British Journal of Sociology 47: S. 481-505.

Goldthorpe, John H., 2003: The myth of education-based meritocracy. New Economy 10: S. 234-239. Good, Thomas L. & Jere E. Brophy, 2003: Looking in Classrooms. New York u.a.: Pearson Education. Hadjar, Andreas, 2008: Meritokratie als gesellschaftlicher Legitimationsmythos. Wiesbaden: VS Verlag

für Sozialwissenschaften. Hartmann, Michael, 2001: Klassenspezifischer Habitus und/oder exklusive Bildungstitel als soziales

Selektionskriterium? - Die Besetzung von Spitzenpositionen in der Wirtschaft. S. 157-215 in: Krais, Beate (Hg.), An der Spitze. Von Eliten und herrschenden Klassen. Konstanz: UVK.

Hartmann, Michael & Johannes Kopp, 2001: Elitenselektion durch Bildung oder durch Herkunft? Promotion, soziale Herkunft und der Zugang zu Führungspositionen in der deutschen Wirtschaft. Köl-ner Zeitschrift für Soziologie und Sozialpsychologie 53: S. 436-466.

Heid, Helmut, 2003: Eliteförderung oder Chancengleichheit im Bildungswesen? . S. 35-50 in: Bolder, Axel & Andreas Witzel (Hg.), Berufsbiographien. Beiträge zur Theorie und Empirie ihrer Bedingungen, Genese und Gestaltung. Opladen: Leske+Budrich.

Heinz, Walter R., 1996: Status Passages as Micro-Macro Linkages in Life Course Research. S. 51-65 in: Weymann, Ansgar & Walter R. Heinz (Hg.), Society and Biography. Interrelationships between Social Structure, Instiutions and the Life Course. Weinheim: Deutscher Studien Verlag.

Hox, Joop, 2002: Multilevel-Analysis: Techniques and Applications. Mahwah, NJ: Lawrence Erlbaum. Huinink, Johannes & Torsten Schröder, 2008: Skizzen zu einer Theorie des Lebenslaufs. S. 291-308 in:

Diekmann, Andreas, Klaus Eichner, Peter Schmidt & Thomas Voss (Hg.), Rational Choice: Theoreti-sche Analysen und empirische Resultate. Festschrift für Karl-Dieter Opp zum 70. Geburtstag. Wies-baden: VS Verlag für Sozialwissenschaften.

Ingenkamp, Karlheinz, 1968: Untersuchungen zur Übergangsauslese (Theorie und Praxis der Schulpsycho-logie, Band VIII). Weinheim und Berlin: Beltz.

Ingenkamp, Karlheinz (Hg.), 1971: Die Fragwürdigkeit der Zensurengebung. Weinheim und Basel: Beltz. Ingenkamp, Karlheinz, 1989: Diagnostik in der Schule. Beiträge zu Schlüsselfragen der Schülerbeurteilung.

Weinheim: Beltz. Jöreskog, Karl G., 1990: New developments in LISREL: analysis of ordinal variables using polychoric

correlations and weighted least squares. Quality & Quantity 24: S. 387-404. Klauer, Karl Josef, 1989: Zensierungsmodelle und ihre Konsequenzen für die Notengebung. S. in: Jäger,

Reinhold S., Ralf Horn & Karlheinz Ingenkamp (Hg.), Tests und Trends 7. Jahrbuch der pädagogi-schen Diagnostik. . Weinheim: Beltz.

Koller, Peter, 1995: Soziale Gleichheit und Gerechtigkeit. S. 53-79 in: Müller, Hans-Peter & Bernd Wegener (Hg.), Soziale Ungleichheit und Gerechtigkeit. Opladen: Leske+Budrich.

Lehrerurteile und meritokratisches Prinzip 21

Kristen, Cornelia, 2006: Ethnische Diskriminierung in der Grundschule? Die Vergabe von Noten und Bildungsempfehlungen. Kölner Zeitschrift für Soziologie und Sozialpsychologie 58: S. 79-97.

Langer, Wolfgang, 2004: Mehrebenenanalyse : Eine Einführung für Forschung und Praxis. Wiesbaden VS Verlag für Sozialwissenschaften.

Lehmann, Rainer H., Rainer Peek & Rüdiger Gänsfuß, 1997: LAU 5 - Aspekte der Lernausgangslage und der Lernentwicklung von Schülerinnen und Schülern, die im Schuljahr 1996/97 eine fünfte Klasse an Hamburger Schulen besuchten. Bericht über die Erhebung im September 1996. Hamburg.

Maaz, Kai, Cornelia Hausen, Nele McElvany & Jürgen Baumert, 2006: Stichwort: Übergänge im Bildungssystem. Theoretische Konzepte und ihre Anwendung in der empirischen Forschung beim Übergang in die Sekundarstufe. Zeitschrift für Erziehungswissenschaft 9: S. 299-327.

Marsh, Herbert W., 1987: The big-fish-little-pond effect on academic self-concept. Journal of Educational Psychology 79: S. 280-295.

Marsh, Herbert W. & John W. Parker, 1984: Determinants of student self-concept: Is it better to be a relatively large fish in a small pond even if you don't learn to swim as well? Journal of Personality & Social Psychology 47: S. 213-231.

Marsh, Herbert W., Chit-Kwong Kong & Kit-Tai Hau, 2000: Longitudinal Multilevel Models of the Big-Fish-Little-Pond Effect on Academic Self-Concept: Counterbalancing Contrast and Reflected-Glory Effects in Hong Kong Schools. Journal of Personality & Social Psychology 78: S. 337-349.

Marsh, Herbert W., Ulrich Trautwein, Oliver Lüdtke, Jürgen Baumert & Olaf Köller, 2007: The Big-Fish-Little-Pond Effect: Persistent Negative Effects of Selective High Schools on Self-Concept After Grad-uation. American Educational Research Journal 44: S. 631 –669.

Marsh, Herbert W., Marjorie Seaton, Ulrich Trautwein, Oliver Lüdtke, K. T. Hau, Alison J. O’Mara & Rhonda G. Craven, 2008: The Big-fish–little-pond-effect Stands Up to Critical Scrutiny: Implications for Theory, Methodology, and Future Research. Educational Psychological Review 20: S. 319-350.

Mayer, Karl Ulrich, 1975: Ungleichheit und Mobilität im sozialen Bewusstsein. Opladen: Westdeutscher Verlag.

Mayer, Karl Ulrich, 1990: Lebensverläufe und sozialer Wandel. Anmerkungen zu einem Forschungspro-gramm. S. 7-21 in: Mayer, Karl Ulrich (Hg.), Lebensverläufe und sozialer Wandel. Sonderheft 31/1990 der KZfSS. Opladen: Westdeutscher Verlag.

Mayer, Karl Ulrich, 2004: Whose Lives? How History, Societies and Institutions Define and Shape Life Courses. Research in Human Development 1: S. 161-187.

Mayer, Karl Ulrich & Hans-Peter Blossfeld, 1990: Die gesellschaftliche Konstruktion sozialer Ungleich-heit im Lebenslauf. S. 297-318 in: Berger, Peter A. & Stefan Hradil (Hg.), Lebenslagen, Lebensläufe, Lebensstile (Soziale Welt: Sonderband 7). Göttingen: Otto Schwarz.

Merton, Robert K., 1948: The Self-Fulfilling Prophecy. The Antioch Review 8: S. 193-210. Meulemann, Heiner, 1979: Soziale Herkunft und Schullaufbahn. Arbeitsbuch zur sozialwissenschaftlichen

Methodenlehre. Frankfurt/New York: Campus. Meulemann, Heiner, 1995: Die Geschichte einer Jugend. Lebenserfolg und Erfolgsdeutung ehemaliger

Gymnasiasten zwischen dem 15. und 30. Lebensjahr. Opladen: Westdeutscher Verlag. Meulemann, Heiner, Klaus Birkelbach & Stephan Blaneck (Hg.), 1993: Fachliche und private Bedingungen

des Studien- und Berufserfolgs. Endbericht eines von der Deutschen Forschungsgemeinschaft geför-derten Projektes. Düsseldorf: Sozialwissenschaftliches Institut der Heinrich-Universität.

Meulemann, Heiner, Klaus Birkelbach & Jörg Otto Hellwig (Hg.), 2001: Ankunft im Erwachsenenleben. Lebenserfolg und Erfolgsdeutung in einer Kohorte ehemaliger Gymnasiasten zwischen 16 und 43. Opladen: Leske+Budrich.

Meulemann, Heiner, Hans-Joachim Hummel, Maria Wieken-Mayser, Wilhelm Wiese & Rolf Ziegler (Hg.), 1987: Lebensplanung und Lebenserfolg in privilegierten Lebensläufen. Abschlußbericht eines DFG-Projektes. Köln: Zentralarchiv für empirische Sozialforschung Universität zu Köln.

Müller-Benedict, Volker, 2007: Wodurch kann die soziale Ungleichheit des Schulerfolgs am stärksten verringert werden? Kölner Zeitschrift für Soziologie und Sozialpsychologie 59: S. 615–639.

Müller, Hans-Peter & Bernd Wegener, 1995: Die Soziologie von der Gerechtigkeit. Konturen einer soziologischen Gerechtigkeitsforschung. S. 7-49 in: Müller, Hans-Peter & Bernd Wegener (Hg.), So-ziale Ungleichheit und Gerechtigkeit. Opladen: Leske+Budrich.

Paulus, Christoph & Petra Lauermann, 2004: Schulische Übergangsentscheidung mittels Lernfähigkeitsdi-agnose. Arbeitsberichte aus der Fachrichtung Erziehungswissenschaft der Universität des Saarlandes. Saarbrücken. Universität des Saarlandes.

Lehrerurteile und meritokratisches Prinzip 22

Peisert, Hansgert, 1967: Soziale Lage und Bildungschancen in Deutschland. München: Piper. Raudenbush, Stephen W. & Anthony S. Bryk, 2002: Hierarchical Linear Modell. Applications and Data

Analysis Methods (2nd ed.). Thousand Oaks, CA: Sage. Rauh, Hellgard, 1977: Schulleistungen und Übertrittsempfehlungen am Ende des 4. Schuljahres in ihrer

Beziehung zur Entwicklung während der Grundschulzeit - Empirische Längsschnittanalyse eines komplexen Begabungsurteils. S. 14-64 in: Ingenkamp, Karlheinz (Hg.), Schüler und Lehrerbeurtei-lung. Empirische Untersuchungen zur pädagogischen Diagnostik. Weinheim und Basel: Beltz.

Rindermann, Heiner & Kurt A. Heller, 2005: The Benefit of Gifted Classes and Talent Schools for Developing Students’ Competences and Enhancing Academic Self-Concept. Zeitschrift für Pädagogi-sche Psychologie 19: S. 133–136.

Sauer, Joachim & Erich Gamsjäger, 1986: Ist Schulerfolg vorhersagbar? Die Determinanten der Grund-schulleistung und ihr prognostischer Wert für den Sekundarschulerfolg. Göttingen: Hogrefe.

Schelsky, Helmut, 1957: Schule und Erziehung in der industriellen Gesellschaft. Würzburg: Werkbund. Schmidt, Frank L., 2002: The Role of General Cognitive Ability and Job Performance: Why There Cannot

Be a Debate. Human Performance 15: S. 187-210. Schmidt, Frank L. & John E. Hunter, 1998: The Validity and Utility of Selection Methods in Personnel

Psychology. Practical and Theoretical Implications of 85 Years of Research Findings. . Psychological Bulletin 124: S. 262-274

Schrader, Friedrich-Wilhelm & Andreas Helmke, 2001: Alltägliche Leistungsbeurteilung durch Lehrer. S. 45-58 in: Weinert, Franz E. (Hg.), Leistungsmessungen in Schulen. Weinheim und Basel: Beltz

Snijders, Tom A.B. & Roel J. Bosker, 2004: Multilevel analysis: An introduction to basic and advanced multilevel modeling. London et. al: Sage.

Solga, Heike, 2005: Meritokratie - die moderne Legitimation ungleicher Bildungschancen. S. 19-38 in: Berger, Peter A. & Heike Kahlert (Hg.), Institutionalisierte Ungleichheiten: Wie das Bildungswesen Chancen blockiert. Weinheim: Juventa.

Stocké, Volker, 2007: Explaining Educational Decisions and Effects of Families' Social Class Position: An Empirical Test of the Breen-Goldthorpe Model of Educational Attainment. European Sociological Review 23: S. 505-519.

Tent, Lothar, 2001: Zensuren. S. 580-584 in: Rost, Detlef H. (Hg.), Handwörterbuch Pädagogische Psychologie (2. Auflage). Weinheim: Beltz/PVU.

Thorndike, Edward L., 1920: A Constant Error on Psychological Rating. Journal of Applied Psychology IV: S. 25-29.

Trautwein, Ulrich, Oliver Lüdtke, Herbert W. Marsh & Gabriel Nagy, 2009: Within-School Social Comparison: How Students Perceive the Standing of Their Class Predicts Academic Self-Concept. Journal of Educational Psychology 101: S. 853–866.

Treiman, Donald J., 1977: Occupational Prestige in Comparative Perspective. New York: Academic Press. Wegener, Bernd, 1985: Gibt es Sozialprestige? Zeitschrift für Soziologie 14: S. 209-235. Wegener, Bernd, 1988: Kritik des Prestiges. Opladen: Westdeutscher Verlag. Weinert, Franz E. (Hg.), 2001: Leistungsmessungen in Schulen. Weinheim und Basel: Beltz Young, Michael, 1961: The Rise of the Meritocracy 1870-2034. An Essay on Education and Equality.

Harmondsworth: Penguin. Ziegenspeck, Jörg W., 1999: Handbuch Zensur und Zeugnis in der Schule. Historischer Rückblick,

allgemeine Problematik, empirische Befunde und bildungspolitische Implikationen. Bad Heilbrunn: Verlag Julius Klinkhardt.

Teacher Evaluations and the De�nition of the

Situation in the Classroom

Dominik Becker & Klaus Birkelbach

January 21, 2010

Abstract

The theoretical contribution of this paper is to regard teacher evalu-

ations with a prognostic claim about students' future academic ability

as a result of a special social situation in the classroom. We assume

that both teachers' rational framing of the situation (RC-mode) and

their recourse to internalized norms and habits (AS-mode) are impor-

tant predictors of teacher evaluations.

Our empirical contribution is to test the hypotheses that we de-

duced from our theoretical assumptions in a set of structural equation

models. We �nd that even when controlling for the path structure of

the model indicators for both modes are of substantial size.

1 Introduction

In this paper we aim to cover two research questions in the �eld of educationalinequality that have been neglected so far: First, the literature seems toagree about the issue that teacher recommendations concerning students'transition from primary to secondary school are an important dimension ofsocial inequality in educational opportunities (Becker, 2003; Bos & Pietsch,2004; Ditton, 2007). However, only little is known whether there are similarmechanisms with regard to the transitions from higher secondary school touniversity. Second, rational-choice explanations of educational inequalityhave put great e�ort in modeling the expectations and considerations of bothstudents and their parents, but rational-choice models of teacher assessmentshave not progressed with similar pace (Ditton, 2007).

This paper's contribution is to regard teacher evaluations about students'future academic ability as a result of a speci�c social situation in the class-room. In the following theoretical section we will �rst replicate the general

23

model of sociological explanations as it has been introduced by Coleman(1990). Then we will specify the logic of the social situation more concretelyand we will try to derive an adequate explanation of the formation of teacherevaluations and their underlying social situation in the classroom. After thatwe will summarize some well-known �ndings of German educational researchabout predictors of teacher recommendations and we will try to transferthem onto teacher evaluations. Additionally, we will refer to the distinctionbetween primary and secondary e�ects of social inequality and apply thisdi�erentiation on the emergence of teacher evaluations.

2 Theory and Hypotheses

A general model of sociological explanations was given in the seminal bookby Coleman (1990) wherein he di�erentiates between macro-level and micro-level propositions as a general form of modeling individual behavior in speci�csocial contexts. The three-step procedure from the macro-level to the micro-level and back to macro-level was extended by Esser (1993, 1996, 1999) wholabeled it as the logic of the situation, the logic of selection, and the logic ofaggregation.

The logic of the situation describes the top-down link from macro-levelto micro-level and contains assumptions about both the conditions of thesocial situation and the alternatives of individual actors. Expectations andevaluations of actors are linked to the conditions and alternatives of the socialsituation via bridge hypotheses.

The logic of selection aims to explain individual decisions on the micro-level based on an underlying theory of action. If the latter is describedexplicitely, scholars usually make use of rational choice (RC ) or subjectiveexpected utility (SEU ) theory.

The logic of aggregation 'simply' embodies the bottom-up link betweenindividual behavior on the micro-level and a collective explanandum on themacro-level via transformation rules that can vary depending on the respec-tive context (e.g. statistical aggregations like divorce rates, institutionallyde�ned aggregations like the 5%-cuto�-criterion in German electoral systemor di�usion models). Figure 1 displays this general schema of sociologicalexplanations.

For the explanation of the kind of teacher evaluations as we have them inour data a more detailed description of the social situation in the classroomseems to be fruitful. (Concretely, we want to explain the variance of teach-ers' assessments which of their students they consider to be appropriate foracademic studies and which of them not; also see section 3.2.) Since teacher

24

social situation 1

individual actor individual action

social situation 2

logic of the situation

logic of selection

logic of aggregation

MACRO­LEVEL

MICRO­LEVEL

conditions and alternatives

expectations and evaluations

SEU

transformation rules

Figure 1: General model of sociological explanations. Source: (Esser, 1993,98).

evaluations will of course depend on their respective expectations in a partic-ular social situation, our aim is to specify the relevant bridge hypotheses thatare necessary to link these expectations and evaluations to the conditions ofthe underlying situation.

2.1 The Social Situation in the Classroom

The literature about teacher recommendations assumes that the latter areactually based on rational decisions and a 'correct' de�nition of the situationin order to guarantee that these recommendations are optimal for the stu-dents (Ditton, 2007). A 'correct' de�nition of the situation should be framedby the idea of meritocracy and should consider both the actual achievementand the future development possibilities of the students. This idea serves asa legitimation for the selectional function of the educational system. Hence,we should keep in mind that when we talk about 'rational' teacher recom-mendations we always imply a kind of Weberian ideal type of objectivityand rationality that might (and idealiter also should) thoroughly serve asa frame for teachers' recommendations � but that all actual recommenda-tions will never be more than a subjective and thus more or less imperfectrealization of this ideal type of rationality.

In many � not all � German States (�Bundesländer�) teacher recommen-dations concerning the transition from primary to the three-tiered secondaryschool (�Hauptschule�, �Realschule�, and �Gymnasium�) are legally binding.Because of the minor permeability between lower and higher education withinthe strati�ed German school system there are only little chances to adjust afalse choice during the future educational course. Actually, teacher recom-mendations are more or less valid forecasts of students' future achievement �potentially based on an evaluation of their actual performance and additionalinformation about familial endorsement even spanning the next educationalsteps � and thus have far reaching consequences for students' life course.

25

However, with regard to teacher evaluations which are � in contrast to theformer � neither made public to the students nor have a binding characterfor them this kind of 'rational' explanation may fall to short. Likewise, thesesubjective evaluations lack any dependence on structural necessities of theschool system � meaning that teachers' subjective assessment of students'academic ability will neither be in�uenced by assumptions about their di-rect impact on students' transition decisions nor by outright norms of therespective school environment. Thus, we can assume that the more intrinsicexpectations and evaluations of the teachers will explain di�erent explicitteacher evaluations for students with di�erent background variables.

We will assume that teacher evaluations emerge in accordance with aspeci�c social production function (Lindenberg, 1989) in the classroom thatdepends on both primary and indirect 'middling' goods. According to Esser(1996), it is the respective social production function that de�nes the objec-tive frame of a social situation. Whereas the general utility that is aspired byindividual actors is aimed on the achievement of physical wellness and socialesteem, these basic needs cannot be achieved in a direct manner but onlyvia institutionally de�ned primary middling goods, that, in turn, depend onindirect middling goods. It is again institutionally de�ned whether the indi-rect middling goods are appropriate means to realize the primary middlinggoods.

Based on these considerations it is now possible to model the emergenceof teacher evaluations in the classroom: For the students, the chance for aca-demic studies is (of course) an institutionally de�ned primary good to achievephysical wellness and social esteem in their later life. With their evaluations,the teachers assess to what extend the students dispose of the institutionallyde�ned indirect means that are necessary to achieve this primary good.

Because of their function of justi�cation and selection (Schelsky, 1957),school grades might be regarded as 'the' main indirect middling good toachieve an academic degree. Teachers might also concede students' intelli-gence (provided that they are able to assess the latter somewhat adequately)to be a virtue to reach that aim even independently of their school grades.But for other empirically corroborated predictors like parental SES or stu-dents' aspirations we would halt to consider it to be an institutionally de�nedmean for it.

Now the teachers' subjective de�nition of the situation becomes impor-tant. Esser integrates a slightly modi�ed version of the frame approach as ithas been introduced by Kahneman & Tversky (1984) into his conception ofthe de�nition of the situation. The idea behind the frame concept is that theactual de�nition of a situation may vary between an almost rational selection(RC-mode) and a dependence on a 'match' that is more determined by (1) the

26

signi�cant symbols of a situation, (2) to what extend the latter are perceivedand (3) how strongly they are anchored in the actor's mind (AS-mode; alsosee Kroneberg (2005). Once a particular situation has been de�ned, moreconcrete scripts of action reduce the complexity of possible alternatives ofactions. Just like the frame-selection, also the script-selection varies betweena rational re�ection about the alternatives at hand (RC-mode) and a decisionmaking acquired through the process of socialization and depending on theinternalization of norms and on the habitualization of routines (AS-mode).

While the importance of students' school grades and possibly also theimportance of their intelligence for teacher evaluations may be due to thefact that teachers more or less rationally assume that these factors are legit-imate indirect middling goods to achieve the primary good of an academicdegree (RC-mode), we assume that predictors like parental SES and students'aspirations a�ect teacher evaluations more about signals and symbols thatstudents emit in class and that match (or mismatch) with teachers' respectiveinternalized norms and habits (AS-mode).

From Bourdieu's (1984) theory about di�erent forms of capital we couldlearn that the habitus of upper-class students which is de�ned as a system ofdispositions (socially acquired schemes of perception, thought and action thatare stable over time) perfectly matches with the habitus of their teachers whousually originate from the same social stratum and thus have incorporateda similar system of social dispositions. The positive social discriminationof upper-class students is twofold: First, upper-class students usually aremore familiar with the (�rst-order) codes (or routines) that are necessary toacquire the cultural goods that are taught in class. Second, these �rst-ordercodes depend, in turn, on second-order codes of perception, communicationand self-control strategies that likewise are acquired in socialization and mayeven a�ect factors like motivation and aspiration (Bourdieu, 1984; Bourdieu& Passeron, 1990). Thus, upper-class students with more cultural capitalwill not only have more knowledge about school-relevant contents but willalso be more able to perceive and to communicate according to norms andvia symbols that �t to the expectations of their teachers.1

In sum, we assume that teacher evaluations might not only be in�uencedby rational considerations about the extend to what students dispose of theadequate indirect middling goods that are necessary to achieve the primarygood of an academic degree, but also by the signals and symbols that stu-dents emit in class, that are in�uenced by students' social background and

1Scholars who stress the distinction between primary and secondary e�ects of socialinequality also assume that social background variables may lead to a twofold discrimina-tion in the educational system. We will discuss this assumption in the following subsectionand we will try to integrate it in our general theoretical framework.

27

that might either match or mismatch with teachers' expectations via theirinternalized norms and habits.

2.2 Determinants of Teacher evaluations

Cognitive capabilities According to Ingenkamp (1971), in the �eld oftransition from primary to secondary school test results have been used tocompensate for the fallibility of teacher evaluations since the beginning of the20th century.2 Admittedly, cognitive capabilities can be regarded as the mostimportant predictor of school achievement, but a considerable empirical gapbetween test results and teacher evaluations can be detected notwithstand-ing: Bos & Pietsch (2004) found in their investigation of German teacherrecommendations about school transitions that students' ability in readingand maths only could account for 39% of the variance of the teacher recom-mendations Bos & Pietsch (2004).

Nevertheless, a linear relationship between intelligence and the probabil-ity of the particular teacher recommendation to attend "Gymnasium" stillholds � especially for the verbal component of intelligence (Ditton, 2007).And there is evidence to assume that teachers assess students' intelligenceas an adequate middling good to achieve the primary good of an academicdegree. Thus we hypothesize that we can transfer this assumption on ourteacher evaluations :

H1: The higher students' intelligence, the better the teacher evaluations.

School Grades Being perhaps the most visible criterion, the impact ofschool grades on teacher evaluations is well-corroborated, too � albeit thelimited value of school grades for long-term recommendation has also beendiscussed since the 1920s (Ingenkamp, 1971). Thus, it is not surprising thatin the study by Bos & Pietsch which has already been mentioned the gradesin mathematics and German language could only account for 66% of the totalvariance of teacher recommendations (Bos & Pietsch, 2004). Since the rela-tionship as such is well-tried and school grades might be assessed as maybethe most important middling good to achieve the primary good of an aca-demic degree, we also transfer this relationship on teacher evaluations:

H2: The better students' school grades, the better the teacher evaluations.

2Moede et al. (1919) and Bobertag & Hylla (1926) can be cited as a very early referencefor the attempt of buidling teacher recommendations about school transition on the groundof standardized test results.

28

Social Background Although the impact of students' social backgroundvariables and their school achievement is basically undoubted, both strengthand importance of this relationship is still discussed broadly (Sauer & Gam-sjäger, 1996). Sticking with the unmediated correlation, Ingenkamp (1977)could �nd a bivariate relationship between fathers' occupational status andteacher recommendations for their children with regard to school transitions:85% of the students whose father had an academic background or was work-ing in the leading white-collar-sector received a recommendation for German"Gymnasium" while 1.4% only got one for "Hauptschule". Reversely, only6.5% of "working class" students received a recommendation for Gymna-sium but 85.5% got one for "Hauptschule". Furthermore, Bos et al. (2004)could also show that the odds to attend Gymnasium (with "Realschule" asa reference category) is 2.7 times higher for "higher service class" childrencompared to "working class" children � even after having controlled for basiccognitive abilities and reading competences. This and the explanations inthe previous section give us good reasons to test for the supposition that stu-dents' social background might in�uence their respective teacher evaluations:

H3: The higher the socio-economic status (SES) of students' parents, thebetter the teacher evaluations.

Aspirations Besides there admittedly exists a bivariate relationship be-tween students' social background and their respective school achievement,scholars have passed some critique in terms of "the inadequacy of uni-factorialtheories" (Boudon, 1974, 101). The crucial point of this critique about mereone-factorial theories is about the di�erentiation between primary e�ects ofsocial inequality de�ned as the relationship between social background vari-ables and pupils' ability (however the latter will be measured) and secondarye�ects of social inequality de�ned either as conditions of schools' structure ororganization � but mainly as the lower educational aspirations of the studentsthemselves or of their parents (Müller-Benedict, 2007). The argument is thatsecondary e�ects of social inequality are still present after having controlledfor all primary e�ects, i.e. given an intelligence score of a certain level,"working class" children will still have lower school achievements becauseof lower educational aspirations.3 Our assumption is that students' aspira-

3Given education as an investment good (Goldthorpe, 1996, 494), the chief concern foreach family will be to achieve some kind of intergenerational stability of class positions.Hence, service-class parents will be more likely than others to encourage their children toattain higher education of some kind. Reversely, for families in less advantaged positionsnot only less ambitious and less costly educational options would be adequate for the goalof maintaining class stability � but also each failed attempt in obtaining higher educational

29

tions not only a�ect educational transitions but also, previously, the teacherevaluations that might thoroughly have an in�uence on the later transitiondecisions. The claim that this e�ect takes place independently of intelligence,school grades and even social background implies that aspirations not onlycontain rationality assumptions but also an interactional part that some-how has to a�ect teachers' internalized norms and habits. We hypothesizethat aspirations can be subsumed under the general idea of Bourdieus (1984)habitus in terms of an outright a�nity towards education that matches theexpectations and norms of the teachers (e.g. about the classical humanisticvalue of education par se). Thus:H4: The higher students aspirations, the better the teacher evaluations.

3 Research Design

3.1 Data

All analysis will be based on a dataset which is known as the "KölnerGymnasiasten-Panel" (KGP). The KGP consists of an initial survey from1969 with N=3385 10th-grade Gymnasium students in North Rhine-Westphaliaand two re-surveys in 1985 (N= 1987) and 1996/97 (N=1596). In the initialsurvey, students have been asked about issues like their performance, inter-ests and plans in school and about their social origin and their relationshipto their parents. Parallel to the initial survey the students took part in anIntelligence Structure Test (IST) containing four sub-scales as developed byAmthauer (1957). At the same time, also the students' teachers (N=1701)and parents (N=2646) have been surveyed. The main items of the parentquestionnaire covered issues like their social background, their style of raisingchildren and their aspirations for their children. Amongst others, teacherswere asked about their pedagogic concepts and about the school climate.4

levels is likely to be more serious in its consequences (e.g. in terms of further opportunitycosts which have to be shouldered). Thus, a higher level of education will be aspired ifthe educational motivation to continue somehow exceeds the underlying investment risk.

4In the �rst re-survey in 1985 the at that time approximately 30 years old former stu-dents gave detailed information about their private backgrounds and occupational careersbeginning at the age of 15 until the age of 30. In the second re-survey in 1996/97, theperiod from the age of 30 until the age of 43 was added to the data. Common focusof both questionnaires were items about the biographical self-de�nition and -re�ection,causal attribution, centrality of particular areas of life and attitudes towards family, workand politics. For a general overview about the existing literature with the KGP data seeBirkelbach (1998) and Meulemann et al. (2001).

30

3.2 Variables

Dependent Variable In the KGP teachers have been asked to evaluateby a dichotomous decision which students they suppose to be appropriate foracademic studies and which of them not. Since the question was put open,teachers could mention students as appropriate, as inappropriate or not atall.

This data structure causes two problems. First, each student could beevaluated by more than one teacher, and each teacher could evaluate morethan one student. An analysis of the intra-class correlations (ICC) revealeda considerable variance of multiple teacher evaluations for each student (notshown). Second, the openness of the question is not without problems, be-cause it has to be clari�ed whether the 'missing' category really can be treatedtechnically as a missing value or if we would loose substantive informationwhen proceeding on this assumption.

To overcome the �rst problem, our analysis will focus on teacher evalua-tions only of class teachers.5 To overcome the second problem, as a prelimi-nary analysis we will estimate two logistic regressions of the chance of gettinga positive teacher evaluation vs. getting a negative one or none at all, re-spectively, on the same independent variables which we will use in structuralequation modeling. These results will serve as a rule for the coding of ourdependent variable in the subsequent structural equation models.

Independent Variables First, students' intelligence was measured bytheir scores in an Intelligence Structure Test consisting of four sub-scales(analogy, selection of words, series of numbers, cube test). For the structuralequation models we will use the z-transformed scores of these sub-scales as ameasure for the latent variable of students' intelligence (re�ective indicators;see Bollen & Lennox 1991, MacCallum & Browne 1993, Diamantopoulos &Winklhofer 2001).

Second, we control for students' school grades in terms of their averagegrades.6 Third, parental socio-economic status (SES) will be operationalizedas the maximum value of both mother's and father's education and occupa-

5We expect that the intra-individual variance of teacher evaluations partially dependson the quality of teacher-student relationships. We assume that class teachers have a moreintense relationship to and a better knowledge of their students than 'ordinary' teachers.Thus, regarding only class teacher evaluations will both simplify the data structure andovercome the problem of variance.

6Note that according to the German grade system an average grade below the mediandisplays relatively better marks and an average grade above the median relatively worsemarks. To ensure that a higher variable value denotes better marks, we inverted thevariable.

31

tional prestige. Education was measured in twelve categories reaching from1 'without graduation' to 12 'university degree'. We categorized the variableinto four dimensions. For occupational prestige, the data already contain therespective Treiman scores (Treiman, 1977).7

Finally, students aspirations are measured by the appraisement of thestudents if 'Abitur' is necessary to reach their aim in life (1 'necessary'; 2'not necessary, but useful'; 3 'not necessary').8

3.3 Preliminary Path Structure and Plan of Analysis

Since we expect that the independent variables will correlate with each otherconsiderably, we intend to model this intercorrelation directly in our calcula-tions. Not surprisingly, we expect �rst that students' intelligence will be ableto explain part of the variance of their school grades. Second, our consider-ations about the primary e�ect of social inequality imply that parental SESwill in�uence both students' intelligence and their school grades. Third, toconsider also the secondary e�ect of social inequality, we assume an impactof parental SES on students' aspirations. Fourth, it seems reasonable thathigher grades will foster students' aspirations � and reversely. Therefore, wewill allow for a covariance between those two variables. And �nally, researchabout both Pygmalion and self-ful�lling prophecies9 has shown that under-standing teacher evaluations as pure exogenous variables would fall too short.Therefore, we will model the relationship between school grades and teacherevaluations and the one between students' aspirations and teacher evalua-

7See Ho�meyer-Zlotnik & Geis (2003) for a general overview about classi�cation ofoccupation. Another possibility of dealing with parental SES would be to model all avail-able information, i.e. all four variables, as formative indicators of a latent variable 'SES'(Bollen & Lennox, 1991; MacCallum & Browne, 1993; Diamantopoulos & Winklhofer,2001). However, since the initial survey of the KGP took place in 1969, we have to expectthat a considerable amount of mothers will be not employed, hence the variance of thisvariable would be rather low. Indeed, a simple frequence analysis revealed that an amountof 78% of all mothers had not been in labour when they have been surveyed (not shown).As a consequence, the factor loadings of a con�rmatory factor analysis wherein we treatedthe four SES variables as formative indicators were rather low (not shown). Thus, weconclude that introducing the maximum value of both mothers' and fathers' educationand occupational prestige as two single indicators will be a better strategy and lead tomore consistent estimates.

8Table A (appendix) contains minimum/maximum, mean and standard deviation ofall variables.

9For the initial study of Pygmalion in the Classroom see Rosenthal & Jacobson (1968).For early meta-analyses of existing studies about Pygmalion up to that point see Smith(1980) and Raudenbush (1984). For a current summary of implications and open questionsin self-ful�lling prophecy research see Jussim & Harber (2005).

32

tions as covariances rather than as regression weights. The preliminary pathmodel is presented in �gure 2.

intelligence teacher evaluations

average grade

parental socio­economic status  aspirations

H1

H2

H3 H4

Figure 2: Preliminary path model.

First, we will present the univariate distribution of teacher evaluationsand some bivariate results. In our multivariate analyses we will, second,estimate a multinomial logit model on teacher evaluations to test only forthe simple one-way relationships of all predictors on our dependent variable.Third, we will run more elaborate structural equation models in order to takethe complex path structure of the independent variables into account.

4 Results

4.1 Univariate Analysis

Table 1 presents the distribution of class teacher evaluations with their ap-praisements which of their students they consider to be appropriate for aca-demic studies � and which of them not.

Table 1: Distribution of teacher evaluations: Ability for academic studiesteacher evaluation

not able able not mentioned /missing

Row Total

n 616 751 1060 2427% students 25.4 30.9 43.7 100.0% mentioned 45.1 54.9 - -

33

Table 1 shows that 43.7% of the students did not get any teacher eval-uation. Below we will discuss the question whether this category shoud beincluded in our analyses or treated as a missing value. Among the studentswho had been mentioned by their teachers (n=1367), a majority of 54.9%gets a positive recommendation whereas an amount of 45.1% gets a negativeone.

4.2 Bivariate Analysis

The following tables consist of simple cross-tabulations of teacher evaluationsas the dependent variable on the independent variables as introduced in sec-tion 2. This will cover intelligence, average school grades, parental SES andaspiration.

Intelligence Table 2 shows that students with lower intelligence scores alsoget worse teacher evaluations: Only 23.3% of the students whose intelligenceis ranked below the overall median get a positive teacher evaluation � whereasthe respective amount in the group of students with an intelligence scoreabove the median is 39.9%. Reversely, more intelligent students less oftenget negative teacher evaluations than less intelligent students (17.7% vs. 32.7%). Interestingly, in the group of students who had not been mentioned bytheir teachers at all we �nd almost as much students with an IST aboveaverage than below. But when we compare the means of students' intelligencescores grouped by the categories of teacher evaluations (not displayed) we �ndthat the mean score of those students who had not been mentioned (109.47)is exactly located between the students who had been classi�ed as 'able'(113.89) and 'not able' (106.51), respectively (not shown). The adequatemeasure of association for asymmetric cross-tabulations for ordinal variables,Kendall's Tau-c, shows that there is a moderate association between students'intelligence scores and teacher evaluations of .23.10

School Grades Following Table 3, we can see that the impact of schoolgrades seems to be even stronger than the e�ect of intelligence. An amount of49.3% of the students with relatively better marks gets a positive teacher eval-uation, but only 13.1% of the students with relatively worse marks. Kendall'sTau-c now shows a relatively strong association of .454.11Furthermore, in

10The measure of association for the metric scores of students' intelligence and teacherevaluations is about Eta = .307.

11The measure of association for students uncategorized (i.e. metric) average grade andteacher evaluations is about Eta = .591.

34

Table 2: E�ect of Students' Intelligence Scores On Teacher Evaluationsintelligence scores

low (belowmedian)

high (abovemedian)

Row Total

not ablen 391 199 590% 32.7 17.8 25.3

teachernot mentioned

n 525 471 996% 43.9 42.2 43.1

evaluationable

n 279 445 724% 23.3 39.9 31.6

totaln 1195 1115 2310% 100.0 100.0 100.0

χ2 = 100.8202 (d.f. = 2, p < .001); Kendall's Tau-c = .225 (p < .001).

contrast to table 2 we can note di�erences in school grades for the groupof students who did not get any teacher evaluations: The amount of stu-dents who had not been mentioned by their teachers is higher among pupilswith relatively worse grades. To refer again to the means grouped by thecategories of teacher evaluations, the mean z-transformed grades of thosestudents who had not been mentioned by their teachers (510.74) is again ex-actly located between the scores for students with a positive (451.38) and anegative (541.50) teacher evaluation. Thus, the visibility of grades not onlyin�uences the fact whether students get a good or a bad teacher evaluationbut also whether they get one at all.

Table 3: E�ect of Students' Average Grade On Teacher Evaluationsaverage grade

low (abovemedian)

high (belowmedian)

Row Total

not ablen 446 141 587% 39.1 12.1 25.6

teachernot mentioned

n 546 451 997% 47.8 38.6 43.2

evaluationable

n 150 575 725% 13.1 49.3 31.2

totaln 1142 1167 2309% 100.0 100.0 100.0

χ2 = 416.4435 (d.f. = 2, p < .001); Kendall's Tau-c = .454 (p < .001).

Socio-economic Status In table 4 and 5 the e�ects of parental highesteducational degree and occupational prestige are displayed. Although therelationship is not perfectly linear, there is a clear tendency that students

35

whose parents completed higher educational degrees get better teacher eval-uations. Students whose parents have a higher occupational prestige alsoget better teacher evaluations. Looking at Kendall's Tau-c, we can concludethat the social background e�ect via parental occupational prestige is a bitstronger than via parental education.

Table 4: E�ect of Parents' Educational Degree (highest) on Teacher Evalu-ations

parental education (highest)lower middle Abitur degree Row Total

not ablen 319 145 38 111 613% 29.1 27.6 20.0 18.3 23.8

teachernot mentioned

n 465 242 83 267 1057% 42.3 46.1 43.7 44.1 44.1

evaluationable

n 314 138 69 227 748% 28.6 26.3 36.3 37.5 32.2

totaln 1098 525 190 605 2418% 100.0 100.0 100.0 100.0 100.0

χ2 = 39.89409 (d.f. = 6, p < .001); Kendall's Tau-c = .090 (p < .001).

Table 5: E�ect of Parents' Occupational Prestige on Teacher Evaluationsparental occupational prestige (highest)below median above median Row Total

not ablen 303 171 474% 28.5 19.8 24.2

teachernot mentioned

n 455 373 828% 42.7 43.2 43.0

evaluationable

n 307 320 627% 28.8 37.0 32.7

totaln 1065 864 1929% 100.0 100.0 100.0

χ2 = 12.09309 (d.f. = 2, p = 0.002); Kendall's Tau-c = .119 (p < .001).

Aspirations Table 6 �nally reveals that students' aspirations also have aconsiderable bivariate e�ect on teacher evaluations. 40.5% of the studentswho explicitely said that completing 'Abitur' is relevant to reach their aim inlife get a positive teacher evaluation, but only 12.5% of those who explicitelysaid that 'Abitur' is not relevant for their aim in life. Reversely, an amount of49.1% of the latter gets a negative teacher evaluation but only 14.4% of thosewho consider 'Abitur' to be important for their aim in life. Interestingly,aspirations do not have a positive impact on the fact whether students are

36

mentioned by their teachers or not: Students who consider 'Abitur' not to benecessary to reach their aim in life are less often not mentioned than studentswith higher aspirations. When we look at Kendall's Tau-c, we can note thatthe association between students aspirations and teacher evaluation (.251)is even stronger than the association between their intelligence and teacherevaluations (.225).

Table 6: E�ect of Students' Aspiration On Teacher Evaluationsaspirations

('Abitur' necessary to reach aim in life?)not necessary useful necessary Row Total

not ablen 114 192 143 449% 49.1 33.7 14.4 32.4

teachernot mentioned

n 89 236 450 775% 38.4 41.4 45.2 41.7

evaluationable

n 29 142 403 574% 12.5 24.9 40.5 26.0

totaln 232 570 996 1798% 100.0 100.0 100.0 100.0

χ2 = 178.0454 (d.f. = 4, p < .001); Kendall's Tau-c = .251 (p < .001).

37

4.3 Multivariate Analyses

4.3.1 Logistic Regressions

Basically, we will run the same models as we are intending to estimate in theSEM section. Performance Model 1 will include students' intelligence andadditionally control for their sex. Performance Model 2 will amend perfor-mance model 1 by students' average grade. The SES model will introduceparental socio-economic status, and the Aspiration Model �nally amends theSES model by students' aspirations. The exponated log-odds of these calcu-lations are shown in tables 7 and 8.

First we present the results of a logistic regression on the determinantsof good vs. bad teacher evaluations (table 7). In performance model 1 wecan see that when the model controls for their respective intelligence, malestudents get better teacher evaluations than female students. But intelligenceitself is a much stronger predictor of teacher evaluations than sex. Whenstudents' average grade is introduced (performance model 2 ), the sex e�ectincreases while the intelligence e�ect decreases. Average grade by itself isthe strongest independent variable in the model (12.35) and becomes evenstronger when controlling for parental SES (13.20) with parental educationand occupational prestige as additional predictors (SES model). Likewise,also the e�ect sizes of sex and intelligence increased compared to performancemodel 2.

The �nal aspiration model shows that average grade is the strongest pre-dictor of good or bad teacher evaluations while students' aspirations comesecond. With regards to content, the coe�cient e.g. of average grade meansthat the chance of students with relatively better average grades to get a goodteacher evaluation is 13.6 times higher than the chance of students with rela-tively worse average grades � even when controlling for all other variables inthe model. Likewise, the chance of students who consider 'Abitur' to be nec-essary or important for their aim in life to get a good teacher evaluation is 4.1times higher than the chance of students who explicitely said that 'Abitur'is not relevant for them. Controlling for students' aspirations cancels outthe e�ect of parental occupational prestige on teacher evaluations � whileparental education is still signi�cant.

Second we present the results of a logistic regression on the determinantsof getting a good teacher evaluation compared to getting no evaluation atall by their teachers (table 8). In contrast to table 7, there is no signi�cantsex e�ect between students with a positive teacher evaluation and those whogot none. Furthermore, the e�ect of both students' intelligence and theiraverage grade is weaker than in the logistic regression of table 7. Similar

38

Table 7: Logistic Regression: able vs. not ablePerf. Model 1 Perf. Model 2 SES Model Asp. Model

(Intercept) 1.06 7.07*** 3.93*** 1.25−1

sex 1.29−1* 1.9−1*** 1.85−1*** 1.46−1*intelligence 3.04*** 2.33*** 2.84*** 3.19***average grade 12.35*** 13.2*** 13.67***parental education 1.19* 1.22*parental occ. prestige 1.56* 1.43aspirations 4.1***Nagelkerke's R2 .104 .417 .457 .510N 1314 1309 1067 841

Note: All coe�cients are odds ratios. Values smaller than 1 are displayed asmultiplicative inverses.Signi�cance values: * (p < .05); ** (p < .01); *** (p < .001).

to the previous table, only parental education has a signi�cant e�ect on theoutcome of teacher evaluations but not parental occupational prestige. Inthe �nal model, students' average grade is again the strongest predictor,and again students' aspiration come second. The chance of students withrelatively better school marks (average grade below the overall median) to geta positive teacher evaluations (in contrast to get none at all) is 4.8 times (table7: 13.7 times) higher than the chance of students with relatively worse schoolmarks (average grade above the overall median). The chance of studentswho consider 'Abitur' to be 'necessary' or 'important' for their aim in life toget a good teacher evaluations (in contrast to get none et all) is 1.7 times(table 7: 4.1 times) higher than the chance of students who explicitely saidthat 'Abitur' is not relevant for them. Since the e�ect sizes in the logisticregression of getting a good teacher evaluation vs. getting none at all (table8) are consistently lower than the e�ect sizes in the logistic regression ofgetting a good teacher evaluation vs. getting a bad one (table 7), we canconclude that students who are not mentioned at all rank lower in teacherperceptions than students with a good teacher evaluation but higher thanstudents with a bad teacher evaluation. To get to the point: When teachersdo not receive clear evidence for their decision, they will develop only vagueexpectations for their students. Thus, in the subsequent structural equationmodels we will treat the 'missing' category not as missing but as an implicitmiddle category between good and bad teacher evaluations.

39

Table 8: Logistic Regression: able vs. not mentionedPerf. Model 1 Perf. Model 2 SES Model Asp. Model

(Intercept) 1.73−1*** 1.27 1.45−1 2.37−1*sex 1.06−1 1.19−1 1−1 1.04intelligence 1.77*** 1.56*** 1.79*** 1.69***average grade 4.56*** 4.72*** 4.83***parental education 1.15* 1.16*parental occ. prestige 1.07 1−1

aspirations 1.74*Nagelkerke's R2 .027 .171 .189 .200N 1720 1716 1412 1103

Note: All coe�cients are odds ratios. Values smaller than 1 are displayed asmultiplicative inverses.Signi�cance values: * (p < .05); ** (p < .01); *** (p < .001).

4.3.2 Structural Equation Modeling

In order to take the complex path structure of the independent variables intoaccount, we ran a set of structural equation models.12 Since our dependentvariable is categorical, conventional maximum likelihod estimation based ona usual variance-covariance matrix will be biased (Bollen 1989: 433�.). In-stead, it has been suggested to use a matrix of polychoric correlations (Olsson1979; Muthén 1984; Aish & Jöreskog 1990; Jöreskog 1994) as input matrix.13

The basic idea of polychoric correlations of categorical variables is to com-pute the thresholds of an assumed underlying continuous variable. Becausethe attempt of computing polychoric correlations of metric variables maylead to convergence problems, we categorized also the metric variables in thedataset. For our model we have dichotomized the IST subscores, students'average grade and parental occupational prestige based on their respectivemedian. The polychoric correlation matrix is displayed numerically in tableD and graphically in �gure A (appendix). We used the SEM package in R(Fox, 2006) for our analyses.

Measurement Part Following the "Jöreskog tradition" (Byrne, 2004) instructural equation modeling, �rst of all the measurement models have to

12The SEM approach is also known as a LISREL model (Jöreskog & Sörbom, 1989;Jöreskog, 1993), named after the �rst statistical package which could deal with SEMs.Bollen (1989) is still the classical textbook for structure equation models.

13Maximum-Likelihood estimation of SEM models based on polychoric correlations maylead to consistent estimates, but the standard errors, z-values and signi�cance parameterswill be biased (Bollen, 1989, 443). Therefore, we use bootstrapping techniques to correctthe latter parameters (Zhang & Browne, 2006; Fox, 2006).

40

be �tted. Since we already saw in the logistic regression part that only twoof our four SES variables posess simultanious predictive power on teacherevaluations, we abstain from estimating a formative measurement model forthe SES indicators in favour of including them as single indicators that arecorrelated with each other. Thus, only the measurement model for the intel-ligence subscores will be reported here (�gure 3).14

The re�ective measurement model for the intelligence scores (IST) achieveda good �t with respect to the Adjusted General Fit Index (AGFI = .996),the Comparative Fit Index (CFI = .992), the Root Mean Square Error ofApproximation (RMSEA = 0.018) and the Standardized Root Mean SquareResidual (SRMR = 0.008).15

The insigni�cant χ2-value of 4.226 (df=2) suggests that there is no sig-ni�cant di�erence between the variance-covariance matrix of the observedvariables and the model we have estimated. When we look at the standard-ized estimates, we can see that all except one IST subdimensions show factorloadings around .50. Only the cube test seems to perform a little bit worsein explaining the latent variable "intelligence".

intelligence

word test

analogy test

number test

cube test

.45

.42

.52

.35

Figure 3: IST Measurement Model

Structural Part The structural part will proceed in three subsequentsteps: First, teacher evaluations are regressed on the latent intelligence vari-able as it has been estimated in the IST measurement model (performance

14All regression weights and covariances that are displayed in this and the subsequentstructural equation �gures (�gures 3-7) have corresponding z-values that ful�ll a signi�-cance value of p < .05 or lower.

15Bollen (1989) de�nes the following cut-o� values for the goodness-of-�t criteria: AGFI> .95, CFI > .90, and both RMSEA and SRMR <.08 (better < 0.05).

41

model 1 ). Second, this structural model is amended by the single indicatoraverage grade (performance model 2 ). Third, the SES indicators are in-troduced to model the primary e�ects of social inequality(SES model). And�nally, also students' aspirations are included in order to model the secondarye�ects of social inequality(aspiration model).

Performance Models The Performance Model 1 simply regresses teacherevaluations (1 = 'not able'; 2 = 'not mentioned'; 3 = 'able') on the latentintelligence variable that we have �tted in the previous section. This modelcould achieve a satisfactory model �t (table 1, model PERF1a) and revealeda standardized coe�ciant of intelligence on teacher evaluations of .35 (notshown).

In our theoretical part we expected that we might �nd stronger or addi-tional causal e�ects for the verbal part of our intelligence test. And indeed,modi�cation indices (MI; see e.g. Sörbom, 1989) suggested to allow for a di-rect covariance between the analogy subscore and teacher evaluations. Sinceit does not make much sense to assume a cross-sectional impact of teacherevaluations on students' intelligence16, it will be better to allow only for aone-way relationship in terms of an impact of intelligence on teacher eval-uations.17 This version of the Performance Model 1, PERF1b, is presentedin �gure 4. The numbers next to the arrows show the standardized pathcoe�cients and the factor loadings of the model. The �t measures couldimprove clearly and also the χ2 value dropped down tremendously (see table2, model PERF1b). The coe�cient itself is highly signi�cant (p < .001) andits size of .17 is not far from the coe�cient of the overall IST variable onteacher evaluations (.19). Of course the similarity of these e�ect sizes is dueto a drop-down of the e�ect-size of the latent variable intelligence on teacherevaluations from .35 (not shown) to .19 � meaning that this is the price wehave to pay for relaxing our model. But since the respective z-statistic is stillsigni�cant, we will continue with the model allowing for a direct relationship.

16In contrast, several studies modeled the Pygmalion e�ect as a longitudinal impactof teacher evaluations on intelligence (e.g. Rosenthal & Jacobson, 1968) and all studiesanalyzed in Smith 1980 ). Others focused on changes in school grades while controlling forintelligence (e.g. Smith et al., 1999). Although we are not directly testing the self-ful�llingprophecy hypothesis we will yet consider its basic idea in terms of a covariance betweenteacher evaluations and school grades.

17(Jöreskog, 1993, 312) strongly recommends only to relax parameters which can beinterpreted substantively. In this case two arguments seem to make sense. Possibly thecompetence of a student to draw analogy-based inferences is more appliable (and thus alsomore visible to teachers) in school lessons than the other subdimentions of intelligence.Another explanation would be that teachers rate the competence in drawing analogy-basedinferences particularly high with respect to successfully completing academic studies.

42

Performance Model 2 extends performance model 1 in adding students' av-

intelligence

word test

analogy test

number test

cube test

.45

.42

.52

.35

teacher evaluations.19

.17

Figure 4: Performance Model 1

erage grade as a second independent variable. At �rst we did not allow fora covariance between intelligence and average grade although according toour theoretical considerations we surely expected it to be there. The model�t of the unfreed model (table 1, model PERF2a) was not very satisfactory,and thus we followed out theoretical assumptions and allowed for a one-wayco�cient of intelligence on the average grade. The �t of this model was a bitbetter (model PERF2b), but could still be improved: Interestingly, modi�-cation indices also suggested to allow for another direct e�ect of the analogysubscore on the average grade (which seems to con�rm our hypothesis aboutthe particular visibility of this subdimention of intelligence in school). Thismodel, PERF2c, is presented in �gure 5.

intelligence

word test

analogy test

number test

cube test

.45

.42

.52

.35

teacher evaluations.20

.16

average grade

.40

.10

.15

Figure 5: Performance Model 2

Similar to the coe�cient sizes in our logistic regressions (cf. section 4.3.1,tables 7 and 8), the covariance between average grade and teacher evaluationsseems to be much larger than the impact of students' intelligence scores (.40

43

Table 9: Performance Models: Fit Measures

PERF1a PERF1b PERF2a PERF2b PERF2c

χ2 58,269 8,287 135,820 28,132 8,850

DF 5 4 9 7 6

p(> χ2) 0.000 0.082 0.000 0.000 0.182

AGFI 0.979 0.996 0.970 0.992 0.997

RMSEA 0.056 0.018 0.065 0.030 0.012

CFI 0.947 0.996 0.932 0.989 0.998

SRMR 0.028 0.010 0.057 0.018 0.009

vs. .20). Not surprisingly, the relationship between intelligence and teacherevaluations is mediated by the intervening variable average grade (.15). Italso seems noteworthy that the "pure" e�ect of the analogy subscore onaverage grade (.10) is again not much smaller than the respective overallregression weight of the latent variable intelligence (.15) � which is, again,due to a dropdown of the latter from .43 in the restricted model (not shown).In contrast, by including students' average grade in the model, the e�ect ofIST on teacher evaluations slightly increases from .19 (Performance Model1) to .20. Appearently, for students with the same average grade the e�ectof intelligence on teacher evaluations is even more important. The model �tis convincing (cf. table 2, model PERF2c).

SES Model Now we introduce the maximum value of both mothers'and fathers' educational degree and occupational prestige as two single indi-cators in order to model the primary e�ects of social inequality explicitely.The initial �t of this model is already acceptable (see table 2, model SES1 )and it could be improved slightly when the covariance between the twoSES indicators was relaxed (model SES2 ). Another improvement could beachieved when we allowed for the regression weights of the two SES indicatorson the latent intelligence variable (model SES3 ) - meaning an operational-ization of primary e�ects of social inequality. Though, in contrast to ourtheoretical model (�gure 2), two coe�cients in the SES model turned outto lack statistical signi�cance: the coe�cient of education on the global in-telligence variable (p=.35) and the coe�cient of occupational prestige onteacher evaluations. Therefore, we subsequently dropped these regressionweights (models SES4 and SES5 ). Moreover, modi�cation indices suggestedto introduce a direct e�ect of education on the analogy subscore of intel-

44

ligence. Since we already found direct e�ects of this dimension on bothaverage grade and teacher evaluations (see �gure 5), which was in line withour theoretical considerations, we allowed for this regression weight (modelSES6 ). While models SES5 and SES6 still contain occupational prestige asa covariate of education, we �nally tested a model that completely passedthe former variable (model SES7 ). Since this model could achieve a better�t than SES6, it is the preferred model up to now (see �gure 6).18 The di-

intelligence

word test

analogy test

number test

cube test

.48

.50

.36

teacher evaluations.26

.13

average grade

.40

.08

.16

parentaleducation 

.10.11

.46

Figure 6: SES Model

rect e�ect of education on teacher evaluations is about .10 - which is, up tonow, the second smallest coe�cient in the model. Yet we also have to keepin mind the indirect e�ect in terms of the relationship between education,the IST analogy dimension and teacher evaluations. The covariance betweenstudents' average grade and teacher evaluations is still the strongest e�ectin the model (.40), while � at least up to now � the impact of intelligenceon teacher evaluations comes second (.26). Again, the e�ect of the latentintelligence variable on teacher evaluations slightly increases when control-ling for direct and indirect e�ects of education. Apparently, the predictivepower of intelligence on teacher evaluations becomes even stronger amongstudents with the same social background. The model could achieve a fullysatisfactory �t (table 3, model SES7 ).

Aspiration Model Finally, we include students' aspirations measuredby their dummy-coded appraisement if 'Abitur' is necessary to reach their aim

18We tested three additional variants of models SES6 and SES7 (not shown, availableon request): one with a regression weight between occupational prestige and average grade(not signi�cant), one with a direct e�ect of education on the latent IST variable than onthe analogy subscore (signi�cant, but worse model �t), and one with regression weights ofaverage grade on both the latent IST variable and the analogy subscore (which is signi�cantbut su�ers from multicollinearity). Because of these drawbacks we still prefer model SES7.

45

Table 10: SES Models: Fit Measures

SES1 SES2 SES3 SES4 SES5 SES6 SES7

χ2 1563.100 78.170 69.152 69.394 75.486 38.477 22.746

DF 19 18 16 17 18 17 11

p(> χ2) 0.000 0.000 0.000 0.000 0.000 0.002 0.019

AGFI 0.835 0.989 0.989 0.989 0.989 0.994 0.995

RMSEA 0.155 0.031 0.031 0.030 0.031 0.019 0.018

CFI 0.556 0.983 0.985 0.985 0.983 0.994 0.994

SRMR 0.103 0.026 0.022 0.022 0.023 0.015 0.013

in life in order to model also the secondary e�ects of social inequality. The �tof the initial model without allowing any additional covariances or regressionweights except the direct e�ect of students' aspirations on teacher evaluations(table 3, model ASP1 ) could be improved when we allowed for a regressionweight of education on students' aspirations (model ASP2 ). Furthermore, wealso assumed a direct e�ect of intelligence of aspirations � which once moreupgraded the �t of our model (model ASP3 ). Moreover, we also hypothesizeda covariance between students' aspirations and their average grade (ASP4 ).And �nally, modi�cation indices suggested to introduce a direct e�ect ofthe IST analogy subscore on aspirations. In accordance with our antecedentmodel modi�cations we allowed for this coe�cient in ASP5. Since the model�t could be improved when we dropped the direct e�ect of aspirations on thelatent intelligence variable IST (model ASP6, this �nal model is displayed in�gure 7. The largest e�ect in our model is still the covariance between average

intelligence

word test

analogy test

number test

cube test

.46

.50

.37

teacher evaluations.28

.14

average grade

.40

.09

.16

parentaleducation 

.12.12

aspirations

.08

.20

.46

.11.09

Figure 7: Aspiration Model

46

Table 11: Aspiration Models: Fit Measures

ASP1 ASP2 ASP3 ASP4 ASP5 ASP6

χ2 161.000 98.478 66.836 48.799 29.964 31.103

DF 18 17 16 15 14 15

p(> χ2) 0.000 0.000 0.000 0.000 0.008 0.009

AGFI 0.977 0.985 0.989 0.991 0.994 0.995

RMSEA 0.048 0.038 0.031 0.026 0.018 0.018

CFI 0.939 0.965 0.978 0.986 0.993 0.993

SRMR 0.043 0.033 0.023 0.018 0.014 0.014

grade and teacher evaluations (.40) while the regression weight of the latentintelligence variable comes second (.24). The covariance between students'aspirations and teacher evaluations comes on third place (.20). Besides thisdirect e�ect of aspirations we can also note a signi�cant indirect e�ect of it viastudents' average grade (.08) - which is the smallest coe�cient in the model.Aspirations themselves are signi�cantly predicted by parental education (.09)and students' intelligence in terms of the IST analogy subscore (.12). Theseresults clearly show that not only teachers' rational assessment about thefact to which extend students dispose of the indirect middling goods thatare necessary to achieve the primary good of an academic degree explain thevariance of their evaluations (RC-mode) � but that also rather unconsciousmechanisms between students' habitus and teacher's internalized norms andhabits are relevant (AS-mode). Yet, the predictive power of the former isstill stronger than that of the latter. Given the size of the �nal model, its �tis very satisfactory (table 3, model ASP6 ).

5 Summary and Outlook

In this paper we tried to model the emergence of teacher evaluations withregard to students' academic ability as an outcome of a speci�c social sit-uation in the classroom. We assumed that students' intelligence and theiraverage grade might function as indirect middling goods that are necessaryin order to achieve the primary good of an academic degree � and that teach-ers would be able to recognize the extend to which students dispose of thesemiddling goods somehow rationally (RC-mode). On the other hand, we hy-pothesized that the corroborated predictive power of variables like students'social background and their educational aspirations which do not �t in this

47

rather instrumental explanation can be explained via the signals and symbolsthat students emit in class and that either match or mismatch with teach-ers' expectations, their internalized norms and habits (AS-mode). In a shortliterature review we derived four hypotheses, according to which we postu-lated that teacher evaluations would be in�uenced by students' intelligence,average grade, social background and aspirations, respectively. Furthermore,we expected that some of these independent variables would show a pathstructure in terms of additional regression weights or covariances betweenthem (Figure 2).

This model was tested by use of the "Kölner Gymnasiasten-Panel" (1969).In simple cross-tabulations (section 4.2) we could already note that students'average grade seems to have the strongest e�ect on (positive or negative)teacher evaluations while their aspirations come second. This impression wasstrengthened by logistic regression analyses, and additionally it was revealedthat not all indicators of parental socio-economic status were able to explainteachers evaluations equally. Thus, we included only father's education andmother's occupational prestige as crucual SES indicators. Another result oflogistic regression analyses was the fact that getting no evaluation at all canbe regarded as lying somewhere in between getting a positive evaluation andgetting a negative one. Therefore, for the subsequent structural equationmodels as our main analyses we modeled the decisions of the teachers withregard to the academic ability of their students as our dependent variable inthe following way: 1 'not able'; 2 'not mentioned'; 3 'able'.

In the structural equation models our main hypotheses could be cor-roborated. Even when controlling for additional path structures, all of our(formally) independent variables showed signi�cant e�ects on teacher evalu-ations. Average grade is still the strongest predictor, but in contrast to thepreceding logistic regression analyses now students' intelligence comes secondand their aspirations come third.

Additional to our main hypothesis we already found evidence in the lit-erature that the verbal dimension of intelligence might be more importantfor teacher evaluations than the numeric dimension. Indeed we could noteindependent e�ects of the analogy subscore of intelligence on both averagegrade and teacher evaluations. But compared to the initial path model wealso had to drop several arrows due to lacks of signi�cance: First we couldnot �nd a signi�cant regression weight of father's education on the global in-telligence variable. However, we could note a signi�cant impact of the formeron the analogy subscore of intelligence. Since this variable showed indepen-dent e�ects on both average grade and teacher evaluations, we conclude thatthe primary e�ect of social inequality is mainly passed on this predictor.Second, we could not �nd any direct e�ects of both father's education and

48

mother's occupational prestige on students' average grade. Apparently, theprimary e�ect of social inequality is exhaustively modeled when we controlfor the indirect e�ect of parental SES via intelligence on average grade. Thethird arrow we had to drop concerned the regression weight of mother's oc-cupational prestige on students' aspirations. This was due to freeing thecovariance between students aspirations and their average grade since thelatter is also indirectly in�uenced by mother's occupational prestige.

In sum, we found evidence that teachers not only make rational assess-ments about the adequate middling goods (in terms of intelligence and av-erage grade) that are necessary to achieve the primary good of an academicdegree (RC-mode) � but that also mechanisms exist which could be explainedby a more interactionist view stressing the signals and symbols that studentsemit in the classroom according to Bourdieu's concept of habitus (AS-mode).Yet we saw that the RC-mode explanation of teacher evaluations has morepredictive power than the as-mode. Whithin the AS-mode variables, sec-ondary e�ects of social inequality are stronger than primary e�ects.

These results suggest the following implications for further studies: First,rational-choice explanations of the emergence of teacher evaluations have tobe further extended. Future studies could try to sharpen the distinctionbetween RC-mode and AS-mode explanations as we have transferred it onthe social situation in the classroom.

Second this approach clearly needs the consideration of more backgroundvariables. On the one hand, the set of student variables in our analyses mightbe no exaustive operationalization of the student side of the social situation inthe classroom. Thus, it would make sense to include additional informationlike students' grades in di�erent subjects or their academic self-concept inorder to specify the social situation in the classroom more concretely. On theother hand, it appears to be insightful also to control for teacher backgroundvariables. Future studies could try to examine to what extend teachers'over- and under-estimations of their students as well as their principles ofevaluation vary with background variables like their pedagogic concepts ortheir duration of teaching in class.19

And �nally, this approach could be integrated into the general Pygmalionframework. Once the social situation in the classroom has been modeledprecisely enough, the critique about a lack of consideration of enough mod-

19For instance, Raudenbush's (1984) meta-analyses of all Pygmalion studies up to thatpoint could show that the e�ect size of Pygmalion is about -.13 for teachers with a durationof 24 weeks and about .55 for teachers with a duration less than 5 weeks of teaching in class.Whereas these e�ect sizes measure the impact of teachers' over- and under-estimations onstudents later performance, it could be possible that already the fact whether an over- orunder-estimation takes place depends on the duration of teaching in class.

49

erators of Pygmalion which has been passed by (Jussim & Harber, 2005, 143)will be overcome more easily.

References

Amthauer, R. (1957). Intelligenz-Struktur-Test . Göttingen: Hogrefe.

Becker, R. (2003). Educational Expansion and Persistent Inequalities ofEducation. European Sociological Review , 19 , 1�24.

Birkelbach, K. (1998). Berufserfolg und Familiengründung. Lebensläufezwischen institutionellen Bedingungen und individueller Konstruktion.Opladen: Westdeutscher Verlag.

Bobertag, O., & Hylla, E. (1926). Begabungsprüfung für den Übergang vonder Grundschule zu weiterführenden Schulen.. Langensalza: Verlag vonJulius Beltz.

Bollen, K., & Lennox, R. (1991). Conventional wisdom on measurement: Astructural equation perspective. Psychological Bulletin, 110 , 305�314.

Bollen, K. A. (1989). Structural Equations With Latent Variables.. NewYork: Wiley.

Bos, W., & Pietsch, M. (2004). Erste Ergebnisse aus KESS 4. Kurzbericht .Hamburg: Freie und Hansestadt Hamburg.

Bos, W., Voss, A., Lankes, E.-M., Schwippert, K., Valtin, J., & Thiel, R.(2004). Schullaufbahnempfehlungen von Lehrkräften für Kinder am Endeder vierten Jahrgangsstufe, (pp. 191�228). Münster: Wachsmann.

Boudon, R. (1974). Education, Opportunity and Social Inequality: ChangingProspects in Western Society . New York: John Wiley & Sons.

Bourdieu, P. (1984). Distinction: A social critique of the judgement of taste.Cambridge, Mass.: Harvard University Press.

Bourdieu, P., & Passeron, J. C. (1990). Reproduction in Education, Societyand Culture. London: Sage Publications Ltd.

Byrne, B. M. (2004). Testing for multigroup invariance using AMOS graphics:A road less traveled. Structural Equation Modeling: A MultidisciplinaryJournal , 11 , 272�300.

50

Coleman, J. (1990). Foundations of Social Theory . New York: HarvardUniversity Press.

Diamantopoulos, A., & Winklhofer, H. M. (2001). Index construction withformative indicators: an alternative to scale development. Journal of Mar-keting Research, 38 , 269�277.

Ditton, H. (2007). Der Beitrag von Schule und Lehrern zur Reproduktion vonBildungsungleichheit , (pp. 247�275). Wiesbaden: VS Verlag für Sozialwis-senschaften.

Esser, H. (1993). Soziologie. Allgemeine Grundlagen.. Frankfurt / New York:Campus Verlag.

Esser, H. (1996). Die De�nition der Situation. Kölner Zeitschrift für Sozi-ologie und Sozialpsychologie, 48 , 1�34.

Esser, H. (1999). Soziologie. Spezielle Grundlagen 1. Situationslogik undHandeln.. Frankfurt / New York: Campus Verlag.

Fox, J. (2006). Structural Equation Modeling With the sem Package in R.Structural Equation Modeling , 13 , 465�486.

Goldthorpe, J. H. (1996). Class analysis and the reorientation of class the-ory: the case of persisting di�erentials in educational attainment. BritishJournal of Sociology , 47 , 481�505.

Ho�meyer-Zlotnik, J. H., & Geis, A. (2003). Berufsklassi�kation und Mes-sung des beru�ichen Status/Prestige. ZUMA-Nachrichten, 52 , 125�138.

Ingenkamp, K. (1971). Die Fragwürdigkeit der Zensurengebung. Texte undUntersuchungsberichte.. Weinheim & Basel: Beltz Verlag.

Ingenkamp, K. (1977). Schüler- und Lehrerbeurteilung. Empirische Unter-suchungen zur pädagogischen Diagnostik . Weinheim: Beltz Verlag.

Jöreskog, K. G. (1993). Tesing structural equation models , (pp. 294�316).London: Sage Publications Ltd.

Jöreskog, K. G., & Sörbom, D. (1989). LISREL 7. A guide to the programand applications.. Chicago, Ill.: SPSS Inc.

Jussim, L., & Harber, K. D. (2005). Teacher Expectations and Self-Ful�llingProphecies: Knowns and Unknowns, Resolved and Unresolved Controver-sies. Personality and Social Psychology Review , 9 , 131�155.

51

Kahneman, D., & Tversky, A. (1984). Choices, Values, and Frames. AmericanPsychologist , 39 , 341�350.

Kroneberg, C. (2005). Die De�nition der Situation und die variable Ra-tionalität der Akteure: Ein allgemeines Modell des Handelns. (German).Zeitschrift für Soziologie, 34 , 344�363.

Lindenberg, S. (1989). Social Production Functions, De�cits, and SocialRevolutions: Prerevolutionary France and Russia. Rationality and Society ,1 , 51�77.

MacCallum, R. C., & Browne, M. W. (1993). The use of causal indicators incovariance structure models: Some practical issues. Psychological Bulletin,114 , 533�541.

Meulemann, H., Birkelbach, K., & Hellwig, O. (2001). Ankunft im Erwach-senenleben. Lebenserfolg und Erfolgsdeutung in einer Kohorte ehemaligerGymnasiasten zwischen 16 und 43.. Opladen: Leske + Budrich Verlag.

Moede, W., Piorkowski, C., & Wol�, G. (1919). Die Berliner Begabten-schulen, ihre Organisation und die Methoden ihrer Schülerauswahl . Lan-gensalza: Bayer.

Müller-Benedict, V. (2007). Wodurch kann die soziale Ungleichheit desSchulerfolgs am stärksten verringert werden? KZfSS Kölner Zeitschriftfür Soziologie und Sozialpsychologie, 59 , 615�639.

Raudenbush, S. W. (1984). Magnitude of Teacher Expectancy E�ects onPupil IQ as a Function of the Credibility of Expectancy Induction: ASynthesis of Findings From 18 Experiments. Journal of Educational Psy-chology , 76 , 85�97.

Rosenthal, R., & Jacobson, L. (1968). Pygmalion in the Classroom: TeacherExpectation and Pupils' Intellectual Development . New York: Holt, Rine-hart & Winston.

Sauer, J., & Gamsjäger, E. (1996). Ist Schulerfolg vorhersagbar? Die De-terminanten der Grundschulleistung und ihr prognostischer Wert für denSekundarschulerfolg . Göttingen: Hogrefe.

Schelsky, H. (1957). Schule und Erziehung in der industriellen Gesellschaft .Würzburg: Werkbund Verlag.

52

Smith, A. E., Jussim, L., & Eccles, J. (1999). Do self-ful�lling propheciesaccumulate, dissipate, or remain stable over time? Journal of Personalityand Social Psychology , 77 , 548�565.

Smith, M. L. (1980). Meta-analysis of research in teacher expectation. Eval-uation in Education, 4 , 53�56.

Sörbom, D. (1989). Model modi�cation. Psychometrika, 54 , 371�384.

Treiman, D. J. (1977). Occupational Prestige in Comparative Perspective.New York: Academic Press.

Zhang, G., & Browne, M. W. (2006). Bootstrap �t testing, con�dence in-tervals, and standard error estimation in the factor analysis of polychoriccorrelation matrices. Behaviormetrika, 33 , 61�74.

53

6 Appendix

Table A: Descriptive Resultsvalid mean stdev min max

teacher evaluations 2427 2.06 0.75 1 31 'not able'2 'not mentioned3 'able'

sex 3385 1.47 0.5 1 21 'male'2 'female'

intelligence scores (global in-dex)

3230 110.45 11.35 76 151

analogy test 3230 111.66 11.66 77 152analogy test (dichotomized) 3230 0.5 0.5 0 1

0 'below median'1 'above median'

word test 3230 106.39 10.53 70 138word test (dichotomized) 3230 0.48 0.5 0 1

0 'below median'1 'above median'

number test 3230 106.82 10.93 80 147number test (dichotomized) 3230 0.45 0.5 0 1

0 'below median'1 'above median'

cube test 3230 103.21 10.76 73 140cube test (dichotomized) 3230 0.47 0.5 0 1

0 'below median'1 'above median'

average grade 3227 499.98 69.22 221 703average grade (dichotomized) 3227 0.5 0.5 0 1

0 'above median'1 'below median'

parental education (highest) 3374 2.14 1.23 1 41 'lower'2 'middle;3' Abitur'4 'degree'

occ. prestige (highest) 2687 49.37 12.63 18 78occ. prestige (highest, di-chotomized)

2687 0.47 0.5 0 1

0 'below median'1 'above median'

aspirations 2543 2.43 0.71 1 31 'not necessary'2 'not necessary but useful'3 'necessary'

54

TableB:PolychoricCorrelation

Matrix

teacher

evalua-

tions

intelli-

gence:

word

test

intelligen

ce:

analogy

test

intelligen

ce:

number

test

intelligen

ce:

cube

test

average

grade

max(ed-

ucation)

max

(occ.

prestige)

aspirations

teacher

evalua-

tions

1.00

0.15

0.28

0.18

0.12

0.49

0.15

0.13

0.24

intelligen

ce:

analogy

test

0.15

1.00

0.24

0.23

0.14

0.10

0.02

0.04

0.03

intelligen

ce:

word

test

0.28

0.24

1.00

0.20

0.17

0.17

0.12

0.09

0.13

intelligen

ce:

numbertest

0.18

0.23

0.20

1.00

0.21

0.11

0.02

0.02

0.04

intelligen

ce:

cube

test

0.12

0.14

0.17

0.21

1.00

0.07

0.01

0.01

0.02

average

grade

0.49

0.10

0.17

0.11

0.07

1.00

0.05

0.04

0.11

max

(educa-

tion)

0.15

0.02

0.12

0.02

0.01

0.05

1.00

0.60

0.14

max

(occ.

prestige)

0.13

0.04

0.09

0.02

0.01

0.04

0.60

1.00

0.12

aspirations

0.24

0.03

0.13

0.04

0.02

0.11

0.14

0.12

1.00

55

Figure A: Polychoric Correlations: Correlogram

pres_h

bildcath

lebziel_abi_di

progstud_ord

zwerte_dnote_di

ists_anal_di

ists_zahlen_di

ists_wort_di

ists_wuerfel_di

Polychoric Correlation Matrix

Upper panel: Pie chart (�lled portion indicates magnitude of correlation). Lower

panel: Shade chart (depth of shading indicates magnitude of correlation). Blue colors

indicate positive correlations, red colors indicate negative correlations.

56

Lehrerurteile im Klassenkontext Eine Mehrebenen­Analyse von Lehrerurteilen  

  

Arbeitspapier Nr. 4 der Projektgruppe „Lehrerurteile im Lebensverlauf“

Dominik Becker

(Cologne Graduate School in Economics, Management and Social Sciences,

Universität zu Köln)

Klaus Birkelbach

(Fachbereich Bildungswissenschaften, Zentrum für Empirische Bildungsforschung,

Universität Duisburg-Essen)

 

Universität Duisburg-Essen, September 2009

 

Zusammenfassung

In der Erstbefragung des Kölner Gymnasiastenpanels 1969/1970 sollten die Lehrer u.a. den zukünftigen Studienerfolg ihrer Schüler (10. Klasse) beurteilen. In diesem Beitrag wollen wir der Frage nachgehen, inwieweit zusätzlich zur Erklärungskraft von Individualprädiktoren auch Kontextmerkmale auf Schulklas-senebene das Lehrerurteil beeinflussen können.

Dabei wird zum einen untersucht, ob, wie es der Big-Fish-Little-Pond-Effekt vermutet, Lehrerurteile nega-tiv vom durchschnittlichen Leistungsniveau in der jeweiligen Klasse abhängen – oder ob vielmehr, wie es der Reflected-Glory-Effekt postuliert, ein positiver Zusammenhang vorliegt. Zum anderen wird überprüft, ob das durchschnittliche Leistungsniveau in der jeweiligen Klasse die Effektstärke der Prädiktoren auf Individualebene zu beeinflussen vermag.

Die Untersuchungen belegen, dass Intelligenz, Schulnoten, Aspirationen und die soziale Herkunft der Schüler auf der Individualebene signifikante Prädiktoren der Lehrerurteile sind. Auf Klassenebene besitzen Intelligenz und Schulnote ebenfalls positive Effekte auf akademische Eignungsempfehlungen (Referenzka-tegorie: nicht geeignet) – was für die Reflected-Glory- und gegen die Big-Fish-Little-Pond-Hypothese spricht. Darüber hinaus nimmt in Klassen mit vergleichsweise guten Notendurchschnitten die Stärke des Effekts sowohl von Schulnoten auf Individualebene als auch der sozialen Herkunft auf Lehrerurteile zu.

Erscheint in gekürzter Form in: Beckers, Tilo, Klaus Birkelbach, Jörg Hagenah & Ulrich Rosar (eds.), 2010, Komparative empirische Sozialforschung. Wiesbaden: VS Ver-lag für Sozialwissenschaften

Lehrerurteile im Klassenkontext 58

1 Einleitung: Bewertung von Schülerleistungen

Die Auslesefunktion der Schule wurde bereits von Schelsky (1957: 18) als „erste und damit entscheidende zentrale Dirigierungsstelle für die künftige soziale Sicherheit, für den künftigen sozialen Rang und für das Ausmaß künftiger Konsummöglichkeiten“ beschrieben. Verengt man diese Perspektive von der Schule auf die Funktion der Schulnoten, so lassen sich mit Ziegenspeck (1999) drei Funktionen von Zensuren festhalten: (a) die Orientierungs- und Be-richtsfunktion, (b) die pädagogische Funktion sowie (c) die Selektions- und Allokations-funktion:

a. Orientierungs- und Berichtsfunktion: Die Zensur ist nicht nur das Ergebnis von Prüfungen und Beobachtungen, sondern auch Mittel, diese Ergebnisse mitzuteilen und weiterzuge-ben. Daher lässt sich der Zusammenhang zwischen Kontrolle und Bericht auch als ein „dialogisches Verhältnis“ (Ziegenspeck 1999: 99) bezeichnen, das jedoch zwei entschei-denden Verzerrungen unterworfen ist: Zum einen spiegeln, vielleicht abgesehen von den Extremwerten „ungenügend“ und „sehr gut“, Zensuren nicht unbedingt den Leistungs-stand von Schülern wider – geschweige denn eine Entwicklungstendenz. Zum anderen können sie nicht isoliert von der Profession und Person des Lehrers betrachtet werden, die als „integraler Hintergrund“ (Ziegenspeck 1999: 103) immer mittelbar in die Zensurenge-bung einfließen.

b. Pädagogische Funktion: Während gute Zensuren allgemein verstärkend wirken und auch ein gelegentlicher „Ausrutscher“ bei an sich guten Schülern leistungsfördernd wirken kann, werden schlechte Schüler durch schlechte Zensuren nicht nur kaum gefördert, son-dern unterliegen auch der Gefahr, beim Lehrer auf emotionaler Ebene Bewertungen her-vorzurufen, die eine „objektiv-rationale“ Bewertung nahezu unmöglich machen (Ziegens-peck 1999: 107-110).

c. Selektions- und Allokationsfunktionen: Zensuren sind und waren nie ausschließlich päda-gogische Hilfsmittel der Schule, sondern immer auch die Basis institutionell festgelegter Zertifikate zur Legitimation des Übergangs in die nächsthöhere Einrichtung auf der „hie-rarchisch gegliederten Ausbildungsleiter“ (Ziegenspeck 1999: 111). Dadurch produziert und reproduziert die Schule soziale Ungleichheiten im Lebensverlauf (z.B. Meulemann 1990; 1999; Geißler 2006; Hillmert 2007). Normative Basis der Selektions- und Alloka-tionsfunktion, ist der Wert „Leistung“, verbunden mit der Forderung nach Chancenge-rechtigkeit. Die resultierende Ungleichheit erscheint nur solange als legitim, wie die Se-lektion auf Basis inter-individueller Leistungsunterschiede stattfindet und Chancenge-rechtigkeit beim Zugang besteht (Heid 2003; Hillmert 2007: 77-79; Becker, R. / Hadjar 2009). Die Frage allerdings, was Schulnoten wirklich messen, wird spätestens seit Ingen-kamps (1971) Reader „Die Fragwürdigkeit der Zensurengebung“ kritisch betrachtet (z.B. Ziegenspeck 1999; Tent 2001; Trautwein et al. 2008). Eine Vielzahl von Untersuchungen belegt, dass sich Lehrer bei der Notengebung primär an einem klasseninternen Bezugs-system orientieren (u.a. Ingenkamp 1971: 156-163; 1989; Ziegenspeck 1999: 142f; Schrader / Helmke 2001, 50). Darüber hinaus werden klassenstufen-, schulform- und län-derspezifische Unterschiede in der Benotungspraxis berichtet (Ziegenspeck 1999: 143f). Die Folge ist, dass Schüler der gleichen Schulform und Klassenstufe für objektiv gleiche Leistungen unterschiedlich benotet werden.

Aber Lehrer beurteilen nicht nur einzelne Leistungen. Beim Übergang von der Grundschule in die verschiedenen Schulformen der Sekundarstufe I, aber auch darüber hinaus in Gesprächen mit Eltern und Schülern geben Lehrer Beurteilungen über ihre Schüler ab, die von einzelnen Leistungen abstrahieren und die (zukünftige) Leistungsfähigkeit insgesamt prognostizieren. Wegen der weitreichenden Folgen der mehr oder weniger verbindlichen Übergangsempfeh-

Lehrerurteile im Klassenkontext 59

lungen1 der Grundschullehrer am Ende der 4. Klasse für den weiteren Bildungsverlauf wurde dieser Übergang und die Validität der Prognose in der Vergangenheit immer wieder unter-sucht (u.a. Ingenkamp 1968; Rauh 1977; Sauer / Gamsjäger 1986; Lehmann et al. 1997; Köl-ler et al. 1999; Bos / Pietsch 2004; Bos et al. 2004; Paulus / Lauermann 2004; Ditton / Krüsken 2006; Arnold et al. 2007). Wenn Lehrer eine über spezifische Leistungen hinausrei-chende Beurteilung ihrer Schüler abgeben sollen, dann basiert dieses Urteil im Wesentlichen auf den Schulnoten (Bos et al. 2004: 204ff; Kristen 2006) und dürfte daher mit ähnlichen Problemen behaftet sein.

Schulleistungsuntersuchungen belegen regelmäßig, dass die Lehrerempfehlungen von den in Leistungstests gemessenen Kompetenzen zumindest teilweise entkoppelt sind (Lehmann et al. 1997; Bos / Pietsch 2004; Bos et al. 2004; Arnold et al. 2007). Gleichzeitig werden enge Zusammenhänge zwischen den Übergangsempfehlungen und der sozialen Herkunft der Schü-ler nachgewiesen (vgl. Ditton / Krüsken 2006).

Derart umfassende Beurteilungen, die von einzelnen Noten abstrahieren und versuchen, eine ganzheitliche Einschätzung der Leistungsfähigkeit mit prognostischem Anspruch zu leis-ten, werden von den Lehrern gegenüber Eltern und Schülern nach der Schullaufbahnempfeh-lung nicht mehr in institutionalisierter Form abgegeben. Dennoch entwickeln Lehrer natürlich auch über die aktuellen Leistungen ihrer Schüler/innen hinaus eine allgemeinere Einschätzung von deren Leistungspotential und knüpfen daran Erfolgserwartungen, die sie ihren Schülerin-nen und Schülern sowie deren Eltern vermitteln (Good / Brophy 2003).

Während die soziologischen „Klassiker“ wie Weber und Durkheim hauptsächlich Hypo-thesen auf Makroebene formulierten,2 verorten die Vertreter des methodologischen Individu-alismus auch – und gerade – bei der Erklärung von Aggregatphänomenen das zu Grunde lie-gende soziale Handeln auf der Individual-, sprich Mikroebene (Schumpeter 1970: 90f.). Ein großer Vorteil dieser Erklärungsstrategie liegt in der Vermeidung von ökologischen Fehl-schlüssen (Robinson 1950), denen all jene Theorien anheimfallen, welche aus der bloßen Koinzidenz von zwei Merkmalen auf Makroebene eine kausale Beziehung ableiten, die auch auf Individualebene zu bestehen habe (vgl. z.B. Opp 2002: 208).

Umgekehrt besteht jedoch bei streng individualistisch argumentierenden Theorien die Ge-fahr, den eigenständigen Effekt von Phänomenen auf Kontextebene auf individuelles soziales Handeln zu vernachlässigen. Wie Erbring und Young (1979) am Beispiel von potentiellen Kontexteffekten von Intelligenz je Schulklasse auf individuelle Schülerleistungen gezeigt haben, enthält eine adäquate Modellierung von Kontexteffekten neben zusätzlich möglichen Merkmalen wie ein gemeinsames Schicksal – etwa in Form von besonders motivierten Leh-rern – oder ein durch die Durchschnittsintelligenz bedingtes Lernklima stets die Annahme der Endogenität der abhängigen Variable im Sinne wechselseitiger Interaktionen der Individuen in der spezifischen sozialen Situation.

In der vorliegenden Studie soll der Hintergrund informeller Lehrerurteile, bei denen Gymnasiallehrer ihre Schüler im ersten Halbjahr der 10. Klasse hinsichtlich ihrer Eignung für ein Studium eingeschätzt haben, untersucht werden. Dabei steht die Fragestellung im Zent-rum, inwieweit das Lehrerurteil auf Leistungsmerkmalen der Schüler basiert und inwieweit es

1 Die Verbindlichkeit der Schullaufbahnempfehlungen variiert zwischen den Bundesländern (vgl. Bos et al.

2004: 191f). 2 Vgl. dazu z.B. die Darstellung der Erklärungslogik von Webers Protestantischer Ethik bei McClelland (1967)

und bei Coleman (1990).

Lehrerurteile im Klassenkontext 60

zusätzlich durch die soziale Herkunft sowie durch den Kontext der Schulklasse beeinflusst wird. Konkret wird dabei analysiert, inwiefern das Leistungsniveau einer Schulklasse die Ein-schätzungen der Lehrer auch unabhängig von den Individualmerkmalen der Schüler zu beein-flussen vermag. Dadurch werden Fragen angesprochen, die direkt schulische Beurteilungen als Basis der Selektions- und Allokationsfunktion der Schule betreffen, denn diese erscheint nur legitim, wenn die Basis solcher Beurteilungen, die im gesellschaftlichen Statuszuwei-sungsprozess eine wichtige Rolle spielen, die Leistungsfähigkeit der einzelnen Schüler ist. Die soziale Herkunft sollte dagegen in einem am meritokratischen Prinzip orientierten Status-zuweisungsprozess keine Rolle spielen (Becker, R. / Hadjar 2009). Darüber hinaus ist die Frage der Vergleichbarkeit der Beurteilungen von besonderer Bedeutung, denn nur, wenn die Maßstäbe der Lehrer in verschiedenen Klassen und Schulen gleich sind, werden die Legitimi-tätskriterien des Selektionsprozesses nicht verletzt.

Bei den Lehrerurteilen, deren Hintergrund und Vergleichbarkeit im Folgenden untersucht werden soll, handelt es sich um Beurteilungen, die in dieser Form weder den Schülern noch ihren Eltern direkt mitgeteilt wurden. Das Urteil ist weder durch pädagogische Absichten der Lehrer beeinflusst noch ist es verbindlich, sondern es stellt lediglich eine mehr oder weniger valide Prognose dar. Birkelbach (2009) zeigt im Längsschnitt, dass diese Lehrerurteile die Bildungsentscheidungen zu beeinflussen vermögen. Dabei wird unterstellt, dass die Lehrerur-teile auf der Grundlage von längerfristigen Einschätzungen der Schüler gefällt werden, die im schulischen Alltag auf vielfältige Weise kommuniziert werden (Brophy / Good 1974; Bratte-sani et al. 1984; Good / Brophy 2003) und so, vermittelt über die Erwartungen der Schüler und deren Selbstkonzept (Dalbert / Stöber 2008), deren weitere Bildungsentscheidungen be-einflussen. Durch diesen Mechanismus kann sich auch ein bezogen auf die individuelle Leis-tungsfähigkeit invalides Lehrerurteil langfristig in Form einer self-fulfilling prophecy (Merton 1948) selbst bestätigen.

Bei den Analysen von Birkelbach (2009) bleiben zwei Aspekte unberücksichtigt: Zum ei-nen die hier behandelte Frage nach dem Hintergrund und den Vergleichsmaßstäben der Leh-rerurteile und zum anderen die Frage, inwieweit die Lehrerurteile tatsächlich auch die Leis-tungen der Schüler zu beeinflussen vermögen, so wie es in der vieldiskutierten Studie von Rosenthal und Jacobson (1968) unter der Bezeichnung Pygmalion-Effekt beschrieben wird.3

Da in der vorliegenden Untersuchung der Hintergrund des Lehrerurteils behandelt wer-den soll, kann an dieser Stelle auf die Diskussion der umfangreichen Literatur zum Pygmali-on-Effekt verzichtet werden,4 aber es ist auf den Umstand hinzuweisen, „[that] surprisingly little research has been conducted regarding students' social backgrounds as moderators of self-fulfilling prophecies“ (Jussim / Harber 2005: 143). Wenn ein Gutteil der Kontroverse für

3 Aufgrund des nur einmalig durchgeführten Intelligenztests kann mit unseren Daten ein möglicher Pygmali-

oneffekt – also die Frage, inwieweit die Leistung durch das Lehrerurteil beeinflusst wird – nicht untersucht werden, wohl aber der Einfluss des Lehrerurteils auf spätere Bildungsentscheidungen und damit auf den Le-bensverlauf (Birkelbach 2009).

4 Mit Jussim und Harber (2005) sei allerdings auf die Kontroverse zwischen Sozialpsychologen und Entwick-lungspsychologen hingewiesen: Während viele Sozialpsychologen den Pygmalion-Effekt als eine klare Be-stätigung für die These sahen, dass es die eigenen Erwartungen sind, die die soziale Realität erst schaffen, waren die Entwicklungspsychologen weitaus skeptischer und wiesen auf einige methodologische Schwächen der Studie von Rosenthal und Jacobson (1968) sowie auf alternative Erklärungen hin. Ungeachtet dieser Einwände konnte eine Metaanalyse von Smith (1980) eine durchschnittliche Effektgröße von .16 nachwei-sen. Raudenbush (1984) konnte zudem zeigen, dass der Effekt der Lehrererwartungen zum Zeitpunkt t1 auf die Intelligenz zum Zeitpunkt t2 stark von der Dauer der Beziehung zwischen Schülern und Lehrern abhängt.

Lehrerurteile im Klassenkontext 61

oder wider die Geltung des Pygmalion-Effekts sich auf den Umstand der mangelnden Kon-trolle von Drittvariablen zurückführen lässt, so liegt es nahe, die Lehrerurteile ihrerseits auf ihre Abhängigkeit von Merkmalen der Schüler zurückzuführen – und zwar detaillierter, als dies in vorliegenden Studien geschehen ist. Während dort zumeist Hypothesen für Indivi-dualmerkmale formuliert und überprüft werden, sollen hier explizit auch Kontextmerkmale der Schulklasse einbezogen werden, also die Frage eines klasseninternen Beurteilungsmaß-stabs der Lehrer berücksichtigt werden. Im folgenden Abschnitt sollen zunächst die wichtigs-ten Hypothesen auf Individualebene dargestellt und anschließend um Kontexthypothesen er-gänzt werden.

2 Hypothesen: Leistung, soziale Herkunft und Aspirationen als Prädiktoren für Lehrerurteile

2.1 Individualmerkmale

Da es unseres Wissens keine Untersuchungen zu Lehrerurteilen in der hier vorliegenden Form gibt, orientieren sich die folgenden Überlegungen hauptsächlich an der Forschungslage zu den Übergangsempfehlungen am Ende der Grundschulzeit. „Anders als in Hogwarts, der von Joanne K. Rowling erdachten Zauberschule, gibt es in Deutschland keinen schlauen spre-chenden Hut, der alle Kinder richtig danach aussuchen kann, zu welcher Schule sie gehören“ (Bos et al. 2004: 191), sondern die Lehrer formulieren am Ende der Grundschulzeit – je nach Bundesland unterschiedlich verbindliche – Empfehlungen, welche Schulform angesichts des Leistungsvermögens des Kindes geeignet sei. Im Folgenden werden neben der sozialen Her-kunft zwei Leistungsindikatoren (Intelligenz, Schulnoten) und die Aspirationen der Schüler als ein Indikator für deren Bewertungen und Ansprüche, der einerseits mit der Leistung zu-sammenhängt, andererseits aber auch stark von der sozialen Herkunft geprägt ist, als Indivi-dualmerkmale mit potentiellem Einfluss auf die Lehrerurteile diskutiert.

Intelligenz

Bereits in den 1920er Jahren wurde versucht, Lehrerurteile durch Prüfungsexperimente oder Tests von kognitiven Kompetenzen zu ergänzen (Ingenkamp 1990). In den USA werden Tests (ACT, SAT) insbesondere beim Übergang von der High School zum College bzw. die Uni-versität breit genutzt. Auch wenn sich immer wieder zeigt, „dass die mit gültigen Tests ge-messene Intelligenz der wichtigste Einzelprädiktor für Schulerfolg ist“ (Ingenkamp 1993: 79), gibt es in Deutschland kaum ernsthafte Bemühungen, Leistungstests als Kriterium für Über-gangsentscheidungen heranzuziehen.

Neuere Untersuchungen, wie die „Internationale-Grundschul-Lese-Untersuchung“ (IG-LU) 2001 und 2006 (Bos et al. 2004; Arnold et al. 2007), die Hamburger Längsschnittstudie LAU „Aspekte der Lernausgangslage und der Lernentwicklung“ (Lehmann et al. 1997) sowie die Grundschulstudie KESS 4 „Kompetenzen und Einstellungen von Schülerinnen und Schülern – Jahrgangsstufe 4“ (Bos / Pietsch 2004) zeigen, dass Testergebnisse und Lehrerur-teile nur teilweise übereinstimmen: So unterscheiden sich die durchschnittlichen mathemati-schen Kompetenzen und die Lesekompetenzen der Kinder mit Hauptschul-, Realschul- und Gymnasialempfehlung erwartungsgemäß, aber es gibt auch einen breiten Überlappungsbe-reich, in dem jede Schulform empfohlen wird (Bos / Pietsch 2004: 52ff; Bos et al. 2004:193-204; Arnold et al. 2007: 279-281). Aber nicht nur in der Mitte, auch im obersten und im unte-ren Leistungsbereich gibt es Überlappungen: So gehören 2006 knapp 10 Prozent der Kinder,

Lehrerurteile im Klassenkontext 62

die von ihren Lehrern eine Gymnasialempfehlung bekommen, der untersten Leistungsstufe (Lesen) und umgekehrt knapp fünf Prozent derjenigen, die eine Hauptschulempfehlung be-kommen, der obersten Leistungsstufe an. Die getesteten Kompetenzen im Lesen und der Ma-thematik vermögen 2001 zusammen 39% der Varianz aller Schullaufbahnempfehlungen zu erklären (Arnold et al. 2007).

Trotz aller Diskrepanzen konnte in LAU ein nahezu linearer Zusammenhang zwischen den Leistungen im Hamburger kombinierten Schulleistungstest für vierte und fünfte Klassen, der die Komponenten Sprachverständnis, Leseverständnis, passives Rechtschreibwissen, In-formationsentnahme und Mathematik enthält, und der Wahrscheinlichkeit, eine Gymnasial-empfehlung zu erhalten, nachgewiesen werden (Lehmann et al. 1997). Für die in PISA ver-wendeten Tests, die einer vergleichbaren Logik folgen, zeigen Baumert et al. (2007) in einer konfirmatorischen Faktoranalyse, dass die einzelnen Sub-Tests zwar domänenspezifische Faktoren für Lesen und Mathematik bilden, aber darüber hinaus die Intelligenz als allgemei-ner Faktor die Lösung der einzelnen Aufgaben insgesamt beeinflusst. Unsere erste Hypothese lautet daher:

H1: Intelligentere Schüler erhalten eher eine positive Lehrerbeurteilung.

Schulnoten

Schulnoten besitzen als sozial sichtbares Kriterium für Schulleistungen einen deutlichen Ein-fluss auf die Lehrerurteile (Kristen 2006). Wie Ingenkamp (1993) herausstellt, gilt dies insbe-sondere für Lehrerurteile, die Übergangsempfehlungen beinhalten. In IGLU 2006 konnten 69 Prozent der Varianz der Schullaufbahnempfehlung durch die Mathematik- und Deutschnoten erklärt werden; dabei war der Einfluss der Deutschnote etwas größer der der Mathematiknote (Arnold et al. 2007: 283). Da Schulnoten trotz ihrer wohlbekannten Defizite empirisch be-währte Prädiktoren von Lehrerempfehlungen sind, erwarten wir:

H2: Je besser die Schulnoten, desto eher erhalten die Schüler ein positives Lehrerurteile.

Soziale Herkunft

Bereits Ingenkamp (1977) konnte in einer Untersuchung von 21 Klassen mit N=756 Schüle-rinnen und Schülern bivariate Zusammenhänge zwischen den Berufen der Väter und den Eig-nungsurteilen von Grundschullehrern nachweisen: Während aus der Gruppe der akademi-schen und leitenden Berufe 85,7% der Schüler für das Gymnasium begutachtet wurden und nur 1,4% kein Gutachten erhielten (was einer Hauptschulempfehlung gleichkam), verhielt es sich in der Gruppe der zumeist aus Arbeitern bestehenden „unteren Berufe“ nahezu exakt um-gekehrt: Hier erhielt nur ein Anteil von 6,5% eine Gymnasialempfehlung, während 85,5% keine Empfehlung erhielten und somit einen Hauptschulbesuch nahegelegt bekamen. Die IG-LU-Studien (2001 und 2006) zeigen, dass ein Zusammenhang zwischen sozialer Herkunft und Schullaufbahnempfehlung der Lehrer auch heute noch besteht. Unter Kontrolle der kognitiven Grundfähigkeiten sowie der Lesekompetenz erhalten Schüler, deren Eltern aus der „oberen Dienstklasse“ stammen, im Vergleich zu Facharbeitern und leitenden Angestellten 2,6 mal häufiger eine Gymnasialempfehlung (Bos et al. 2004: 213; Arnold et al. 2007: 289).

Lehrerurteile im Klassenkontext 63

Ein von Leistungen5 unabhängiger Effekt der sozialen Herkunft auf die Beurteilungen durch die Lehrer am Ende der 10. Klasse lässt sich mit Bourdieu und Passeron (1971) folgen-dermaßen erklären: Kulturelles Kapital, das von den Eltern an ihre Kinder weitergegeben wird, äußert sich u.a. in der Beherrschung bestimmter symbolischer Codes, wie sie im Schul-alltag erwartet werden. Dieser Vorteil von Kindern der oberen Klassen kann sich in den Leh-rerurteilen bewusst oder unbewusst niederschlagen: unbewusst, wenn Lehrer schlicht unre-flektiert Schüler besser beurteilen, die im Schulunterricht die verlangten symbolischen Codes besser beherrschen;6 bewusst, wenn sie davon ausgehen, dass diese Schüler bessere Erfolgs-aussichten haben, weil sie von ihren Eltern mehr Unterstützung während der Abitur- oder Studienzeit erwarten können als Schüler aus den unteren Klassen (Ingenkamp 1993: 74). Da-her kann vermutet werden:

H3: Je höher die soziale Herkunft der Schüler, desto eher erhalten sie auch ein positives Leh-rerurteil.

Aspirationen

Während der bivariate Zusammenhang zwischen der sozialen Herkunft und den (wie auch immer gemessenen) intellektuellen Fähigkeiten von Schülern als primärer Effekt sozialer Un-gleichheit betrachtet wird, kann zusätzlich ein über die Aspirationen der Schüler bzw. Eltern vermittelter sekundärer Effekt sozialer Ungleichheit erwartet werden (Boudon 1974; Erikson et al. 2005; Müller-Benedict 2007a), der unabhängig von den primären Effekten besteht. Wenn Bildung als Investitionsgut betrachtet wird (Goldthorpe 1996: 494), werden Eltern als vorrangiges Ziel die Vermeidung des sozialen Abstiegs anstreben. Daher haben Eltern mit höherem sozialem Status auch höhere Anreize für ihre Kinder eine möglichst hohe Schulform anzustreben. Umgekehrt ist für Eltern mit niedrigerem sozialem Status nicht nur eine ver-gleichsweise niedrige Schulform für die Reproduktion ihres sozialen Status ausreichend, son-dern für sie ist zusätzlich jeder misslungene Versuch, eine höhere Schulform zu besuchen, mit hohen Kosten verbunden (Meulemann 1979: 23ff; Breen / Goldthorpe 1997; Esser 1999: 265-275; Erikson et al. 2005; Maaz et al. 2006; Stocké 2007). Dies wird auch den Kindern vermit-telt, so dass die Aspirationen der Kinder in einem engen Zusammenhang mit denen ihrer El-tern stehen (Meulemann 1979: 159).

Wir nehmen an, dass durch unterschiedliche Aspirationen definierte sekundäre Effekte sozialer Ungleichheit unabhängig von dem Zusammenhang zwischen sozialer Herkunft und kognitiven Kompetenzen von Schülern nicht nur die eigentlichen Übergangsentscheidungen beeinflussen, sondern bereits zuvor einen Einfluss auf Lehrerurteile besitzen können, weil sie in den Interaktionen zwischen Schülern bzw. ihren Eltern und den Lehrern alltäglich kommu-

5 Der vorherrschende Leistungsbegriff mag inhaltlich kritisch betrachtet werden, aber auch Kritiker wie z.B.

Klafki (1994) können und wollen nicht darauf verzichten (Ziegenspeck 1999: 29-64). Dennoch ist Heid (2003: 41) zuzustimmen, wenn er feststellt: „Zur Leistung wird ein Handeln erst durch die Bewertung und Anerkennung dieses Handelns als Leistung. … Hinsichtlich ihrer Definitions- und Sanktionsmacht sind die Menschen außerordentlich ungleich“ und damit auf die Zirkularität einer auf Leistungsunterschieden aufbau-enden Legitimation sozialer Ungleichheit hinweist. Hier kann und soll der Leistungsbegriff allerdings nicht problematisiert, sondern ein pragmatischer Leistungsbegriff benutzt werden, der sich an den curricularen An-forderungen der Schule und deren Erfüllung durch die Schüler orientiert.

6 Natürlich ist davon auszugehen, dass sich die Reaktion der Lehrer auf das Ausmaß an Beherrschung symbo-lischer Codes der Schüler bereits in ihren Zensuren widerspiegelt. In den multivariaten Untersuchungen (Ab-schnitt 4) wird überprüft, ob unter Kontrolle weiterer Kovariaten ein unabhängiger Effekt der sozialen Her-kunft auf die Lehrerurteile besteht.

Lehrerurteile im Klassenkontext 64

niziert werden. Über die verbale Kommunikation hinaus dürften sich höhere Aspirationen von Kindern höherer Schichten in spezifischen Verhaltensformen im Sinne von Bourdieus (1987) Habitus-Konzept ausdrücken, die ihrerseits mit den entsprechenden Normen und Erwartungen ihrer Lehrer übereinstimmen und zu besseren Lehrerurteilen führen. Daher vermuten wir:

H4: Je höher die Aspirationen, desto eher erhalten die Schüler ein positives Lehrerurteil.

2.2 Kontexteffekte

Wie oben bereits angesprochen, orientieren sich Lehrer bei der Beurteilung der Leistungen ihrer Schüler mangels anderer Maßstäbe i.d.R. an einem klasseninternen Bezugssystem (In-genkamp 1971: 156-163; 1989: 59; Klauer 1989; Fickermann 1999; Ziegenspeck 1999: 142f; Schrader / Helmke 2001; Weinert 2001: 50). In verschiedenen Studien konnte darüber hinaus gezeigt werden, dass auch die Schülerleistungen selbst nicht nur von Individualmerkmalen abhängen, sondern – vermittelt über das Selbstkonzept – auch durch Merkmale der Schulklas-se beeinflusst werden. Solche Referenzgruppeneffekte werden in der Literatur unter der Be-zeichnung „Big-Fish-Little-Pond-Effekt“ (BFLPE) und alternativ als „Reflected-Glory-Effekt (RGE) diskutiert (vgl. die Erläuterungen unten sowie Marsh / Parker 1984; Marsh 1987; Marsh et al. 2000; Rindermann / Heller 2005; Trautwein / Lüdtke 2005; Marsh et al. 2007; Dai / Rinn 2008; Marsh et al. 2008). Dabei wird im Falle des BFLPE ein negativer, im Falle des RGE ein positiver Effekt des Leistungsniveaus der Schulklasse auf die individuelle Schü-lerleistung postuliert.

Analog zu den Effekten des Leistungsniveaus der Klasse auf individuelle Leistungen vermuten wir, dass ähnliche Kontexteffekte der Klasse auf die Lehrerbeurteilungen nachge-wiesen werden können, die vor allem auf die klassenbezogenen Vergleichsmaßstäbe der Leh-rer bei der Beurteilung zurückzuführen sind. Dazu werden im Folgenden gegenläufige Hypo-thesen eines spezifischen Big-Fish-Little-Pond-Effekts und eines Reflected-Glory-Effekts des Niveaus der Klasse hinsichtlich der durch einen Intelligenztest erhobenen kognitiven Leis-tungsfähigkeit und der durch Noten dokumentierten Leistungen auf das Lehrerurteil aufge-stellt und getestet.

Darüber hinaus werden Hypothesen zu Cross-Level-Interaktionen begründet, in denen es darum geht, inwieweit die jeweilige Kontextvariable die Zusammenhänge zwischen zwei Va-riablen auf Mikroebene beeinflusst. Konkret soll untersucht werden, ob sich auf Individual-ebene mit zunehmendem Leistungsniveau der Klasse die Effekte einzelner Individualmerkma-le (Intelligenz, Noten, Aspirationen, soziale Herkunft) auf das Lehrerurteil verändern.

2.2.1 Big-Fish-Little-Pond-Effekt

Intelligenz

Grundgedanke des BFLPE ist, dass Schüler mit gleichen Begabungen in Abhängigkeit vom Leistungsniveau ihrer Schulklasse ein unterschiedlich ausgeprägtes akademisches Selbstkon-zept entwickeln: Ein Schüler mit gegebener Begabung wird sich in einer vergleichsweise leis-tungsschwachen Klasse als „big fish“, also als vergleichsweise gut aufgestellt wahrnehmen – während er in einer leistungsstärkeren Klasse ein geringeres Selbstkonzept aufweisen wird, was sich negativ auf seine Leistungen auswirkt. Die Grundidee des klassischen BFLPE wurde seit 1984 (Marsh / Parker 1984) vielfältig getestet (u.a. Marsh / Hau 2003; Marsh et al. 2005; Marsh et al. 2007) und ist von der rein schulischen Fragestellung auf andere Bereiche übertra-gen worden (z.B. Chanal et al. 2005).

Lehrerurteile im Klassenkontext 65

Vor allem auch aufgrund des oben diskutierten klasseninternen Vergleichsmaßstabs, an dem die Lehrer sich vornehmlich orientieren (Ingenkamp 1971: 156ff; 1989; Fickermann 1999; Ziegenspeck 1999f; Schrader / Helmke 2001: 50) nehmen wir an, dass ähnliche Refe-renzgruppen-Effekte wie beim klassischen BFLPE auch bei der Formation von Lehrerurteilen zum Tragen kommen, so dass ein Schüler mit gegebener kognitiver Leistungsfähigkeit in ei-ner vergleichsweise leistungsschwachen Klasse aufgrund der insgesamt niedrigeren Ansprü-che der Lehrer an die Klasse bessere Beurteilungen erhalten wird als in einer vergleichsweise leistungsstarken Klasse, wo er eher negativ beurteilt wird:

H5: Schüler werden in Klassen mit vergleichsweise niedrigem Intelligenzniveau eher ein posi-tives Lehrerurteile erhalten als in Klassen mit vergleichsweise hohem Intelligenzniveau und umgekehrt.

Schulnoten

Schulnoten sind für Lehrer und Schüler ein einfacher als die Intelligenz wahrzunehmender Maßstab. Wie Marsh et al. (2007) betonen, sind das akademische Selbstkonzept und damit die Leistungen empirisch enger mit Schulnoten verknüpft als mit standardisierten Test-Scores. So wie die Schüler ihre Leistungen untereinander anhand des sozial offensichtlichen Merkmals der Noten vergleichen, so werden auch die Lehrer ihre Beurteilungen einzelner Schüler vor dem Hintergrund des durch Noten dokumentierten Leistungsniveaus der Klasse vornehmen. Aufgrund des klasseninternen Bezugsrahmens der Lehrer kann es für den einzelnen Schüler in einer Klasse mit gutem Notendurchschnitt schwieriger als in einer schlechteren Klasse sein, eine positive Beurteilung zu erhalten, während umgekehrt dieser Schüler im Vergleich zu einer Klasse mit schlechtem Notendurschnitt leichter eine positive Beurteilung erhalten wird.

H6: Schüler werden in Klassen mit vergleichsweise gutem Notendurchschnitt eher ein negati-ves Lehrerurteil erhalten als in Klassen mit vergleichsweise schlechtem Notendurch-schnitt und umgekehrt.

2.2.2 Reflected Glory-Effect

Intelligenz und Noten

Wie der klassische BFLPE bezieht sich auch der dazu hier als Gegenhypothese eingeführte Reflected-Glory-Effekt in seiner ursprünglichen Fassung (Marsh et al. 2000) auf den Einfluss des Leistungsniveaus der Klasse auf die Individualleistung der Schüler und vermutet einen Assimilationsprozess, bei dem sich das individuelle Leistungsvermögen der Schüler tendenzi-ell dem der Klasse annähert. Die Bezeichnung „Reflected Glory“ wird wegen ihrer Anschau-lichkeit übernommen, aber sie bezeichnet hier eine spezifische Form des Halo-Effektes (Thorndike 1920), bei dem eine über das hohe Leistungsniveau der Klasse vermittelte positive Einstellung der Lehrer gegenüber der gesamten Klasse auf die einzelnen Schüler – auch un-abhängig von deren individuellen Leistungen – ausstrahlt, so dass ein positiver Effekt leis-tungsstarker Klassen auf die Lehrerurteile angenommen werden kann. Das Argument sollte auch umgekehrt gelten: Eine insgesamt als schlecht beurteilte Klasse kann in ähnlicher Weise die Beurteilung der einzelnen Schüler negativ beeinflussen.

H7: Schüler werden in Klassen mit vergleichsweise hoher Durchschnittsintelligenz bessere Lehrerurteile erhalten als in Klassen mit vergleichsweise niedriger Durchschnittsintelli-genz und umgekehrt.

Lehrerurteile im Klassenkontext 66

H8: Schüler erhalten in Klassen mit vergleichsweise gutem Notendurchschnitt bessere Leh-rerurteile als in Klassen mit vergleichsweise schlechtem Notendurchschnitt und umge-kehrt.

2.2.3 Cross-Level-Interaktionen

Leistungsniveau der Klasse und Intelligenz und Noten auf Individualebene

Die bisherigen Kontexthypothesen postulieren Effekte, die allesamt auf die Zielvariable Leh-rerurteile gerichtet sind. Zusätzlich sollen jedoch sogenannte Cross-Level-Interaktionen unter-sucht werden, bei der die jeweilige Kontextvariable die Effektstärke zwischen zwei Variablen auf Mikroebene beeinflusst (Hox 2002: 19, 53).

Zum einen nehmen wir an, dass sowohl die durchschnittliche Intelligenzleistung als auch die durchschnittliche Schulnote in der jeweiligen Klasse die Effektstärke zwischen Intelligenz bzw. Schulnote auf Individualebene und Lehrerurteilen bestimmen: In Klassen mit hoher Durchschnittsintelligenz könnte das Gewicht der Individualvariable Intelligenz als distinkti-ves Merkmal in den Hintergrund treten, da nun jeder Schüler über eine höhere Intelligenz verfügen müsste, um sich damit vor seinen Mitschülern auszuzeichnen. Noch stärker dürfte dies für den Notendurchschnitt auf Klassenebene gelten, da Noten insgesamt für Lehrer 'sichtbarer' sind als die kognitiven Fähigkeiten der Schüler.

H9: In Klassen mit vergleichsweise hoher Durchschnittsintelligenz ist der Zusammenhang zwischen Intelligenz und Lehrerurteil schwächer als in Klassen mit vergleichsweise nied-rigerer Durchschnittsintelligenz.

H10:In Klassen mit vergleichsweise gutem Notendurchschnitt ist der Zusammenhang zwi-schen Schulnote und Lehrerurteil schwächer als in Klassen mit vergleichsweise schlech-tem Notendurchschnitt.

Leistungsniveau der Klasse und Aspirationen sowie soziale Herkunft auf Individualebene

Wenn in leistungsstarken Klassen der Zusammenhang zwischen den jeweiligen Individual-merkmalen und den Lehrerurteilen abnimmt, so könnten Lehrer umgekehrt zur Beurteilung der Schüler andere Schülermerkmale heranziehen, deren Effekt dadurch zunehmen sollte. So könnten zum Beispiel in Klassen mit hoher Durchschnittsintelligenz und hohem Leistungsni-veau Variablen wie der soziale Hintergrund (H3) oder die Aspirationen eines Schülers (H4) an Bedeutung als distinktive Merkmale gewinnen: Entscheidungstheoretisch argumentiert würden sich die Lehrer bei ihren Urteilen nun weniger von ihrer subjektiven Einschätzung der verfügbaren Mittel der Schüler, um das primäre Zwischengut eines akademischen Abschlus-ses zu erreichen, leiten lassen, sondern mehr von deren grundsätzlichen Habitus, welche u.a. von der sozialen Herkunft und einer grundsätzlichen Bildungsaffinität bestimmt ist – und der, wie bereits Bourdieu gezeigt hat, v.a. bei Akademikerkindern relativ deckungsgleich mit den Einstellungen und Werten der Lehrer ist (Bourdieu 1987; Bourdieu & Passeron 1971). Daher vermuten wir:

H11: Mit dem Intelligenzniveau der Klasse nimmt der Zusammenhang zwischen sozialer Her-kunft der Schüler und Lehrerurteilen zu.

H12: Mit dem Intelligenzniveau der Klasse nimmt der Zusammenhang zwischen den Aspirati-onen der Schüler und Lehrerurteilen zu.

Lehrerurteile im Klassenkontext 67

H13: Mit dem Notendurchschnitt der Klasse nimmt der Zusammenhang zwischen sozialer Herkunft der Schüler und Lehrerurteilen zu.

H14: Mit dem Notendurchschnitt der Klasse nimmt der Zusammenhang zwischen den Aspira-tionen der Schüler und Lehrerurteilen zu.

Abbildung 1: Überblick über die Hypothesen

3 Daten, Operationalisierung und Design

3.1 Datenbasis: Kölner Gymnasiastenpanel

Datengrundlage ist die Primärerhebung des Kölner Gymnasiastenpanels (KGP) von 1969/1970.7 Im Zuge der Primärerhebung wurden vom Forschungsinstitut für Soziologie in

7 Die Primärbefragung (Schüler: ZA-Studie Nr. 600, Eltern: ZA-Studie Nr. 639, Lehrer ZA-Studie Nr. 640)

wurde vom Land Nordrhein-Westfalen finanziert und an dem von René König geleiteten Forschungsinstitut für Soziologie der Universität zu Köln durchgeführt. Projektleiter waren H.-J. Hummell, M. Klein, M. Wieken-Mayser und R. Ziegler. Durchgeführt wurde die erste Wiederbefragung (ZA-Studie Nr. 1441) unter der Leitung von H. Meulemann, H.-J. Hummell, M. Wieken-Mayser und R. Ziegler. Einzelheiten der ersten beiden Erhebungen können dem im Zentralarchiv erhältlichen Projektbericht an die DFG (Meulemann et al. 1987) entnommen werden. Ergebnisse der ersten Wiederbefragung wurden von Meulemann (1995) und Bir-kelbach (1998) zusammengefasst. Die zweite Wiederbefragung (ZA-Studie Nr. 4228) wurde 1996/97 telefo-nisch im CATI-Labor des Instituts für Angewandte Sozialforschung der Universität zu Köln durchgeführt und von der DFG finanziert (Birkelbach et al. 2000a; Meulemann et al. 2001). Ein detaillierter Bericht zur Datenerhebung (Birkelbach et al. 2000b) liegt vor. Eine dritte Wiederbefragung der inzwischen 55-jährigen ehemaligen Schülerinnen und Schüler, die von Heiner Meulemann (Köln) und Klaus Birkelbach (Duisburg-Essen) beantragt wurde, ist von der DFG bewilligt und wird 2010 durchgeführt. Die hier vorgelegten Analy-

Lehrerurteile im Klassenkontext 68

einem vom Land NRW finanzierten Projekt nordrhein-westfälische Gymnasiasten des 10. Schuljahres klassenweise u.a. über ihre schulischen Interessen, Leistungen und Pläne, ihre soziale Herkunft sowie über Einstellungen zu Elternhaus und Schule befragt. Außerdem nah-men die Schüler an einem Intelligenz-Strukturtest (vier Subskalen des IST) nach Amthauer (1953) teil. Zusätzlich zu den Schülern wurden Eltern und Lehrer befragt. Der Schülerdaten-satz umfasst n=3385 Fälle, die hierarchisch in 120 Schulklassen geordnet sind. Der Lehrerda-tensatz umfasst n=2680 Fälle und der Elterndatensatz n=2646 Fälle.

3.2 Operationalisierung

Abhängige Variable Lehrerurteile

Die Lehrer wurden in zwei Fragen gebeten, eine Einschätzung darüber abzugeben, welche ihrer Schülerinnen und Schüler am besten zur Aufnahme eines Hochschulstudiums geeignet seien und welche nicht. Die Fragen lauteten:

1 Wen aus der Klasse halten Sie unabhängig vom derzeitigen Leistungsstand für besonders geeignet, ein Studium zu ergreifen?

2 Von welchen Schülern der Klasse glauben Sie, dass sie auf keinen Fall zum Studium ge-eignet sind?

Fasst man beide Fragen in einer Variablen mit zwei Ausprägungen zusammen, dann bleibt ein großer Anteil von Schülern, der weder ein positives noch ein negatives Urteil erhalten hat: Von ihrem Klassenlehrer wurden 751 Schüler als geeignet und 616 Schüler als nicht geeignet beurteilt, während 1060 Schüler keine Beurteilung erhielten.8 Untersucht wurde daher neben der Wahrscheinlichkeit, ein positives gegenüber einem negativen Urteil zu erhalten, auch die Wahrscheinlichkeit eines positiven Urteils gegenüber keiner Beurteilung.

Es ist zu erwarten, dass die Lehrer sich ihres Urteils vor allem bei besonders leistungsstarken und bei besonders leistungsschwachen Schülerinnen und Schülern so sicher sind, dass sie eine explizite Prognose wagen, während sie bei durchschnittlichen Schülern eher darauf verzich-ten. Dies zeigt auch ein Vergleich der durchschnittlichen Intelligenz (IST) in den drei Grup-pen: Die liegt in der Gesamtgruppe bei MW=110,4 und damit um rund eine Standardabwei-chung über der Eichstichprobe. In der Gruppe ohne explizites Urteil liegt das arithmetische Mittel bei MW=109,6, in der Gruppe mit positivem Urteil bei MW=114,7 und in der Gruppe mit negativem Urteil bei MW=107,8 (vgl. Birkelbach 2009, Abbildung 1), in ähnlicher Weise gilt dies auch für die Schulnoten. Die Kontraste der beiden Gruppen sind bei der ersten Alter-native (positives vs. negatives Lehrerurteil) also schärfer konturiert als bei der zweiten Alter-native (positives vs. kein Urteil), so dass bei den Modellen mit der ersten Alternative auch die die stärkeren Effekte zu erwarten sind. Allerdings sollten die Effekte bei der zweiten Alterna-tive als Zielvariablen zumindest in die gleiche Richtung weisen.

sen basieren auf bislang nicht ausgewerteten Zusatzbögen zur Lehrerbefragung. Die Aufbereitung der Daten und ihre Auswertung wurde von der DFG durch die Finanzierung einer WHK-Stelle ermöglicht. Unser Dank gilt Heiner Meulemann und Maria Wieken-Mayser, die die Fragebögen aufbewahrt haben und uns bei der Aufbereitung und Integration der Daten in das KGP unterstützt haben.

8 Die Schüler wurden von allen Lehrern, von denen sie zum Zeitpunkt der Befragung unterrichtet wurden, beurteilt. Wir beschränken die Analyse auf die Urteile der Klassenlehrer, da wir annehmen, dass die Klassen-lehrer i.d.R. einen intensiveren Kontakt zu ihren Schülern haben und sie daher valider als einzelne Fachlehrer beurteilen können.

Lehrerurteile im Klassenkontext 69

Unabhängige Variablen (Individualebene)

Die Intelligenz wurde mithilfe von vier Subskalen des Intelligenz-Strukturtests (ist) nach Amthauer (1953) erhoben.9 Wir verwenden die Gesamtskala über alle Subscores, von der wir für alle Individualwerte den jeweiligen Klassenmittelwert subtrahiert haben.10 Der Schulerfolg wurde anhand des Notendurchschnitts der Schüler (dnote) operationalisiert.11 Hierbei handelt es sich um den Mittelwert aller verfügbaren Noten eines Schülers, von dem der jeweilige Klassenmittelwert subtrahiert wurde. Die soziale Herkunft der Schüler wurde über die Schichtzugehörigkeit der Eltern operationalisiert. Aus den Angaben der Eltern zu Bildung, Berufstatus und -situs wurde ein dreidimensionaler Schichtindex (Meulemann 1979: 49) mit den folgenden Ausprägungen gebildet: 1 'untere Unterschicht', 2 'obere Unterschicht', 3 'unte-re Mittelschicht', 4 'mittlere Mittelschicht', 5 'obere Mittelschicht', 6 'Oberschicht' (schicht). Die Aspirationen wurden mit der Frage gemessen, ob die Schüler das Abitur als notwendig betrachten, um ihr Lebensziel zu erreichen. Antwortvorgaben waren 'ja, notwendig', 'nicht notwendig, aber nützlich', 'nicht notwendig'. Die Variable aspir wurde wie folgt dichotomi-siert: 0 'nicht notwendig'; 1 'notwendig oder nützlich'.

Unabhängige Variablen (Kontextebene)

Auf Kontextebene wurden die klassenweisen Durchschnittswerte für die Intelligenzscores (IST) und den Notendurchschnitt (DNOTE) berechnet. Für Schulklassen, die auf Individual-ebene fehlende Werte aufweisen, wurden die jeweiligen Mittelwerte aller nicht-fehlenden Werte berechnet. Von beiden Kontextvariablen wurde der jeweilige Gesamtmittelwert subtra-hiert (grand-mean-centering).

3.3 Design

Für die Schätzung von Effekten auf Individual- und Kontextebene ist eine Mehrebenen-analyse das angemessene Verfahren (Bryk / Raudenbush 1992; Hox 2002; Snijders / Bosker 2004). Da sowohl Hypothesen untersuchen werden, die einen Effekt von Makrovariablen auf das Lehrerurteil in den einzelnen Schulklassen postulieren (H5-H8) als auch Hypothesen, die einen Einfluss von Makrovariablen auf Effektgrößen auf Individualebene annehmen (H9-H14), entspricht das von uns angestrebte Endmodell einem Random-Slope-Random-Intercept-Modell (Langer 2004: 131ff). Aufgrund der dichotomen abhängigen Variablen (positives vs. negatives Lehrerurteil) liegt allen folgenden Analysen ein Mehrebenen-Logit-Modell (Hox 2002: 114f) zugrunde. Nach dem Nullmodell M0, das die Varianzen auf Individual- und Kon-textebene berechnet und zueinander ins Verhältnis setzt, rechnen wir für die abhängige Vari-able ('geeignet' vs. 'ungeeignet') folgende 13 Einzelmodelle: Die Modelle M1-M4 nehmen sukzessive die Prädiktoren der Individualebene auf. M5 enthält zusätzlich zu den Mikroprä-

9 Im Folgenden bezeichnen Variablenbezeichnungen in Minuskeln Indikatoren auf Individualebene, solche in

Majuskeln Indikatoren auf Klassenebene. Dabei werden bewusst die Variablennamen genannt, um deutlich zu machen, dass es sich um Indikatoren handelt, nicht um die Konzepte selber.

10 Der Multilevel-Terminologie folgend bezeichnet man dieses Verfahren als „group-mean-centering“ (Hox 2002: 61). Gegenüber dem üblicherweise vorgenommenen „grand-mean-centering“ besitzt es den Nachteil, dass sich die so geschätzten Parameter nicht mehr in Rohwerte rücktransformieren lassen und folglich auch nicht als Rohwerte interpretiert werden dürfen (vgl. Kreft et al. 1995). Die Zentrierung am Gruppenmittel-wert stellt eine adäquate Umsetzung der BFLP-Hypothese (und somit auch der RG-Hypothese) in ein Mehr-ebenen-Modell dar (Hox 2002: 61f).

11 Um einheitlich interpretierbare Effekte zu erhalten, wurden die Schulnoten umkodiert, so dass der höchste Wert (6) die beste Leistung („sehr gut“) und der niedrigste Wert (1) die schlechteste Leistung („ungenü-gend“) bezeichnet.

Lehrerurteile im Klassenkontext 70

diktoren den Haupteffekt der Intelligenz-Makrovariablen (IST) und M6 zusätzlich zu den Mikroprädiktoren den Haupteffekt der Durchschnittsnote (DNOTE) auf Klassenebene. Mit M5 und M6 werden somit die BFLP- sowie die RFG-Hypothesen getestet (H5-H8). M7 bein-haltet den Intelligenz-Haupteffekt sowie die Crosslevel-Interaktion IST*ist, M8 zusätzlich zu M6 DNOTE*dnote. Hier wird getestet, ob ein hohes Leistungsniveau in der Klasse zu einem Rückgang der Erklärungskraft der Leistungsprädiktoren auf Individualebene führt (H9, H10). Die Modelle M9-M12 untersuchen darüber hinaus, ob infolgedessen Merkmale wie die sozia-le Herkunft (schicht) und die Aspirationen (aspir) bei der Erklärung von Lehrerurteilen an Bedeutung zunehmen. M13 soll als abschließendes Modell mit allen signifikanten Individual-variablen, Makro-Haupteffekten und Interaktionstermen geschätzt werden und kann daher nicht vorab spezifiziert werden. Der Bryk- und Raudenbush-Notation (Bryk / Raudenbush 1992) folgend lassen sich die Modelle auf Individualebene wie folgt formalisieren:

:

:

:

:

:

:

:

:

:

:

:

:

:

Lehrerurteile im Klassenkontext 71

3.4 Schätzverfahren

Im Unterschied zu Logit-Modellen auf Individualebene und auch zu Mehrebenen-Modellen mit metrischen abhängigen Variablen werden Mehrebenen-Logit-Modelle nicht auf Maxi-mum-Likelihood-Basis geschätzt, sondern mit einer Quasi-Likelihood-Schätzung. Diese nä-hert die nichtlineare Logit-Funktion schrittweise einer beinahe linearen Funktion an und be-rechnet erst zum Schluss das Mehrebenenmodell (Hox 2002: 108). Bei diesem als „Taylor Series Approximation“ bekannten Approximationsverfahren kann während des Iterationspro-zesses entschieden werden, ob die jeweils nächste Verbesserung nur auf Basis der vorange-gangen geschätzten Parameter erfolgt (Marginal Quasi-Likelihood: MQL) oder auf Basis der vorangegangen geschätzten Parameter und der jeweiligen Residuen (Penalized Quasi-Likelihood: PQL). PQL-Schätzungen können zwar Konvergenzprobleme aufweisen, führen aber – wenn sie konvergieren – zu konsistenteren Parametern als MQL-Schätzungen (Breslow / Clayton 1993; Goldstein 1995), so dass hier PQL-Schätzungen genutzt werden.12

4 Ergebnisse

4.1 Nullmodell

Zuerst präsentieren wir die Ergebnisse des Nullmodells (M0), das einer „one-way random-effects ANOVA“ gleichkommt (Bryk / Raudenbush 1992). Das Nullmodell besagt, dass der Wert der abhängigen Variablen 'Lehrerurteil' über den Gesamtmittelwert, einen individuellen Fehlerterm sowie einen schulklassenspezifischen Fehlerterm bestimmt ist. Tabelle 1 gibt die Varianz der abhängigen Variable innerhalb der Schulklassen (σ²), zwischen den Schulklassen (τ00) sowie den Anteil der Varianz zwischen den Schulklassen an der Gesamtvarianz, ρ= τ00 / (τ00 + σ²) wieder. ρ wird auch als Intra-Class-Correlation (ICC) bezeichnet und spezifiziert den Anteil der Varianz, der überhaupt durch den Kontext erklärt werden könnte. Hier beträgt ρ = .46 (abhängige Variable: geeignet vs. nicht geeignet) bzw. ρ = .55 (abhängige Variable: geeignet vs. nicht genannt) und gilt damit als hinreichend groß, um eine Mehrebenenanalyse zu rechtfertigen. Muthén und Satorra (1995) schlagen darüber hinaus den design effect d, der zusätzlich die durchschnittliche Gruppengröße berücksichtigt, als Maßstab für das Erklä-rungspotenzial einer Mehrebenenanalyse vor.13 Dabei wird ein Wert über 2 als hinreichend erachtet, um eine Mehrebenenanalyse mit Gewinn durchzuführen (Muthén / Satorra 1995; Maas / Hox 2005). Hier beträgt d = 13,41 (abhängige Variable: geeignet vs. nicht geeignet) bzw. d = 15,84 (abhängige Variable: geeignet vs. nicht genannt).

 

Tabelle 1: Nullmodell

Lehrerurteile Varianz innerhalb

der Klassen Varianz zwischen

den Klassen ρ ≡ ICC

σ² Standard-

fehler τ00

Standard- fehler

τ00/(τ00+σ²)

geeignet vs.ungeeignet 0,93*** 0,04 0,80*** 0,18 0,46

geeignet vs. nicht genannt 1,12*** 0,23 0,92*** 0,03 0,55 * p < .05; ** p < .01; *** p < .001 (zweiseitig)

12 Für die Schätzung wird die Prozedur GLIMMIX von SAS genutzt. 13 Der design effect wird nach der Formel d = 1 + (durchschnittliche Gruppengröße – 1) * ICC berechnet.

Lehrerurteile im Klassenkontext 72

4.2 Mehrebenenmodelle

4.2.1 Abhängige Variable: geeignet vs. nicht geeignet

Nachfolgend werden zunächst die Schätzer der vier Modelle, bei denen sukzessiv die Indika-toren für die kognitive Leistungsfähigkeit (ist), die Schulleitung (dnote), die soziale Herkunft (schicht) und die Aspirationen (aspir) auf Individualebene eingeführt werden, dargestellt (Ta-belle 2). Da die metrischen Variablen ist und dnote bereits auf Gruppenebene zentriert sind und somit abgesehen vom Vorzeichen keine inhaltliche Interpretation möglich ist, werden die unstandardisierten log-odds berichtet.

 

Tabelle 2: Individualmerkmale (Modell 1 bis 4). Abhängige Variable: geeignet vs. ungeeignet.

M1 M2 M3 M4

log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert Interzept 0,30* 2,51 -0,17 -1,08 -1,08 -4,07 -2,34*** -6,23 Individualmerkmale Ist 0,06*** 9,87 0,04*** 5,65 0,04*** 5,83 0,04*** 5,15 dnote 4,39*** 18,33 4,37*** 17,81 4,49*** 15,66 schicht 0,25*** 4,34 0,23*** 3,47 aspir 1,51*** 5,45 Varianz innerhalb der Schulklassen

0,91*** 24,76 0,77*** 24,72 0,79*** 24,72 0,75*** 21,55

zwischen den Schulklassen

0,85*** 4,47 1,79*** 4,86 1,74*** 4,8 1,83*** 4,48

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

Erwartungsgemäß belegen die Modelle, dass Schüler mit höherer Intelligenz, mit besseren Noten, von höherer sozialer Herkunft und mit höheren Bildungsaspirationen auch eher ein positives Lehrerurteil erhalten. Die Effektstärke der einzelnen Koeffizienten bleibt auch bei Aufnahme der jeweils anderen Variablen stabil. Festzuhalten ist, dass auch bei Kontrolle der Intelligenz und der Note als Leistungsindikatoren die soziale Herkunft einen signifikanten Effekt auf das Lehrerurteil besitzt. Angesichts der mit p < .001 allesamt hochsignifikanten Koeffizienten können die Hypothesen H1 bis H4 beibehalten werden (vgl. Becker, D. / Bir-kelbach 2009).

In den Modellen 5 bis 8 (Tabelle 3) werden schrittweise die Haupteffekte von Intelli-genz (IST) und Durchschnittsnote (DNOTE) auf Kontextebene und ihre Interaktionsterme mit der jeweiligen Individualvariablen zur Überprüfung der beiden konkurrierenden Hypothesen (BFLP und Reflected-Glory) eingeführt. Nach der BFLP-Hypothese sollten Schüler in Klas-sen mit höherer Durchschnittsintelligenz und besseren Durchschnittsnoten ungeachtet ihrer Individualmerkmale aufgrund des hohen Vergleichsniveaus eher negative Lehrerurteile erhal-ten. Nach der Reflected-Glory-Hypothese hingegen sollten die positiven Einstellungen der Lehrer gegenüber einer leistungsstarken Klasse auch unabhängig von der konkreten Indivi-dualleistung auf die einzelnen Schüler ausstrahlen und zu einer positiveren Bewertung als bei vergleichbaren Schülern in einer schwächeren Klasse führen.

Lehrerurteile im Klassenkontext 73

Tabelle 3: Big-Fish-Little-Pond oder Reflected-Glory Effekt? Mehrebenen-Modelle 5 bis 8 (Individual- und Kontexteffekte). Abhängige Variable: geeignet vs. ungeeignet

M5 M6 M7 M8 log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert Interzept -2,27*** -6,10 -2,36*** -6,28 -2,40*** -6,31 -2,49*** -6,20 Individualmerkmale ist -,08* -2,11 ,04*** 5,10 -,08* -2,02 ,04*** 4,63 dnote 4,51*** 15,60 2,55** 3,17 4,53*** 15,59 2,37** 2,98 schicht ,23*** 3,45 ,23*** 3,44 ,23*** 3,49 ,23** 3,21 aspir 1,47*** 5,31 1,51*** 5,41 1,49*** 5,38 1,55*** 5,09 Kontextmerkmale IST ,13** 3,28 ,13** 3,23 DNOTE 1,98* 2,50 1,88* 2,40 Cross-Level-Interaktionen ist* IST ,00 1,83 dnote*DNOTE 1,30** 3,19 Varianz innerhalb der Schulklassen

0,75*** 21,55 ,76*** 21,56 ,76*** 21,56 ,89*** 21,57

zwischen Schul-klassen

1,54*** 4,25 1,65*** 4,35 1,65*** 4,35 1,51*** 4,12

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

Die in Tabelle 3 präsentierten Modelle M5 bis M8 sprechen klar gegen die BFLP- und für die Reflected-Glory-Hypothesen: Unabhängig von der individuellen Intelligenz (ist) und der Durchschnittsnote (dnote) führen eine hohe Durchschnittsintelligenz (IST) sowie ein hohes Leistungsniveau in der Klasse (DNOTE) zu vergleichsweise besseren Lehrerurteilen. Beide Koeffizienten sind signifikant. Zu den Modellen M5 bis M8 ist ferner anzumerken, dass bei Aufnahme der Durchschnittsnote auf Kontextebene (M6 und M8) der Koeffizient der betref-fende Individualvariable (dnote) an Stärke und Signifikanz verliert, während die Aufnahme der Durchschnittsintelligenz auf Klassenebene (M5 und M7) zu einer Änderung des Vorzei-chens auf Individualebene führt. Die sichtbare individuelle Leistung (dnote) verliert bei Kon-trolle des Kontextes an Einfluss auf das Lehrerurteil, aber sie behält einen signifikanten Ef-fekt. Dagegen verkehrt die für die Lehrer weniger offensichtliche kognitive Leistungsfähig-keit (ist) ihren Einfluss ins Gegenteil, wenn die Kontextvariable (IST) kontrolliert wird. Of-fenbar wirkt hier die Ausstrahlung des Kontextes derart stark, dass sie die individuellen Leis-tungsmerkmale überlagert. Auffällig ist darüber hinaus, dass die soziale Herkunft ihren Ein-fluss gegenüber den Modellen M1 bis M4 nahezu unverändert beibehält. Unabhängig von der individuellen Leistung und dem Leistungsniveau der Klasse beeinflusst die soziale Herkunft das Lehrerurteil zur Eignung für ein Studium.

In den Hypothesen H9 und H10 haben wir vermutet, dass eine hohe Durchschnittsintelli-genz (IST) sowie gute Durchschnittsnoten (DNOTE) in einer Klasse dazu führen, dass die Individualmerkmale bei der Erklärung von Lehrerurteilen an Bedeutung verlieren. Die Model-le M7 und M8 zeigen, dass dies nicht der Fall ist. Im Falle der Intelligenz auf Klassenebene ist der jeweilige Interaktionsterm nicht signifikant (M7), und im Falle der Durchschnittsnote auf Klassenebene widerspricht das Ergebnis sogar der Hypothese: Der signifikant (p < .01) positive Interaktionsterm in M8 zeigt, dass mit dem Notendurchschnitt auf Klassenebene der

Lehrerurteile im Klassenkontext 74

Zusammenhang zwischen Durchschnittsnote und Lehrerurteilen auf Individualebene sogar zunimmt. Die Hypothesen H9 und H10 müssen somit verworfen werden.

Die Hypothesen H11-H14 postulieren, dass in Klassen mit hoher Durchschnittsintelligenz und guten Noten die Erklärungskraft der sozialen Herkunft und der Aspirationen zunimmt. An den Modellen M9 bis M12 kann abgelesen werden, dass dies nicht zutrifft: Keiner der Inter-aktionsterme der beiden Kontextvariablen mit der sozialen Herkunft oder den Aspirationen der Schüler ist signifikant. H11 bis H14 müssen somit abgelehnt werden.

 

Tabelle 4: Mehrebenenmodelle (M9 bis M13) inklusive Cross-Level-Interaktionen. Abhängige Variable: geeignet vs. ungeeignet

M9 M10 M11 M12 M13 log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert Interzept -2,29*** -6,12 -2,30*** -6,11 -2,50*** -6,51 -2,51*** -6,04 -2,41*** -6,07 Individualmerkmale Ist -,08* -2,12 -,08* -2,12 ,04*** 5,23 ,04*** 5,17 -,07 -1,88 Dnote 4,51*** 15,57 4,51*** 15,57 2,56** 3,17 2,53** 3,16 2,70** 3,52 Schicht ,24*** 3,49 ,23*** 3,42 ,26*** 3,86 ,23*** 3,48 ,23** 3,19 Aspir 1,47*** 5,30 1,50*** 5,30 1,51*** 5,48 1,66*** 5,00 1,51*** 4,96 Kontextmerkmale IST ,11* 2,58 ,11* 2,57 ,11** 3,06 DNOTE 3,03** 2,93 2,72* 2,44 1,59* 2,12 Cross-Level-Interaktionen dnote*DNOTE 1,29** 3,17 schicht*IST ,00 0,53 aspir*IST ,01 ,52 schicht*DNOTE -,28 -1,62 ,46* 2,51 aspir*DNOTE -,81 -,95 Varianz innerhalb der Schulklassen

,77*** 21,49 ,77*** 21,49 ,75*** 21,5 ,77*** 21,51 ,79*** 21,49

zwischen Schulklassen

1,56*** 4,12 1,56*** 4,13 1,8*** 4,34 1,74*** 4,28 1,51*** 4,02

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

Modell M13 stellt das Endmodell aller bis hierhin signifikanten Variablen und Interaktions-terme dar. Es belegt, dass auf der Individualebene die Effekte der Durchschnittsnote, der sozi-alen Herkunft und der Aspirationen weiterhin einen signifikanten Effekt auf das Lehrerurteil haben, während der in den Modelle M5 und M7 überraschend negative Effekt des Intelligenz-niveaus nun auch eine Irrtumswahrscheinlichkeit auf dem 5-Prozent-Niveau verfehlt. Auf der Ebene der Schulklassen bleiben beide Haupteffekte zugunsten der Reflected-Glory-Hypothese bestehen und belegen, dass das Leistungsniveau der Klasse auf die Beurteilung einzelner Schüler durch ihre Lehrer ausstrahlt. Das gilt auch für den unserer Hypothese H8 widerspre-chenden positiven Interaktionseffekt zwischen der Durchschnittsnote auf Klassen- und Indivi-dualebene, der im Rückblick als ein zusätzlicher Beleg für die Ausstrahlung von Lehrerer-wartungen, die sich in einem durch aggregierte Leistungen geformten Referenzrahmen gebil-det haben, auf die Beurteilung der individuellen Leistungsfähigkeit einzelner Schüler aufge-fasst werden kann.

Lehrerurteile im Klassenkontext 75

4.2.2 Abhängige Variable: geeignet vs. nicht genannt

Die Modelle M1 bis M4 in Tabelle 5 belegen, dass die individuelle Intelligenz, Durchschnitts-note und Bildungsaspiration der Schüler auch einen signifikanten Effekt auf die Tatsache be-sitzen, ein positives Lehrerurteil zu bekommen – gemessen daran, vom Lehrer nicht beurteilt zu werden. Die soziale Herkunft spielt hingegen in diesen Modellen keine Rolle. Wie zu er-warten war, sind die Effekte in M1 bis M4 durchweg geringer als in den vergleichbaren Mo-dellen aus Tabelle 2.

 

Tabelle 5: Individualmerkmale (Modelle 1 bis 4). Abhängige Variable: geeignet vs. nicht genannt

M1 M2 M3 M4

log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert

Interzept -,34** -2,60 -,91*** -5,63 -1,16*** -4,99 -1,94*** -5,70 Individualmerkmale ist ,04*** 7,89 ,02*** 4,38 ,02*** 4,38 ,02*** 3,58 dnote 2,68*** 15,70 2,68*** 15,65 2,66*** 13,72 schicht 0,07 1,49 ,07 1,32 aspir ,80** 2,96 Varianz innerhalb der Schulklassen ,91*** 28,43 0,87*** 28,41 0,87*** 28,4 ,86*** 24,9 zwischen den Schulklassen 1,23*** 4,88 1,81*** 5,04 1,81*** 5,04 1,67*** 4,81

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

Tabelle 6: Big-Fish-Little-Pond oder Reflected-Glory Effekt? Modelle 5 bis8 (Individual- und Kontexteffekte). Abhängige Variable: geeignet vs. nicht genannt

M5 M6 M7 M8

log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert

Interzept -1,91*** -5,60 -1,91*** -5,67 -1,97*** -5,73 -1,93*** -5,68 Individualmerkmale

ist -,02 -,61 ,02*** 3,52 -,02 -,58 ,02*** 3,47 dnote 2,67*** 13,72 1,03 1,45 2,67*** 13,71 ,95 1,34 schicht ,06 1,27 ,06 1,26 ,06 1,21 ,06 1,25 aspir ,79** 2,91 0,78** 2,90 ,79** 2,92 ,78** 2,89

Kontextmerkmale

IST ,05 1,24 ,04 1,14 DNOTE 1,66* 2,36 1,59* 2,25

Cross-Level-Interaktionen

ist* IST ,0 1,59 dnote*DNOTE ,28 ,78

Varianz innerhalb der Schulklassen ,86*** 24,9 0,87*** 24,9 ,86*** 24,88 ,88*** 24,89zwischen Schulklas-sen 1,66*** 4,77 1,56*** 4,71 1,69*** 4,77 1,54***

4,7

* p < .05; ** p < .01; *** p < .001 (zweiseitig)

Lehrerurteile im Klassenkontext 76

Bei Aufnahme der Haupteffekte sowie ihrer Interaktionen mit der jeweiligen Individualvari-ablen in M5 bis M8 (Tabelle 6) kann festgehalten werden, dass einzig die Durchschnittsnote auf Klassenebene einen negativen signifikanten Effekt (p < 0.05) auf die Lehrerurteile besitzt. Sowohl der Haupteffekt der Durchschnittsintelligenz auf Klassenebene als auch die Effekte für die beiden Interaktionsterme erreichen nicht das 5%-Signifikanzniveau.

Die Modelle M9 bis M12 (Tabelle 7) schließlich stellen keinen Fortschritt gegenüber M6 dar. Da außer dem Hauteffekt des Notendurchschnitts auf Klassenebene keine weitere Kon-textvariable – sei es als Haupteffekt, sei es als Interaktionsterm – die Signifikanzgrenze er-reicht, erübrigt sich auch die Berechnung eines M13 in Tabelle 4 vergleichbaren Endmo-dells.14

Tabelle 7: Mehrebenenmodelle (M9-M13) inklusive Cross-Level-Interaktionen. Abhängige Variable: geeignet vs. ungeeignet.

M9 M10 M11 M12 log-odds z-Wert log-odds z-Wert log-odds z-Wert log-odds z-Wert Interzept -1,92*** -5,62 -1,92*** -5,64 -2,05*** -5,63 -2,24*** -5,56Individualmerkmale Ist -,02 -,60 -,02 -,61 ,02*** 3,54 0,02*** 3,58dnote 2,67*** 13,70 2,67*** 13,72 1,04 1,47 1,05 1,48schicht ,07 1,35 ,06 1,25 ,1 1,62 0,07 1,32aspir ,79** 2,90 ,81** 2,97 0,80** 2,92 1,12** 3,19Kontextmerkmale IST ,06 1,38 ,03 ,67 DNOTE 2,15* 2,53 2,96** 2,89Cross-Level-Interaktionen schicht*IST ,0 -,61 aspir*IST ,02 ,68 schicht*DNOTE -0,13 -1,04 aspir*DNOTE -1,4 -1,76Varianz innerhalb der Schulklassen ,87*** 24,89 ,86*** 24,89 0,86*** 24,89 0,86*** 24,89zwischen den Schulklassen 1,66*** 4,77 1,65*** 4,77 1,57*** 4,72 1,55*** 4,71* p < .05; ** p < .01; *** p < .001 (zweiseitig)

5 Diskussion

In diesem Beitrag wurde erstens der Frage nachgegangen, ob auf Individualebene neben der Intelligenz und dem Notendurchschnitt als Leistungsindikatoren auch die soziale Herkunft sowie die Aspirationen der Schüler die Urteile ihrer Klassenlehrer hinsichtlich ihrer Eignung für ein Studium beeinflussen. Im Hinblick auf die primäre Zielvariable „geeignet“ vs. „unge-eignet“ kann diese Frage klar bejaht werden: Die Effekte der sozialen Herkunft und der Aspi-rationen bleiben nicht nur bei Kontrolle beider Leistungsindikatoren auf Individualebene stabil, sondern auch, wenn zusätzlich das Leistungsniveau der Klasse als Kontexteffekt be- 14 Einzig der Interaktionsterm zwischen den Aspirationen auf Individualebenen und der Durchschnittsnote auf

Kontextebene ist in M12 mit z=1,76 marginal signifikant. Zwar wurden in allen Modellen die kritischen z-Werte des (strengeren) zweiseitigen Tests zugrunde gelegt, dennoch ist festzuhalten, dass zumindest das Vorzeichen unserer Hypothese H14 tendenziell widerspricht.

Lehrerurteile im Klassenkontext 77

rücksichtigt wird. Umgekehrt verliert bei Kontrolle des Leistungsniveaus der Klasse die über die Testintelligenz operationalisierte kognitive Leistungsfähigkeit der einzelnen Schüler an Bedeutung für das Lehrerurteil, während der individuelle Notendurchschnitt einen signifikan-ten Einfluss behält. Bei prognostischen Urteilen orientieren sich die Lehrer nicht nur an den aktuellen Leistungen und der langfristigen kognitiven Leistungsfähigkeit ihrer Schüler, son-dern auch an der Herkunft der Schüler und ihren Aspirationen. Mehr noch: Wird zusätzlich das Leistungsniveau der Klasse kontrolliert, dann spielt die individuelle kognitive Leistungs-fähigkeit als ein über die Gegenwart hinausweisendes Leistungsmerkmal für das prognosti-sche Urteil keine Rolle mehr, während die aktuellen, durch Noten dokumentierten Leistungen, aber auch die soziale Herkunft und die damit eng zusammenhängenden Aspirationen weiter-hin von Bedeutung sind. Für die Zielvariable „geeignet“ vs. „nicht genannt“ wurden auf Indi-vidualebene ebenfalls signifikante Effekte von Intelligenz, Schulnoten und Aspirationen fest-gestellt, wohingegen kein Herkunftseffekt nachgewiesen werden konnte.

Zweitens sollte untersucht werden, ob darüber hinaus die Beurteilungen der Schüler durch ihre Lehrer auch durch das Leistungsniveau der Klasse insgesamt beeinflusst werden. Wäh-rend die hier diskutierte Variante der Big-Fish-Little-Pond-Hypothese einen negativen Effekt eines hohen durchschnittlichen Leistungsniveaus auf das Lehrerurteil vermutet, weil mit dem Leistungsniveau der Klasse die Ansprüche der Lehrer an die individuelle Leistung zunehmen, postuliert umgekehrt die Reflected-Glory-Hypothese, dass die mit dem Leistungsniveau der Klasse zunehmend positivere Einschätzung der Klasse auf die einzelnen Schüler ausstrahlt – auch unabhängig von deren individueller Leistung.

Die hier präsentierten Ergebnisse sprechen – zumindest bezogen auf die Zielvariable „ge-eignet“ vs. „ungeeignet“ – eindeutig für die Reflected-Glory-Hypothese. Lehrer orientieren sich bei der Einschätzung einzelner Schüler an einem klasseninternen Maßstab. Aber das be-deutet nicht, dass in einer leistungsstarken Klasse die individuell für eine positive Beurteilung durch den Lehrer zu erbringenden Leistungen im Vergleich zu den Leistungen in leistungs-schwächeren Klassen besonders hoch sein müssen. Vielmehr sprechen die Daten dafür, dass das Leistungsniveau der Klasse auf die Beurteilung der Leistung der einzelnen Schüler in Form eines Halo-Effektes ausstrahlt. Dies gilt auch bei Kontrolle der aktuellen Leistungen und der kognitiven Leistungsfähigkeit auf Individualebene. Bei gleicher Leistung erhalten Schüler in guten Klassen eher eine positive Beurteilung, während sie in schlechteren Klassen eher negativ beurteilt werden. Offenbar übertragen die Lehrer ihre Erwartungen, die sie an die Klasse als Ganzes haben auf die einzelnen Schüler. Für die Zielvariable „geeignet“ vs. „nicht genannt“ gilt dieser Befund nur eingeschränkt, da hier auf Kontextebene nur der Durch-schnittsnote ein positiver Haupteffekt ausgemacht werden konnte – welcher jedoch ebenfalls mit der Reflected-Glory-Hypothese im Einklang steht.

Drittens wurde mittels Cross-Level-Interaktionen untersucht, ob mit zunehmender Leis-tungsfähigkeit der Klasse die jeweiligen Individualvariablen bei der Erklärung von Lehrerur-teilen an Bedeutung verlieren und andere Prädiktoren wie die soziale Herkunft oder die Aspi-rationen der Schüler stärker in den Vordergrund rücken. Darauf geben die vorliegenden Daten aber keinen Hinweis. Vielmehr scheint die Relevanz der individuellen Noten in einem schul-leistungsstarken Klassenverband weiter zuzunehmen.

Zusammenfassend ist festzustellen, dass Lehrer sich bei solch allgemeinen Beurteilungen von Schülern mit einem prognostischen Gehalt nicht nur an meritokratischen Kriterien, also an den aktuellen Leistungen und der langfristigen kognitiven Leistungsfähigkeit orientieren, sondern auch der sozioökonomische Status der Eltern und die individuellen Aspirationen eine

Lehrerurteile im Klassenkontext 78

signifikante Rolle spielen. Das ist nicht weiter überraschend und bestätigt nur einmal mehr die eingangs diskutierten Untersuchungen zu den Übergangsempfehlungen von der Grundschule in die Sekundarstufe I. Hervorzuheben ist dagegen die Tatsache, dass die kognitive Leistungs-fähigkeit als langfristig wirksamer Leistungsindikator für das prognostische Lehrerurteil keine Rolle mehr spielt, wenn die aktuellen Leistungen, das Leistungsniveau der Klasse und die soziale Herkunft kontrolliert werden. Dadurch wird eine grundlegende Frage von Lehrerurtei-len mit prognostischem Gehalt angesprochen: Können Lehrer das Potenzial der Schüler über-haupt unabhängig von deren aktuellen Leistungen und dem Leistungsniveau der Klasse als Referenzrahmen einschätzen? Die Ergebnisse legen zumindest Zweifel nahe. Dies gilt insbe-sondere, wenn man sich noch einmal vor Augen führt, in welcher Form das Leistungsniveau der Klasse die Lehrerurteile beeinflusst: Die Erwartungen, die Lehrer an eine Klasse als Gan-zes haben, strahlen auf die Beurteilungen der einzelnen Schüler aus – auch unabhängig von deren individuellen Leistungen und ihrem Leistungsvermögen. Solche Beurteilungen haben Folgen im weiteren Bildungsverlauf, wie an anderer Stelle (Birkelbach 2009) gezeigt werden konnte. Mangels anderer Informationsquellen orientieren die Schülerinnen und Schüler ihr Selbstkonzept an den in der alltäglichen Kommunikation der Schule direkt oder indirekt ver-mittelten Einschätzungen der Lehrer. Diese fließen in die folgenden Bildungsentscheidungen als Erfolgserwartungen der Schüler mit ein und können so in Form einer self-fulfilling pro-phecy (Merton 1948) den Bildungs- und Berufsverlauf und damit den gesellschaftlichen Sta-tuszuweisungsprozess beeinflussen.

Im Zusammenhang mit der langanhaltenden Debatte über soziale Ungleichheit im Bil-dungssystem (z.B.: Boudon 1974; Meulemann 1979; Blossfeld / Shavit 1993; Breen / Gold-thorpe 1997; Becker, R. 2000; Erikson et al. 2005; Becker, R. 2007; Hillmert 2007; Müller-Benedict 2007b; Stocké 2007; Becker, R. 2009b; Becker, R. / Hadjar 2009) weisen die Er-gebnisse zunächst auf eine weitere Entkopplung der individuellen Bildungschancen von der eigenen Leistung hin. Unklar bleiben indes die Folgen der hier konstatierten Homogenisie-rung der Beurteilungen. Zwar wurden Analysen auch soziale Hintergrundmerkmalen kontrol-liert, dennoch müsste in zukünftigen Analysen noch genauer (z.B. durch die Modellierung von Interaktionseffekten auch auf Individualebene) herausgearbeitet werden, inwiefern die beiden „Gesichter“ des Reflected-Glory-Effekts – verhältnismäßig bessere Lehrerurteile in leistungsstarken Klassen auch für schwächere Schüler; aber auch verhältnismäßig schlechtere Lehrerurteile in leistungsschwachen Klassen auch für bessere Schüler – mit der sozialen Her-kunft der Schüler variieren.

Folgt man der Hypothese des primären Effekts sozialer Ungleichheit, so haben Schüler aus Familien mit einem niedrigerem sozialen Status bereits vor der Beschulung niedrigere kognitive Kompetenzen als Schüler aus Elternhäusern mit höherem sozialen Status (Müller-Benedict 2007). Da Birkelbach (2009) bereits einen Effekt der hier analysierten Lehrerurteile auf die Entscheidung zum Abitur und zur Studienaufnahme nachgewiesen hat, könnten nach den Befunden der vorliegenden Untersuchung die Konsequenzen des primären Effekts sozia-ler Ungleichheit in leistungsstarken Klassen leicht abgefedert, in leistungsschwachen Klassen jedoch weiter verstärkt werden.

Weiterhin sollte untersucht werden, ob langfristig Effekte des Leistungsniveaus auf Klas-senebene auf den Bildungserfolg bestehen – und zwar unabhängig von potentiellen Pfadab-hängigkeiten vermittels der Lehrerurteile. Eine explorative Untersuchung von Becker (Be-cker, D. 2009a) deutet an, dass auch unter Kontrolle der jeweiligen Einzelpfade 'Individualva-riablen auf Lehrerurteile', 'Individualvariablen auf Studienbeginn', 'Lehrerurteile auf Studien-

Lehrerurteile im Klassenkontext 79

beginn' und 'Kontextvariablen auf Lehrerurteile' ein Reflected-Glory-Effekt im Sinne positiv signifikanter Effekte der Kontextmerkmale Intelligenz und Durchschnittsnote auf den Zeit-punkt des individuellen Studienbeginns bestehen könnte – bei gleichbleibend signifikantem Reflected-Glory-Effekt im Querschnitt auf die Lehrerurteile. Ein theoretisches Problem einer derartig „synchronen“ Betrachtung der Kontexteffekte ergibt sich allerdings aus den unter-schiedlichen zu Grunde liegenden sozialen Mechanismen: Während die Argumentation in der hier geleisteten Querschnittsuntersuchung auf eine spezifische Form des Halo-Effekts zielte, ist bei der potentiellen Längsschnittwirksamkeit von RGE wie in der ursprünglichen Fassung von Marsh et al. (2000) wieder auf ein verändertes Selbstkonzept als Brückenvariable zu ver-weisen. In zukünftigen Untersuchungen sollten beide Mechanismen analytisch klarer vonei-nander getrennt, und – wenn möglich – durch Proxyvariablen zu operationalisieren versucht werden. Bleiben dabei die Effekte auch im Längsschnitt bestehen, könnte schließlich unter-sucht werden, wie weit sich derartige Referenzgruppeneffekte auf den weiteren Bildungsver-lauf wie den Studienerfolg, die Studiennote oder gar das Berufsprestige der ehemaligen Gymnasiasten auswirken.

Lehrerurteile im Klassenkontext 80

Literatur

Amthauer, Rudolf, 1953: Intelligenz-Struktur-Test (2. erw. Auflage). Göttingen: Hogrefe.

Arnold, Karl-Heinz, Wilfried Bos, Peggy Kichert & Tobias C. Stubbe, 2007: Schullaufbahn-präferenzen am Ende der vierten Klassenstufe. S. 271-297 in: Bos, Wilfried, Sabine Hornberg, Karl-Heinz Arnold, Gabriele Faust, Lilian Fried, Eva-Maria Lankes, Knut Schwippert & Renate Valtin (Hg.), IGLU 2006. Lesekompetenzen von Grundschulkin-dern in Deutschland im internationalen Vergleich. Münster u.a.: Wachsmann.

Baumert, Jürgen, Martin Brunner, Oliver Lüdtke & Ulrich Trautwein, 2007: Was messen internationale Schulleistungsstudien? – Resultate kumulativer Wissenserwerbsprozesse. Eine Antwort auf Heiner Rindermann. Psychologische Rundschau 58: S. 118–128.

Becker, Dominik, 2009a: Referenzgruppeneffekte als Determinaten des Bildungserfolgs. Ein Mehrebenen-Pfadmodell auf Basis des Kölner Gymnasiasten-Panels 1969/70, 1985 und 1997. Vortrag gehalten am 29.09.2009 auf der 73. Tagung der Arbeitsgruppe für empiri-sche pädagogische Forschung (AEPF) in Bochum.

Becker, Dominik & Klaus Birkelbach, 2009: Teacher evaluations and the definition of the social situation in the classroom. Arbeitspapier Nr. 3 der Projektgruppe „Lehrerurteile im Lebensverlauf“. Essen. Universität Duisburg-Essen.

Becker, Rolf, 2000: Klassenlage und Bildungsentscheidungen. Eine empirische Anwendung der Wert-Erwartungstheorie. Kölner Zeitschrift für Soziologie und Sozialpsychologie 52: S. 450-474.

Becker, Rolf, 2007: Soziale Ungleichheit von Bildungschancen und Chancengerechtigkeit. S. 157-185 in: Becker, Rolf & Wolfgang Lauterbach (Hg.), Bildung als Privileg? Erklärun-gen und Befunde zu den Ursachen der Bildungsungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften.

Becker, Rolf, 2009b: Entstehung und Reproduktion dauerhafter Bildungsungleichheiten. S. 86-129 in: Becker, Rolf (Hg.), Lehrbuch der Bildungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaften.

Becker, Rolf & Andreas Hadjar, 2009: Meritokratie - Zur gesellschaftlichen Legitimation ungleicher Bildungs-, Erwerbs- und Einkommenschancen S. 35-59 in: Becker, Rolf (Hg.), Lehrbuch der Bildungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaften.

Birkelbach, Klaus, 1998: Berufserfolg und Familiengründung. Lebensläufe zwischen institu-tionellen Bedingungen und individueller Konstruktion. Opladen: Westdeutscher Verlag.

Birkelbach, Klaus, 2009: Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? Zur Veröffentlichung eingereicht bei der Kölner Zeitschrift für So-ziologie und Sozialpsychologie.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000a: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 1: Arbeitsbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000b: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 2: Ergebnisbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Blossfeld, Hans-Peter & Yossi Shavit, 1993: Persisting Barriers. Changes in Educational Op-portunities in Thirteen countries. S. in: Shavit, Yossi & Hans-Peter Blossfeld (Hg.), Per-sistent Inequality. Changing Educational Attainment in Thirteen Countries. Boulder: Westview Press.

Lehrerurteile im Klassenkontext 81

Bos, Wilfried & Marcus Pietsch, 2004: Erste Ergebnisse aus KESS 4. Kurzbericht. Hamburg. Freie und Hansestadt Hamburg (http://www.li-hamburg.de/fix/files/doc/kurzbericht.pdf).

Bos, Wilfried, Andreas Voss, Eva-Maria Lankes, Knut Schwippert, Jürgen Thiel & Renate Valtin, 2004: Schullaufbahnempfehlungen von Lehrkräften für Kinder am Ende der vier-ten Jahrgangsstufe. S. 191-228 in: Bos, Wilfried, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin & Gerd Walther (Hg.), IGLU. Einige Länder der Bundes-republik Deutschland im nationalen und internationalen Vergleich. Münster u.a.: Wach-smann.

Boudon, Raymond, 1974: Education, opportunity, and social inequality: Changing prospects in Western Society. New York: Wiley.

Bourdieu, Pierre, 1987: Die feinen Unterschiede. Kritik der gesellschaftlichen Urteilskraft. Frankfurt/Main: Suhrkamp.

Bourdieu, Pierre & Jean-Pierre Passeron, 1971: Die Illusion der Chancengleichheit. Unter-suchungen zur Soziologie des Bildungswesens am Beispiel Frankreichs. Heilbronn: Klett.

Brattesani, Karen A., Rhona S. Weinstein & Marshall Hermine H, 1984: Student Perceptions of Differential Teacher Treatment as Moderators of Teacher Expectation Effects. Journal of Educational Psychology 76: S. 236-247.

Breen, Richard & John H. Goldthorpe, 1997: Explaining Educational Differentials. Towards a Formal Rational Action Theory. Rationality and Society 9: S. 275-305.

Breslow, N. E. & D. G. Clayton, 1993: Approximate Inference in Generalized Linear Mixed Models. Journal of the American Statistical Association 88: S. 9-25.

Brophy, Jere E. & Thomas L. Good, 1974: Teacher - Student Relationships. Causes and Con-sequences. New York u.a.: Holt, Rhinehart and Winston.

Bryk, Anthony S. & Stephen W. Raudenbush, 1992: Hierarchical Linear Modell. Applications and Data Analysis Methods. Thousand Oaks, CA: Sage.

Chanal, Julien P., Herbert W. Marsh, Philippe G. Sarrazin & Julien E. Bois, 2005: Big-Fish-Little-Pond Effects on Gymnastics Self-concept: Social Comparison Processes in a Physi-cal Setting. Journal of Sport and Exercise Psychology 27: S. 53-70.

Coleman, James S., 1990: Foundations of social theory. Cambridge /Mass.: Harvard Universi-ty Press.

Dai, David Yun & Anne N. Rinn, 2008: The Big-Fish-Little-Pond Effect: What Do We Know and Where Do We Go from Here? Educational Psychological Review 20: S. 283–317.

Dalbert, Claudia & Joachim Stöber, 2008: Forschung zur Schülerpersönlichkeit. S. 905-925 in: Helsper, Werner & Jeanette Böhme (Hg.), Handbuch der Schulforschung (2., durchge-sehene und erweiterte Auflage). Wiesbaden: VS Verlag für Sozialforschung.

Ditton, Hartmut & Jan Krüsken, 2006: Der Übergang von der Grundschule in die Sekundar-stufe I. Zeitschrift für Erziehungswissenschaft 9: S. 348-372.

Erbring, Lutz & Alice A. Young, 1979: Individuals and Social Structure: Contextual Effects as Endogenous Feedback. Sociological Methods & Research 7: S. 396-430.

Erikson, Robert, John H. Goldthorpe, Michelle Jackson, Meir Yaish & D. R. Cox, 2005: On class differentials in educational attainment. Proceedings of the National Academy of Sciences of the USA (PNAS) 102: S. 9730–9733.

Esser, Hartmut, 1999: Soziologie. Spezielle Grundlagen. Band 1: Situationslogik und Han-deln. Frankfurt/Main und New York: Campus.

Fickermann, Detlef, 1999: Grundschulzeugnis und Schulformwahlverhalten. Untersuchungen zur Leistungsselektivität beim Übergang in die Sekundarstufe I. S. 113-155 in: Weis-

Lehrerurteile im Klassenkontext 82

haupt, Horst (Hg.), Zum Übergang auf weiterführende Schulen. Statistische Analysen und Fallstudien. Erfurt: Pädagogische Hochschule.

Geißler, Rainer, 2006: Die Sozialstruktur Deutschlands. Zur gesellschaftlichen Entwicklung mit einer Bilanz zur Vereinigung (4., überarbeitete und aktualisierte Auflage). Wiesba-den: VS Verlag für Sozialwissenschaften.

Goldstein, Harvey, 1995: Multilevel statistical models. London: Arnold.

Goldthorpe, John H., 1996: Class Analysis and the reorientation of class theory: the case of persisting differentials in educational attainment. British Journal of Sociology 47: S. 481-505.

Good, Thomas L. & Jere E. Brophy, 2003: Looking in Classrooms. New York u.a.: Pearson Education.

Heid, Helmut, 2003: Eliteförderung oder Chancengleichheit im Bildungswesen? . S. 35-50 in: Bolder, Axel & Andreas Witzel (Hg.), Berufsbiographien. Beiträge zur Theorie und Empi-rie ihrer Bedingungen, Genese und Gestaltung. Opladen: Leske+Budrich.

Hillmert, Steffen, 2007: Soziale Ungleichheit im Bildungsverlauf: zum Verhältnis von Bil-dungsinstitutionen und Entscheidungen. S. 72-98 in: Becker, Rolf & Wolfgang Lauter-bach (Hg.), Bildung als Privileg? Erklärungen und Befunde zu den Ursachen der Bil-dungsungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften.

Hox, Joop, 2002: Multilevel-Analysis: Techniques and Applications. Mahwah, NJ: Lawrence Erlbaum.

Ingenkamp, Karlheinz, 1968: Untersuchungen zur Übergangsauslese (Theorie und Praxis der Schulpsychologie, Band VIII). Weinheim und Berlin: Beltz.

Ingenkamp, Karlheinz (Hg.), 1971: Die Fragwürdigkeit der Zensurengebung. Weinheim und Basel: Beltz.

Ingenkamp, Karlheinz, 1977: Einige Ergebnisse einer Untersuchung zur Übergangsauslese. S. 66-84 in: Ingenkamp, Karlheinz (Hg.), Schüler und Lehrerbeurteilung. Empirische Unter-suchungen zur pädagogischen Diagnostik. . Weinheim und Basel: Beltz.

Ingenkamp, Karlheinz, 1989: Diagnostik in der Schule. Beiträge zu Schlüsselfragen der Schü-lerbeurteilung. Weinheim: Beltz.

Ingenkamp, Karlheinz, 1990: Geschichte der pädagogischen Diagnostik in Deutschland on 1885-1933. Weinheim.

Ingenkamp, Karlheinz, 1993: Der Prognosewert von Zensuren, Lehrergutachten, Aufnahme-prüfungen und Tests während der Grundschulzeit für den Sekundarschulerfolg. S. 68-85 in: Olechowski, richard & Elisabeth Persy (Hg.), Frühe schulische Auslese. Weinheim und Basel: Beltz.

Jussim, Lee & Kent D. Harber, 2005: Teacher Expectations and Self-Fulfilling Prophecies: Knowns and Unknowns, Resolved and Unresolved Controversies. Personality & Social Psychology Review 9: S. 131-155.

Klafki, Wolfgang, 1994: Sinn und Unsinn des Leistungsprinzips in der Erziehung. . S. in: Klafki, Wolfgang (Hg.), Neue Studien zur Bildungstheorie und Didaktik. Zeitgemäße All-gemeinbildung und kritisch-konstruktive Diadaktik. . Weinheim: Beltz.

Klauer, Karl Josef, 1989: Zensierungsmodelle und ihre Konsequenzen für die Notengebung. S. in: Jäger, Reinhold S., Ralf Horn & Karlheinz Ingenkamp (Hg.), Tests und Trends 7. Jahrbuch der pädagogischen Diagnostik. . Weinheim: Beltz.

Köller, Olaf, Jürgen Baumert & Kai U. Schnabel, 1999: Wege zur Hochschulreife. Offenheit des Systems und Sicherung vergleichbarer Standards. Zeitschrift für Erziehungswissen-schaft 2: S. 385-422.

Lehrerurteile im Klassenkontext 83

Kreft, Ita G. G., Jan de Leeuw & Leona S. Aiken, 1995: The Effect of Different Forms of Cen-tering in Hierarchical Linear Models. Multivariate Behavioral Research 30: S. 1-21.

Kristen, Cornelia, 2006: Ethnische Diskriminierung in der Grundschule? Die Vergabe von Noten und Bildungsempfehlungen. Kölner Zeitschrift für Soziologie und Sozialpsycholo-gie 58: S. 79-97.

Langer, Wolfgang, 2004: Mehrebenenanalyse : Eine Einführung für Forschung und Praxis. Wiesbaden VS Verlag für Sozialwissenschaften.

Lehmann, Rainer H., Rainer Peek & Rüdiger Gänsfuß, 1997: LAU 5 - Aspekte der Lernaus-gangslage und der Lernentwicklung von Schülerinnen und Schülern, die im Schuljahr 1996/97 eine fünfte Klasse an Hamburger Schulen besuchten. Bericht über die Erhebung im September 1996. Hamburg.

Maas, Cora J. & Joop Hox, 2005: Sufficient sample sizes for multilevel modeling. Methodology 1: S. 86-92.

Maaz, Kai, Cornelia Hausen, Nele McElvany & Jürgen Baumert, 2006: Stichwort: Übergän-ge im Bildungssystem. Theoretische Konzepte und ihre Anwendung in der empirischen Forschung beim Übergang in die Sekundarstufe. Zeitschrift für Erziehungswissenschaft 9: S. 299-327.

Marsh, Herbert W., 1987: The big-fish-little-pond effect on academic self-concept. Journal of Educational Psychology 79: S. 280-295.

Marsh, Herbert W. & John W. Parker, 1984: Determinants of student self-concept: Is it better to be a relatively large fish in a small pond even if you don't learn to swim as well? Jour-nal of Personality & Social Psychology 47: S. 213-231.

Marsh, Herbert W. & Kit-Tai Hau, 2003: Big-fish-little-pond effect on academic self-concept. A cross-cultural (26-country) test of the negative effects of academically selective schools. American Psychologist 58: S. 364-376.

Marsh, Herbert W., Chit-Kwong Kong & Kit-Tai Hau, 2000: Longitudinal Multilevel Models of the Big-Fish-Little-Pond Effect on Academic Self-Concept: Counterbalancing Contrast and Reflected-Glory Effects in Hong Kong Schools. Journal of Personality & Social Psy-chology 78: S. 337-349.

Marsh, Herbert W., Ulrich Trautwein, Oliver Lüdtke, Olaf Köller & Jürgen Baumert, 2005: Academic Self-Concept, Interest, Grades, and Standardized Test Scores: Reciprocal Ef-fects Models of Causal Ordering. Child Development 76: S. 397-416.

Marsh, Herbert W., Ulrich Trautwein, Oliver Lüdtke, Jürgen Baumert & Olaf Köller, 2007: The Big-Fish-Little-Pond Effect: Persistent Negative Effects of Selective High Schools on Self-Concept After Graduation. American Educational Research Journal 44: S. 631 –669.

Marsh, Herbert W., Marjorie Seaton, Ulrich Trautwein, Oliver Lüdtke, K. T. Hau, Alison J. O’Mara & Rhonda G. Craven, 2008: The Big-fish–little-pond-effect Stands Up to Critical Scrutiny: Implications for Theory, Methodology, and Future Research. Educational Psy-chological Review 20: S. 319-350.

McClelland, David C., 1967: The Achieving Society. New York: Free Press.

Merton, Robert K., 1948: The Self-Fulfilling Prophecy. The Antioch Review 8: S. 193-210.

Meulemann, Heiner, 1979: Soziale Herkunft und Schullaufbahn. Arbeitsbuch zur sozialwis-senschaftlichen Methodenlehre. Frankfurt/New York: Campus.

Meulemann, Heiner, 1990: Schullaufbahnen, Ausbildungskarrieren und die Folgen im Le-bensverlauf. Der Beitrag der Lebensverlaufsforschung zur Bildungssoziologie. S. 89-117 in: Mayer, Karl Ulrich (Hg.), Lebensverläufe und sozialer Wandel. Sonderheft 31/1990 der KZfSS. Opladen: Westdeutscher Verlag.

Lehrerurteile im Klassenkontext 84

Meulemann, Heiner, 1995: Die Geschichte einer Jugend. Lebenserfolg und Erfolgsdeutung ehemaliger Gymnasiasten zwischen dem 15. und 30. Lebensjahr. Opladen: Westdeutscher Verlag.

Meulemann, Heiner, 1999: Stichwort: Lebenslauf, Biografie und Bildung. . Zeitschrift für Erziehungswissenschaft 2: S. 305-324.

Meulemann, Heiner, Klaus Birkelbach & Jörg Otto Hellwig (Hg.), 2001: Ankunft im Erwach-senenleben. Lebenserfolg und Erfolgsdeutung in einer Kohorte ehemaliger Gymnasiasten zwischen 16 und 43. Opladen: Leske+Budrich.

Meulemann, Heiner, Hans-Joachim Hummel, Maria Wieken-Mayser, Wilhelm Wiese & Rolf Ziegler (Hg.), 1987: Lebensplanung und Lebenserfolg in privilegierten Lebensläufen. Ab-schlußbericht eines DFG-Projektes. Köln: Zentralarchiv für empirische Sozialforschung Universität zu Köln.

Müller-Benedict, Volker, 2007a: Wodurch kann die soziale Ungleichheit des Schulerfolgs am stärksten verringert werden? Kölner Zeitschrift für Soziologie und Sozialpsychologie 59: S. 615–639.

Müller-Benedict, Volker, 2007b: Intendierte und nicht intendierte Folgen von Bildungspolitik - eine Simulationsstudie über die sozialstrukturellen Grenzen politischer Einflussnahme. S. 393-427 in: Becker, Rolf & Wolfgang Lauterbach (Hg.), Bildung als Privileg? Erklä-rungen und Befunde zu den Ursachen der Bildungsungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften.

Muthén, Bengt O. & Albert Satorra, 1995: Complex sample data in in structural equation modeling. Sociological Methodology 23: S. 267-316.

Opp, Karl-Dieter, 2002: Methodologie der Sozialwissenschaften. Wiesbaden: VS Verlag für Sozialwissenschaften.

Paulus, Christoph & Petra Lauermann, 2004: Schulische Übergangsentscheidung mittels Lernfähigkeitsdiagnose. Arbeitsberichte aus der Fachrichtung Erziehungswissenschaft der Universität des Saarlandes. Saarbrücken. Universität des Saarlandes.

Raudenbush, Stephen W., 1984: Magnitude of Teacher Expectancy Effects on Pupil IQ as a Function of the Credibility of Expectancy Induction: A Synthesis of Findings From 18 Experiments. Journal of Educational Psychology 76: S. 85-97.

Rauh, Hellgard, 1977: Schulleistungen und Übertrittsempfehlungen am Ende des 4. Schuljah-res in ihrer Beziehung zur Entwicklung während der Grundschulzeit - Empirische Längs-schnittanalyse eines komplexen Begabungsurteils. S. 14-64 in: Ingenkamp, Karlheinz (Hg.), Schüler und Lehrerbeurteilung. Empirische Untersuchungen zur pädagogischen Diagnostik. Weinheim und Basel: Beltz.

Rindermann, Heiner & Kurt A. Heller, 2005: The Benefit of Gifted Classes and Talent Schools for Developing Students’ Competences and Enhancing Academic Self-Concept. Zeitschrift für Pädagogische Psychologie 19: S. 133–136.

Robinson, William S. , 1950: Ecological Correlations and the Behavior of Individuals. Ameri-can Sociological Review 15: S. 351-357.

Rosenthal, Robert & Leonore Jacobson, 1968: Pygmalion in the Classroom: Teacher expecta-tion and pupils' intellectual development. New York: Holt, Rinehart & Winston.

Sauer, Joachim & Erich Gamsjäger, 1986: Ist Schulerfolg vorhersagbar? Die Determinanten der Grundschulleistung und ihr prognostischer Wert für den Sekundarschulerfolg. Göttin-gen: Hogrefe.

Schelsky, Helmut, 1957: Schule und Erziehung in der industriellen Gesellschaft. Würzburg: Werkbund.

Lehrerurteile im Klassenkontext 85

Schrader, Friedrich-Wilhelm & Andreas Helmke, 2001: Alltägliche Leistungsbeurteilung durch Lehrer. S. 45-58 in: Weinert, Franz E. (Hg.), Leistungsmessungen in Schulen. Weinheim und Basel: Beltz

Schumpeter, Joseph, 1970: Das Wesen und der Hauptinhalt der der theoretischen National-ökonomie. Berlin: Duncker & Humblot.

Smith, Mary Lee, 1980: Meta-analysis of research in teacher expectation. Evaluation in Edu-cation 4: S. 53-56.

Snijders, Tom A.B. & Roel J. Bosker, 2004: Multilevel analysis: An introduction to basic and advanced multilevel modeling. London et. al: Sage.

Stocké, Volker, 2007: Explaining Educational Decisions and Effects of Families' Social Class Position: An Empirical Test of the Breen-Goldthorpe Model of Educational Attainment. European Sociological Review 23: S. 505-519.

Tent, Lothar, 2001: Zensuren. S. 580-584 in: Rost, Detlef H. (Hg.), Handwörterbuch Pädago-gische Psychologie (2. Auflage). Weinheim: Beltz/PVU.

Thorndike, Edward L., 1920: A Constant Error on Psychological Rating. Journal of Applied Psychology IV: S. 25-29.

Trautwein, Ulrich & Oliver Lüdtke, 2005: The Big-Fish-Little-Pond Effect. Future Research Questions and Educational Implications. Zeitschrift für Pädagogische Psychologie 19: S. 137-140.

Trautwein, Ulrich, Oliver Lüdtke, Michael Becker, Marko Neumann & Gabriel Nagy, 2008: Die Sekundarstufe I im Spiegel der empirischen Bildungsforschung: Schulleistungsent-wicklung, Kompetenzniveaus und die Aussagekraft von Schulnoten. S. 91-107 in: Schlemmer, Elisabeth & Herbert Gerstberger (Hg.), Ausbildungsfähigkeit im Spannungs-feld zwischen Wissenschaft, Politik und Praxis. Wiesbaden: VS Verlag für Sozialwissen-schaften.

Weinert, Franz E. (Hg.), 2001: Leistungsmessungen in Schulen. Weinheim und Basel: Beltz

Ziegenspeck, Jörg W., 1999: Handbuch Zensur und Zeugnis in der Schule. Historischer Rück-blick, allgemeine Problematik, empirische Befunde und bildungspolitische Implikationen. Bad Heilbrunn: Verlag Julius Klinkhardt.

 

Klaus Birkelbach Universität Duisburg-Essen (Campus Essen) Fachbereich Bildungswissenschaften Berliner Platz 6-8 (C14.13) 45117 Essen Telefon: 0201 183-4506 E-Mail: [email protected]

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy?

Teacher Evaluations over the Life Course: Valid Prognosis or Self-Fulfilling Prophecy?

Essen

2009

Im Begutachtungsprozess bei der Kölner Zeitschrift für Soziologie und Sozialpsychologie

Zusammenfassung:

Im Längsschnitt einer Kohorte ehemaliger Gymnasiasten zwischen dem 15. und 43. Lebensjahr wird gezeigt, dass Lehrerurteile mit prognostischem Anspruch vermittelt über die Erfolgserwartungen der Schüler deren Entscheidungen bezüglich ihres weiteren Bildungsverlaufs zu beeinflussen vermögen und dadurch zu einer Self-Fulfilling Prophecy im Sinne Mertons (1948) werden können. Ursprünglich unzutreffende Lehrerurteile können durch die Pfadabhängigkeit und Kumulativität des Ausbildungs- und Berufsverlaufes indirekt noch das Berufsprestige im 43. Lebensjahr beeinflussen. Die hier vorleg-ten Analysen belegen zugleich, wie sich die Längsschnittperspektive der Lebensverlaufsforschung fruchtbar mit der handlungstheoretischen Perspektive einer Wert-Erwartungstheorie verknüpfen lässt.

Abstract:

In a longitudinal study of former German high school students between age 15 and 43 it is shown that teachers' evaluations with prognostic claims may influence the students' educational decisions by shaping their success expectations. Thus initially false teacher evaluations may work like a self-fulfilling prophecy in the sense of Merton (1948). Because of the path dependency and cumulativity of educational and occupational career processes they still affect the occupational prestige at the age of 43 indirectly. Finally, the following analyses offer prospects in terms of fruitfully connecting the lon-gitudinal perspective of life course research to the action-theoretical perspective of a theory of subjec-tive expected utility.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 88 

 

1 Einleitung

Wenn die Schule die „erste und damit entscheidende zentrale Dirigierungsstelle für die künf-tige soziale Sicherheit, für den künftigen sozialen Rang und für das Ausmaß künftiger Kon-summöglichkeiten“ ist, wie es Helmut Schelsky (1957, 18) schon Mitte der 50er Jahre formu-liert hat, dann wird die herausragende Rolle schulischer Beurteilungen im Prozess gesell-schaftlicher Statuszuweisung deutlich. Normative Grundlage der „Auslese-, Rangierungs- und Berechtigungsfunktion“ (Ziegenspeck 1999, 111) der Schule ist der Wert Leistung, verbunden mit der Forderung nach Chancengerechtigkeit. Nur wenn die Schule ihre Selektions- und Allokationsfunktionen auf der Basis inter-individueller Leistungsunterschiede, also nach me-ritokratischen Prinzipien wahrnimmt, erscheint die resultierende Ungleichheit vor dem Hin-tergrund eines normativen Modells von Leistungsgerechtigkeit legitim (z.B. Allmendinger / Aisenbrey 2002, 42f; Hillmert 2004, 77f; Hadjar 2008; Hadjar / Becker 2009). Einen kriti-schen Punkt stellt in diesem Zusammenhang die Bewertung der Leistungen durch die Lehrer dar, die als Schulnoten, Zeugnisse, Abschlüsse und generalisierende Beurteilungen mit prog-nostischem Anspruch, wie die Übergangsempfehlungen am Ende der Grundschulzeit, die Ba-sis für diesen Allokations- und Selektionsprozess bilden (vgl. z.B. Avenarius et al. 2003, 153ff) und damit eine zentrale Weichenstellfunktion für den weiteren Lebensverlauf haben.

Aufgrund der Pfadabhängigkeit des Lebensverlaufs haben frühe Weichenstellungen weitrei-chende Folgen. Der Lebensverlauf ist auf der Ebene individueller Akteure als endogener Kau-salzusammenhang zu verstehen (Mayer 1990; 2004), bei dem die subjektiv und objektiv ver-fügbaren Handlungs- und Entscheidungsspielräume durch den bisherigen Lebensverlauf er-weitert oder eingeschränkt werden. Dies gilt in ganz besonderem Maße für den Ausbildungs- und Berufsverlauf, wo die institutionell vorgegebene Struktur des Bildungswesens eine Folge von Übergängen erzwingt, deren Richtung auf der Mikroebene individueller Akteure über die beruflichen Möglichkeiten, die Erreichbarkeit von sozialem Status, Prestige und materiellen Lebenschancen bestimmt und auf der Makroebene die Strukturen sozialer Ungleichheit prägt. Die Übergänge und die Richtung der möglichen Sequenzen wird durch das institutionelle Ge-füge des Bildungswesens vorgegeben, so dass individuelle Bildungsverläufe – und damit Le-bensverläufe insgesamt – maßgeblich durch staatliche Institutionen vorgeprägt werden (Mayer / Müller 1989; Mayer 1990, 2004). An jedem Übergang sind im Rahmen der instituti-onellen Vorgaben Entscheidungen über den weiteren Weg zu treffen. Ein wichtiges Element der Vorgaben, die die Entscheidungs- und Handlungsräume der Betroffenen (bzw. der Eltern als deren Vertreter) je nach spezifischem Übergang in unterschiedlichem Maße beschränken (Hillmert 2004), stellen institutionell verankerte Akteure dar, die, wie z.B. Lehrer, Empfeh-lungen aussprechen und ggfs. auch Entscheidungen bezüglich des jeweiligen Übergangs tref-fen und somit als „Gatekeeper“ (Heinz 1996, 59) fungieren.

In dem vorliegenden Beitrag sollen die Zusammenhänge zwischen einer Einschätzung der Eignung für ein späteres Studium durch die Klassenlehrer im 10. Schuljahr und den Erfolgen im Ausbildungs- und Berufsverlauf im Längsschnitt einer Kohorte ehemaliger Gymnasiasten zwischen dem 15. und dem 43. Lebensjahr untersucht werden. Dabei wird eine Forderung Robert M. Hausers (2002, 56) nach Untersuchungen der langfristigen Konsequenzen spezifi-scher Übergangskriterien für den weiteren Lebensverlauf der Betroffenen aufgegriffen. Es wird der Frage nachgegangen, inwieweit ein mehr als drei Jahre vor dem Abschluss des Gymnasiums abgegebenes qualitatives Lehrerurteil über die Studieneignung mit den Ent-scheidungen auf dem Weg in ein Studium, dem Studienerfolg und dem beruflichen Erfolg

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 89 

 

zusammenhängt. Die hier untersuchten qualitativen Lehrerurteile sind nicht unmittelbar mit Übergangs- oder Zugangsberechtigung verknüpft; es handelt sich im Grunde zunächst nur um eine Prognose des Klassenlehrers bezüglich der Eignung seiner Schüler für ein Studium, man könnte auch sagen: eine Einstellung gegenüber der Leistungsfähigkeit der einzelnen Schüle-rinnen und Schüler, die auf einem ganzen Bündel unterschiedlicher Beobachtungen und Er-wartungen der Lehrer beruhen mag (Brophy / Good 1974, 32ff), aber sich aufgrund des meri-tokratischen Anspruchs der Institution Schule primär an den Kriterien Leistung und Leis-tungsfähigkeit orientieren sollte.

Wenn sich im weiteren Lebensverlauf Zusammenhänge mit diesem Urteil zeigen, dann scheint dies zunächst ein Indiz der Qualität des Lehrerurteils zu sein und für dessen Validität zu sprechen. Die Validität dieses Lehrerteils ist aber eine empirisch zu beantwortende Frage, die nicht allein am Kriterium des Eintreffens der Prognose überprüft (predictive validity) werden kann, sondern auch an konkurrierenden Kriterien (concurrent validity), wie der im Rahmen eines Intelligenztests erhobenen kognitiven Leistungsfähigkeit. Fällt beides ausein-ander, bestehen also entsprechende Zusammenhänge zwischen dem Urteil und den Ereignis-sen im weiteren Ausbildungs- und Berufsverlauf, obwohl Lehrerurteil und die im Rahmen eines Tests nachgewiesene kognitive Leitungsfähigkeit des Schülers nicht übereinstimmen, dann ist das ein Hinweis auf Mechanismen, wie sie Merton (1948) in seinem vielzitierten Ar-tikel zur Self-Fulfilling Prophecy herausgearbeitet hat.

Im Folgenden wird zunächst ein kurzer Überblick über Untersuchungen zur Güte von Lehrer-urteilen in Form von Schulnoten und Übergangsempfehlungen gegeben und Ergebnisse von Studien zur längerfristigen prognostischen Validität von Lehrerurteilen vorgestellt. Im An-schluss daran wird das Problem einer Unterscheidung zwischen einer validen Prognose von Lehrerurteilen und einer Self-Fulfilling Prophecy aufgegriffen und diskutiert, wie invalide Urteile als Self-Fulfilling Prophecy den Lebensverlauf in die prognostizierte Richtung zu len-ken vermögen und dadurch das Leitbild eines leistungsbezogenen Statuszuweisungsprozesses verletzen. Dabei wird eine Erklärung vorgeschlagen, die sich an Essers Modell einer soziolo-gischen Erklärung (u.a. 1993; 1999-2001; 2006) und die Übertragung dieses Modells durch Huinink und Schröder (2008) auf das Lebensverlaufsparadigma anlehnt. Zur empirischen Überprüfung der These, dass Lehrerurteile auch als Self-Fulfilling Prophecy den weiteren Lebensverlauf zu beeinflussen vermögen, wird anschließend ein einfaches Modell entwickelt, bei dem die Lehrerurteile der kognitiven Leistungsfähigkeit der Schüler gegenüber gestellt und in multivariaten Regressionsmodellen die Einflüsse auf den Eintritt in ein Studium, den Studienabschluss und den beruflichen Erfolg im 43. Lebensjahr untersucht werden.

2 Untersuchungen zu Lehrerurteilen

2.1 Schulnoten und Lehrerempfehlungen beim Übergang in die Sekundar-stufe

Was Schulnoten wirklich messen, wird spätestens seit dem von Ingenkamp (1971) herausge-gebenen Reader „Die Fragwürdigkeit der Zensurengebung“ kritisch betrachtet (z.B. Ziegens-peck 1999; Tent 2001; Trautwein et al. 2008). Eine Vielzahl von Untersuchungen zeigt, dass Lehrer sich bei der Zensurengebung an einem klasseninternen Bezugssystem orientieren (In-genkamp 1971, 156-163; 1989; Ziegenspeck 1999, 142f; Schrader / Helmke 2001, 50). Darü-ber hinaus werden klassenstufen-, schulform- und länderspezifische Unterschiede in der Be-notungspraxis berichtet (Ziegenspeck 1999, 143f). In verschiedenen Untersuchungen konnten

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 90 

 

schicht- und geschlechtsspezifische (zusammenfassend: Ziegenspeck 1999, 209-238) sowie bei den einzelnen Lehrern liegende subjektive Unterschiede der Bewertungsmaßstäbe nach-gewiesen werden (Ingenkamp 1971, 57-148; Ziegenspeck 1999, 173-206). Die Folge ist, dass Schüler der gleichen Schulform und Klassenstufe für objektiv gleiche Leistungen unterschied-lich bewertet werden.

Ähnlich fragwürdig wie Schulnoten, die konkrete Leistungen bewerten, erscheinen auch Leh-rerurteile, die auf der Basis der Einschätzung von Leistungen der Schüler und deren Leis-tungsvermögen eine Prognose zukünftiger Erfolge im Bildungswesen beinhalten. Das gilt insbesondere für die Lehrerempfehlungen am Ende der Grundschule zur Schulformwahl. Ak-tuelle Studien zeigen, dass die Lehrerempfehlungen von Kompetenzen, die davon unabhängig in Tests ermittelt wurden, zumindest teilweise entkoppelt sind (z.B. Lehmann et al. 1997; Bos et al. 2004a; Bos / Pietsch 2004). Zwar unterscheidet sich die durchschnittliche Höhe der ge-messenen Kompetenzen zwischen den Kindern mit Hauptschul-, Realschul- und Gymnasial-empfehlung erwartungsgemäß, aber es existiert ein breiter Bereich mit fast der Hälfte der Schüler, wo jede Empfehlung möglich ist (Bos et al. 2004b, 197). Zugleich werden enge Zu-sammenhänge zwischen den Übergangsempfehlungen und der sozialen Herkunft der Schüler nachgewiesen (vgl. Ditton / Krüsken 2006). Bei der Beurteilung von Schülerinnen und Schü-lern und den darauf basierenden Schullaufbahnempfehlungen orientieren sich Lehrer in star-kem Maße an den Schulnoten (Bos et al. 2004b, 204-210; Kristen 2006). Wenn Schulnoten die zentrale Basis für derartige Beurteilungen mit einem in die Zukunft weisenden prognosti-schen Anspruch darstellen, dann sind solche Beurteilungen auch mit den gleichen Problemen wie die Noten behaftet.

Die Vergleichbarkeit der Noten wird zu einem Gerechtigkeits- und Allokationsproblem, wo mit den Noten soziale Selektionen und individuelle Berechtigungen verknüpft sind, d.h. an den verschiedenen Übergängen im Bildungsverlauf. Dazu gehören die Versetzung in die nächste Klasse oder Jahrgangsstufe, der Übergang von der Grundschule in die Sekundarstufe, die Aufnahme einer Berufsausbildung bzw. eines Studiums und der Berufseintritt. All diese Übergänge gelten als von den Leistungen der Schüler bzw. Studierenden abhängig, genau genommen aber hängen sie von den Bewertungen durch die Lehrer ab. Fragen mangelnder Gerechtigkeit und möglicher Fehlallokationen an den verschiedenen Übergängen werden in einer Reihe von Untersuchungen immer wieder behandelt (z.B.: Ingenkamp 1968, 1971; Rauh 1977; Köller et al. 1999; Baumert et al. 2003; Ditton / Krüsken 2006).

2.2 Längerfristige Prognosen Untersuchungen, die sich mit der tatsächlichen prognostischen Validität von Lehrerurteilen bezogen auf den weiteren Bildungsverlauf befassen, sind vergleichsweise selten. Einen Über-blick über verschiedene Studien zur prognostischen Validität von Grundschulnoten sowie verschiedener Varianten von Eignungsurteilen und Lehrerempfehlungen geben Sauer und Gamsjäger (1986, 143) und kommen zu dem Ergebnis, dass dabei nur geringe Zusammen-hänge der Grundschulnoten mit dem Erfolg in der Sekundarstufe I gefunden wurden.

Der Übergang von der Grundschule ist nur die erste, wenn auch besonders bedeutsame Wei-chenstellung im Ausbildungs- und Berufsverlauf. Weitere folgen in der durch die Struktur des Bildungswesens und dessen Allokations- und Selektionsfunktionen geprägten Bildungsbio-graphie der Individuen. So dienen die Schulzeugnisse der Bewerber Arbeitgebern als ein wichtiges Kriterium der Auswahl von Lehrstellenbewerbern. Mit dem Abitur wird die allge-meine Hochschulreife bescheinigt, also eine Prognose über die Studierfähigkeit gegeben und

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 91 

 

der Notendurchschnitt wird mehr und mehr zum zentralen Kriterium der Studienzulassung. Aber sind gute Schulzeugnisse tatsächlich valide Prädiktoren für den Erfolg im folgenden Ausbildungsabschnitt? Schuler (1998) gibt einen Überblick über verschiedene Studien, in denen die prognostische Validität von Schulnoten für den Erfolg in Ausbildung, Studium oder Beruf untersucht wurde. Dabei kann er für die Kriterien Erfolg in der Berufsausbildung und im Studium auf deutsche Studien zurückgreifen, während er Zusammenhänge zwischen Schulnoten und Berufserfolg fast nur in amerikanischen Studien untersucht findet. Das Bild, das sich beim Vergleich verschiedener Einzelstudien ergibt, ist nicht konsistent. Die berichte-ten Korrelationen zwischen Abitur- und Studiennoten variieren wie die Zusammenhänge zwi-schen Schulnoten und Berufsausbildungserfolg stark (Schuler 1998, 370f). Von Baron-Boldt et al. (1988; 1989) wurden mit Metaanalysen Zusammenhänge zwischen Schulzeugnissen und Ausbildungserfolg sowie zwischen Abiturnoten und Studienerfolg untersucht. Betrachtet man die vielfältige Kritik an Schulnoten, dann werden darin für ältere Untersuchungen erstaunlich hohe Validitätskoeffizienten, aber niedrigere für jüngere Studien ermittelt.

In verschiedenen amerikanischen Studien werden durch eine Kombination von High School Noten und Testergebnissen rund 25 Prozent der Varianz der Durchschnittsnoten im ersten Collegejahr vorhergesagt (Morgan 1989; Robbins et al. 2004, 262). In einer Metaanalyse von 30 Studien können Robbins et al. rund 20 Prozent der Varianz des am College erzielten No-tendurchschnitts durch den Notendurchschnitt der High School erklären. Werden zusätzlich Testergebnisse (ACT/SAT), der sozio-ökonomische Status, Indikatoren für Leistungsmotiva-tion, akademische Zielorientierung und akademische Selbstwirksamkeit in die Gleichung auf-genommen, steigt die erklärte Varianz auf rund 34 Prozent (Robbins et al. 2004, 270-275). Für den Zusammenhang zwischen dem viel spezifischer auf das Studienfach ausgerichteten Ergebnis des Schweizer Eignungstests für das Medizinstudium und den Noten der ersten Vor-prüfung im Medizinstudium werden von (Hänsgen / Spicher 2002, 1658) ähnliche Ergebnisse berichtet (vgl. auch Klieme 1996).

3 Lebensverlaufsparadigma und Wert-Erwartungstheorie

Huinink und Schröder (2008) erweitern das Lebensverlaufsparadigma (Mayer 1990, 2004) auf der Mikroebene individuellen Handelns um Elemente einer Wert-Erwartungstheorie, bei dem die jeweils zu treffenden Entscheidungen dem Ziel der Sicherung und Produktion individuel-ler Wohlfahrt dienen. Dabei wird unterstellt, dass die Akteure effizient zu handeln suchen, also Kosten und Nutzen der Handlungen zur Verwirklichung unterschiedlicher und teilweise konkurrierender Lebensziele in den verschiedenen, hochgradig interdependenten Dimensio-nen des Lebensverlaufes gegeneinander abwägen. Von besonderer Bedeutung für die Be-stimmung des Referenznutzens, an dem die Akteure Kosten und Nutzen alternativer Ent-scheidungen messen, ist neben dem direkten biographischen Nutzen im Sinne einer Steige-rung der individuellen Wohlfahrt und dem Anspruchsniveau an die Zielverwirklichung die subjektive Gewichtung konkurrierender Ziele (Salienz) durch die Akteure sowie die Erwar-tungen, das Ziel auch tatsächlich erreichen zu können.

Ähnliche Modelle werden in der Bildungsforschung zur Erklärung von Bildungsentscheidun-gen schon lange genutzt. Boudon (1974) weist in seinem mikrosoziologischen Modell darauf hin, dass Bildungsentscheidungen in einem Spannungsfeld zwischen den schulischen Leis-tungen der Schülerinnen und Schüler, den spezifischen Gegebenheiten des Bildungssystems mit seinen Selektionsmechanismen und schichtspezifischen Aspirationen, Erwartungen und Bewertungen getroffen werden. Dabei ist zwischen primären Effekten der sozialen Herkunft,

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 92 

 

die aufgrund der unterschiedlichen Ausstattung mit kulturellem, sozialem und ökonomischem Kapital zu einem mit der Herkunftsschicht kovariierenden schulischen Leistungsniveau füh-ren, und einem sekundären Effekt, der sich aus den spezifischen Entscheidungskalkülen un-terschiedlicher sozialer Schichten ergibt, zu unterscheiden. Weiter ausdifferenziert und forma-lisiert wurden diese Überlegungen im Rahmen der Wert-Erwartungstheorie u.a. von Erikson und Jonsson (1996), Breen und Goldthorpe (1997) sowie Esser (1999, 265-297). In Essers Modell lässt sich der subjektiv erwartete Nutzen (SEU) einer Entscheidung zwischen zwei Bildungswegen in einer Funktion des Bildungsertrags (U), der materiellen und immateriellen Bildungskosten (C), sowie des Wertes eines möglichen Statusverlustes (-SV) darstellen. Da-rüber hinaus wird die Funktion durch die Erwartung, dass ein Statusverlust tatsächlich eintritt (c), und durch die Erwartung, dass der Bildungsertrag auch wirklich erzielt werden kann (p), beeinflusst. Eine Entscheidung zugunsten der anspruchsvolleren, weiterführenden Alternative wird umso wahrscheinlicher, je mehr die Bildungsmotivation die Risiken übersteigt, d.h. die Bildungserträge (U) zuzüglich der Wahrscheinlichkeit (c), dass bei Wahl der weniger an-spruchsvollen Alternative der soziale Status (SV) nicht aufrecht erhalten werden kann, höher sind als die Bildungskosten (C), relativiert um die Erwartungen (p), das Ziel der anspruchs-volleren Alternative zu erreichen: U + cSV > C/p. Es ist offensichtlich, dass die konkrete Entscheidung nicht nur durch die jeweilige Bilanzierung des erwarteten Nutzens (einschließ-lich des Motivs des Statuserhalts) und der Kosten, sondern auch in starkem Maße von den Erwartungen, das Ziel erreichen zu können, beeinflusst wird. Je besser die eigenen Erfolgs-chancen eingeschätzt werden, umso geringer fallen die Kosten ins Gewicht.

Das gilt natürlich auch für die Entscheidung ein Studium aufzunehmen. Becker und Hecken (2008) zeigen, dass das zwischen den verschiedenen sozialen Strata variierende Investitionsri-siko maßgeblich dazu beiträgt, Arbeiterkinder von einem Studium in andere Bildungswege umzulenken. Mangels anderer Maßstäbe dürften sich insbesondere Jugendliche aus den unte-ren Schichten an den Einschätzungen ihrer Lehrer zu ihren Aussichten, ein Studium erfolg-reich bewältigen zu können, orientieren. Solche Einschätzungen werden – auch wenn sie den Schülern gegenüber unausgesprochen bleiben – im Schulalltag auf vielfältige Weise kommu-niziert (Brophy / Good 1974; Brattesani et al. 1984; Good / Brophy 2003) und beeinflussen die Selbstwahrnehmung und Erwartungen der Schüler. Die Einschätzungen der Lehrer – ob es sich nun um valide Urteile handelt oder nicht – werden dadurch zum Element der subjektiven Situationsdefinition der Schüler und zum Bestandteil ihres Selbstkonzeptes (Dalbert / Stöber 2008). Während Schulnoten und Abschlüsse die objektiven Übergangsmöglichkeiten der Schüler bestimmen, haben Einstellungen und Erwartungen der Lehrer, indem sie für die Schü-ler zum Element der Situation werden, Einfluss auf die Entscheidungen der Schüler, ihre durch Noten und Abschlüsse eröffneten Möglichkeitsräume auch tatsächlich zu nutzen. Durch diesen Mechanismus kann das Lehrerurteil zur Self-Fulfilling Prophecy werden, die den wei-teren Lebensverlauf beeinflusst.

4 Wie kann die Logik einer möglichen Self-Fulfilling Prophecy durchbrochen werden?

Merton (1948, 195f) fasst seine Überlegungen zur Self-Fulfilling Prophecy folgendermaßen zusammen: “The Self-Fulfilling Prophecy is, in the beginning, a false definition of the situa-tion evoking a new behavior which makes the originally false conception come true. The spe-cious validity of the Self-Fulfilling Prophecy perpetuates a reign of error. For the prophet will

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 93 

 

cite the actual course of events as proof that he was right from the very beginning. ... Such are the perversities of social logic.“

Die Frage, inwieweit Lehrerurteile den weiteren Ausbildungs- und Berufsverlauf und damit letztlich die individuellen Lebenschancen valide prognostizieren können, oder ob sie über die Definition der Situation der Schülerinnen und Schüler deren Entscheidungen beeinflussen und dadurch als Self-Fulfilling Prophecy den Lebensverlauf erst in eine bestimmte Richtung len-ken, kann also nicht durch einen einfachen Abgleich der Vorhersagen mit den Ereignissen im Lebensverlauf beantwortet werden. Man benötigt als Basis für den Vergleich ein konkurrie-rendes Kriterium für die Validität des Lehrerurteils, das zugleich ein guter Prädiktor für Er-folge in der Ausbildungs- und Berufslaufbahn ist. Darüber hinaus sollte das Kriterium mög-lichst objektiv gemessen worden sein, also nicht durch subjektive Eindrücke und Maßstäbe des Lehrers beeinflusst sein, denn nur so wird es möglich, die Logik einer möglichen Self-Fulfilling Prophecy zu durchbrechen. Schließlich sollte es sich auch um ein Maß handeln, dass den meritokratischen Ansprüchen des Bildungswesens genügt, also einen Leistungsindi-kator. Dabei ist als Prognoseinstrument ein Indikator, der über die durch unterschiedliche si-tuative Einflüsse beeinflussten aktuellen Leistungen hinausweist und die generelle Leistungs-fähigkeit indiziert, zu bevorzugen.

Schulnoten sind für unseren Zweck wenig geeignet, weil es sich bei Noten um keine objektive Leistungsmessung handelt und Lehrer vor allem auf der Basis von Noten allgemeinere Schü-lerbeurteilungen mit prognostischem Anspruch abgeben. So können in IGLU/PIRLS alleine die Noten in Deutsch und Mathematik bereits 66 Prozent der Varianz der Schullaufbahnemp-fehlungen aufklären (Bos et al. 2004b, 209). Solche Probleme wären bei objektiven Kompe-tenztests, so wie sie u.a. in PISA durchgeführt wurden (z.B. OECD 2006), nicht gegeben, aber sie stehen nicht zur Verfügung. Allerdings messen diese Skalen neben bereichsspezifischen Kompetenzen vor allem auch die Intelligenz als Indikator der allgemeinen kognitiven Leis-tungsfähigkeit (vgl. Rindermann 2006; Baumert et al. 2007; Prenzel et al. 2007; Rindermann 2007). Enge Zusammenhänge zwischen Testergebnissen und allgemeiner Intelligenz (r= ,82) werden auch für den in den USA verwendeten Scholastic Aptitude/Assessment Test (SAT) berichtet (Frey / Detterman 2004). Intelligenz ist also ein guter Indikator kognitiver Leis-tungsfähigkeit in Institutionen des Bildungswesens, sie prognostiziert darüber hinaus aber auch die Leistungsfähigkeit im Beruf (job performance) sehr gut (Hunter / Hunter 1984; Schmidt / Hunter 1998, 2000; Schmidt 2002). In der vorliegenden Untersuchung wird daher auf die Intelligenz als Maßstab zur Überprüfung der Frage, ob Lehrerurteile nicht nur valide Prognosen des Erfolgs sind, sondern diesen auch in Form einer Self-Fulfilling Prophecy zu beeinflussen vermögen, zurückgegriffen.

Theoretisch ist nicht zu erwarten, dass sich Lehrerurteile ausschließlich auf eine Einschätzung der Schülerintelligenz stützen (vgl. Sauer 2001), und Intelligenz ermöglicht genauso wenig wie das Lehrerurteil eine perfekte Vorhersage des Erfolgs im Bildungs- und Berufsverlauf, der nicht nur von meritokratischen Kriterien beeinflusst wird (Breen / Goldthorpe 2001; Gold-thorpe 2003), sondern auch von weiteren individuellen Merkmalen und strukturellen Gege-benheiten abhängt. Mit dem skizzierten Ansatz ist also keine genaue Quantifizierung des Ausmaßes, in dem invalide Lehrerurteile den Lebensverlauf beeinflussen, möglich – auch wenn man für einige weitere individuelle und strukturelle Erfolgsfaktoren kontrolliert. Aber man kann so den „Prophezeiungen“ (Merton 1948) der Lehrer und den Ereignissen im Le-bensverlauf der Schüler einen externen Maßstab gegenüberzustellen, mit dem beides vergli-

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 94 

 

chen wird, um zu zeigen, dass Lehrerurteile zur Self-Fulfilling Prophecy werden können, in-dem sie Bildungsentscheidungen der Schüler beeinflussen.

Der skizzierte Ansatz unterscheidet sich von Untersuchungen eines Effektes von Lehrer-erwartungen auf die Leistungen der Schülerinnen und Schüler, der unter der Bezeichnung „Pygmalioneffekt“ seit Rosenthal und Jacobsens (1966; 1971) Untersuchungen in der schul-psychologischen Literatur kontrovers diskutiert wird (u.a.: Raudenbush 1984; Wineburg 1987; Rosenthal 1994; Madon et al. 1997; Jussim / Harber 2005). Das Explanandum liegt in der vorliegenden Untersuchung nicht auf der Ebene der individuellen Schülerleistung, son-dern auf der des Prozesses der Zuweisung von sozialem Status, wenn mögliche langfristige Effekte von Lehrerurteilen bzw. -erwartungen auf den Ausbildungs- und Berufserfolg unter-sucht werden. Die Frage, ob und inwieweit Lehrererwartungen als Self-Fulfilling Prophecy auch die Schülerleistungen zu beeinflussen vermögen, kann dabei vorläufig offen bleiben, denn die in Form von Noten dokumentierten Leistungen sind als objektive Gegebenheit und in ihrer subjektiven Relevanz Bestandteil der Situation und fließen in die Entscheidungen über den nächsten Bildungsabschnitt ein.

5 Datenbasis und Hypothesen

5.1 Daten Datenbasis der empirischen Untersuchungen ist das „Kölner Gymnasiasten-Panel“ (Meule-mann 1995; Birkelbach 1998b; Meulemann 2001). Im Rahmen der Primärerhebung 1969 wurden 3240 nordrhein-westfälische Gymnasiasten des 10. Schuljahres klassenweise u.a. über ihre schulischen Interessen, Leistungen und Pläne, ihre soziale Herkunft und ihre Einstellun-gen zu Elternhaus und Schule befragt. Im Rahmen der Erhebung wurde auch ein Intelligenz-Struktur-Test (IST) mit vier Subskalen (Amthauer 1953) durchgeführt (vgl. Meulemann 1979, 194). Die individuellen Testergebnisse wurden weder den Lehrern, noch den Schülern oder ihren Eltern mitgeteilt. Parallel dazu wurden die Eltern (n=2646) und Lehrer (n=1701) be-fragt, wobei die Lehrer, die in den befragten Klassen unterrichteten, in einem Zusatzbogen um Einschätzungen ihrer Schülerinnen und Schüler gebeten wurden. 1984/85 wurde eine erste Wiederbefragung (WB1, n=1987) durchgeführt, in der die damals rund 30-jährigen ehemali-gen Gymnasiasten in standardisierter Form detailliert über ihren beruflichen und privaten Werdegang zwischen dem 15. und dem 30. Lebensjahr Auskunft gegeben haben. Eine zweite Wiederbefragung 1996/97 (WB2, n=1596) knüpft unmittelbar an die Daten der ersten an und ergänzt die privaten und beruflichen Lebensverläufe um den Zeitraum zwischen dem 30. und 43. Lebensjahr.1 Die ehemaligen Gymnasiasten, für die Lebensverlaufsdaten für den gesamten Beobachtungszeitraum vorliegen, bilden die Basis der folgenden Analysen.

                                                            1 Die Primärbefragung  (Schüler: ZA‐Studie Nr. 600, Eltern: ZA‐Studie Nr. 639, Lehrer ZA‐Studie Nr. 640) wurde vom Land Nordrhein‐Westfalen finanziert und an dem von René König geleiteten Forschungsinstitut für Soziologie der Universität zu Köln durchgeführt. Projektleiter waren H.‐J. Hummell, M. Klein, M. Wieken‐Mayser und R. Ziegler. Durchgeführt wurde die erste Wiederbefragung (ZA‐Studie Nr. 1441) unter der Leitung von H. Meulemann, H.‐J. Hummell, M. Wieken‐Mayser und R. Ziegler. Einzelheiten der ersten beiden Erhebungen können dem im Zentralarchiv erhältlichen Projektbericht an die DFG (Meulemann et al. 1987) entnommen werden. Ergebnisse der ersten Wiederbefragung wurden von Meulemann (1995) und Birkelbach  (1998b) zusammengefasst. Die zweite Wiederbefragung  (ZA‐Studie Nr. 4228) wurde  telefonisch  im CATI‐Labor des Instituts für Angewandte Sozialforschung der Universität zu Köln durchgeführt und von der DFG finanziert (Birkelbach et al. 2000a). Ein detaillierter Bericht zur Datenerhebung (Birkelbach et al. 2000b) liegt vor. Eine von der DFG bewilligte dritte Wiederbefragung geht 2010  ins  Feld. Die hier  vorgelegten Analysen basieren auf den bislang noch nicht ausgewerteten Zusatzbögen  zur Lehrerbefragung 1969. Die Aufbereitung der Daten und  ihre Auswertung wurde von der DFG durch die Finanzierung  einer WHK‐Stelle  ermöglicht.  Projektmitarbeiter  ist  Dominik  Becker.  Besonderer  Dank  gilt Maria Wieken‐

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 95 

 

5.2 Entscheidungen und Erfolge im Ausbildungs- und Berufsverlauf Das Lehrerurteil, dessen mittel- und langfristige Wirkung auf den Ausbildungs- und Berufs-verlauf untersucht werden soll, bezieht sich auf die Eignung ihrer damals 15-jährien Schüle-rinnen und Schüler für ein späteres Studium und kann daher als eine Prognose des Studiener-folgs verstanden werden. Die Operationalisierung dieser zentralen unabhängigen Variablen wird in Abschnitt 5.3, die Hypothesen werden in Abschnitt 5.4 dargestellt.

Bei den Analysen wird in vier Schritten vorgegangen: Zunächst werden mit dem (a) Abitur und dem (b) Studieneintritt mögliche Einflüsse auf die Entscheidungen, die Voraussetzungen für den Studienerfolg, d.h. für das Ereignis, auf das die Prognose des Lehrurteils zielt, in der Gesamtgruppe aller Panelteilteilnehmer untersucht.2 Wenn das Lehrerurteil im Sinne einer Self-Fulfilling Prophecy wirkt und die Entscheidungen beeinflusst, dann sollte dies an beiden Übergängen des Lebensverlaufes sichtbar werden. Anschließend werden Zusammenhänge des Lehrerurteils mit dem (c) Studienerfolg nur in der Gruppe der Panelteilnehmer, die jemals ein Studium aufgenommen haben, analysiert. Im (d) Berufserfolg am Ende des Beobachtungszeit-raums, d.h. im 43. Lebensjahr, kumulieren schließlich die bisherigen Entscheidungen und Erfolge im Lebensverlauf. Untersuchungsgesamtheit sind daher hier alle zum Zeitpunkt der zweiten Wiederbefragung 1997 erwerbstätigen Befragten. Erhoben wird der Berufserfolg durch das auf Wegeners (1988) Magnitude-Prestigeskala (MPS) gemessene Prestige des Be-rufs am Ende des Beobachtungszeitraums.

In den Analysen wird zunächst ein nach dem Lehrerurteil und der kognitiven Leistungsfähig-keit differenzierter Überblick über den Erfolg beim Abitur, den Studieneintritt und -abschluss sowie das Berufsprestige mit 43 Jahren gegeben. Diese Ergebnisse werden anschließend in multivariaten Analysen überprüft. Wo möglich und sinnvoll werden die mit monatlicher Ge-nauigkeit erhobenen zeitlichen Informationen der vorliegenden Ereignisdaten genutzt und Verfahren der Ereignisanalyse (Blossfeld / Rohwer 2002) eingesetzt. Es werden also streng genommen Ereignisse – Übergange – betrachtet, aber diese Übergänge setzen entsprechende Entscheidungen im Lebensverlauf, um die es hier gehen soll, voraus. Bei den bivariaten Ana-lysen werden für das Abitur und den Studieneintritt jeweils die Anteile der im Beobachtungs-zeitraum nicht zensierten Panelteilnehmer berichtet. Bei den multivariaten Analysen mit die-sen Ereignissen als Zielvariablen werden semiparametrische (Cox-)Regressionen gerechnet. Der Studienerfolg wird mit einer binären logistischen Regression analysiert, da hier die Studi-engänge kontrolliert werden sollen, aber durch die unterschiedliche Dauer der einzelnen Stu-diengänge die Proportionalitätsannahme der Cox-Regression (Blossfeld / Rohwer 2002, 240ff) verletzt würde.3 Schließlich werden für die Analyse des letzten Berufsprestiges im Be-obachtungszeitraum Mittelwerte und die Ergebnisse einer OLS-Regression berichtet.

In den multivariaten Analysen des Abiturs sowie des Studieneintritts und -erfolgs werden zusätzliche Aspekte der Situation kontrolliert, die die Entscheidungen, über das Abitur ein Studium und ein entsprechend ehrgeiziges Berufsziel anzustreben, beeinflussen können. Dazu gehört der Notendurchschnitt4 des ersten Halbjahres der Klasse 10 als ein Leistungsindikator.

                                                                                                                                                                                          Mayser und Heiner Meulemann, die die Fragebögen aufbewahrt und uns bei der Aufbereitung und Integration der Daten in das KGP unterstützt haben.  2 Da das Abitur durch die allgemeine Hochschulreife operationalisiert wird, aber auch andere Wege in ein Studium möglich sind, werden beide Entscheidungen  in der Gesamtgruppe analysiert. Tatsächlich haben weniger Befragte die allgemeine Hochschulreife an einer Schule erworben als ein Studium begonnen. 3 Zwar könnte man die Studiengänge in einer Cox‐Regression als Schichtungsvariable berücksichtigen; der Preis aber wäre der Verzicht auf die Schätzung von Effekten für die Studiengänge. 4 Die Noten wurden im Klassenverband z‐transformiert. 

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 96 

 

Hinzu kommt die in der Primärerhebung erfragte subjektive Selbsteinschätzung der schuli-schen Leistungen im Vergleich zur Klasse. Beides sind Faktoren, die – wie das Lehrerurteil – die Erwartung, ein Studium leistungsmäßig erfolgreich bewältigen zu können, beeinflussen dürften. Weiterhin wird die soziale Herkunft kontrolliert, die durch das Berufsprestige (Treiman 1977) des Vaters operationalisiert wird. Mit der sozialen Herkunft korreliert einer-seits die Erwartung, ein Studium finanziell zu bewältigen, andererseits kann die Furcht vor einem drohenden Statusverlust die Entscheidung beeinflussen. Der subjektive Wert, der dem Abitur und dem Studium zugemessen wird, hängt von den langfristigen Zielen ab, die man sich im Leben setzt. Die Aspirationen werden bei den Analysen zum Abitur durch Fragen an die 15-Jährigen, ob sie ein festes Lebensziel haben und ob sie dafür das Abitur brauchen, und bei der Entscheidung zum Studieneintritt durch die Frage, ob ein Studium angestrebt wird, operationalisiert. Als Indikator geschlechtsspezifischer Lebenspläne wird das Geschlecht ein-bezogen. Darüber hinaus werden jeweils biographische Verlaufsumstände mit zeitabhängigen Variablen berücksichtigt, die die persönliche Lebenssituation verändern und daher den jewei-ligen Übergang negativ beeinflussen (vgl. Birkelbach 1998b). Kontrolliert werden bei den Analysen zum Abitur die Tatsache, bereits aus dem Elternhaus ausgezogen zu sein, und beim Studieneintritt die Elternschaft. Bei den Analysen zum Studieneintritt wird auch die Tatsache eines Wehr- oder Zivildienstes als zeitabhängige Variable berücksichtigt, weil sie den Studi-eneintritt bei den Männern um mehr als ein Jahr verschiebt. Bei der Analyse des Studiener-folgs werden zusätzlich zu den beschriebenen Variablen die gewählten Studiengänge kontrol-liert. Als ein Indikator für möglicherweise konkurrierende private Ziele wird die Geburt eines Kindes vor dem Ende des Studiums berücksichtigt, mögliche geschlechtsspezifische Effekte werden durch eine Interaktionsvariable der Elternschaft mit dem Geschlecht (Mutterschaft) erfasst.

Der durch Wegeners Magnitude-Prestigeskala (1988) erfasste Berufserfolg am Ende des Beo-bachtungszeitraumes wird maßgeblich durch die Entscheidung für das Abitur, für die Auf-nahme eines bestimmten Studiums und dessen erfolgreichen Abschluss geprägt (Birkelbach et al. 1997). Aufgrund der Pfadabhängigkeit des Bildungsverlaufes sind hier frühere Bildungser-folge zu kontrollieren ist. In der multivariaten Analyse sollte das Lehrerurteil wegen seines Einflusses auf die Erfolge in der Bildungslaufbahn keinen eigenständigen Effekt auf den Be-rufserfolg haben. Nach dieser Logik sollte dies auch für die soziale Herkunft und die Aspira-tionen gelten, aber Birkelbach et al. (1997) konnten anhand der Daten des KGP zeigen, dass auch bei Kontrolle der Leistungen im bisherigen Bildungsverlauf sowohl die soziale Herkunft als auch die Aspirationen der Schüler noch einen signifikanten Effekt auf das Berufsprestige mit 43 Jahren haben. Zugleich können eigene Entscheidungen (z.B. zugunsten der Familie zumindest zeitweise aus dem Erwerbsleben auszuscheiden, Elternschaft), aber auch externe Veränderungen der Situation, wie Arbeitslosigkeit oder eine längere Krankheit, die Berufskar-riere beeinträchtigt haben. In der Gleichung werden daher die Elternschaft als Tatsache und die Dauer der Lebensphasen als Hausfrau/-mann sowie erzwungener Erwerbsunterbrechungen kontrolliert.

5.3 Lehrerurteile und kognitive Leistungsfähigkeit Die Lehrer wurden 1969 in zwei aufeinander folgenden Fragen gebeten, die Schülerinnen und Schüler ihrer Klasse zu benennen, die (a) „Sie unabhängig vom derzeitigen Leistungsstand für besonders geeignet, ein Studium zu ergreifen“ halten bzw. die, von denen sie glauben, „dass

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 97 

 

sie auf keinen Fall zum Studium geeignet“ sind.5 Für die übrigen liegt kein Lehrerurteil vor, so dass eine Variable mit drei Kategorien konstruiert wurde: (1) „Ungeeignet“, (2) „Ohne Beurteilung“ und (3) „Geeignet“.6

Abbildung 1 Kognitive Leistungsfähigkeit differenziert nach Lehrerurteil zur Studieneignung

Abbildung 1 gibt die Verteilung der durch vier Subskalen von Amthauers (1953) Intelligenz-Struktur-Test gemessenen kognitiven Leistungsfähigkeit (IST) für die drei Gruppen wieder. Die durchschnittliche Intelligenz der von ihren Lehrern als für ein Studium geeignet bzw. ungeeignet beurteilten Schülerinnen und Schüler unterscheidet sich signifikant (p < .0001) voneinander, die Verteilungen sind entsprechend gegeneinander verschoben, aber es bestehen große Überlappungen zwischen den Gruppen.

Die Lehrerurteile zur Studieneignung basieren nur teilweise auf der kognitiven Leistungsfä-higkeit der Schülerinnen und Schüler. Becker und Birkelbach (im Erscheinen) zeigen anhand der vorliegenden Daten in einer multivariaten Analyse, dass den Lehrereinschätzungen zur Studieneignung neben der kognitiven Leistungsfähigkeit durch die in Form des Notendurch-schnitts sichtbaren Leistungen, die soziale Herkunft und die Aspiration der Schüler signifikant (p < ,001) beeinflusst werden. Darüber hinaus hat auch das Leistungsniveau der Klasse als Kontextmerkmal einen eigenständigen Effekt. In einer weiteren Arbeit (Becker, D. / Birkel-bach 2009) wird mithilfe eines Pfadmodells die Struktur der Zusammenhänge zwischen die-sen Variablen eingehend beschrieben.

Wie oben diskutiert wurde, kann die kognitive Leistungsfähigkeit ein Kriterium sein, an dem die Prognose der Studieneignung gemessen werden kann. Um unterscheiden zu können, ob

                                                            5 In dieser Analyse wird auf das Urteil der Klassenlehrer zurückgegriffen, da angenommen wird, dass diese ihre Schüler auch über die Grenzen ihrer Fächer hinaus zu beurteilen in der Lage sind. Das Urteil sollte bei Klassenlehrern auf einer breiteren Basis als bei Fachlehrern stehen. 6 Bei der Kategorie (2) „Ohne Beurteilung“ wurden nur Klassenlehrer berücksichtigt, die den Zusatzbogen ausgefüllt, aber im Einzelfall weder ein positives noch ein negatives Urteil zur Studieneignung abgegeben haben.  

77,582,5

87,592,5

97,5102,5

107,5112,5

117,5122,5

127,5132,5

137,5142,5

147,5

Ergebnisse des IST

0

5

10

15

20

25

Ungeeignet (n=288, MW= 107,8, StdAbw=9,6)Ohne Beurteilung (n=473, MW= 109,6, StdAbw=11,3)Geeignet (n=371, MW= 114,7, StdAbw=11,8)

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 98 

 

das Eintreffen der im Lehrerurteil formulierten Prognose dessen Validität bestätigt oder ob dieses Ereignis als das Resultat einer Self-Fulfilling Prophecy im Sinne Mertons (1948) ange-sehen werden kann, werden durch Kreuztabellierung der Lehrerurteile mit der am Median dichotomisierten kognitiven Leistungsfähigkeit (IST) der Schülerinnen und Schüler sechs Gruppen gebildet. Durch die Dichotomisierung des IST entsteht im mittleren Bereich eine Unschärfe. Während man sich bei den Extremwerten schnell einig werden dürfte, ob eine spe-zifische Beurteilung valide ist oder nicht, schwindet die Sicherheit, je mehr man sich einer durchschnittlichen Intelligenz nähert. Es existiert kein „natürlicher“ Schwellenwert, anhand dessen mit absoluter Sicherheit zwischen validen Urteilen und Fehlurteilen unterschieden werden könnte. Allerdings erhält man durch die Kreuztabellierung der Lehrerurteile mit den am Median dichotomisierten Intelligenzwerten Gruppen, die sich hinsichtlich der Wahr-scheinlichkeit eines validen bzw. invaliden Urteils unterscheiden. Ein positives Urteil trifft z.B. bei Schülern mit überdurchschnittlicher Intelligenz mit einer höheren Wahrscheinlichkeit zu als bei den Schülern mit unterdurchschnittlicher Intelligenz, wo entsprechend die die Wahrscheinlichkeit eines Fehlurteils durch Überschätzung höher ist.

Tabelle 1 weist neben den Häufigkeiten für die einzelnen Gruppen in der Panelstichprobe WB2 in Klammern die Häufigkeiten für die Ausgangsstichprobe aus.7 Bei zwei Gruppen (–/– und +/+) stimmen Lehrerurteil und individuelle Leistungsfähigkeit überein. Gemessen am Kriterium der kognitiven Leistungsfähigkeit geben die Lehrer jeweils in der Mehrheit der Fälle, in denen sie sich eine Einschätzung der Studieneignung zutrauen, ein wahrscheinlich valides Urteil über ihre Schüler ab. Komplementär dazu sind die Gruppen, bei denen das Leh-rerurteil von der Leistungsfähigkeit abweicht. Ein relativ großer Anteil (41,3%) der als unge-eignet beurteilten Schülerinnen und Schüler ist überdurchschnittlich leistungsfähig, wird also von ihren Lehrern unterschätzt (+/–), und in etwas geringerem Umfang (35,6%) ist eine Über-schätzung der unterdurchschnittlich Leistungsfähigen (–/+) zu beobachten. Trifft hier die im Urteil formulierte Prognose ein und entwickelt sich der weitere Lebensverlauf entsprechend, dann kann dies als ein Hinweis auf die Wirkung einer Self-Fulfilling Prophecy (SFP) im oben zitierten Sinne Mertons (1948) interpretiert werden, bei der das ursprünglich falsche Lehrerur-teil vermittelt über die Erfolgserwartung der Schülerinnen und Schüler deren Situationsdefini-tion und so die Entscheidung für oder gegen ein Studium schon frühzeitig beeinflusst, so dass der Ausbildungs- und Berufsverlauf in die entsprechende Richtung gelenkt wird. Die beiden Gruppen, bei denen die Lehrer keine Beurteilung abgeben konnten oder wollten (–/0 und +/0), sollen in den weiteren Analysen als Kontrollgruppen zeigen, wie die Entscheidungen im Aus-bildungsverlauf sowie der beruflichen Erfolg unbeeinflusst durch ein Lehrerurteil mit der kognitiven Leitungsfähigkeit zusammenhängen.

                                                            7 Das  Problem  der  Panelmortalität wurde  für  die  vorliegende  Stichprobe  untersucht  (Birkelbach  1998a). Dabei  hat  sich gezeigt, dass die Teilnahmebereitschaft bei WB2 u.a. schwach mit dem bisherigen Lebenserfolg zusammenhängt. In diesem Sinne lassen sich auch die Differenzen zwischen den für die Ausgangsstichprobe und für WB2 ermittelten Werten interpre‐tieren. Die Ausfälle kumulieren in der Gruppe mit unterdurchschnittlicher Leistungsfähigkeit und negativer Erfolgsprognose durch die Lehrer, also dort, wo man den geringsten beruflichen Erfolg erwarten kann.  

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 99 

 

Tabelle 1 Lehrerurteil zur Studieneignung und kognitiven Leistungsfähigkeit (Spaltenprozente)*

Lehrerurteil – Ungeignet 0 Kein Urteil + Geeignet Gesamt

IST < Median –

–/– Valides

negatives Urteil 58,7 (64,2)**

–/0 IST unterdurch.,

kein Urteil 47,6 (50,1)

–/+ Überschätzt

35,6 (36,9)

46,5 (49,6) IST >= Me-

dian +

+/– Unterschätzt

41,3 (35,8)

+/0 IST überdurch.,

kein Urteil 52,4 (49,9 )

+/+ Valides

positives Urteil 64,4 (63,1)

53,5 (50,4) N 288 (590) 473 (996) 371 (724) 1132 (2310)

25,4 (25,5) 41,8 (43,1) 32,8 (31,3) 100

* am Median dichotomisiert ** Die ausgewiesenen Werte beziehen sich auf WB2, in Klammern: Ausgangsstichprobe 1969/70

5.4 Hypothesen Im Folgenden werden vier Hypothesen vorgestellt: Die Intelligenz-Hypothese bezieht sich auf die Qualität einer Prognose, die sich auf die kognitive Leistungsfähigkeit stützt. Die WV-Hypothese geht davon aus, dass sich kognitive Leistungsfähigkeit und Lehrerurteil bei Über-einstimmung wechselseitig validieren. Im Zentrum der Untersuchung steht die Überlegung, dass Lehrerurteile als Self-Fulfilling Prophecy (SFP-Hypothese) die Entscheidungen im Vor-feld des Studiums beeinflussen können und damit auch Einfluss auf die Weichen für den wei-teren Ausbildungs- und Berufsverlauf zu nehmen vermögen. Gegenstand der vierten Hypo-these sind der Studienerfolg und das Berufsprestige mit 43 Jahren. Die Richtigkeit der Über-legungen zur Wirkung einer Self-Fulling Prophecy vorausgesetzt, sollten beide Erfolgskriteri-en aufgrund der vorausgegangenen, dem weiteren Ausbildungs- und Berufsverlauf die Rich-tung gebenden Entscheidungen nur indirekt vom Lehrerurteil beeinflusst werden. Sollten al-lerdings auch bei Kontrolle der Endscheidungen noch direkte Zusammenhänge mit dem Stu-dienerfolg (und darüber vermittelt mit dem Berufserfolg) nachzuweisen sein, dann wäre dies ein Beleg für die Validität des Lehrerurteils (Kontroll-Hypothese).

Intelligenz-Hypothese: Wenn Erfolg im Ausbildungs- und Berufsverlauf ehemaliger Gymna-siasten vor allem von der kognitiven Leistungsfähigkeit abhängt, dann ist zu erwarten, dass die drei Gruppen mit überdurchschnittlicher Intelligenz (+/-, +/0, +/+, vgl. Tabelle 1) auch jeweils häufiger das Abitur erreichen, ein Studium aufnehmen und es erfolgreich abschließen sowie in prestigeträchtigere Berufe gelangen als ihre ehemaligen Mitschüler in den Ver-gleichsgruppen (-/+, -/0, -/-).

WV-Hypothese: Bei den Gruppen, bei denen sich kognitive Leistungsfähigkeit und Lehrerur-teil entsprechen, kann aufgrund der wechselseitigen Validierung von einer besonders sicheren Prognose des Erfolgs ausgegangen werden, so dass in der Gruppe +/+ der Anteil der an den jeweiligen Übergängen Erfolgreichen am höchsten und in der Gruppe -/- am niedrigsten lie-gen dürfte.

SFP-Hypothese: Beeinflusst das im Schulalltag direkt oder indirekt kommunizierte Lehrerur-teil die Entscheidung, einen Studienabschluss anzustreben im Sinne einer Self-Fulfilling Pro-phecy (SFP), dann sollten die unterschätzten Schülerinnen und Schüler (+/-) bei gleicher Leis-tungsfähigkeit an beiden Schwellen seltener erfolgreich sein als die Vergleichsgruppen mit

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 100 

 

einem positiven Lehrerurteil (+/+) bzw. ohne Beurteilung (+/0). Umgekehrt werden die Über-schätzten (-/+) nur unwesentlich seltener erfolgreich sein wie die Befragten der Gruppe mit einem durch kognitive Leistungsfähigkeit validierten positiven Lehrerurteil (+/+). Sie sollten zugleich häufiger erfolgreich sein als die Gruppen mit vergleichbarer Leistungsfähigkeit und negativem Lehrerurteil (-/-) oder ohne Lehrerurteil (-/0).

Kontroll-Hypothese: Sind die Entscheidungen erst einmal zugunsten eines Studiums gefallen, dann sollte der beschriebene Mechanismus einer Self-Fulfilling Prophecy durch die vorausge-gangenen (Selbst-)Selektionsprozesse seine Bedeutung verloren haben und das Lehrerurteil bei Kontrolle dieser Entscheidungen keinen direkten Effekt mehr auf den Erfolg im Studium und Beruf haben. Umgekehrt wären Zusammenhänge zwischen dem Lehrerurteil auf der ei-nen Seite und dem Studienerfolg sowie dem Berufsprestige bei Kontrolle der Entscheidungen auf der anderen Seite als Beleg für die prognostische Validität des Lehrerurteils zu werten. Zu erwarten ist, dass nur in der bivariaten Analyse der Studien- und Berufserfolg zwischen den sechs Gruppen ähnlich wie beim Abitur und den Studieneintritt variiert. In der multivariaten Analyse sollte deutlich werden, dass das Lehrerurteil keinen direkten Einfluss mehr hat, wenn die Entscheidungen im Vorfeld des Erfolgs, auf den das Lehrerurteil gerichtet ist, kontrolliert werden.

6 Ergebnisse

6.1 Bivariate Analysen Die Ergebnisse in Tabelle 2 zeigen, dass die Mehrheit der Stichprobe den mit dem Besuch des Gymnasiums eingeschlagenen Pfad über das Abitur und ein Studium in einen prestigeträchti-gen Beruf weiter verfolgt hat. Knapp drei Viertel der ehemaligen Gymnasiasten haben die Allgemeine Hochschulreife (Abitur) erworben. Der Anteil, der ein Studium aufgenommen hat, liegt noch etwas höher, was darauf hinweist, das eine Minderheit mit der Fachhochschul-reife oder auf Umwegen den Weg ins Studium gefunden hat. Die große Mehrheit (85 Prozent) derjenigen, die sich für ein Studium entschieden haben, schließt dieses auch erfolgreich ab und übt mit 43 Jahren einen angesehen Beruf (vgl. Wegener 1988, 239-244) aus.

Insgesamt ergeben sich deutliche Unterschiede zwischen den sechs Gruppen im Hinblick auf die Entscheidung zum Abitur und zum Studieneintritt. Sind diese beiden Hürden erst einmal überwunden und betrachtet man den Studienerfolg in der Gruppe, die ein Studium aufge-nommen hat, dann fallen die Differenzen, wie gemäß der Kontroll-Hypothese zu erwarten ist, deutlich geringer aus. Die Erfolge im Bildungsverlauf spiegeln sich erwartungsgemäß in den Ergebnissen für das Berufsprestige wider.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 101 

 

Tabelle 2 Erfolge im Ausbildungs- und Berufsverlauf

Voraussetzungen

Gegenstand der Prognose

Langfristige Folgen

(a) Abitur

(b) Studien-eintritt

(c) Studienerfolg

(d) Berufsprestige mit 43 J. (MPS)

N Anteil(*) Anteil(*) N Anteil(*) N MW (*)

+/+: Valides positives LU 239 95,8 (1) 92,0 (1) 220 88,2 (1) 213 111,9 (1)

–/+: Überschätzt 132 85,6 (2) 81,8 (2) 108 87,0 (2) 109 107,0 (2)

+/0: IST hoch, kein LU 248 78,2 (3) 78,6 (3) 195 86,7 (3) 216 96,4 (3)

–/0: IST niedrig, kein LU 225 69,8 (4) 71,5 (4) 161 81,4 (5) 198 95,7 (4)

+/–: Unterschätzt 119 50,4 (5) 62,2 (5) 74 75,7 (6) 106 90,6 (6)

–/–: Valides negatives LU 169 43,2 (6) 60,9 (6) 103 85,4 (4) 137 94,4 (5)

Gesamt 1384 73,9 77,6 861 85,0 979 99,9

LU: Lehrerurteil, (*) Rangfolge

Betrachtet man zunächst nur die Zahlen für die beiden Gruppen, über die ihre Lehrer geurteilt haben, sie seien für ein Studium nicht geeignet, dann wird deutlich, dass die prognostische Validität dieses Lehrerurteils gering zu sein scheint. Immerhin nehmen auch aus diesen Grup-pen mehr als 60 Prozent der Panel-Teilnehmer ein Studium auf und schließen es in ihrer gro-ßen Mehrheit erfolgreich ab. Der hohe Anteil Erfolgreicher in der Gruppe mit unterdurch-schnittlicher Intelligenz und negativem Lehrerurteil ist vermutlich teilweise auf die oben dis-kutierte durch Unschärfe durch die Dichotomisierung zurückzuführen. Unterdurchschnittliche kognitive Kompetenzen innerhalb der Gymnasiastenstichprobe können im Vergleich zur gleichaltrigen Bevölkerung durchaus als überdurchschnittlich gelten (und für ein erfolgreiches Studium ausreichen).8 Aber dies erklärt lediglich, warum eine verhältnismäßig große Gruppe trotz ihrer – bezogen auf die Stichprobe – unterdurchschnittlichen IST-Ergebnisse erfolgreich das Abitur bewältigen und ein Studium aufnehmen (und abschließen) konnte. Es erklärt nicht das durch den weiteren Lebenslauf widerlegte negative Lehrerurteil. Das dürfte auf Seiten der Gymnasiallehrer zumindest teilweise auf deren hohe Maßstäbe bei der Urteilsbildung zurück-zuführen sein, hat aber bezogen auf die späteren Bildungserfolge vermutlich auch etwas mit den für diese Kohorte günstigen Gelegenheitsstrukturen durch den Ausbau von Studienmög-lichkeiten in den frühen siebziger Jahren des vergangenen Jahrhunderts zu tun (vgl. Müller / Haun 1994; Müller et al. 2009).

Gemäß der Intelligenz-Hypothese sollten sich die Gruppen mit überdurchschnittlicher kogni-tiver Leistungsfähigkeit häufiger als die Vergleichsgruppen für das Abitur entscheiden und auch häufiger ein Studium aufnehmen, also die drei ersten Rangplätze einnehmen. Empirisch aber ergibt sich für beide Übergänge eine Rangfolge, die sich an erster Stelle an den Beurtei-lungen durch die Lehrer und erst an zweiter Stelle an der Intelligenz ausrichtet. Erst wenn man das Lehrerurteil konstant hält, zeigt sich für die Gruppen mit überdurchschnittlicher Test-intelligenz ein Vorteil. Insgesamt am erfolgreichsten sind die beiden Gruppen, über die ihre Lehrer geurteilt haben, sie seien besonders geeignet für ein Studium, gefolgt von den Grup-pen, über die die Lehrer kein Urteil abgeben konnten oder wollten. Am Ende der Rangfolge findet man diejenigen, die als ungeeignet für ein Studium eingeschätzt wurden. Grundsätzlich gilt dies auch für den Studienerfolg und das Berufsprestige mit 43 Jahren, allerdings sind die

                                                            8 Der Mittelwert des IST liegt für die Gymnasiastenstichprobe bei 110 und damit um etwa eine Standardabweichung über der Eichstichprobe.    

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 102 

 

Unterschiede in Übereinstimmung mit der Kontroll-Hypothese weniger stark ausgeprägt und es ergeben sich im unteren Bereich der Rangfolge Verschiebungen.

Die WV-Hypothese, mit der angenommen wird, dass sich die gemessene kognitive Leistungs-fähigkeit und das Lehrerurteil bei Übereinstimmung wechselseitig validieren und die Progno-se insofern doppelt abgesichert ist, wird ganz überwiegend bestätigt. Die Panelteilnehmer, die im Alter von 15 Jahren im Test ihre überdurchschnittliche Leistungsfähigkeit belegt haben und über die ihre Lehrer zusätzlich positiv geurteilt haben (+/+), liegen durchgängig an der Spitze der Erfolgsrangliste. Sie bewältigen zu fast 96 Prozent das Abitur, nehmen mit 92 Pro-zent am häufigsten ein Studium auf, schließen es dann auch am häufigsten mit einem Ab-schluss (88 Prozent) ab und üben mit 43 Jahren im Schnitt die prestigeträchtigsten Berufe aus. Umgekehrt bewältigen diejenigen, bei denen eine unterdurchschnittliche Leistungsfähigkeit mit einem negativen Lehrerurteil kombiniert ist (-/-), am seltensten die Schwellen des Abiturs und des Studieneintritts. Die scharfe Selektion dieser Gruppe im Vorfeld, die nur die leis-tungswilligsten in ein Studium gelangen lässt, bietet eine Erklärung für deren im weiteren Verlauf vergleichsweise erfolgreiches Abschneiden im Studium.

Die SFP-Hypothese, die sich auf die Wirkung des Lehrerurteils als Self-Fulfilling Prophecy bezieht, nimmt an, dass bei gleicher kognitiver Leistungsfähigkeit die von ihren Lehrern posi-tiv beurteilten Panelteilnehmer sich eher für Abitur und Studium entscheiden, während diese Entscheidungen bei den negativ Beurteilten häufiger negativ ausfällt. Tatsächlich ist unter den Befragten mit vergleichsweise unterdurchschnittlicher Leistungsfähigkeit die als „über-schätzt“ bezeichnete Gruppe (-/+) an beiden Schwellen und auch im weiteren Ausbildungs- und Berufsverlauf erfolgreicher als die Gruppen ohne (-/0) oder mit negativem Lehrerurteil (-/-). Und umgekehrt haben die „Unterschätzten“ (+/-) unter den Befragten mit überdurch-schnittlichem Leistungsvermögen an den beiden Übergängen deutlich seltener Erfolg als die Gruppen ohne explizites (+/0) oder mit positivem Lehrerurteil (+/+). Dass das Lehrerurteil mehr als eine Prognose sein kann und wie in der SFP-Hypothese vermutet einen eigenständi-gen Effekt auf den Erfolg hat, wird zusätzlich durch die mittleren Ränge der Gruppen ohne Lehrerurteil unterstrichen.

6.2 Multivariate Analysen

6.2.1 Entscheidungen im Vorfeld: Abitur und Aufnahme eines Studiums Tabelle 3 gibt die Ergebnisse von Cox-Regressionen des Abiturs und des Studieneintritts auf die durch das Lehrerurteil und die kognitive Leistungsfähigkeit gebildeten Gruppen, die spe-zifischen Aspirationen, Schulleistungen, die soziale Herkunft sowie private Lebenspläne und biographische Verlaufsumstände wieder.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 103 

 

Tabelle 3 Entscheidungen im Vorfeld: Abitur und Studienaufnahme (Cox-Regressionen)

(a) Abitur (b) Studienaufnahme

min /max

unstandard. exp(b)

standard. exp(b*SD)

unstandard. exp(b)

standard. exp(b*SD)

Lehrerurteil und kognitive Leistungsfähigkeit +/+: Valides positives LU (Referenz) –/+: Überschätzt 0/1 0.98 1.01-1 0.78 1.08-1 +/0: IST hoch, kein LU 0/1 0.85 *** 1.07-1 0.85 1.07-1 –/0: IST niedrig, kein LU 0/1 0.68 *** 1.17-1 0.69 *** 1.16-1 +/–: Unterschätzt 0/1 0.50 *** 1.24-1 0.66 *** 1.14-1 –/–: Valides negatives LU 0/1 0.46 *** 1.32-1 0.82 1.07-1 Leistung in der Schule Notendurchschnitt Klasse 10 2.3/7.0 0.71 *** 1.26 0.76 *** 1.20 Selbsteinschätzung der Schulleistungen -2/2 1.20 *** 1.17 1.10 *** 1.09 Aspirationen (a) Kein Abitur angestrebt (Referenz) (b) Kein Studium angestrebt (Referenz)

(a) Abitur angestrebt, kein fest. Lebensziel (b) Studium: Weiß noch nicht

0/1 0/1

3.42 *** 1.65 3.14

***

1.63

(a) Eventuell Abitur für Lebensziel (b) Studium: Eventuell

0/1 0/1

3.70 *** 1.75 3.27

***

1.54

(a) Abitur notwendig für Lebensziel (b) Studium: Sicher

0/1 0/1

4.18 *** 2.03 3.43

***

1.83

Soziale Herkunft Berufsprestige des Vaters 19/82 1.01 * 1.08 1.01 * 1.09 Private Lebenspläne u. biografische Verlaufsumstände Geschlecht: Frau 0/1 0.99 1.01-1 Schichtungsvariable Eig. Wohnung vor Abitur (z) 0/1 0.27 *** 1.85-1 Mit Kind (z) 0/1 .41 *** 1.45-1 In Wehr-/Zivildienst (z) 0/1 .003 1.19-1

N=1097 (zensiert: 27.3%) CHI2 (13 FG): 425.7*** McFadden Pseudo-R2=.04

N=1097 (zensiert: 23,7%) CHI2 (13 FG): 673,5*** McFadden Pseudo-R2= .07

* p < .05, ** p<.01, *** p<.001; LU: Lehrerurteil, SD: Standardabweichung; (z): zeitabhängige Variablen. Notendurch-schnitt des ersten Halbjahres der Klasse 10 im Klassenverband standardisiert. Zur Darstellung der Effekte siehe Kühnel et al. (1989), negative standardisierte Werte werden als Kehrwert dargestellt.

(a) Abitur Auch bei Kontrolle der genannten Variablen wird für das Abitur, ausgehend von dem validen positiven Lehrerurteil (+/+), exakt die schon aus Tabelle 2 bekannte Rangfolge der Gruppen durch die Stärke der Effekte reproduziert. Dies bedeutet, dass auch hier die WV-Hypothese der wechselseitigen Validierung von Intelligenz und Lehrerurteil bestätigt wird, während die Intelligenz-Hypothese eines Primats der kognitiven Leistungsfähigkeit nur eingeschränkt auf-recht erhalten werden kann. Dagegen stützen die Daten die SFP-Hypothese des Lehrerurteils als einer Self-Fulfilling Prophecy, denn verglichen mit dem validen positiven Lehrerurteil (+/+) ergeben sich keine signifikanten Unterschiede zur Gruppe der Überschätzten (-/+) und umgekehrt unterscheiden sich die Koeffizienten für die Unterschätzten (+/-) kaum von denen der Gruppe, in der unterdurchschnittliche Leistungsfähigkeit mit einem negativen Lehrerurteil kombiniert (-/-) ist.

Die schulischen Leistungen haben neben dem Lehrerurteil und der durch den IST erhobenen kognitiven Leistungsfähigkeit einen eigenständigen Einfluss auf die Wahrscheinlichkeit, das Abitur zu erreichen. Leistungen in der Vergangenheit sind einerseits Voraussetzungen des Erfolgs und andererseits beeinflussen sie die Erwartungen, im nächsten Schritt auch ein Stu-dium erfolgreich abschließen zu können, positiv. Allerdings sind die Effekte der Leistung

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 104 

 

schwächer als die der Aspirationen, was den voluntaristischen Charakter des Übergangs und die Bedeutung individueller Motivation betont. Wenn das Abitur im biografischen Kalkül eine besondere Rolle spielt, dann steigt die Wahrscheinlichkeit deutlich, dass es auch erreicht wird. Bei der Interpretation des Effektes der Aspirationen ist zu beachten, dass diese positiv mit der sozialen Herkunft korrelieren, so dass in diesem Effekt auch das beschriebene Motiv des Statuserhalts sichtbar wird, also auch ein Grund für die Entscheidung enthalten ist. Die soziale Herkunft hat dagegen nur einen schwachen positiven Effekt, der neben dem Statuser-haltungsmotiv von Kinder aus höheren Schichten auch darauf zurückzuführen sein dürfte, dass die Möglichkeit materieller Unterstützung durch die Eltern die Erwartung, nach dem Abitur ein Studium erfolgreich abschließen zu können, beeinflusst. Die Bedeutung der Le-bensplanung für die Entscheidung zum Abitur wird auch an dem starken negativen Effekt einer eigenen Wohnung vor einem grundsätzlich noch möglichen Abitur sichtbar. Wer sich für die Selbständigkeit einer eigenen Wohnung entschieden hat, der hat sein Leben bereits in andere Bahnen gelenkt und entscheidet sich nur in den seltensten Fällen danach noch für das Abitur. Das Geschlecht bleibt in dem vorgestellten Modell ohne signifikanten Effekt.

(b) Aufnahme eines Studiums

Bei der zweiten Entscheidung, die dem Studienerfolg voraus geht, der Studienaufnahme, sind im multivariaten Modell die Effekte für die sechs durch Lehrerurteil und kognitive Leistungs-fähigkeit gebildeten Gruppen nicht mehr so eindeutig wie im Falle des Abiturs. Verglichen mit dem durch überdurchschnittliche Intelligenz validierten positiven Lehrerurteil (+/+), senkt zwar die Zugehörigkeit zu jeder anderen Gruppe die Wahrscheinlichkeit, eine darüber hinaus gehende Ordnung ist aber auf den ersten Blick nicht erkennbar, so dass sowohl die Intelli-genz-Hypothese als auch die WV-Hypothese allenfalls eingeschränkt aufrechterhalten werden kann.

Aber die in Tabelle 3 dargestellten Ergebnisse stützen die Hypothese einer Self-Fulfilling Prophecy (SFP), denn verglichen mit der Gruppe mit validem positiven Lehrerurteil (+/+) erwartet die SFP-Hypothese für die von ihren Lehrern überschätzten Befragten (-/+) keine, aber für die Unterschätzten (+/-) signifikante Unterschiede bei der Entscheidung für ein Stu-dium. Genau dies zeigen die Daten. Dennoch muss eine Einschränkung gemacht werden: Die Gruppe mit einem validen negativen Urteil entscheidet sich wider Erwarten nicht signifikant seltener als die Gruppe mit einem validen positiven Urteil für ein Studium. Wie in der bivaria-ten Analyse bereits diskutiert könnte dies mit den günstigen Gelegenheitsstrukturen der Bil-dungsexpansion zusammenhängen. Wichtiger als dieser Tatbestand scheint aus der Lebens-verlaufsperspektive aufeinander folgender Entscheidungen, dass die Effekte für die Gruppen mit negativem Lehrerurteil gegenüber dem Modell für das Abitur insgesamt schwächer sind. Dies weist darauf hin, dass insbesondere das negative Lehrerurteil als subjektive Entschei-dungsgrundlage im weiteren Verlauf an Bedeutung verliert, weil neue Erfahrungen – wie das bestandene Abitur – die Erwartung eines erfolgreichen Studiums beeinflussen. Dagegen ent-sprechen die Effekte für die Leistungen in der Schule und die Aspirationen in ihrer Stärke etwa denjenigen, die auch in dem Modell für das Abitur ermittelt wurden. Auch an diesem Übergang verdeutlicht die Höhe der Koeffizienten für die Aspirationen die Bedeutung des Statuserhaltungsmotivs. Die durch das Berufsprestige des Vaters erhobene soziale Herkunft hat darüber hinaus wieder einen schwachen eigenständigen Effekt auf die Entscheidung, ein Studium aufzunehmen, was darauf hinweist, dass auch die Möglichkeit materieller Unterstüt-zung während des Studiums durch das Elternhaus, die Erwartung eines erfolgreichen Studi-ums und damit die Entscheidung für das Studium beeinflusst. Die Tatsache, dass Panelteil-

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 105 

 

nehmer, die vor der Aufnahme eines Studiums bereits Eltern sind, sich deutlich seltener für ein Studium entscheiden, belegt einmal mehr die Interdependenz von Entscheidungen im pri-vaten und beruflichen Strang des Lebensverlaufs und deren Folgen. Dagegen suspendiert die Tatsache, aktuell Wehr- oder Zivildienst zu leisten, lediglich die Aufnahme eines Studiums für einen bestimmten Zeitraum, steht ihr im weiteren Verlauf aber nicht entgegen.

6.2.2 Erfolg im Studium Ist die Entscheidung erst einmal gefallen und ein Studium wurde aufgenommen, dann sollte, wie in der Kontroll-Hypothese begründet, das Lehrerurteil keinen signifikanten Einfluss mehr auf den Erfolg im Studium haben, da es vermittelt über die subjektiven Erfolgserwartungen die dem Studium vorgelagerten Entscheidungen, nicht aber die Leistungen im Studium beein-flusst. Wie Tabelle 4 ausweist, wird die Kontroll-Hypothese durch die Daten gestützt. Das gilt in gleicher Weise auch für die Aspirationen, für die ein vergleichsweise starker Einfluss auf die beiden Entscheidungen im Vorfeld nachgewiesen werden konnte, die aber nachdem die Weichen für das Studium gestellt worden sind, keinen signifikanten Effekt mehr auf den er-folgreichen Abschluss des Studiums haben. Verglichen mit den klassischen Professionen Me-dizin und Recht bestehen auch zwischen den hier kontrollierten Studiengängen und dem Stu-dienerfolg keine signifikanten Zusammenhänge. Allenfalls das Vorzeichen der Koeffizienten lässt vermuten, dass die in der Gruppe der Sprach-, Kultur- und Orientierungswissenschaften zusammengefassten Studiengänge seltener den Abschluss erreichen. Auch für das Geschlecht und die private Lebenssituation ist kein signifikanter Effekt zu berichten, obwohl auch hier die Vorzeichen den Erwartungen entsprechen.

Signifikante Effekte zeigen sich nur bei zwei der kontrollierten Variablen: Unabhängig vom Lehrerurteil und der Testintelligenz erweisen sich erstens die Schulnoten der Klasse 10 noch Jahre später als guter Prädiktor zur Vorhersage des Studienerfolgs. Dies weist darauf hin, dass der Notendurchschnitt anders als die Test-Intelligenz auch motivationale Leistungselemente indiziert, die über die Schule hinausweisen und relativiert die eingangs referierte Kritik an (Einzel-)noten: Auch wenn einzelne Noten möglicherweise problematisch sind, scheinen sie insgesamt zum Notendurchschnitt aggregiert doch ein guter Indikator individueller Leistungs-fähigkeit und Leistungsbereitschaft zu sein. Zweitens lässt sich beim Studienerfolg wieder ein signifikanter Effekt der sozialen Herkunft beobachten, der sich angesichts der kontrollierten Variablen auf im Studium verwertbares kulturelles Kapital (Bourdieu 1983), aber auch auf die ökonomische Absicherung durch die Herkunftsfamilie zurückführen lassen dürfte. Darüber hinaus dürften ähnliche Entscheidungskalküle wie beim Abitur und dem Studieneintritt eine Rolle spielen, denn zumindest die Entscheidung ein Studium abzubrechen dürfte wiederum durch das Statuserhaltungsmotiv und die Erwartung eines erfolgreichen Abschlusses beein-flusst werden. Meulemann (1995, 186) zeigt anhand der vorliegenden Stichprobe in einer Cox-Regression, dass nur die Neigung zum Abbruch, nicht aber die konkurrierende Neigung zum Abschluss signifikant durch das Vaterprestige beeinflusst wird.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 106 

 

Tabelle 4 Studienerfolg (Logistische Regression)

min /max

unstandardisiert exp(b)

standardisiert exp(b*SD)

Interzept 13.32 * Lehrerurteil und kogn. Leistungsfähigkeit +/+: Valides positives LU (Referenz) –/+: Überschätzt 0/1 0.92 1.03-1 +/0: IST hoch, kein LU 0/1 1.15 1.06 –/0: IST niedrig, kein LU 0/1 0.68 1.16-1 +/–: Unterschätzt 0/1 0.55 1.18-1 –/–: Valides negatives LU 0/1 1.23 1.07 Leistung in der Schule und Studiengang Notendurchschnitt Klasse 10 2.3/7.0 0.63 * 1.37-1 Klass. Professionen (Medizin, Jura) (Referenz) Fachhochschule / Lehramt Grundschule 0/1 1,53 1.21 Lehramt Sek. II 0/1 1,58 1.23 Sprach-, Kultur- u. Orientierungswissenschaften 0/1 0,74 1.10-1 Wirtschaft, Technik, Naturwissenschaften 0/1 0,98 1.01-1 Aspirationen Kein Studium angestrebt (Referenz) Studium: Weiß noch nicht 0/1 1.01 1.01 Studium: Eventuell 0/1 1.14 1.05 Studium: Sicher 0/1 1.49 1.22 Soziale Herkunft Berufsprestige des Vaters 19/82 1.02 ** 1.38 Private Lebenspläne u. Situation Geschlecht: Frau 0/1 1,36 1.16 Mit Kind 0/1 0.94 1.03-1 Interaktion Frau*Kind 0/1 0.62 1.12-1

N=841 CHI2 (17 FG): 43,5***

McFadden Pseudo-R2= .06

* p < .05, ** p<.01, *** p<.001; LU: Lehrerurteil, SD: Standardabweichung. Notendurchschnitt des ersten Halbjahres der Klasse 10 im Klassenverband standardisiert. Zur Darstellung der Effekte siehe Kühnel et al. (1989), negative standardisierte Werte werden als Kehrwert dargestellt.

6.2.3 Berufserfolge mit 43 Jahren In der bivariaten Analyse wurden deutliche Zusammenhänge zwischen dem Lehrerurteil und dem durch Wegeners Magnitude-Prestigeskala (1988) erhobenen Berufserfolg mit 43 Jahren nachgewiesen: Das Berufsprestige liegt in den Gruppen mit einem positiven Lehrerurteil um bis zu 21 Punkte höher als in den Vergleichsgruppen ohne oder mit negativen Urteil (vgl. Ta-belle 2). Wie bereits für den Studienerfolg gezeigt werden konnte, kann auch hier mit der Kontroll-Hypothese erwartet werden, dass das Lehrerurteil im multivariaten Modell, bei Kon-trolle der Entscheidungen und Erfolge im Bildungsverlauf, keinen direkten Einfluss mehr auf den Berufserfolg hat. Die sehr niedrigen, nicht signifikanten Koeffizienten für die durch Leh-rerurteil und kognitive Leistungsfähigkeit gebildeten Gruppen in Tabelle 5 stützen die Kont-roll-Hypothese.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 107 

 

Tabelle 5 Berufserfolg mit 43 Jahren: OLS-Regression auf das Berufsprestige (MPS)1

min /max

Regressionskoeffizienten unstandardisiert standardisiert

Interzept 9.21 *** Lehrerurteil und kognitive Leistungsfähigkeit +/+: Valides positives LU (Referenz) –/+: Überschätzt 0/1 .28 .03 +/0: IST hoch, kein LU 0/1 -.28 -.03 –/0: IST niedrig, kein LU 0/1 .21 .02 +/–: Unterschätzt 0/1 .31 .03 –/–: Valides negatives LU 0/1 .56 .05 Aspirationen Kein Studium angestrebt (Referenz) Studium: Weiß noch nicht 0/1 .32 .04 Studium: Eventuell 0/1 .12 .01 Studium: Sicher 0/1 .72 * .10 Leistungen im Bildungsverlauf Notendurchschnitt Klasse 10 2.3/7.0 -.61 *** -.12 Kein Studium (Referenz) Studium nicht abgeschlossen 0/1 -.01 -.00 Abgeschlossenes Studium 0/1 2.69 *** .37 Promotion 0/1 6.31 *** .50 Soziale Herkunft Berufsprestige des Vaters 19/82 .03 *** .10 Erwerbsunterbrechungen in Monaten Hausfrau/-mann 0/269 -.01 -.05 Sonstige erzwungene Unterbrechungen 0/133 -.00 -.02 Private Lebenspläne u. Situation Geschlecht: Frau 0/1 -.65 -.09 Mit Kind 0/1 .10 .01 Interaktion Frau*Kind 0/1 .71 .09

N=973 R2= .37

1 Wegeners Magnitude-Prestigeskala (1988), zur besseren Darstellung der Koeffizienten durch 10 dividiert. Notendurch-schnitt des ersten Halbjahres der Klasse 10 im Klassenverband standardisiert. Sonstige erzwungene Erwerbsunterbrechungen: Arbeitslosigkeit, Krankheit. * p < .05, ** p<.01, *** p<.001; LU: Lehrerurteil

Hohe Aspirationen, deren besondere Bedeutung für die Entscheidungen auf dem Weg ins Studium (vgl. Tabelle 3) nachgewiesen wurde, die dann aber, wie das Lehrerurteil, keinen Einfluss mehr auf den Studienerfolg hatten, haben nun wieder einen – geringeren – Effekt auf den Berufserfolg mit 43 Jahren. Dies dürfte darauf zurückzuführen sein, dass sich die Aspira-tionen zwar zunächst auf ein Studium richten, aber das Studium selber natürlich Mittel für einen angesehen Beruf ist. Die mit Abstand stärksten Effekte aber haben erwartungsgemäß die Erfolge in der Bildungsbiografie, auf die sowohl das Lehrerurteil als auch die Aspiratio-nen gerichtet waren, also das abgeschlossene Studium und darauf aufbauend die Promotion. Der signifikante Effekt des Notendurchschnitts der 10. Klasse, der selbst bei Kontrolle des Studienerfolgs noch einen eigenständigen Effekt auf das Berufsprestige mit 43 Jahren hat, bestätigt die oben formulierte Vermutung, dass – ungeachtet der Kritik an Einzelnoten und trotz des zeitlichen Bezugs – der Notendurchschnitt eines Zeugnisses hier als ein Indikator für Leistungsfähigkeit und –motivation interpretiert werden kann.

Die soziale Herkunft, gemessen durch das väterliche Berufsprestige, hat auch bei Kontrolle von Studiengängen, Aspirationen, Leistungen und Bildungserfolgen noch einen signifikanten Einfluss auf das Berufsprestige der Befragten mit 43 Jahren. Einen hier möglicherweise wirk-samen Mechanismus beschreibt Blaneck (1994), wenn er zeigt, dass insbesondere in den pres-

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 108 

 

tigeträchtigen klassischen Professionen Jura und Medizin häufig Prozesse der Berufs- und Statusvererbung zu beobachten sind. Darüber hinaus aber dürfte generell das im Elternhaus erworbene kulturelle und soziale Kapital (Bourdieu 1983) nicht nur beim Einstieg in einen prestigeträchtigen Beruf, sondern auch in der Berufskarriere hilfreich sein (vgl. Meulemann 1995, 240-254; Hartmann 2001). Erwerbsunterbrechungen sowie Geschlecht und Elternschaft (auch als Interaktion mit dem Geschlecht) haben im Modell keinen eigenständigen Einfluss auf das Berufsprestige mit 43 Jahren.

7 Diskussion und Resümee: Lehrerurteile im Bildungs- und Berufsverlauf

Um die Logik einer Self-Fulfilling Prophecy durchbrechen zu können, wurde in der vorlie-genden Untersuchung dem Lehrerurteil mit der im Rahmen eines Intelligenz-Strukturtests gemessenen kognitiven Leistungsfähigkeit ein zweites Kriterium, an dem es gemessen wird, gegenübergestellt. Diese Vorgehensweise birgt unumgänglich Unschärfen, denn weder kön-nen beide ineinander überführt werden, noch kann erwartet werden, dass sie die Entscheidung und Erfolge im Ausbildungs- und Berufsverlauf genau zu prognostizieren vermögen. Wie oben diskutiert, können durch die Dichotomisierung der Intelligenzwerte im mittleren Intelli-genzbereich weitere Unschärfen entstehen. Aber es wurde so möglich, Vergleichsgruppen zu bilden, die sich hinsichtlich der durchschnittlichen Wahrscheinlichkeit eines validen oder in-validen Urteils unterscheiden, auch wenn die Höhe dieser Wahrscheinlichkeit nicht genau zu quantifizieren ist. Durch die Vergleichsgruppen wird deutlich, dass auf der einen Seite über-durchschnittlich leistungsfähige Schülerinnen und Schüler von ihren Lehrern unterschätzt und andererseits unterdurchschnittlich leistungsfähige Schülerinnen und Schüler überschätzt wer-den. Bei einer knappen Mehrheit stimmen Intelligenz und Lehrerurteil überein. Die Gruppe mit überdurchschnittlicher Intelligenz und positivem Lehrerurteil ist durchgängig erfolgrei-cher als alle anderen Gruppen, während die Gruppe mit unterdurchschnittlicher Intelligenz und negativem Lehrerurteil am wenigsten erfolgreich ist. Das bestätigt die WV-Hypothese, die auf eine wechselseitige Validierung von Intelligenz und Lehrerurteil anhand der Erfolge im Ausbildungs- und Berufsverlauf zielt, und unterstreicht die Tragfähigkeit des gewählten Untersuchungsdesigns.

Die Gruppen, die anhand der Gegenüberstellung von Lehrerurteil und kognitiver Leistungsfä-higkeit als überschätzt bzw. unterschätzt klassifiziert werden können, entscheiden sich im weiteren Verlauf häufig dem Lehrerurteil entsprechend. Eine solche Entwicklung entspricht genau Mertons (1948) Definition einer Self-Fulfilling Prophecy, nach der eine ursprünglich falsche Definition der Situation das Handeln derart beeinflusst, dass die auf der falschen Si-tuationsanalyse beruhenden Erwartungen tatsächlich eintreffen. Die SFP-Hypothese, die eine bestimmte Rangfolge der Gruppen hinsichtlich ihrer Entscheidungen vorhergesagt hat, wird durch die Analysen fast durchgängig bestätigt. Wo es eine kleine Abweichung gibt – beim Studienzugang der Gruppe mit validem negativen Lehrerurteil – bieten die Gelegenheitsstruk-turen der Bildungsexpansion als Periodeneffekt eine ergänzende Erklärung. Für eine Wirkung von Lehrerurteilen auf die Bildungsentscheidungen im Sinne einer Self-Fulfilling Prophecy spricht auch, dass die Kontrollhypothese bestätigt werden konnte. Sind die Entscheidungen im Vorfeld entsprechend gefallen und wurde ein Studium aufgenommen, dann besteht bei Kon-trolle von Leistungen, Aspirationen sozialer Herkunft und privater Lebenssituation kein signi-fikanter Zusammenhang mehr zwischen dem Lehrerurteil und dem Erfolg im Studium, der die prognostische Validität des Lehrerurteils stützen könnte. Die fehlenden Effekte auch für die Gruppen mit negativem Lehrerurteil bestätigen also noch einmal die Annahme, dass die ur-

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 109 

 

sprünglichen Lehrerurteile nicht zutreffend waren. Dies gilt auch für den durch das Berufs-prestige erhobenen Berufserfolg im 43. Lebensjahr. Durch die Kontrolle der Entscheidungen, auf die sie wirken, verlieren die Lehrerurteile im multivariaten Regressionsmodell ihren Ein-fluss auf den Erfolg im Studium und Beruf. Aufgrund der Pfadabhängigkeit des Lebensver-laufes, bei dem Bildungsentscheidungen Weichenstellungen darstellen, die dem Leben seine Richtung geben und so bestimmte Erfolge erst möglich machen, können sie aber dennoch indirekt auch den langfristigen Berufserfolg beeinflussen, wie die bivariaten Analysen belegt haben. Retrospektiv sind es vor allem die richtigen Weichstellungen, d.h. die Erfolge im Bil-dungsverlauf, die das Berufsprestige am Ende des Beobachtungszeitraums prägen. Insgesamt zeigen die Analysen, dass Lehrerurteile mit einem prognostischen Anspruch sich im Lebens-verlauf zu einer Self-Fulfilling Prophecy im Sinne Mertons entwickeln können, die vermittelt über Bildungsentscheidungen eine eigene Macht auf die eingeschlagene Richtung des Bil-dungs- und Berufsverlaufs und das Niveau des Erreichten ausübt. Dadurch beeinflussen sie letztlich auch den Prozess der gesellschaftlichen Statuszuweisung.

Lehrerurteile und -prognosen, die in dem beschriebenen Sinne als falsch verstanden werden, können auf die weitere Entwicklung direkt einwirken, wenn die Lehrer als Gatekeeper fungie-ren und das Urteil mit entsprechenden Berechtigungen verknüpft ist, wie es z.B. bei den Schullaufbahnempfehlungen am Ende der Grundschulzeit in einigen Bundesländern der Fall ist. Dass Lehrerurteile auch ohne eine solche Verknüpfung mit institutionellen Berechtigun-gen eine Wirkung auf den weiteren Ausbildungs- und Berufsverlauf haben können, wurde in der vorgelegten Untersuchung gezeigt. Eine Erklärung für dieses Phänomen bietet die Wert-Erwartungstheorie. Mangels anderer Informationsquellen orientieren die Schülerinnen und Schüler ihre eigenen Erwartungen an den in der alltäglichen Kommunikation der Schule di-rekt oder indirekt vermittelten Einschätzungen der Lehrer. Die Einschätzungen fließen in die folgenden Bildungsentscheidungen als Erfolgserwartungen mit ein, wie am Beispiel des Abi-turs und des Studieneintritts gezeigt wurde, und durch diese Weichenstellungen beeinflussen sie in der Folge indirekt auch den beruflichen Lebensverlauf.

Aber der starke Effekt der Aspirationen auf die Entscheidungen hat auch gezeigt, dass die Schülerinnen und Schüler dem auch ihre Ziele und Pläne entgegenstellen können. Dazu sind entsprechende Leistungen notwendig, wie der Effekt des Notendurchschnitts belegt. Schulno-ten sind, zumindest in Form eines breiter angelegten Notendurchschnitts, teilweise zu rehabi-litieren. Sie scheinen über die konkreten Leistungen hinaus auch Indikatoren für die Art von Leistungsfähigkeit und Motivation zu sein, die nicht nur im Bildungswesen, sondern auch im Beruf notwendig ist, wie ihr Effekt noch auf den Berufserfolg mit 43 Jahren belegt. Aber auch die soziale Herkunft hat noch einen eigenständigen Einfluss auf die Entscheidungen für oder gegen das Studium, der sich auf das Motiv des Statuserhalts von Kindern höherer Schichten, aber auch auf die Erwartung, ein Studium aufgrund der finanziellen Rahmenbedingungen abschließen zu können, zurückführen lassen dürfte. In ähnlicher Weise lässt sich auch der Effekt der sozialen Herkunft auf den Studienerfolg als Entscheidung für oder gegen einen Studienabbruch verstehen. Darüber hinaus wird auch der Berufserfolg mit 43 Jahren bei Kon-trolle der Bildungsentscheidungen und –erfolge noch hochsignifikant durch den sozialen Sta-tus des Elternhauses beeinflusst. Das kulturelle und soziale Kapital des Elternhauses vermag die berufliche Karriere langfristig positiv zu beeinflussen, was einmal mehr belegt, dass Be-rufserfolg nicht allein von meritokratischen Kriterien abhängt.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 110 

 

8 Literaturverzeichnis Allmendinger, Jutta & Silke Aisenbrey, 2002: Soziologische Bildungsforschung. S. 41-60 in: Tippelt,

Rudolf (Hg.), Handbuch der Bildungsforschung. Opladen: Leske + Budrich. Amthauer, Rudolf, 1953: Intelligenz-Struktur-Test (2. erw. Auflage). Göttingen: Hogrefe. Avenarius, Hermann, Hartmut Ditton, Hans Döbert, Klaus Klemm, Eckhard Klieme, Matthias Rürup,

Heinz-Elmar Tenorth, Horst Weißhaupt & Manfred Weiß, 2003: Bildungsbericht für Deutschland. Erste Befunde. Opladen: Leske + Budrich.

Baron-Boldt, Jutta, Heinz Schuler & Uwe Funke, 1988: Prädiktive Validität von Schulabschlussnoten: Eine Metaanalyse. Zeitschrift für Pädagogische Psychologie 2: S. 79-90.

Baron-Boldt, Jutta, Heinz Schuler & Uwe Funke, 1989: Prognostische Validität von Schulnoten. Eine Metaanalyse der Prognose des Studien und Ausbildungserfolgs. S. 11-39 in: Jäger, Reinhold S., Ralf Horn & Karlheinz Ingenkamp (Hg.), Tests und Trends. 7. Jahrbuch der Pädagogischen Diag-nostik. Weinheim / Basel: Beltz.

Baumert, Jürgen, Ulrich Trautwein & Cordula Artelt, 2003: Schulumwelten – institutionelle Bedin-gungen des Lehrens und Lernens. S. 261 – 331 in: Deutsches PISA-Konsortium (Hg.), PISA 2000 – Ein differenzierter Blick auf die Länder der Bundesrepublik Deutschland. Opladen: Les-ke+Budrich.

Baumert, Jürgen, Martin Brunner, Oliver Lüdtke & Ulrich Trautwein, 2007: Was messen internationa-le Schulleistungsstudien? – Resultate kumulativer Wissenserwerbsprozesse. Eine Antwort auf Hei-ner Rindermann. Psychologische Rundschau 58: S. 118–128.

Becker, Dominik & Klaus Birkelbach, 2009: Teacher evaluations and the definition of the social situa-tion in the classroom. Arbeitspapier Nr. 3 der Projektgruppe „Lehrerurteile im Lebensverlauf“. Es-sen. Universität Duisburg-Essen.

Becker, Dominik & Klaus Birkelbach, im Erscheinen: Intelligenz und Schulleistung als Kontextmerk-male: Big Fish-Little Pond oder Reflected-Glory-Effekt? Eine Mehrebenen-Analyse von Lehrerur-teilen S. in: Beckers, Tilo, Klaus Birkelbach, Jörg Hagenah & Ulrich Rosar (Hg.), Komparative Sozialforschung. Wiesbaden: VS-Verlag.

Becker, Rolf & Anna Etta Hecken, 2008: Warum werden Arbeiterkinder vom Studium an Universitä-ten abgelenkt? Eine empirische Überprüfung der „Ablenkungsthese“ von Müller und Pollak (2007) und ihrer Erweiterung durch Hillmert und Jacob (2003). Kölner Zeitschrift für Soziologie und So-zialpsychologie 60: S. 3-29.

Birkelbach, Klaus, 1998a: Befragungsthema und Panelmortalität: Ausfälle in einer Lebenslauferhe-bung. ZA-Informationen 42: S. 128-147.

Birkelbach, Klaus, 1998b: Berufserfolg und Familiengründung. Lebensläufe zwischen institutionellen Bedingungen und individueller Konstruktion. Opladen: Westdeutscher Verlag.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann, 1997: Success and Satisfaction in the Occupational Career from Youth to Mid-Life in a Cohort of German Gymna-sium Students, 1969, 1984, and 1997. Paper prepared for the Working Group 5.9 „Constraints and Opportunities in Life Histories“ at the World congress of Sociology of the International Institute of Sociology (IIS), July 7-11, 1997 in Cologne, Germany.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000a: Leben-serfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gym-nasiasten im 43. Lebensjahr. Teil 1: Arbeitsbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000b: Leben-serfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gym-nasiasten im 43. Lebensjahr. Teil 2: Ergebnisbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Blaneck, Stephan, 1994: Der Berufseinstieg in Professionen. Berlin: VWF. Blossfeld, Hans-Peter & Götz Rohwer, 2002: Techniques of Event History Modelling. New Ap-

proaches to Causal Modelling (2nd Edition). Mahwah (New Jersey): Lawrence Erlbaum Asso-ciates.

Bos, Wilfried & Marcus Pietsch, 2004: Erste Ergebnisse aus KESS 4. Kurzbericht. Hamburg. Freie und Hansestadt Hamburg (http://www.li-hamburg.de/fix/files/doc/kurzbericht.pdf).

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 111 

 

Bos, Wilfried, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin & Gerd Walther (Hg.), 2004a: IGLU. Einige Länder der Bundesrepublik Deutschland im nationalen und internatio-nalen Vergleich. Münster: Wachsmann.

Bos, Wilfried, Andreas Voss, Eva-Maria Lankes, Knut Schwippert, Jürgen Thiel & Renate Valtin, 2004b: Schullaufbahnempfehlungen von Lehrkräften für Kinder am Ende der vierten Jahrgangsstu-fe. S. 191-228 in: Bos, Wilfried, Eva-Maria Lankes, Manfred Prenzel, Knut Schwippert, Renate Valtin & Gerd Walther (Hg.), IGLU. Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich. Münster u.a.: Wachsmann.

Boudon, Raymond, 1974: Education, opportunity, and social inequality: Changing prospects in West-ern Society. New York: Wiley.

Bourdieu, Pierre, 1983: Ökonomisches Kapital, kulturelles Kapital, soziales Kapital. S. 183-198 in: Kreckel, Reinhard (Hg.), Soziale Ungleichheiten. Soziale Welt. Sonderband 2. Göttingen: Otto Schwartz & Co.

Brattesani, Karen A., Rhona S. Weinstein & Marshall Hermine H, 1984: Student Perceptions of Diffe-rential Teacher Treatment as Moderators of Teacher Expectation Effects. Journal of Educational Psychology 76: S. 236-247.

Breen, Richard & John H. Goldthorpe, 1997: Explaining Educational Differentials. Towards a Formal Rational Action Theory. Rationality and Society 9: S. 275-305.

Breen, Richard & John H. Goldthorpe, 2001: Class, Mobility and Merit. The Experience of Two Brit-ish Birth Cohorts. European Sociological Review 17: S. 81-100.

Brophy, Jere E. & Thomas L. Good, 1974: Teacher - Student Relationships. Causes and Conse-quences. New York u.a.: Holt, Rhinehart and Winston.

Dalbert, Claudia & Joachim Stöber, 2008: Forschung zur Schülerpersönlichkeit. S. 905-925 in: Helsper, Werner & Jeanette Böhme (Hg.), Handbuch der Schulforschung (2., durchgesehene und erweiterte Auflage). Wiesbaden: VS Verlag für Sozialforschung.

Ditton, Hartmut & Jan Krüsken, 2006: Der Übergang von der Grundschule in die Sekundarstufe I. Zeitschrift für Erziehungswissenschaft 9: S. 348-372.

Erikson, Robert & Jan O. Jonsson, 1996: Explaining class inequality in education: The Swedish test case. S. 1-63 in: Erikson, Robert & Jan O. Jonsson (Hg.), Can education be equalized? The Swe-dish case in comparative perspective. Oxford: Westview Press.

Esser, Hartmut, 1993: Soziologie. Allgemeine Grundlagen. Frankfurt/Main und New York: Campus. Esser, Hartmut, 1999: Soziologie. Spezielle Grundlagen. Band 1: Situationslogik und Handeln. Frank-

furt/Main und New York: Campus. Esser, Hartmut, 1999-2001: Soziologie. Spezielle Grundlagen. 6 Bände. Frankfurt/Main und New

York: Campus. Esser, Hartmut, 2006: Eines für alle(s)? Das Weber-Paradigma, das Konzept des moderaten methodo-

logischen Holismus und das Modell der soziologischen Erklärung. Kölner Zeitschrift für Soziolo-gie und Sozialpsychologie 58: S. 352–363.

Frey, Meredith C. & Douglas K. Detterman, 2004: Scholastic Assessment or g? The Relationship Between the Scholastic Assessment Test and General Cognitive Ability. Psychological Science 15: S. 373-378.

Goldthorpe, John, 2003: The myth of education-based meritocracy. New Economy 10: S. 234-239. Good, Thomas L. & Jere E. Brophy, 2003: Looking in Classrooms. New York u.a.: Pearson Educa-

tion. Hadjar, Andreas, 2008: Meritokratie als gesellschaftlicher Legitimationsmythos. Wiesbaden: VS Ver-

lag für Sozialwissenschaften. Hadjar, Andreas & Rolf Becker, 2009: Erwartete und unerwartete Folgen der Bildungsexpansion in

Deutschland. S. 195-213 in: Becker, Rolf (Hg.), Lehrbuch der Bildungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaften.

Hänsgen, Klaus-Dieter & Benjamin Spicher, 2002: Numerus Clausus: Finden wir mit dem „Eignungs-test für das Medizinstudium“ die Geeigneten? Schweizerische Ärztezeitung 83: S. 1653-1660.

Hartmann, Michael, 2001: Klassenspezifischer Habitus und/oder exklusive Bildungstitel als soziales Selektionskriterium? - Die Besetzung von Spitzenpositionen in der Wirtschaft. S. 157-215 in: Krais, Beate (Hg.), An der Spitze. Von Eliten und herrschenden Klassen. Konstanz: UVK.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 112 

 

Hauser, Robert M. , 2002: Meritocracy, Cognitive Ability, and the Sources of Occupational Success. Paper prepared for the annual meeting of the American Sociological Association, Chicago, 2002. CDE Working Paper. Center for Demography and Ecology, University of Wisconsin-Madison.

Heinz, Walter R., 1996: Status Passages as Micro-Macro Linkages in Life Course Research. S. 51-65 in: Weymann, Ansgar & Walter R. Heinz (Hg.), Society and Biography. Interrelationships between Social Structure, Instiutions and the Life Course. Weinheim: Deutscher Studien Verlag.

Hillmert, Steffen, 2004: Soziale Ungleichheit im Bildungsverlauf: zum Verhältnis von Bildungsinstitu-tionen und Entscheidungen. S. 72-98 in: Becker, Rolf & Wolfgang Lauterbach (Hg.), Bildung als Privileg? Erklärungen und Befunde zu den Ursachen der Bildungsungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften.

Huinink, Johannes & Torsten Schröder, 2008: Skizzen zu einer Theorie des Lebenslaufs. S. 291-308 in: Diekmann, Andreas, Klaus Eichner, Peter Schmidt & Thomas Voss (Hg.), Rational Choice: Theoretische Analysen und empirische Resultate. Festschrift für Karl-Dieter Opp zum 70. Geburts-tag. Wiesbaden: VS Verlag für Sozialwissenschaften.

Hunter, John E. & Ronda F. Hunter, 1984: Validity and Utility of Alternative Predictors of Job Per-formance Psychological Bulletin 96: S. 72-98

Ingenkamp, Karlheinz, 1968: Untersuchungen zur Übergangsauslese (Theorie und Praxis der Schul-psychologie, Band VIII). Weinheim und Berlin: Beltz.

Ingenkamp, Karlheinz (Hg.), 1971: Die Fragwürdigkeit der Zensurengebung. Weinheim und Basel: Beltz.

Ingenkamp, Karlheinz, 1989: Diagnostik in der Schule. Beiträge zu Schlüsselfragen der Schülerbeur-teilung. Weinheim: Beltz.

Jussim, Lee & Kent D. Harber, 2005: Teacher Expectations and Self-Fulfilling Prophecies: Knowns and Unknowns, Resolved and Unresolved Controversies. Personality & Social Psychology Review 9: S. 131-155.

Klieme, Eckhard, 1996: Erfolgsprognose in medizinischen Studiengängen - Zur Validität des Tests für medizinische Studiengänge und anderer Auswahlinstrumente. S. 31-34 in: Hänsgen, Klaus-D., Rainer Hofer & Daniel Ruefli (Hg.), Eignungsdiagnostik und Medizinstudium. Fribourg: Zentrum für Testentwicklung und Diagnostik am Psychologischen Institut der Universität Fribourg.

Köller, Olaf, Jürgen Baumert & Kai U. Schnabel, 1999: Wege zur Hochschulreife. Offenheit des Sys-tems und Sicherung vergleichbarer Standards. Zeitschrift für Erziehungswissenschaft 2: S. 385-422.

Kristen, Cornelia, 2006: Ethnische Diskriminierung in der Grundschule? Die Vergabe von Noten und Bildungsempfehlungen. Kölner Zeitschrift für Soziologie und Sozialpsychologie 58: S. 79-97.

Kühnel, Steffen, Wolfgang Jagodzinski & Michael Terwey, 1989: Teilnehmen oder boykottieren. Ein Anwendungsbeispiel der binären logistischen Regression mit SPSSx. ZA-Informationen 25: S. 44-75.

Lehmann, Rainer H., Rainer Peek & Rüdiger Gänsfuß, 1997: LAU 5 - Aspekte der Lernausgangslage und der Lernentwicklung von Schülerinnen und Schülern, die im Schuljahr 1996/97 eine fünfte Klasse an Hamburger Schulen besuchten. Bericht über die Erhebung im September 1996. Ham-burg.

Madon, Stephanie, Lee Jussim & Jacquelynne Eccles, 1997: In Search of a Powerful Self-Fulfilling Prophecy. Journal of Personality and Social Psychology 72: S. 791-804.

Mayer, Karl Ulrich, 1990: Lebensverläufe und sozialer Wandel. Anmerkungen zu einem Forschungs-programm. S. 7-21 in: Mayer, Karl Ulrich (Hg.), Lebensverläufe und sozialer Wandel. Sonderheft 31/1990 der KZfSS. Opladen: Westdeutscher Verlag.

Mayer, Karl Ulrich, 2004: Whose Lives? How History, Societies and Institutions Define and Shape Life Courses. Research in Human Development 1: S. 161-187.

Mayer, Karl Ulrich & Walter Müller, 1989: Lebensverläufe im Wohlfahrtsstaat. S. 41-60 in: Weymann, Ansgar (Hg.), Handlungsspielräume. Untersuchungen zur Individualisierung und Insti-tutionalisierung von Lebensläufen in der Moderne. Stuttgart: Ferdinand Enke.

Merton, Robert K., 1948: The Self-Fulfilling Prophecy. The Antioch Review 8: S. 193-210. Meulemann, Heiner, 1979: Soziale Herkunft und Schullaufbahn. Arbeitsbuch zur sozialwissenschaftli-

chen Methodenlehre. Frankfurt/New York: Campus. Meulemann, Heiner, 1995: Die Geschichte einer Jugend. Lebenserfolg und Erfolgsdeutung ehemaliger

Gymnasiasten zwischen dem 15. und 30. Lebensjahr. Opladen: Westdeutscher Verlag.

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 113 

 

Meulemann, Heiner, 2001: Einleitung: Erwachsenwerden als Übergang von Identitätsbildung zur Identitätswahrung. S. 11-34 in: Meulemann, Heiner, Klaus Birkelbach & Jörg Otto Hellwig (Hg.), Ankunft im Erwachsenenleben. Lebenserfolg und Erfolgsdeutung in einer Kohorte ehemaliger Gymnasiasten zwischen 16 und 43. Opladen: Leske+Budrich.

Meulemann, Heiner, Hans-Joachim Hummel, Maria Wieken-Mayser, Wilhelm Wiese & Rolf Ziegler (Hg.), 1987: Lebensplanung und Lebenserfolg in privilegierten Lebensläufen. Abschlußbericht ei-nes DFG-Projektes. Köln: Zentralarchiv für empirische Sozialforschung Universität zu Köln.

Morgan, Rick, 1989: Analyses of the Predictive Validity of the SAT and High School Grades From 1976 to 1985. College Board Report No. 89-7 (also: ETS RR No. 89-37). New York. College Entrance Examination Board.

Müller, Walter & Dietmar Haun, 1994: Bildungsgleichheit im sozialen Wandel. Kölner Zeitschrift für Soziologie und Sozialpsychologie 46: S. 1-42.

Müller, Walter, Detlef Pollack, David Reimer & Steffen Schindler, 2009: Hochschullbildung und sozi-ale Ungleichheit. S. 281-319 in: Becker, Rolf (Hg.), Lehrbuch der Bildungssoziologie. Wiesbaden: VS Verlag für Sozialwissenschaften.

OECD, 2006: Assessing Scientific, Reading and Mathematical Literacy. A Framework for PISA 2006. Paris. OECD.

Prenzel, Manfred, Oliver Walter & Andreas Frey, 2007: PISA misst Kompetenzen. Eine Replik auf Rindermann (2006): Was messen internationale Schulleistungsstudien? Psychologische Rundschau 58: S. 128-136.

Raudenbush, Stephen W., 1984: Magnitude of Teacher Expectancy Effects on Pupil IQ as a Function of the Credibility of Expectancy Induction: A Synthesis of Findings From 18 Experiments. Journal of Educational Psychology 76: S. 85-97.

Rauh, Hellgard, 1977: Schulleistungen und Übertrittsempfehlungen am Ende des 4. Schuljahres in ihrer Beziehung zur Entwicklung während der Grundschulzeit - Empirische Längsschnittanalyse eines komplexen Begabungsurteils. S. 14-64 in: Ingenkamp, Karlheinz (Hg.), Schüler und Lehrer-beurteilung. Empirische Untersuchungen zur pädagogischen Diagnostik. Weinheim und Basel: Beltz.

Rindermann, Heiner, 2006: Was messen internationale Schulleistungsstudien? Schulleistungen, Schü-lerfähigkeiten, kognitive Fähigkeiten, Wissen oder allgemeine Intelligenz? Psychologische Rund-schau 57: S. 69–86.

Rindermann, Heiner, 2007: Intelligenz, kognitive Fähigkeiten, Humankapital und Rationalität auf verschiedene Ebenen. Psychologische Rundschau 58: S. 137-145.

Robbins, Steven B. , Kristy Lauver, Huy Le, Daniel Davis, Ronelle Langley & Aaron Carlstrom, 2004: Do psychosocial and study skill factors predict college outcomes? A meta-analysis. Psychological Bulletin 130: S. 261 - 288.

Rosenthal, Robert, 1994: Interpersonal Expectancy Effects: A 30-Year Perspective. Current Directions in Psycholgy Science 3: S. 176-179.

Rosenthal, Robert & Leonore Jacobson, 1966: Teachers' Expectancies: Determinants Of Pupils' IQ Gains. Psychological Reports 19: S. 115-118.

Rosenthal, Robert & Leonore Jacobson, 1971: Pygmalion im Unterricht. Lehrererwartung und Intelligenzenwicklung der Schüler. Weinheim und Basel: Beltz.

Sauer, Joachim, 2001: Prognose von Schulerfolg. S. 544-555 in: Rost, Detlef H. (Hg.), Handwörter-buch Pädagogische Psychologie (2. Auflage). Weinheim: Beltz/PVU.

Sauer, Joachim & Erich Gamsjäger, 1986: Ist Schulerfolg vorhersagbar? Die Determinanten der Grundschulleistung und ihr prognostischer Wert für den Sekundarschulerfolg. Göttingen: Hogrefe.

Schelsky, Helmut, 1957: Schule und Erziehung in der industriellen Gesellschaft. Würzburg: Werk-bund.

Schmidt, Frank L., 2002: The Role of General Cognitive Ability and Job Performance: Why There Cannot Be a Debate. Human Performance 15: S. 187-210.

Schmidt, Frank L. & John E. Hunter, 1998: The Validity and Utility of Selection Methods in Person-nel Psychology. Practical and Theoretical Implications of 85 Years of Research Findings. . Psycho-logical Bulletin 124: S. 262-274

Schmidt, Frank L. & John E. Hunter, 2000: Messbare Personenmerkmale: Stabilität, Variabilität und Validität zur Vorhersage zukünftiger Berufsleistung und berufsbezogenen Lernens. S. 15-43 in:

Lehrerurteile im Lebensverlauf: Valide Prognose oder Self-Fulfilling Prophecy? 114 

 

Kleinmann, M. & B. Strauß (Hg.), Potentialfeststellung und Personalentwicklung. Göttingen: Hog-refe.

Schrader, Friedrich-Wilhelm & Andreas Helmke, 2001: Alltägliche Leistungsbeurteilung durch Leh-rer. S. 45-58 in: Weinert, Franz E. (Hg.), Leistungsmessungen in Schulen. Weinheim und Basel: Beltz

Schuler, Heinz, 1998: Noten und Studien- und Berufserfolg. . S. 370-374 in: Rost, Detlef H. (Hg.), Handwörterbuch Pädagogische Psychologie (2. Auflage). Weinheim: Beltz/PVU.

Tent, Lothar, 2001: Zensuren. S. 580-584 in: Rost, Detlef H. (Hg.), Handwörterbuch Pädagogische Psychologie (2. Auflage). Weinheim: Beltz/PVU.

Trautwein, Ulrich, Oliver Lüdtke, Michael Becker, Marko Neumann & Gabriel Nagy, 2008: Die Se-kundarstufe I im Spiegel der empirischen Bildungsforschung: Schulleistungsentwicklung, Kompe-tenzniveaus und die Aussagekraft von Schulnoten. S. 91-107 in: Schlemmer, Elisabeth & Herbert Gerstberger (Hg.), Ausbildungsfähigkeit im Spannungsfeld zwischen Wissenschaft, Politik und Praxis. Wiesbaden: VS Verlag für Sozialwissenschaften.

Treiman, Donald J., 1977: Occupational Prestige in Comparative Perspective. New York: Academic Press.

Wegener, Bernd, 1988: Kritik des Prestiges. Opladen: Westdeutscher Verlag. Wineburg, Samuel S., 1987: The Self-Fulfillment of the Self-Fulfilling Prophecy. Educational Resear-

cher 16: S. 28-37. Ziegenspeck, Jörg W., 1999: Handbuch Zensur und Zeugnis in der Schule. Historischer Rückblick,

allgemeine Problematik, empirische Befunde und bildungspolitische Implikationen. Bad Heilbrunn: Verlag Julius Klinkhardt.

 

 

 

  

Aufbereitung der Daten der Lehrerzusatzerhebung und deren

Integration in die Daten des Kölner Gymnasiasten-Panels (KGP)

Dominik Becker (Cologne Graduate School of Economics, Management and Social Sciences,

Universität zu Köln)

Klaus Birkelbach (Fachbereich Bildungswissenschaften, Zentrum für Empirische Bildungsforschung,

Universität Duisburg-Essen)

Essen 2009

Dokumentation der Datenaufbereitung 116  

 

 

1 Die Lehrerzusatzerhebung im Rahmen des Kölner Gymnasiasten-Panels (KGP)

1.1 Primärerhebung 1969/70

1.1.1 Schüler In einem vom Land NRW finanzierten Projekt zur „Sozialstrukturanalyse der Schule“ wurden zwischen Dezember 1969 und März 1970 im damals von René König geleiteten Kölner For-schungsinstitut für Soziologie unter der Leitung von Hans-Joachim Hummell, Michael Klein, Maria Wieken-Mayser und Rolf Ziegler in 121 Klassen aus 68 Gymnasien in Nordrhein-Westfalen insgesamt 3240 nordrhein-westfälische Gymnasiasten des 10. Schuljahres klassen-weise u.a. über ihre schulischen Interessen, Leistungen und Pläne, ihre soziale Herkunft und ihre Einstellungen zu Elternhaus und Schule befragt. Im Rahmen der Befragung wurde auch ein Intelligenz-Struktur-Test (Amthauer 1953) mit vier Subskalen (Wortauswahl-, Analogie-, Zahlenreihen- und Würfeltest) des IST durchgeführt. Die Daten der Schülerbefragung (Pri-märerhebung) sind unter der Studiennummer 600 im Kölner Datenarchiv für Sozialwissen-schaften verfügbar.1

1.1.2 Eltern Parallel zu der Erhebung bei den Schüler/innen wurden deren Eltern (n=2646) u.a. zum sozia-len Hintergrund der Schüler/innen, zu den Bildungsaspirationen und zum Erziehungsstil be-fragt. Die Daten sind unter der Studiennummer 639 verfügbar.

1.1.3 Lehrer Ebenfalls parallel zur Schülerbefragung wurden alle Lehrer der 68 Gymnasien (insgesamt n=2680, darunter allerdings n=1599 Lehrkräfte, die nicht in den befragten Klassen unterrich-tet haben und daher auch keine Beurteilungen abgegeben haben) befragt. Gegenstand der Be-fragung waren unter anderem deren pädagogische Konzepte, Anforderungen an die Schüler, Elternkontakte, Erziehungsziele, Charakteristika des Lehrerkollegiums und der Schule. Die Daten sind unter der Studiennummer 640 verfügbar.

In einem Zusatzbogen wurden die Lehrer, die in den befragten Klassen unterrichteten, um Einschätzungen ihrer Schüler/-innen gebeten. Die Zusatzbögen lagen, anders als im maschi-nenlesbaren Codebuch zur Studie 640 ausgewiesen, bisher nur in Fragebogenform und noch nicht als Datei vor und mussten für die im Rahmen dieses Berichts vorgelegten Auswertungen erst von Hand erfasst werden.2 Da jeder Lehrer mehrere Schüler beurteilt hat, aber auch die Schüler jeweils durch mehrere Lehrer beurteilt wurden, wurde sowohl auf Lehrer- als auch

                                                       1 Dieser Datensatz enthält nur die Rohwerte der Intelligenztests. Die entsprechend der Tabellen des Testbe-

gleitheftes in Standardwerte transformierten Daten wurden der Datei „GYM“ (die darüber hinaus eine Teil-menge der Variablen der Schüler- und Elternbefragung enthält) zu dem Arbeitsbuch zur sozialwissenschaftli-chen Methodenlehre „Soziale Herkunft und Schullaufbahn“ (Meulemann 1979) entnommen. Darüber hinaus enthält diese Datei die Noten der Schüler nicht als Rohwerte, sondern im Klassenverband standardisiert. Auch diese Datei ist im Kölner Archiv (Studiennummer 1032) erhältlich.

2 Wir danken Maria Wieken-Mayser und Heiner Meulemann sowie den Kollegen am Kölner Datenarchiv für Sozialforschung der GESIS für ihre Unterstützung bei der Aufbereitung der Daten.

Dokumentation der Datenaufbereitung 117  

 

 

auf Schülerebene eine eigene Datei mit Lehrerurteilen abgespeichert. Der Aufbau dieser Da-teien wird unten erläutert. Beide Dateien werden dem Kölner Archiv übergeben.

1.1.4 Direktorenbefragung Zeitgleich wurden auch die Direktoren der 68 Gymnasien u.a. zu Besonderheiten der Schule, dem Bildungskonzept der Schule und zur sozialen Zusammensetzung der Schülerschaft be-fragt. Die Datei enthält darüber hinaus wichtige regionale Kontextmerkmale der Schule: Rela-tiver Gymnasialbesuch, Anteil der unselbständig Beschäftigten, Anteil der im primären, se-kundären und tertiären Bereich Beschäftigten, Index des Bruttoinlandsproduktes, Bevölke-rungsdichte, Kreiskennziffer. Die Daten liegen unter der Studiennummer 996 vor.

1.2 Aktenanalyse zur Ermittlung der Noten Mithilfe einer am Zentralarchiv für empirische Sozialforschung (ZA) durchgeführten Akten-analyse konnten 1981/82 die Zeugnisnoten des 10. Schuljahres und die Noten im Abitur er-mittelt werden (Studiennummer 1440).

1.3 Erste Wiederbefragung 1984/85 (WB1) Zu der Primärerhebung wurde zwischen September 1984 und Juni 1985 eine erste Wiederbe-fragung durchgeführt, in der die nunmehr rund 30-Jährigen ehemaligen Schülerinnen und Schüler (n=1987) detailliert über ihren beruflichen und privaten Werdegang zwischen dem 15. und dem 30. Lebensjahr Auskunft gegeben haben. Darüber hinaus wurden u.a. Einstel-lungsfragen der Primärerhebung repliziert und Fragen zum Lebenserfolg und zur Erfolgsdeu-tung gestellt. Die Daten liegen unter der Studiennummer 1441 vor.3 Ergebnisse dieser Unter-suchung werden u.a. in den Berichten an die DFG (Meulemann et al. 1987; Meulemann et al. 1993) und von Meulemann (1995) und Birkelbach (1998a) zusammengefasst.

1.4 Zweite Wiederbefragung 1996/97 (WB2) Zwischen Dezember 1996 und Juli 1997 wurde im Kölner Institut für Angewandte Sozialfor-schung eine zweite Wiederbefragung durchgeführt, in der die nunmehr rund 43-Jährigen (n=1596) wiederum über ihren beruflichen und privaten Werdegang befragt wurden. In der telefonisch durchgeführten Befragung wurde unmittelbar an die Lebensphasen der ersten Wiederbefragung angeknüpft, sowie wiederum verschiedene Fragen der beiden Vorgängerbe-fragungen repliziert und durch weitere Einstellungsfragen ergänzt. Das Generalthema beider Wiederbefragung waren der Lebenserfolg in Beruf und Familie und die Erfolgsdeutung. Im 30. Lebensjahr stehen dabei noch die Identitätsfindung und der Übergang vom Jugendlichen zum Erwachsenen, im 43. Lebensjahr jedoch die Identitätswahrung der Erwachsenen im Vor-dergrund. Die Daten liegen unter der Studiennummer 4228 im Kölner GESIS-Archiv vor. Die Erhebung wird in dem Arbeitsbericht an die DFG (Birkelbach et al. 2000a) ausführlich do-kumentiert. Eine Analyse zur Frage der Panelmortalität wurde von Birkelbach (1998b) vorge-

                                                       3 Die erste Wiederbefragung wurde von der Deutschen Forschungsgemeinschaft drei Jahre gefördert. Projekt-

leiter waren Hans-Joachim Hummell, Heiner Meulemann, Maria Wieken-Mayser und Rolf Ziegler; Projekt-mitarbeiter war Wilhelm Wiese. Das Projekt wurde vom Zentralarchiv für Empirische Sozialforschung der Universität zu Köln institutionell getragen. Die Feldarbeit wurde von GETAS-Institut Bremen durchgeführt. Zusätzlich zur Erhebung hat die Deutsche Forschungsgemeinschaft eine zweijährige Auswertungsphase fi-nanziert, die von Heiner Meulemann geleitet und von Stefan Blaneck und Klaus Birkelbach bearbeitet wurde.

Dokumentation der Datenaufbereitung 118  

 

 

legt. Inhaltliche Ergebnisse werden u.a. in den Berichten an die DFG (Birkelbach et al. 1998, 2000b) und in einem Reader (Meulemann et al. 2001) zusammengefasst.4

1.5 Dritte Wiederbefragung 2010 (WB3) Eine dritte Wiederbefragung befindet sich zurzeit in Vorbereitung, die Feldphase ist für die erste Jahreshälfte 2010 vorgesehen. Dabei wird wiederum der berufliche und private Lebens-verlauf seit WB2 der dann rund 55-jährigen ehemaligen Gymnasiasten retrospektiv erhoben sowie Fragen aus früheren Panelwellen repliziert. Neues Thema dieser Befragung ist darüber hinaus die Vorbereitung auf das Alter. Das Projekt wird zunächst für 30 Monate von der DFG gefördert, Antragsteller waren Heiner Meulemann (Universität zu Köln) und Klaus Birkel-bach (Universität Duisburg-Essen).

2 Umfang und Struktur des Materials der Lehrerzusatzbögen

Von insgesamt 628 auswertbaren Zusatzbögen5 wurden die Daten der Fragen 2 bis 4, 6,7, 8, 10,13 in einer Datenmatrix erfasst.6 Dabei handelt es sich um die Fragen, die für die geplanten Untersuchungen als relevant eingeschätzt wurden. Es wurden nur die Zusatzbögen mit Anga-ben in der Datei „0 Lehrerzusatzbögen1970.SAV“ erfasst.

Da jeder Lehrer die Schüler von einer oder zwei Klassen beurteilen konnte, enthält die Datei insgesamt 17.562 Datensätze mit Lehrerurteilen zu einzelnen Schülern. Dabei ist zu beachten, dass die Schüler auch von mehreren Lehrern ihrer Schule (max. 10 Lehrer) beurteilt wurden, so dass die einzelnen Schüler mehrfach in der Datei enthalten sind, aber jeweils mit der Beur-teilung durch unterschiedliche Lehrer.

Die Datei „1 Lehrer Zusatzbögen inkl. ZA0640.sav“ (= „LEHRZUS_L.SAV“) ist ähnlich aufgebaut, aber jeder Datensatz enthält auch die unter der Studiennummer 640 erhältlichen Informationen der eigentlichen Lehrerbefragung. Dabei wurden jedem Lehrerurteil in dem SPSS-Syntaxfile „1 Lehrer Zusatzbögen einlesen labeln und Grundauszählung.SPS“ die In-formationen aus der Lehrerbefragung zugeordnet.

                                                       4 Die zweite Wiederbefragung wurde von der Deutschen Forschungsgemeinschaft vier Jahre gefördert. Sie

wurde von Heiner Meulemann beantragt und mit Klaus Birkelbach als Projektkoordinator und Jörg-Otto Hellwig als Projektmitarbeiter und Werner Hemsing als Mitarbeiter des Instituts für Angewandte Sozialfor-schung durchgeführt. Das Projekt wurde vom Institut für Angewandte Sozialforschung der Universität zu Köln institutionell getragen. Die Feldarbeit wurde vom Projektteam geleitet und von Studenten der Universi-tät zu Köln durchgeführt.

5 Die Zusatzbögen sind im Anhang dokumentiert. 6 Nach den Angaben im Lehrerdatensatz (ZA Nr. 640, V7 Sample Filter 2) war mit 691 Zusatzbögen zu rech-

nen. Die Differenz zu den tatsächlich aufgefundenen Fragebögen ist möglicherweise darauf zurückzuführen, dass nicht alle gezählten Fragebögen auch ausgefüllt waren und leere Bögen nicht aufbewahrt wurden.

Dokumentation der Datenaufbereitung 119  

 

 

Tabelle 1 Aufbau der SPSS-Datei „0 Lehrerzusatzbögen1970.SAV“

Spalte Var. Inhalt Weitere Angaben 1-2 L2 Nr. der Schule Kode 4/5 auf S. 1 ZB 3-4 L3 Nr. des Lehrers/Schule Kode 6/7 auf S. 1 ZB 5 L4 Nr. der Klasse/Schule Kode 8 auf S. 1 ZB 6-7 L5 Nr. des Schülers/Klasse Kennziffer S. 2 ZB 8 L6 Prognose für das Schuljahres-

ende (Frage 2) 1-A: Wird zu den Besten gehören 2-B: Wird keine Schwierigkeiten haben 3-C: Wird wahrscheinlich einige Schwierigkeiten haben 4-D: Wird kaum versetzt 9 Keine Angabe

9 L7 Eignung für Studium (Frage 3 und 4)

1: Ja (Frage 3 Schüler angekreuzt) 2: Nein (Frage 4 Schüler angekreuzt) 9: KA zu dem jeweiligen Schüler

10 L8 Beliebtheit des Schülers (Fra-gen 6 und 7)

1: Ja (Frage 6 Schüler angekreuzt) 2: Nein (Frage 7 Schüler angekreuzt) 9: KA zu dem jeweiligen Schüler

11 L9 Schlechtes Betragen (Frage 8)

1 ja: Frage 8 Schüler angekreuzt 0: Frage 8 Schüler nicht angekreuzt 9: KA zu Schülern

12 L10 Gibt Ton in Klasse an (Frage 10)

1 ja: Frage 10 Schüler angekreuzt 0: Frage 10 Schüler nicht angekreuzt 9: KA zu Schülern

13 L11 Elternkontakt (Frage 11)

1 gut: Schüler bei 13a angekreuzt 2 könnte besser sein: Schüler bei 13b angekreuzt 9: KA zu Schülern

Ein solcher Datensatz ist für Analysen auf Schülerebene nicht geeignet. Es war daher not-wendig, die Daten so umzustrukturieren, dass die Fälle die Schüler sind.7 Die dazu notwendi-gen Anweisungen finden sich in dem Syntaxfile „2 Lehrerurteile je Schueler.sps“; der Name der resultierenden SPSS-Datei lautet entsprechend „2 Lehrerurteile je Schueler.sav“. Sie ent-hält für einen Schüler die Beurteilungen von bis zu 10 Lehrern. Diese können bei Bedarf zu-sammengefasst werden. Darüber hinaus können durch eine Erweiterung der Syntaxdatei zu-sätzliche Lehrermerkmale mit in die Datei übernommen werden.

Es ist davon auszugehen, dass die Klassenlehrer ihre Schüler valider beurteilen können, als einzelne Fachlehrer, die teilweise nur eine oder zwei Stunden Unterricht in den jeweiligen Klassen geben. Daher wurde unter den Lehrern, von denen Beurteilungen der Schüler vorlie-gen, der jeweilige Klassenlehrer mithilfe der in „3 Lehrerurteile_KL.sps“ dokumentierten SPSS-Syntax identifiziert und in der Datei „3 Lehrerurteile_KL.sav“ abgespeichert. Diese Datei wurde mit der Datei „2 Lehrerurteile je Schueler.sav“ zur Datei „4 Lehrerurteile je

                                                       7 Technisch geschieht dies, indem zunächst die Variablen innerhalb des Lehrerdatensatzes zuerst nach der

Schüler-ID und anschließend nach der Lehrer-ID sortiert werden (sort cases). Die den Schülern zugeordneten Lehrern werden sodann gemäß ihrer Sortierung „gerankt“, d.h. es wird eine Rank-Variable berechnet, die den „Rang“ jedes einzelnen Lehrers je Schüler ausdrückt (1, 2, 3 usw.). Die Rank-Variable dient nun der Berech-nung von neuen Variablen des Typs „Lehrermerkmal pro Schüler und Lehrer“ (z.B. Geschlecht Lehrer1, Ge-schlecht Lehrer2, Geschlecht Lehrer10). Die neu berechneten Variablen werden zunächst aus technischen Gründen in Einzeldatensätzen pro Lehrerrang abgespeichert (d.h. Geschlecht Lehrer1, Alter Lehrer1; Ge-schlecht Lehrer2, Alter Lehrer2 usw.) und anschließend anhand der Schüler-ID zusammen geführt.

Dokumentation der Datenaufbereitung 120  

 

 

Schueler inkl Klassenlehrer.sav“ zusammengeführt. Diese Datei enthält 3318 Schülerfälle und 77 Variablen (vgl. Tabelle 2).

Tabelle 2 Aufbau der Datei „4 Lehrerurteile je Schueler inkl Klassenlehrer.sav“

IDT Identifikationsnummer Schüler IDL_KL IDL01 – IDL10

Identifikationsnummer Klassenlehrer Lehrer1 bis 10

progschul_kl progschul_lehr1 – progschul_lehr10

Prognose Schuljahrsende Klassenlehrer Lehrer1 bis 10

progstud_kl progstud_lehr1 – progstud_lehr10

Prognose Eignung Studium Klassenlehrer Lehrer1 bis 10

beliebt_kl beliebt_lehr1 – beliebt_lehr10

Einschätzung Schüler beliebt Klassenlehrer Lehrer1 bis 10

betrag_kl betrag_lehr1 – betrag_lehr10

Einschätzung Schüler Betragen Klassenlehrer Lehrer1 bis 10

ton_kl ton_lehr1 – ton_lehr10

Einschätzung Schüler gibt Ton an Klassenlehrer Lehrer1 bis 10

eltern_kl eltern_lehr1 – eltern_lehr10

Einschätzung Elternkontakte Klassenlehrer Lehrer1 bis 10

3 Struktur der Identifikationsnummern

Die einzelnen Dateien lassen sich über die einzelnen Elemente der Identifikationsnummern verknüpfen. Die folgenden Tabellen sollen daher einen Überblick über den Aufbau der Identi-fikationsnummern geben.

Tabelle 3 Struktur der Identifikationsnummer

Identifikationsnummer der Schüler (V2 in ZA S600) und IDT in den anderen Schülerdaten

1. Stelle 2. Stelle 3. Stelle 4. Stelle 5. Stelle Nr. der Schule (V3 in S600) 01-70 insgesamt 68 Schulen (lfd. Nr. 24,40 feh-len)

Nummer der Klasse innerhalb der Schule: 1,2 (V4 in S600) insge-samt 121 Klassen

Nummer des Schülers (V5 in S600) in-nerhalb der Klasse (1 bis 43)

Identifikationsnummer der Lehrer (IDL, V2 in ZA S640)

1. Stelle 2. Stelle 3. Stelle 4. Stelle 5. Stelle Typ Lehrer 3: Lehrer an Schule (n=1599) 4: Lehrer in Klasse10 (n=1081)

Nr. der Schule 01-70 insgesamt 68 Schulen (Nr. 24,40 fehlen)

Nummer des Lehrers i. d. Schule

Identifikationsnummern auf den Zusatzbögen (nur Lehrer Typ 4)

1. Stelle 2. Stelle 3. Stelle 4. Stelle 5. Stelle 6. Stelle 7. Stelle Information auf dem Deckblatt der Zusatzbögen Seite 2 der Zusatzbögen Nr. der Schule (V3 in S600) 01-70 insgesamt 68 Schulen (24,40 fehlen)

Nr. des Lehrers in der Schule Nr. der Klasse in der Schule (V4 in S600) (1,2) insgesamt 121 Klassen

Nummer des Schülers in der Klasse

Dokumentation der Datenaufbereitung 121  

 

 

4 Literatur

Birkelbach, Klaus, 1998a: Berufserfolg und Familiengründung. Lebensläufe zwischen institu-tionellen Bedingungen und individueller Konstruktion. Opladen: Westdeutscher Verlag.

Birkelbach, Klaus, 1998b: Befragungsthema und Panelmortalität: Ausfälle in einer Lebens-lauferhebung. ZA-Informationen 42: S. 128-147.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 1998: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 2: Erste Ergebnisse. Projektzwischen-bericht zur Vorlage bei der DFG. Köln: Institut für Angewandte Sozialforschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000a: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 1: Arbeitsbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Birkelbach, Klaus, Jörg Otto Hellwig, Werner Hemsing & Heiner Meulemann (Hg.), 2000b: Lebenserfolg und Erfolgsdeutung im frühen Erwachsenenalter. Eine Wiederbefragung ehemaliger Gymnasiasten im 43. Lebensjahr. Teil 2: Ergebnisbericht. Projektbericht zur Vorlage bei der DFG (Az. 577/7-1). Köln: Institut für Angewandte Sozialforschung.

Meulemann, Heiner, 1979: Soziale Herkunft und Schullaufbahn. Arbeitsbuch zur sozialwis-senschaftlichen Methodenlehre. Frankfurt/New York: Campus.

Meulemann, Heiner, 1995: Die Geschichte einer Jugend. Lebenserfolg und Erfolgsdeutung ehemaliger Gymnasiasten zwischen dem 15. und 30. Lebensjahr. Opladen: Westdeut-scher Verlag.

Meulemann, Heiner, Klaus Birkelbach & Stephan Blaneck (Hg.), 1993: Fachliche und private Bedingungen des Studien- und Berufserfolgs. Endbericht eines von der Deutschen For-schungsgemeinschaft geförderten Projektes. Düsseldorf: Sozialwissenschaftliches Institut der Heinrich-Universität.

Meulemann, Heiner, Klaus Birkelbach & Jörg Otto Hellwig (Hg.), 2001: Ankunft im Erwach-senenleben. Lebenserfolg und Erfolgsdeutung in einer Kohorte ehemaliger Gymnasiasten zwischen 16 und 43. Opladen: Leske+Budrich.

Meulemann, Heiner, Hans-Joachim Hummel, Maria Wieken-Mayser, Wilhelm Wiese & Rolf Ziegler (Hg.), 1987: Lebensplanung und Lebenserfolg in privilegierten Lebensläufen. Abschlußbericht eines DFG-Projektes. Köln: Zentralarchiv für empirische Sozialfor-schung Universität zu Köln.

5 Dateien auf beiliegender CD-ROM

0 Lehrerzusatzbögen1970.SAV (Rohdaten) 1 Lehrer Zusatzbögen einlesen labeln und Grundauszählung.SPS 1 Lehrer Zusatzbögen inkl. ZA0640.sav 2 Lehrerurteile je Schueler.sps 2 Lehrerurteile je Schueler.SAV 3 Lehrerurteile_KL.sps 3 Lehrerurteile_KL.SAV 4 Lehrerurteile je Schueler inkl Klassenlehrer.sps 4 Lehrerurteile je Schueler inkl Klassenlehrer.sav

Dokumentation der Datenaufbereitung 122  

 

 

6 Anhang Lehrerzusatzbögen

Dokumentation der Datenaufbereitung 123  

 

 

Dokumentation der Datenaufbereitung 124  

 

 

Dokumentation der Datenaufbereitung 125  

 

 

Dokumentation der Datenaufbereitung 126  

 

 

Dokumentation der Datenaufbereitung 127