Kapitel 14

Embed Size (px)

Citation preview

Es ist keine bertreibung, dass jegliches Verhalten eine Wahl einschliet. Selbst in den reizrmsten Experimentierkarnrnern kann ein Tier whlen, ob es die operante Reaktion zeigt, die Kammer erkundet, sitzt, steht, sich putzt, schlft usw. Fr Tiere auerhalb des Labors sind die Wahlmglichkeiten noch viel zahlreicher. Zu jedem Zeitpunkt kann ein Organismus whlen, mit seinem bisherigen Verhalten fortzufahren oder zu einem anderen zu wechseln. Die Konsequenzen einiger Wahlen (wie etwa ein Stck Futter mit der linken oder rechten Tatze aufzunehmen) sind vielleicht flchtig und unbedeutend, wohingegen andere Wahlen (zum Beispiel vor einem Gegner zu fliehen oder gegen ihn zu kmpfen) wichtige und nicht umkehrbare Konsequenzen haben knnen. In jedem Fall sollte jedoch klar sein, dass ein Verstehen, wie Wahlen getroffen werden, fr ein Verstehen des Verhaltens selbst wesentlich ist. Seit den sechziger Jahren des letzten Jahrhunderts beschftigten sich viele Experimente auf dem Gebiet der operanten Konditionierung mit dem Wahlverhalten, wie eine rasche Durchsicht von Zeitschriften wie Journal o the Experimental Analysis of Behavior oder f Animal Learning and Behavior zeigt. Auch wenn es unmglich ist, diesem groen und weiter wachsenden Wissensgebiet gerecht zu werden, versucht dieses Kapitel, reprsentative Beispiele fr einige wichtige Experimente, Theorien und kontroverse Punkte in diesem Bereich zu liefern. Eine der beeindruckendsten Eigenschaften des Verhaltens von Tieren in Wahlsituationen ist seine Regelmigkeit und Vorhersagbarkeit. Ein groer Teil meiner eigenen Forschungsarbeiten beschftigt sich mit Wahlverhalten, und wenn ich meine Studenten und Besucher durch meine Labors fhre, fragen sie oft: ,,Knnen denn diese Tauben und Ratten wirklich die komplexen Wahlmglichkeiten, die Sie ihnen prsentieren, verstehen und anders als nur planlos darauf reagieren?" Die Antwort ist, dass sie es ganz bestimmt knnen (und die Forschung auf dem Gebiet Wahlverhalten wre nicht so gediehen, wenn Tiere sich nicht so regelgem verhielten). Vielleicht ist der Grund, warum Menschen diese Frage so oft stellen, der, dass das Verhalten von Tieren in freier Wildbahn einem zuflligen Beobachter planlos und unvorhersagbar erscheint. Wenn Sie das Verhalten einer Taube auf einem Gehweg in der Stadt beobachten, ist es vielleicht schwierig, Ordnung in ihrem Verhalten zu erkennen. Sie luft beispielsweise vorwrts, dann nach links, nach rechts, hlt an, dreht sich um usw., ohne klar erkennbares Muster. Vielleicht pickt sie auf einige Objekte am Boden oder bewegt sich auf eine andere Taube zu oder von ihr weg; vielleicht fliegt sie ohne erkennbaren Anlass davon. Obgleich die Verhaltensauswahl der Taube dem Zufallsprinzip zu unterliegen scheint, ist dies doch zum grten Teil auf die Komplexitt und Zuflligkeit ihrer natrlichen Umgebung zurckzufhren, denn wrde man dieselbe Taube ins Versuchslabor bringen, wrde ihr Verhalten bei einer vereinfachten Wahlsituation mit Sicherheit einige erstaunliche Regelmigkeiten aufweisen. Ein relativ einfacher mathematischer Ausdruck, der einige der Regelmigkeiten eines Verhaltens in vielen Wahlsituationen umfasst, ist das so genannte Gesetz des Matching, entwickelt von Richard Herrnstein. Die nchsten Abschnitte beschreiben das Gesetz des Matching, zeigen, wie es auf verschiedene Arten von Versuchsergebnissen Anwendung fand und errtert einige Theorien dazu, warum das Matching-Verhalten bei Auswahlexperimenten ein solch vorherrschendes Resultat ist.

Das Gesetz des MatchingHerrnsteins (1 961) ExperimentHerrnstein benutzte eine Versuchskammer mit zwei Reaktionstasten, die einige Zentimeter voneinander in einer Seitenwand angebracht waren: eine rote Taste links und eine weie Taste rechts. Unten in der Mitte zwischen den beiden Tasten war eine ffnung, durch die Futterkrner als Verstrker gegeben werden konnten. Das Experiment bestand aus einer Reihe von Situationen, in denen jede Taste von ihrem eigenen VI-Verstrkerplan gesteuert wurde. Einmal wurde zum Beispiel Picken auf die linke Taste mit einem VI135-Sekunden-Plan verstrkt und Picks auf die rechte Taste mit einem VI-270-SekundenPlan. (Technisch wird dieser Plan als gleichzeitig ablaufender VI- 135-Sekunden-NI-270Sekunden-Plan bezeichnet. Im Allgemeinen bezeichnet man jede Situation, in der zwei oder mehr Verstrkerplne gleichzeitig prsentiert werden, als gleichzeitig ablaufende Verstrkerplne [engl.: concurrent schedules].) Die Plne der beiden Tasten waren unabhngig voneinander - das heit, jede Taste hatte ihren eigenen VI-Timer. Wie in jedem typischen VI-Plan wurde der VI-Timer fr die jeweilige Taste nach Hinterlegen des Verstrkers gestoppt, bis der Verstrker aufgenommen worden war. In dieser Situation erhielten die Vgel etwa 27 Verstrker pro Stunde ber die linke Taste und 13 pro Stunde (halb so viele) ber die rechte. Herrnsteins Hauptfrage war: Nachdem die Vgel so viel wie mglich ber diese Wahlsituation gelernt haben - wie werden sie ihre Reaktionen verteilen? Er gab ihnen deshalb tagelanges Training mit denselben beiden VI-Plnen und zhlte dann ihre Reaktionen. Wie bei den meisten VI-Plnen zeigten die Tiere fr jeden erhaltenen Verstrker viele Reaktionen. Was jedoch interessant ist: Als etwa zwei Drittel der Verstrker ber die linke Taste kamen, pickten die Vgel auch in etwa zwei Drittel aller Flle auf die linke Taste. Das heit: Der Anteil an Reaktionen auf die linke Taste entsprach dem Anteil der ber diese Taste verabreichten Verstrker. In einer weiteren Situation bei diesem Experiment erhielten zwei Vgel nur etwa 15 Prozent ihrer Verstrker ber die linke Taste, und ebenso pickten die Vgel in etwa 15 Prozent aller Flle auf die linke Taste. Wiederum entsprach der Anteil der Reaktionen auf die linke Taste dem Anteil an Verstrkern, der ber diese Taste erhltlich war. Auf der Grundlage von Resultaten wie diesen schlug Herrnstein das folgende allgemeine Prinzip vor, das nun als das Gesetz des Matching bekannt ist:

II

I

B1 ist die Anzahl der Reaktionen vom Typ 1 (zum Beispiel Picken auf die linke Taste) und B2 die Anzahl der Reaktionen vom Typ 2 (zum Beispiel Picken auf die rechte Taste). In hnlicher Weise ist R1 die Anzahl von Verstrkern, die durch Reaktion 1 erhltlich sind, und R2 die Anzahl von Verstrkern, die durch Reaktion 2 erhltlich sind. Die Gleichung 14-1 sagt: In einer Wahlsituation mit zwei Mglichkeiten sollte der Anteil an

Reaktionen auf eine der beiden Alternativen dem proportionalen Anteil der Verstrker entsprechen, die bei dieser Alternative verabreicht werden. Abbildung 14.1 gibt die Resultate aus allen Bedingungen in Herrnsteins Experiment wieder. Die x-Achse stellt den Prozentsatz an Verstrkern, die ber die linke Taste verabreicht wurden, dar und die y-Achse den Prozentsatz an Reaktionen auf die linke Taste. Nach dem Gesetz des Matching sollten die Datenpunkte auf der Diagonalen liegen, da dort die beiden Prozentstze gleich sind. Wie man sehen kann, fallen die Punkte nicht genau auf die Diagonale, doch sind alle Punkte in ihrer Nhe. Auerdem scheinen die Abweichungen von den Vorhersagen des Matching-Gesetzes eher zufllig als systematisch zu sein. Wir knnen deshalb den Schluss ziehen, dass das Gesetz des Matching eine gute Beschreibung fr das Verhalten des Versuchstiers gibt, mit Ausnahme der Art von Zufallsabweichungen, die in jedem psychologischen Experiment auftreten.

0

10

20

30

40

50

60

70

80

90

100

% Verstrkungen auf Taste 1

Abbildung 14.1: Die Resultate von drei Tauben in Herrnsteins (1 961) Experiment mit gleichzeitig ablaufenden VI-/VI-Plnen. jeder Punkt zeigt die Resultate einer anderen Bedingung. Die Diagonale das zeigt die Vorhersage des Gesetzes des Matching (Gleichung 14-I), besagt, dass der Prozentsatz an Reaktionen dem Prozentsatz an Verstrkungen entspricht.

Andere Experimente zum MatchingEin Grund, weshalb viele Forscher zu der Ansicht gelangt sind, dass das Gesetz des Matching ein wichtiges Prinzip des Wahlverhaltens ist, ist, dass es mit einigem Erfolg bei vielen verschiedenen Experimenten sowohl mit Menschen als auch mit Tieren angewendet wurde (siehe Davison & McCarthy, 1988). Ein Experiment untersuchte die soziale Interaktion zwischen College-Studenten (Conger & Killeen, 1974). Gruppen von jeweils vier Studenten saen um einen Tisch und fhrten ein 30-mintiges Gesprch zum Thema Drogenmissbrauch. Die Studenten wussten, dass ihr Gesprch auf Video aufgenommen wurde und spter von den Versuchsleitern analysiert wrde. Drei Mitglieder der Gruppe waren jedoch keine echten Versuchspersonen, sondern Vertraute des Versuchsleiters. Die Aufgabe des Mitarbeiters, der der Versuchsperson gegenber sa, war, das Gesprch in Gang zu halten. Die Aufgaben der Mitarbeiter zur Linken und Rechten der Versuchsperson waren, verbale Verstrker nach zwei unterschiedlichen VI-Plnen zu verabreichen. Wann immer der Mitarbeiter zur Linken zum Beispiel ein Signal erhielt (ein Licht, das nur er sehen konnte), verstrkte er die nchste Aussage der Versuchsperson, indem er Dinge sagte wie ,,Das ist ein wichtiger Gesichtspunkt". Dasselbe galt fr den Mitarbeiter zur Rechten. Conger und Killeen lieen spter mehrere Beobachter die Videoaufzeichnungen sehen und maen, wie lange die Versuchsperson sich an den Mitarbeiter zu ihrer Linken und an den zu ihrer Rechten wendete. Diese Vorgehensweise wurde noch mit fnf anderen Versuchspersonen wiederholt. In den ersten 15 Minuten des Gesprchs lieferte der Mitarbeiter zur Linken etwa 82 Prozent der Verstrker. Nach Ablauf von 15 Minuten verbrachte die Versuchsperson etwa 78 Prozent der Zeit im Gesprch mit dem Mitarbeiter zu ihrer Linken (was ungefhr dem Prozentsatz an Verstrkungen entspricht). In den zweiten 15 Minuten lieferte der Mitarbeiter zur Linken weniger Verstrker (etwa 38 Prozent aller Verstrker) als der Mitarbeiter zur Rechten der Versuchsperson. Am Ende dieser Hlfte des Experiments verbrachten die Versuchspersonen etwa 29 Prozent der Zeit im Gesprch mit dem Mitarbeiter zu ihrer Linken. Dieses ungefhre Matching ist beeindruckend, wenn man die kurze Dauer des Experiments und die vielen willkrlichen Variablen bercksichtigt (ein Mitarbeiter htte der Versuchsperson vielleicht grundstzlich freundlicher oder netter als der andere erscheinen knnen, ganz unabhngig von den verabreichten Verstrkern). Die Idee, dass Menschen dazu neigen, mehr mit denjenigen zu sprechen, die ihnen zustimmen, ist nicht neu (Homans, 1961). Trotzdem ist Congers und Killeens Studie eine gute Demonstration, wie man das Gesetz des Matching in einer kontrollierten, aber realistischen Versuchssituation rigoros testen kann. Das Gesetz des Matching wurde auch unter realistischen Lebensumstnden auf eine Reihe von Situationen angewendet. Es wurde zum Beispiel benutzt, um Konflikte zwischen Berufsleben und Familie zu analysieren (Redmon & Lockwood, 1986) und um den Erfolg von Gewinnbeteiligungs-Programmen zu erklren, bei denen Arbeiter fr erhhte Produktivitt eine Belohnung in Form eines Anteils des Gewinns des Unternehmens erhielten (Mawhinney & Gowen, 1990).

I

,

II

14.1.3

Abweichungen vom Matching

Nicht alle Experimente haben Resultate hervorgebracht, die mit Gleichung 14.1 bereinstimmen. W. M. Baum (1974, 1979) listete drei Arten auf, wie empirische Ergebnisse vom strikten Matching abgewichen sind. Jede dieser drei Abweichungen ist in Abbildung 14.2 wiedergegeben. Die hufigste Form dieser Abweichungen ist das Undermatching, bei dem die Anzahl der Reaktionen unterproportional (nher zu 0,5) zur Anzahl der Verstrker ist. Im idealisierten Beispiel fr Undermatching in Abbildung 14.2, wenn der Anteil der linken Verstrker 0,8 betrgt, ist der Anteil der linken Reaktionen lediglich 0,6. Wenn die Proportion der linken Verstrker 0,3 betrgt, ist die Proportion der linken Reaktionen 0,45. Mit anderen Worten: Undermatching beschreibt den Fall, in dem die Prferenzen einer Versuchsperson mehr Richtung Indifferenz neigen, als es nach dem Gesetz des Matching der Fall sein sollte.Underrnatching Overrnatching Bias

linke Verstrker gesamte Verstrker

Abbildung 14.2: I n jeder Darstellung zeigt die gestrichelte Diagonale, w o die Punkte sich befnden, wenn das Verhalten eines Individuums genau dem Gesetz des Matching entsprche (Gleichung 14-1). Die durchgezogenen Linien zeigen drei Arten der Abweichung v o m perfekten Matching.

Um die gelufige Erklrung fr das Undermatching zu verstehen, ist es notwendig, ein weiteres Merkmal in Hermsteins (1961) Experiment zu bercksichtigen, das bisher noch nicht erwhnt wurde. Hermstein schloss eine 1,5-sekndige Wechselpause ein, die im Grunde eine Strafe fr einen Wechsel von einer Taste zur anderen war. Nehmen wir an, ein Verstrker wurde auf der rechten Taste platziert, whrend eine Taube auf die linke Taste pickt. Wrde der Vogel nun zur rechten Taste wechseln, wrde er bei seinem ersten Picken den Verstrker nicht erhalten. Wegen der Wechselpause war fr 1,5 Sekunden nach einem Wechsel kein Verstrker verfgbar, doch der erste Pick nach Ablauf von 1,5 Sekunden lieferte ihm den Verstrker. Herrnstein fhrte die Wechselpause ein, da er herausgefunden hatte, dass die Vgel ohne Wechselpause die Gewohnheit entwickelten, abwechselnd auf die linke und rechte Taste zu picken, unabhngig von der Gre der beiden VI-Plne. Herrnstein war der Ansicht, dass dieses Wechselmuster ein Beispiel fr aberglubisches Verhalten sei. Wenn der Vogel zum Beispiel auf die linke Taste picken wrde, dann auf die rechte und darauf einen Verstrker erhielte, knnte die Links-rechts-Sequenz zufllig verstrkt werden,

selbst wenn nur das Picken auf die rechte Taste fr den Verstrker ntig gewesen wre. Nachdem jedoch die Wechselpause eingefgt wurde, musste das Tier mindestens zweimal hintereinander dieselbe Taste bettigen, bevor der Verstrker verfgbar war, was die zufllige Verstrkung des Wechsels weniger wahrscheinlich machte. Eine weitere Hypothese zum Undermatching ist, dass Tiere einen Verstrker gelegentlich einer falschen Reaktion zuschreiben (Davison & Jenkins, 1985). So kann die Taube zum Beispiel in der kurzen Zeit zwischen Reaktion und Erhalt des Verstrkers vergessen, auf welche Taste sie gepickt hat. Andere Erklrungen fr Undermatching wurden ebenfalls gegeben (Baum, 1979; Myers & Myers, 1977), und es gibt keinen allgemeinen Konsens, weshalb es auftritt. Das Gegenteil von Undermatching ist Overmatching, bei dem die Reaktionen einer Versuchsperson berproportional zur Zahl der Verstrker sind. In der Darstellung des Overmatching in Abbildung 14.2 zum Beispiel bringt eine Verstrkerproportion von 0,8 eine Reaktionsproportion von 0,9 hervor, und eine Verstrkerproportion von 0,3 erzeugt eine Reaktionsproportion von 0,15. Overmatching tritt nicht so hufig auf wie Matching oder Undermatching, doch es wurde vor allem in Situationen beobachtet, in denen das Wechseln zwischen Plnen hart bestraft wurde. So entdeckte zum Beispiel W. M. Baum (1982) Overmatching, wenn Tauben um ein Hindernis herumlaufen und eine Hrde berwinden mussten, um von einer Taste zur anderen zu wechseln. Da es mehr Anstrengung bedurfte, zwischen den Tasten zu wechseln, taten die Tauben dies immer seltener und verbrachten den grten Teil ihrer Zeit auf dem besseren VI-Plan, was in Overmatching resultierte. Bei einer dritten Art der Abweichung vom Matching, dem Bias oder der Voreingenommenheit, handelt es sich um eine Abweichung, bei der ein Versuchstier durchweg mehr Zeit mit einer Alternative verbringt als von der Matching-Gleichung vorausberechnet. Abbildung 14.2 zeigt die Art von Resultaten, die man erhlt, wenn das Versuchstier einen Bias fr die rechte Taste hat. Wenn 80 Prozent der Verstrker von der linken Taste kommen, drckt das Versuchsobjekt nur in 50 Prozent aller Flle auf die linke Taste. Wenn 30 Prozent der Verstrker von der linken Taste kommen, drckt das Versuchsobjekt nur in 10 Prozent aller Flle auf die linke Taste. Unabhngig vom Prozentsatz der Verstrker reagiert das Versuchsobjekt hufiger auf die rechte Taste als durch das Gesetz des Matching vorhergesagt wird. Viele Faktoren knnen zu einem Bias fhren, wie etwa die Vorliebe fr eine bestimmte Seite der Kammer, die Vorliebe fr eine bestimmte Taste (die vielleicht leichter zu bedienen ist als die andere) oder eine bestimmte Farbe (wenn die beiden Reaktionstasten unterschiedliche Farben haben).

14.1.4I II

Vernderungen der Qualitt und Menge der Verstrkung

,I

Alle bisher in diesem Kapitel beschriebenen Experimente hatten mit zwei Alternativen zu tun, die beide genau denselben Verstrker liefern (wie etwa Futter oder verbale Zustimmung), doch in unterschiedlichen Mengen. Bei solchen Experimenten werden Voreingenornmenheiten oft als rgernis betrachtet, die mit einem entsprechendem Gegengewicht ausgeglichen werden mssen. Wenn Bias jedoch als Hinweis auf eine Prferenz fr eine

Kapitel 1 4 Wahl

Alternative angesehen wird, kann das Gesetz des Matching dazu verwendet werden, die Prferenzen des Versuchsobjekts hinsichtlich verschiedener Arten von Verstrkem zu messen. Eine interessante Studie von Harold Miller (1976) zeigte, wie dies durchgefhrt werden kann. Wie Hermstein (1961) benutzte Miller verschiedene Paare von VI-Plnen, doch die beiden Plne boten den Tauben zwei unterschiedliche Arten von Futter als Verstrker an. In einigen Fllen gab es die Wahl zwischen Hanf und Buchweizen, in einem anderen zwischen Weizen und Buchweizen und in einem weiteren Fall zwischen Hanf und Weizen. Bei der Wahl zwischen Weizen und Buchweizen zum Beispiel fand Miller eine starke Vorliebe fr den Weizen, doch sagte er, dass die Matching-Gleichung dem Rechnung tragen knnte, wenn sie auf folgende Weise modifiziert wrde:

Q1 und Q2 stehen fr die Qualitt der Verstrker, die ber die beiden Tasten verfgbar sind. Diese Gleichung besagt, dass die Verteilung des Verhaltens eines Versuchsobjekts sowohl durch das Ausma an Verstrkung als auch durch ihre Qualitt bestimmt wird. Miller wies der Qualitt des Buchweizens (Qb) willkrlich den Wert 10 zu und fand, dass Gleichung 14-2 eine gute Beschreibung der Resultate wiedergab, wenn die Qualitt des Weizens (Q,) der Wert 14 zugewiesen wurde. Er interpretierte diese Zahl so, dass jeder Weizenverstrker etwa 1,4-mal so viel wert war wie jeder Buchweizenverstrker. Miller stellte hnliche Berechnungen fr Flle an, in denen die Alternativen Hanf und Buchweizen waren, und er schtzte die Qualitt des Hanfs (Qh) bei etwa 9,1, also etwas geringwertiger als Buchweizen, ein. Miller sagte, dass seine Schtzungen von Qb, Qw und Qh Messwerte fr die Strke dieser verschiedenen Futtersorten als Verstrker sei, doch wie knnen wir wissen, dass dies nicht einfach bedeutungslose Zahlen sind? Millers Antwort auf diese Frage war dieselbe wie die in Kapitel 9 errterte, als eine Methode der Vermeidung einer tautologischen Definition des Begriffs ,,Verstrkungu: Die Zahlen wrden bedeutungsvoll und ntzlich, wenn sie zu neuen Vorhersagen fhren wrden, die ohne sie nicht mglich wren. Die neuen Vorhersagen, die Miller traf, betrafen das erste Wahlpaar, also Hanf und Weizen. So wurden in einem Fall beide Futtersorten mit einer Menge von 30 Verstrkem pro Stunde verabreicht. Mit Q, = 14 und Qh = 9 sagt Gleichung 14-2 vorher, dass die Versuchsobjekte in 61 Prozent aller Flle auf die Taste picken wrden, die Weizen lieferte. Fr diesen Fall und vier weitere mit unterschiedlichen VI-Plnen lagen die Vorhersagen von Gleichung 14-2 sehr nah am tatschlichen Verhalten der Versuchsobjekte. Das Gesetz des Matching wurde in anderen Studien benutzt, um Prferenzen fr Verstrker unterschiedlicher Qualitt zu messen, und zwar mit so unterschiedlichen Spezies wie Menschen (Neef, Mace, Shea & Shade, 1992) und Khen (Foster, Temple, Robertson, Nair & Poling, 1996). Neben Menge und Qualitt der Verstrkung ist eine weitere Variable, die die Prferenz beeinflussen kann, die Gre oder Menge jedes Verstrkers. Wenn eine Taste bei ihrer Bettigung zwei Futterkgelchen als Verstrker liefert und die andere nur eine, sollte das die Wahl des Versuchsobjekts sicherlich beeinflussen. Mehrere Forscher (Baum und Rachlin, 1969; Killeen, 1972) waren der Ansicht, wenn die Menge des Verstrkers die unabhngige Variable sei, dann knne sie anstelle der Verstrkungsrate in der MatchingGleichung verwendet werden:

,

I

Al und A2 stehen fr die Menge der Verstrkung, die durch die beiden Alternativen verabreicht wird. Catania (1963) fand Ergebnisse, die ziemlich genau mit Gleichung 14-3 bereinstimmten. Bei dieser Studie wurde der Zugang, den Tauben zu Futter hatten, zwischen drei und sechs Sekunden pro Verstrker variiert. Andere Studien fanden jedoch groe Abweichungen von den Vorhersagen in Gleichung 14-3: Sowohl Under- als auch Overmatching wurden in erheblichem Ausma beobachtet (Davison & Hogsden, 1984; Schneider, 1973). Wie bei anderen Abweichungen vom Matching wurde eine Reihe von Erklrungen angeboten, doch besteht kein Konsens darber, weshalb sie auftreten (de Villiers, 1977; R. M. Dunn, 1982; Logue & Chavarro, 1987).

14.1.5

Anwendung auf einzelne Verstrkerplne

Es mag scheinen, als ob das Gesetz des Matching, das Vorhersagen bezglich W&lsituationen trifft, keine Aussage zu Situationen macht, in denen nur ein Verstrkerplan existiert. Herrnstein (1970, 1974) entwickelte jedoch eine Methode, um mit dem Geseiz des Matching Vorhersagen zum Verhalten bei einzelnen VI-Plnen abgeben zu knnen. Um zu sehen, wie Hemsteins Analyse funktioniert, lassen Sie uns mit einigen willkrlichen Annahmen beginnen. Gehen wir davon aus, dass eine bestimmte Taube eine Taste mit einer Rate von zweimal Picken pro Sekunden bettigt, wann immer sie auf einen VI-Plan reagiert. Das heit: Wenn der Vogel pausenlos auf die Taste picken wrde, wren das 120 Picks pro Minute. Zweitens: Lassen Sie uns annehmen, dass - obwohl die einzige M6glichkeit, wie die Taube zu Futterverstrkern kommt, das Picken auf eine Taste ist - es ,,eingebauteuVerstrker gibt (wir knnten sie ,,Premack'sche Verstrker" nennen), andere Verhaltensweisen wie etwa sich putzen, etwas erkunden, pausieren usw. auszufhren. Herrnstein war folgender Ansicht: Der Versuchsleiter kann die Zahl der Futterverstrker kontrollieren, doch die eingebauten Verstrker fr nichtpickendes Verhalten sind auerhalb der Kontrolle des Versuchsleiters und treten mit ziemlicher Regelmigkeit auf. Obwohl diese Hintergrundverstrker kein Futter sind, mssen wir sie in denselben Einheiten messen wie die Futterverstrker, um die notwendigen Berechnungen anstellen zu knnen. Fr dieses Beispiel nehmen wir an, dass alle Verhaltensweisen auer dem Picken die Taube mit eingebauten Verstrkern versorgen, die vom Wert her 30 Futterverstrkern pro Stunde entsprechen. Auch wenn andere Verhaltensweisen der Taube wie das Putzen und Umherwandern sich vom Picken auf Tasten sehr unterscheiden, mssen wir sie doch auf einer einheitlichen Skala messen knnen. Eine ntzliche Strategie ist, alle Verhaltensweisen in Zeiteinheiten zu messen, womit sich fr Gleichung 14-1 Folgendes ergbe:

1

,

Tl ist die Zeit, die zum Picken der Taste bentigt wird; T2 ist die Gesarntzeit aller anderen Verhaltensweisen, so dass Tl und T2 der Gesamtzeit des Experiments entsprechen. R1 ist

die Rate, mit der Futterverstrker nach dem VI-Plan verabreicht werden, und R2 ist das quivalent des Verstrkungswerts aller eingebauten Verstrker (in unserem Beispiel 30). Nun sind wir in der Lage, Vorhersagen fr verschiedene VI-Plne zu treffen. Wenn die Taube einem VI-Plan folgt, der ihr 30 Verstrker pro Stunde verabreicht, sagt Gleichung 14-4 vorher, dass der Vogel die eine Hlfte seiner Zeit mit Picken beschftigt ist und die andere Hlfte mit anderen Verhaltensweisen (da R1 und R2 beide gleich 30 sind). Da wir annahmen, dass die Taube zweimal pro Sekunde pickt, sollte der Vogel im Experiment durchschnittlich 60 Reaktionen pro Minute zeigen. Wird dem Vogel nun ein VI-Plan prsentiert, der 90 Verstrker pro Stunde liefert, sagt Gleichung 14-4, dass er 75 Prozent seiner Zeit mit Picken verbringen sollte, was in einer durchschnittlichen Reaktionsrate von 90 Picks pro Minute resultieren wrde. hnliche Vorhersagen knnen fr jede Gre des VI-Plans getroffen werden, die der Versuchsleiter ansetzt. Die durchgezogene Kurve in Abbildung 14.3 zeigt die Vorhersagen fr unser hypothetisches Beispiel fr alle Verstrkungsraten zwischen 0 und 500 Futterverstrkern pro Stunde. Es zeigt, dass Gleichung 14-4 bei Erhhung der Verstrkungsrate vorhersagt, dass sich die Reaktionsrate des Tieres auf die maximale Rate von 120 Picks pro Minute erhht. Natrlich beruhen diese Vorhersagen auf ganz bestimmten Annahmen hinsichtlich der Pickfrequenz des Vogels und des Werts aller anderen Verhaltensweisen auer Picken. Gehen wir davon aus, wir wrden dieselbe Taube nehmen und sie in eine interessantere Experimentierkammer setzen, in der R2 60 entsprche (vielleicht weil die zweite Kammer ein Fenster hat, durch das die Taube eine andere Taube beobachten kann). Mit dem erhhten Wert der nichtpickenden Verhaltensweisen sagt Gleichung 14-4 nun vorher, dass der Vogel bei allen VI-Plnen weniger Zeit mit Picken verbringen wird, als die gestrichelte Linie in Abbildung 14.3 zeigt.

I

I

I

I

I

100

200

300

400

500

Verstrker pro StundeAbbildung 14.3: Die beiden Kurven stellen einige reprsentative Vorhersagen aus Herrnsteins

(1 970) Gleichung fr einzelne Verstrkerplne dar (Gleichung 14-4). Diese Gleichung sagt vorher, wiesich die Reaktionsraten verndern sollten, wenn die Verstrkungsraten variiert werden. Die durchgezogene Linie stellt einen Fall dar, in dem es relativ wenige Verstrker fr anderes Verhalten auer Picken gibt (R2 = 30 in Gleichung 14-4). Die gestrichelte Linie stellt einen Fall dar, in dem es mehr Verstrker fr anderes Verhalten auer Picken gibt (R2 = 60), so dass die Pickfrequenz des Versuchsobjekts niedriger sein sollte.

Herrnstein (1970) wandte diese Analyse auf die Resultate eines Experiments von Catania und Reynolds (1968) an, in dem sechs Tauben mehrere unterschiedliche VI-Plne erhielten (wobei einer nach dem anderen jeweils fr mehrere Experimentalphasen prsentiert wurde). Abbildung 14.4 zeigt die Resultate der Studie von Catania und Reynolds (Datenpunkte), und die Kurven sind die Vorhersagen von Gleichung 14-4. Die nahezu vollstndige bereinstimmung der Vorhersagen mit den tatschlich erzielten Ergebnissen ist beeindruckend. De Villiers und Herrnstein (1976) fertigten hnliche Analysen der Resultate von mehreren Dutzend Experimenten an, die einzelne Verstrkerplne beinhalteten. Diese Experimente wurden von vielen verschiedenen Forschern durchgefhrt, wobei mit einer Reihe verschiedener Spezies, operanten Reaktionen und Verstrkern gearbeitet wurde. In fast allen Fllen war die bereinstimmung zwischen den Vorhersagen des Gesetzes des Matching und den tatschlichen Resultaten so gut wie beim Experiment von Catania und Reynolds (1968). Herrnsteins Analyse des Verhaltens bei Einzelplnen wurde auch auf menschliches Verhalten in einem natrlichen Lebensumfeld angewendet (Beardsley & McDowell, 1992; McDowell, 1988). So zeigten Martens und Houk (1989) zum Beispiel, dass Gleichung 14-4 relativ gut das Verhltnis zwischen dem Verhalten eines geistig behinderten Mdchens und der Anzahl an Verstrkern wiedergibt, die ihr Lehrer ihr verabreichte.

!

Verstrkungen pro Stunde Abbildung 14.4: jede Darstellung zeigt die Resultate von einer der sechs Tauben im Experiment von Catania und Reynolds (1 968). Jeder Punkt zeigt die Verstrkungs- und die Reaktionsrate auf einen VI-Plan. Fr jedes Versuchsobjekt zeigt die Kurve die Vorhersagen der Gleichung 14-4 unter Verwendung der am besten passenden Schtzer der maximalen Pickrate des Vogels und von R2. Die Zahlen in jeder Darstellung sind die am besten passenden Schtzer dieser beiden Quantitten. Das Muster der Resultate fr jedes Versuchsobjekt wird durch Gleichung 14-4 gut beschrieben (HerrnStein, 1970).

II

I

Herrnsteins Theorie kann sehr einfach ausgedruckt werden: Eine operante Reaktion muss mit allen anderen in der fraglichen Zeit mglichen Verhaltensweisen eines Individuums

1

konkurrieren. Erhht sich die Verstrkung fr die operante Reaktion, widmet das Individuum diesem Verhalten immer mehr Zeit. Deshalb sagt Herrnstein, dass die Reaktion auf einen einzelnen VI-Plan erklrt werden kann, indem man genau dieselben Prinzipien verwendet, die auf die Wahl in einer konkurrierenden VI-VI-Situation Anwendung finden. Nicht jeder akzeptiert Herrnsteins Interpretation (Catania, 1973; Killeen, 1982). Einige Studien haben zum Beispiel gefunden, dass die Asymptoten der Reaktionsrate - wie in Abbildung 14.4 wiedergegeben - sich bedeutend erhhen knnen, wenn Menge oder Qualitt des Verstrkers erhht wird, was mit Herrnsteins Annahme in Widerspruch steht, nmlich dass die Asymptoten die hchsten Reaktionsraten darstellen, die ein Tier erreichen kann (Dallery, McDowell & Lancaster, 2000). Obwohl diese theoretische Debatte noch nicht beendet ist, hat das Gesetz des Matching doch klare Auswirkungen auf das Verhalten im realen Lebensumfeld. Eine wichtige Auswirkung ist, dass es nicht mglich ist vorherzusagen, wie ein Verstrker ein Verhalten beeinflussen wird, ohne den Kontext zu bercksichtigen - die anderen Verstrker, die gleichzeitig fr andere Verhaltensweisen zur Verfgung stehen. Dies Prinzip wird in Abbildung 14.3 dargestellt, die zwei unterschiedliche Vorhersagen fr jeden VI-Plan treffen, abhngig vom Ausma an Verstrkung, das fr nichtpickendes Verhalten verfgbar ist. Versuchen Sie, als Parallele aus dem realen Leben vorherzusagen, wie das Verhalten eines Kindes verndert wrde, wenn man ihm einen neuen Verstrker gbe - einen Jo-Jo zum Beispiel. Um eine vernnftige Vorhersage zu treffen, mssen wir etwas ber den Kontext wissen. Gibt man dem Kind den Jo-Jo an einem durchschnittlichen verregneten Augusttag, spielt das Kind vielleicht stundenlang mit ihm, weil die anderen Spielzeuge und huslichen Aktivitten zu langweilig sind. Bekommt das Kind andererseits den Jo-Jo zu Weihnachten und der Kontext schliet viele andere neue Spielzeuge mit ein - Spielzeugautos, Videospiele, Puzzle -, dann wird die Zeit, die das Kind mit dem Jo-Jo verbringt, wahrscheinlich nur kurz sein. Die reichliche Versorgung mit anderen Verstrkern wird den grten Teil der Zeit des Kindes einnehmen. Andere Beispiele, bei denen der Gesarntverstrkungskontext eine grere Rolle spielt, kann man sich leicht ausmalen. Viele Leute sagen, dass sie mehr essen, wenn sie sich langweilen. Dies passiert wahrscheinlich nicht, weil der Verstrkungswert des Essens sich erhht, wenn man sich langweilt, sondern weil nur so wenig andere Verstrker vorhanden sind, die mit dem Essen konkurrieren. Ein weiteres Beispiel fr eine Situation, in der der Verstrkungskontext eher drftig ist: Stellen Sie sich vor, Sie sitzen in einem Warteraum und warten auf einen Termin mit jemandem, der sich versptet (wie etwa Ihr Automechaniker oder Optiker). Sie knnen kaum etwas anderes tun als warten, und wenn Sie mir hnlich sind, dann greifen Sie wahrscheinlich zur Lektre von Zeitschriften, denen Sie gewhnlich keine Zeit widmen wrden, wie etwa zwei Jahre alte Ausgaben des Stern, Schner Wohnen oder Der Augenoptiker. Der geringe Verstrkungswert solcher veralteten Zeitschriften wchst bei Abwesenheit alternativer Verstrkungsquellen.

Theorien zum WahlverhaltenIn vielen Bereichen der Wissenschaft ist es wichtig, zwischen der Beschreibung eines Phnomens und der Erklrung der Mechanismen, die diesem Phnomen zu Grunde liegen, zu unterscheiden. So ist zum Beispiel die Aussage, dass Wasser an Volumen

zunimmt, wenn es gefriert, zunchst nur eine Beschreibung; sie erklrt nicht, wie diese Ausdehnung zustande kommt. Solche beschreibenden Aussagen knnen fr sich genommen extrem ntzlich sein, denn sie knnen uns helfen, zuknftige Ereignisse vorherzusagen und zu kontrollieren (zum Beispiel, indem wir im Winter Wasserrohrbrche vermeiden wollen und aus Auenleitungen das Wasser ablassen, bevor es gefrieren kann). Eine Aussage, die andererseits diese Ausdehnung auf die kristalline Struktur der Wasserstoffund Sauerstoffmoleklezurckfhrt, die sie im festen Zustand einnehmen, kann man eine Erklrung nennen: Es ist eine Theorie zu den molekularen Ablufen, die diesem Phnomen zu Grunde liegen. Im Prinzip kann die Matching-Gleichung entweder als einfache Beschreibung eines Wahlverhaltens gesehen werden oder als eine Theorie der Mechanismen des Wahlverhaltens. Wir haben gesehen, dass die Matching-Gleichung als Beschreibung in gewissen Wahlsituationen recht genau ist. Nun werden wir die Mglichkeit in Betracht ziehen, dass das Gesetz des Matching eine erklrende Theorie sein knnte, und wir werden sie mit einigen anderen Theorien vergleichen, die als mgliche erklrende Theorien des Wahlverhaltens prsentiert wurden.

14.2.1

Matching als erklrende Theorie

In seinen frheren Abhandlungen ging Herrnstein (1970, 1974) davon aus, dass die Matching-Gleichung auch eine allgemeine Theorie ist, die das Wahlverhalten erklrt. Der Grundgedanke ist ziemlich einfach: Es ist mglich, dass Tiere Matching-Verhalten zeigen, weil sie so ,,gebautu sind. Das heit, in einer Wahlsituation knnte ein Tier den Wert der Verstrkung einschtzen, die es von jeder Alternative erhlt (wobei ,,WertG'solche Dinge umfasst wie Rate, Gre und Qualitt der Verstrker), und das Tier knnte dann sein Verhalten proportional auf die Werte der verschiedenen Alternativen verteilen. Nach solch einer Theorie ist Matching nicht nur eine Beschreibung des Verhaltens in miteinander konkurrierenden VI-NI-Plnen. Es ist ein allgemeines Prinzip, das erklrt, wie Tiere in allen Situationen Wahlen treffen, sowohl im Labor als auch in freier Wildbahn. Nachdem wir diese Theorie des Wahlverhaltens eingefhrt haben, lassen Sie uns nun einen Grund untersuchen, der Herrnstein spter zu dem Schluss fhrte, dass sie inkorrekt sei. Das Problem betrifft Flle, in denen sich ein Tier zwischen zwei Quotenplnen (wie etwa VR 20 und VR 100) entscheiden muss. Die Matching-Gleichung sagt vorher, dass ein Tier all seine Reaktionen bei einer der beiden Alternativen zeigt, aber sie spezifiziert nicht bei welcher. Ob das Tier nun 100 Prozent seiner Reaktionen auf den VR-20-Plan oder 100 Prozent seiner Reaktionen auf den VR- 100-Plan zeigt - es wird 100 Prozent seiner Verstrker nach diesem Plan erhalten und so der Matching-Gleichung folgen. Hermstein und Loveland (1974) fanden jedoch heraus, dass Tauben in solchen Situationen immer den kleineren VR-Plan whlten, nie den greren. Shah, Bradshaw und Szabadi (1989) erhielten hnliche Resultate mit menschlichen Versuchspersonen, die gegen Geld mit Paaren von VR-Plnen arbeiteten. Dies ist nicht berraschend, denn ein VR-100-Plan verlangt im Durchschnitt fnfmal so viele Reaktionen pro Verstrker wie ein VR-20-Plan. Diese Entdeckungen zeigen jedoch, dass wir eine Theorie bentigen, die vorhersagt, dass

I

I

Personen bei zwei VR-Plnen immer eine ausschlieliche Vorliebe fr den kleineren VRPlan haben, nie fr den greren. Um sich hiermit auseinander zu setzen, entwickelten Herrnstein und Vaughan (1980; Vaughan 1981, 1985) eine Verfeinerung des MatchingGesetzes, das sie Melioration nannten.

Die Meliorationstheorie,,Meliorierenb'bedeutet ,,verbessern6',und im Grunde besagt das Prinzip der Melioration, dass Tiere immer mehr Zeit undloder Anstrengung in die Alternative investieren, die ihnen besser erscheint. Das Prinzip klingt einfach genug, doch lassen Sie uns sehen, wie es in die Praxis umgesetzt werden kann. Es ist leicht zu zeigen, dass Gleichung 14-1 der folgenden Gleichung entspricht:

Die Gleichung betont die Tatsache, dass am Punkt des Matching das Verhltnis der erhaltenen Verstrker zu gezeigten Reaktionen fr beide Alternativen gleich ist. Wir knnten sagen, dass die ,,Kostenu fr jeden Verstrker bei beiden Alternativen dieselben sind. Das Prinzip der Melioration sagt: Wenn diese Verhltnisse nicht gleich sind, wird das Tier sein Verhalten zu derjenigen Alternative verlagern, die das hhere Verstrker-zu-ReaktionVerhltnis aufweist. Nehmen wir an, ein Versuchsobjekt beginnt, indem es ungefhr dieselbe Anzahl von Reaktionen auf beiden Tasten in einem gleichzeitigen VI-30-Sekunden und VI- 120-Sekunden-Plan zeigt. Gehen wir davon aus, dass der VI-30-Sekunden-Plan 118 Verstrker fr 1000 Reaktionen im ersten einstndigen Durchgang liefert und der VI-120-Sekunden-Plan 30 Verstrker fr 1000 Reaktionen. Da das Verhltnis von Verstrker zu Reaktion beim VI-30-Sekunden-Plan hher ist, sagt das Prinzip der Melioration voraus, dass das Versuchsobjekt beginnen wird, mehr Reaktionen auf der VI-30Sekunden-Taste zu zeigen. Sie sollten imstande sein, selbst abzuleiten, dass das Verhalten des Tieres sich immer weiter auf die VI-30-Sekunden-Taste verlagert, bis etwa 80 Prozent der Reaktionen auf diese Taste erfolgen. An diesem Punkt erfllt sich Gleichung 14-5, so dass es keine weiteren Verlagerungen des Verhaltens geben sollte (mit Ausnahme unvermeidbarer Zufallsvariationen). Kurz, das Prinzip der Melioration sagt vorher, dass Matching-Verhalten bei gleichzeitigen V1 VI-Plnen auftritt. Lassen Sie uns nun gleichzeitige VR-NR-Plne betrachten, die fr das Gesetz des Matching Probleme darstellten. Wenn die beiden Plne zum Beispiel ein VR 30 und ein VR 120 sind, dann ist das jeweilige Verhltnis von Verstrker zu Reaktion 1:30 bzw. 1:120. Diese Verhltnisse werden sich nicht ndern, egal wie das Versuchsobjekt sein Verhalten verteilt, so dass das Prinzip der Melioration voraussagt, dass sich das Verhalten des Versuchsobjekts immer weiter zur VR-30-Taste verlagert, bis es kein Verhalten mehr zu verlagern gibt (das heit, bis es ausschlielich auf diese Taste reagiert). Die Vorhersagen sind fr jedes Paar von VR-Plnen dieselben: Das Versuchsobjekt sollte schlielich nur noch auf den Plan mit dem gnstigeren Verhltnis von Verstrker zu Reaktion reagieren. Zusammengefasst: Das Prinzip der Melioration sagt Matching-Verhalten in einer Wahl-

situation zwischen zwei VI-Plnen korrekt voraus, und es sagt auch eine ausschlieliche Prferenz fr den besseren der beiden VR-Plne voraus. Herrnstein (1990) stellte die These auf, dass (1) Menschen dem Prinzip der Melioration bei vielen alltglichen Entscheidungen folgen, und (2) als Resultat ihre Wahlen oft nicht optimal sind. Er fhrt das Beispiel eines Tennisspielers an, der zwei Mglichkeiten hat, wann immer sein Gegner sich whrend des Spiels zum Netz vorbewegt: den Ball ber den Gegner hinwegzulupfen oder einen Passierschlag anzusetzen. Beide Schlge sind effektiver, wenn sie berraschend kommen: Verwendet der Spieler oft den Passierschlag, wird der Gegner dies erwarten und sich entsprechend darauf vorbereiten. Dasselbe gilt fr den Lupfer. Wenn Sie nun diese Optionen haben - wie wrden Sie zwischen Passierschlag und Lupfer whlen? Wenn Herrnstein diese Frage stellte, sagten die meisten Menschen, sie wrden Gebrauch von beiden Mglichkeiten machen, je nachdem, welche effektiver scheint. Wenn Lupfer effektiver wren, wrden sie mehr lupfen; wren Passierschlge effektiver, wrden sie deren Anzahl erhhen. Diese Strategie, den jeweils besser funktionierenden Schlag zu verwenden, ist ein Beispiel fr Melioration. Ein Tennisspieler, der dieses Prinzip anwendet, knnte zum Beispiel 70 Prozent Lupfer und 30 Prozent Passierschlge spielen. Herrnstein zeigte jedoch, dass die Verwendung des Meliorationsprinzips nicht unbedingt zur besten Performanz fhren muss. Es knnte sein, dass die kombinierte Effektivitt von Lupfern und Passierschlgen dann am grten ist, wenn sie in einem anderen Mengenverhltnis verwendet werden, wie etwa 40 Prozent Lupfer und 60 Prozent Passierschlge. Einfach ausgedrckt: Ein Tennisspieler, der seine Performanz optimieren will, sollte sich nicht fragen ,,Welcher Schlag ist gegenwrtig effektiver?", sondern ,,Welche Mischung aus diesen beiden Schlgen ist die effektivste?" Nach Herrnstein stellen sich Menschen selten die zweite Frage. Fr die meisten von uns sind die Wahlen, die wir in einem Tennismatch oder in anderen Sportarten treffen, nicht unbedingt die bedeutendsten in unserem Leben. Herrnstein und Prelec (1991) argumentierten jedoch, dass Menschen das Prinzip der Melioration auch bei wichtigeren Wahlen verwenden, wie etwa in persnlichen Beziehungen, beim Einkaufen, beim Glcksspiel und in Geschftsangelegenheiten. Und genau wie im Tennisbeispiel kann die Verwendung des Meliorationsprinzips in Wahlen resultieren, die alles andere als optimal sind. Es sollte daher klar sein, warum die Meliorationstheorie (und das eng mit ihm verwandte Prinzip des Matching) als Konkurrenten fr die Optimierungstheorie betrachtet werden knnen, die besagt, dass Menschen zu Wahlen neigen, die ihre Befriedigung maximieren.

I I

I

I

14.2.3,

Die Optimierungstheorie als Erklrung fr Matching

II

Wie in Kapitel 9 errtert, haben einige Psychologen die These aufgestellt, dass die Optimierungstheorie eine allgemeine Erklrung fr Wahlen sowohl bei Menschen als auch bei anderen Lebewesen ist. Es ist leicht zu sehen, dass die Optirnierungstheorie eine ausschlieliche Prferenz fr den besseren von zwei VR-Plnen vorhersagt; dieses Verhalten maximiert Verstrkung und minimiert Anstrengung. Einige Psychologen haben vorge-

schlagen, dass die Optimierungstheorie auch erklren kann, warum Matching bei zwei gleichzeitigen VI-NI-Plnen auftritt (Rachlin, Green, Kagel & Battalio, 1976; Silberberg, Thomas & Berendzen, 1991). Bevor wir ihre Argumentation untersuchen, ist es wichtig, die Auswirkungen ihrer Ansichten zu verstehen. Die Befrworter der Optimierungstheorie sagen: Whrend das Gesetz des Matching eine zufrieden stellende Beschreibung des Verhaltens in solchen Situationen liefert, bietet die Optimierungstheorie eine Erklrung des Matching-Verhaltens. Sie behaupten, dass Optimierung der grundlegende Mechanismus des Wahlverhaltens sei, und der einzige Grund, weshalb in manchen Situationen Matching auftritt, sei, dass es das optimale Vorgehen darstellt. Fr die Befrworter der Optimierungstheorie ist das Matching-Verhalten nur ein Beispiel unter vielen dafr, dass der Optimierungsprozess am Werk ist. Um diese Logik zu untersuchen, stellen Sie sich eine Taube bei gleichzeitig ablaufendem VI-30-Sekunden- (linke Taste) und VI-120-Sekunden- (rechte Taste) Plan vor. Rachlin und seine Mitarbeiter (1976) fhrten eine Reihe von Computersimulationen durch, um zu bestimmen, wie verschiedene Methoden der Verteilung von Reaktionen zwischen den beiden Tasten die Gesamtrate der Verstrkung beeinflussen wrden. Die Resultate dieser Simulation sind in Abbildung 14.5 dargestellt. Damit Sie sich berzeugen knnen, dass diese Simulationen zumindest annhernd korrekt sind, betrachten wir als Erstes, was passieren wrde, wenn die Taube all ihre Reaktionen auf die linke Taste verlegen wrde. Die linke Taste wrde etwa 120 Verstrker pro Stunde liefern; ber die rechte Taste wrden keine Verstrker kommen, so dass die Gesamtsumme von beiden Tasten etwa 120 Verstrker pro Stunde betragen wrde (der uerste rechte Punkt in Abbildung 14.5). Wrde der Vogel nur die rechte Taste bettigen, wrde er nur auf dem VI-120-Sekunden-Plan Verstrker bekommen, so dass die Gesarntverstrkungsrate etwa 30 pro Stunde betragen wrde (der uerste linke Punkt in Abbildung 14.5). Wrde der Vogel jedoch beide Tasten bettigen, wrde er viele der Verstrker beider Plne erhalten. Die Computersimulationen von Rachlin und seinen Kollegen sagten vorher, dass die maximale Gesamtverstrkungsrate erreicht werden knnte, wenn 80 Prozent aller Reaktionen auf die linke Taste erfolgten, was der Stelle des Matching-Verhaltens entspricht. Der Grund fr niedrigere Verstrkungsraten bei anderen Reaktionsverhltnissen ist: Bei der Reaktion auf eine Taste wird die VI-Uhr fr die andere Taste gestoppt (mit einem verfgbaren Verstrker), und jedes Anhalten einer der beiden Uhren wird die Gesamtverstrkungsrate verringern. Wenn der Vogel zum Beispiel 90 Prozent seiner Zeit an der VI-120-Sekunden-Taste verbringt, wrde die Uhr fr die VI-30-Sekunden-Taste oft gestoppt, so dass von letzterer wesentlich weniger als 120 Verstrker verfgbar wren. Allgemeiner gesprochen, Rachlin und seine Kollegen stellten die These auf, dass bei typischen gleichzeitig ablaufenden VI-NI-Plnen das Matching-Verhalten die Verstrkungsrate maximiert. Natrlich wrde die Taube einige Zeit brauchen (vielleicht viele Durchgnge pro Tag), um zu bestimmen, welche Art von Reaktion optimal ist. Nach der Optimierungstheorie wird ein Tier in dieser Art Situation verschiedene Methoden ausprobieren, sein Verhalten zu verteilen (zum Beispiel 50 Prozent links, 80 Prozent links, 90 Prozent links usw.) und sich schlielich bei der Verteilung einpendeln, die die Gesamtverstrkungsrate maximiert. Mit gleichzeitig ablaufenden VI-NI-Plnen ist es so, dass die maximale Verstrkungsrate durch Matching erzielt wird.

I

I

I

I

I

0'0

0,2 0,4 0,6 0,8 1,0 Anteil Reaktionen auf linke Taste

Abbildung 14.5: Vorhersagen von Computersimulationenvon Rachlin, Green, Kagel und Battalio (1 976) fr den gleichzeitig ablaufenden VI-30-Sekunden- (linke Taste) und VI-120-Sekunden- (rechte Taste) Verstrkungsplan. Wenn diese Vorhersagen korrekt sind, wrde ein Versuchsobjekt bei diesem Plan die Verstrkungsrate maximieren, wenn es bei 80% seiner Reaktionen die linke Taste bettigte.

Ein Test: Optimierung vs. MatchingDie Standardsituation gleichzeitig ablaufender VI-NI-Plne ist kein gutes Beispiel, um die Vorhersagen des Matching-Gesetzes und der Optimierungstheorie einander gegenberzustellen, denn beide treffen sehr hnliche Vorhersagen: Beide sagen Matching-Verhalten voraus oder etwas, das dem nahe kommt. Um zu bestimmen, welches dieser beiden Prinzipien die grundstzlichere Wahlregel ist, wre es am besten, eine Wahlsituation zu entwerfen, in der das Gesetz des Matching bestimmte Vorhersagen trifft und die Optimierungstheorie ganz andere Dinge vorhersagt. Wir knnten dann das Verhalten der Versuchsobjekte beobachten und bestimmen, welche Vorhersagen sich als zutreffender erweisen. Eine Reihe von Experimenten dieser Art wurden durchgefhrt (Herrnstein & Vaughan, 1980; Heyman & Herrnstein, 1986), doch eines meiner eigenen Experimente (Mazur, 1981) ist wohl am leichtesten zu beschreiben, Vom Versuchsplan her war dieses Experiment nicht sehr viel anders als Herrnsteins (1961) Experiment. Tauben hatten die Wahl zwischen zwei Tasten, und gelegentlich erzeugte eine Reaktion eine Dunkelphase (ein Zeitraum ohne beleuchtete Tasten), in dem die roten und grnen Tastenlichter abgeschaltet wurden, und Futter stand zur Verfgung oder auch nicht. Die Hauptunterschiede zu Herrnsteins Experiment waren: (1) Bei manchen Dunkelphasen war kein Futter verfgbar, und (2) die Dunkelphasen bei beiden Tasten wurden von einem einzigen VI-Timer gesteuert, nicht von zwei separaten VI-Timern wie bei Herrnsteins Experiment. Abbildung 14.6 zeigt die Vorgehensweise meines Experiments. Jedesmal wenn der VI-45-Sekunden-Timer das Ende eines Zeitintervalls erreichte, stoppte er und wies einer der beiden Tasten nach dem Zufallsprinzip eine Dunkelphase zu. Der VI-Timer lief nicht weiter, bis das Tier auf die entsprechende Taste pickte und den in der Dunkelphase verfgbaren Verstrker gesammelt hatte. (Das Verfah-

ren beinhaltete auch eine Wechselpause von drei Sekunden.) Das einzige, was von Bedingung zu Bedingung gendert wurde, war die Wahrscheinlichkeit, dass die Dunkelphasen einen Futterverstrker einschlieen wrden.

J.VI Timer Iufi

3-

0Grn Reaktionen ineffektiv

Reaktionen ineffektiv

Dunkelphase und mglicherweise Futter

angehalten

Dunkelphase und mglicherweise Futter

Abbildung 14.6: Eine schematische Darstellung der Vorgehensweise in Mazurs (1 981) Experiment.

Bei der ersten Bedingung gab es in allen Dunkelphasen Futter. Die Tiere erhielten etwa 32 Verstrker pro Stunde bei jeder Taste, und sie reagierten auf jede der beiden Tasten zu etwa 50 Prozent. Dieses Ergebnis ist nicht berraschend und es steht im Einklang sowohl mit der Optimierungstheorie als auch mit dem Gesetz des Matching. Die zweite Bedingung war aufschlussreicher. Diesmal gab es nach einem roten Licht nur in 10 Prozent der Dunkelphasen Futter; in den anderen 90 Prozent gab es keinen Verstrker. Alle Dunkelphasen nach einem grnen Licht boten jedoch weiterhin Futter. Das Gesetz des Matching sagt vor-

aus, dass ein Vogel nun beginnen sollte, viel hufiger auf die grne Taste zu picken, da diese Taste etwa zehnmal so viele Verstrker liefert. Zeigt der Vogel jedoch tatschlich eine Prferenz fr die grne Taste, wird dies die Gesamtverstrkungsrate verringern. Der Grund dafr ist: Wenn der Vogel lange Zeit damit verbringt, auf die grne Taste zu picken, wird der VI-Timer oft gestoppt, da die rote Taste in einer Dunkelphase ist. Die optimale Strategie in diesem Fall (und in allen anderen Fllen in diesem Experiment) wre also, hufig zwischen den beiden Tasten hin- und herzuwechseln und beide zu je 50 Prozent zu bettigen. Dies wrde sicherstellen, dass der VI-Timer die meiste Zeit laufen wrde. Wenn die Versuchsobjekte ihr Verhalten zwischen Bedingung 1 und Bedingung 2 nicht nderten, htten sie pro Stunde etwa 32 Verstrker ber die grne Taste und 3,2 ber die rote erhalten (denn nun bestand nur noch in 10 Prozent aller Flle die Chance, in Dunkelphasen nach der roten Taste Futter zu erhalten). Doch das Verhalten der Vgel verlagerte sich, und am Ende der Bedingung reagierten sie in durchschnittlich 86 Prozent aller Flle auf die grne Taste (die 92 Prozent aller Verstrker lieferte). Aufgrund dieser Verlagerung erhielten die Tiere 23 Verstrker pro Stunde ber die grne Taste und nur zwei ber die rote. Dadurch, dass die Vgel also eine so groe Prferenz fr die grne Taste zeigten (wie vom Gesetz des Matching vorausgesagt), verloren sie etwa 29 Prozent ihrer Verstrker. In einigen anderen Bedingungen verloren die Vgel 75 Prozent und mehr ihrer potenziellen Verstrker. Die Verfahrensweise bei diesem Experiment war sehr komplex, aber die Resultate knnen auf einen einfachen Nenner gebracht werden: Obwohl die Optimierungstheorie voraussagt, dass die Vgel etwa 50 Prozent ihrer Reaktionen jeder Taste widmen wrden, zeigten die Vgel durchweg eine Prferenz fr die Taste, die mehr Verstrker lieferte, wie das Gesetz des Matching voraussagt. Die Wahl der Vgel fhrte zu einer starken Verringerung der Gesamtverstrkungsrate- genau das Gegenteil dessen, was nach der Vorhersage der Optimierungstheorie passieren sollte.

Weitere Tests der OptimierungstheoriePsychologen haben eine Reihe anderer experimenteller Vorgehensweisen benutzt, um die Vorhersagen des Gesetzes des Matching und der Optimierungstheorie zu vergleichen. In Wahlsituationen, die zum Beispiel sowohl einen VI- als auch einen VR-Plan beinhalten, sagt die Optimierungstheorie voraus, dass Tiere die meisten ihrer Reaktionen auf einen VR-Plan zeigen werden, denn die meisten Reaktionen auf einem VI-Plan sind vergebens, whrend jede Reaktion auf einem VR-Plan das Tier der Verstrkung nher bringt. Eine Reihe von Experimenten mit Tieren konnte diese Vorhersage nicht besttigen, doch standen die Ergebnisse im Einklang mit den Vorhersagen des Gesetzes des Matching (DeCarlo, 1985; Vyse & Belke, 1992). hnliche Resultate erhielt man mit College-Studenten, die fr Geld arbeiteten: Die Studenten verbrachten mehr Zeit mit dem VI-Plan als von der Optimierungstheorie vorhergesagt, und ihre Wahlen lagen den Vorhersagen des Matching-Gesetzes naher (Savastano & Fantino, 1994). Mehrere andere Experimente sowohl mit Tieren als auch mit Menschen lieferten keine Untersttzung fr die Vorhersagen der Optimierungstheorie (zum Beispiel Ettinger, Reid & Staddon, 1987; Jacobs & Hackenberg, 2000). Einige Experimente erlangten jedoch

Resultate, die fr die Optimierungstheorie sprachen (Jacobs & Hackenberg, 1996; Sakagami, Hursh, Christensen & Silberberg, 1989), und Verhaltenskologen haben viele Belege dafr erbracht, dass sich die von Tieren getroffenen Entscheidungen in vielen Situationen in der realen Welt den Vorhersagen der Optimierungstheorie annhern. Es ist noch nicht klar, wie-diese einander widersprechenden Resultate miteinander vereinbart werden knnen, und da die Belege mehrdeutig sind, bevorzugen einige Psychologen weiterhin die Optimierungstheorie, andere hingegen die Matching- (oder Meliorations-) Theorie. Da die Matchingtheorie, die Meliorationstheorie und die Optimierungstheorie sich mit der Gesamtverteilung der Reaktionen von Versuchsobjekten ber lange Zeitrume beschftigen, knnen sie als molare Theorien klassifiziert werden (siehe Kapitel 7). Einige Forscher nehmen nun an, dass vollstndigere Erklrungen des Wahlverhaltens in molekularen Theorien gefunden werden, die versuchen, ein Verhalten von Moment zu Moment vorherzusagen, und die davon ausgehen, dass kurzfristige Konsequenzen einen groen Einfluss auf die Wahl ausben. Nachdem Ettinger und andere (1987) zum Beispiel keine empirische Untersttzung der Optimierungstheorie finden konnten, zogen sie den Schluss, dass ,,Tiere fur die molaren Raten von Reaktion und Verstrkung vielleicht nicht sensitiv sind (...). Unsere Tiere waren auf einer molekularen Ebene sensitiv fr die Verstrkungsplne,und dieser molekularen Ebene sollten wir unsere Aufmerksamkeit schenken " (S. 366). Im nchsten Abschnitt wird eine molekulare Auswahltheorie vorgestellt.

14.2.4

Die Momentary-Maximization-Theorie

In ihrer allgemeinsten Form besagt die Momentary-Maximization-Theorie, dass ein Lebewesen zu jeder Zeit die Alternative whlen wird, welche im jeweiligen Augenblick den hchsten Wert hat. Der Wert einer Alternative wird gewhnlich von vielen Faktoren abhngen: Gre und Qualitt des Verstrkers, Mangelerscheinungen beim Versuchsobjekt usw. Obgleich sowohl die Momentary-Maximization-Theorieals auch die Optimierungstheorie davon ausgehen, dass Tiere versuchen, den Wert ihrer Wahlen zu maximieren, treffen beide Theorien oft unterschiedliche Vorhersagen, denn die beste kurzfristige Wahl ist nicht immer die beste langfristige Wahl. Ein einfaches Beispiel: Stellen Sie sich vor, eine Person auf einer Dit muss zwischen einem leichten Joghurt und einem kalorienhaltigen Becher Sahne-Erdbeereis zum Nachtisch whlen. Fr den Moment mag das Erdbeereis attraktiver als der Joghurt erscheinen, doch fr jemanden auf einer Dit wre der Wackelpudding langfristig nutzbringender. Wahlen, die einen Konflikt zwischen kurz- und langfristigem Nutzen einschlieen, werden wir spter in diesem Kapitel eingehend untersuchen; das Thema wird hier nur erwahnt, um zu zeigen, dass die Strategien der momentanen Maximierung und der langfristigen Optimierung zu sehr verschiedenen Wahlen fhren knnen. Um zu verstehen, welche Arten von Vorhersagen die Momentary-Maximization-Hypothese fr eine gleichzeitig ablaufende VI-NI-Situation liefert, wird es fr Sie hilfreich sein, an dem folgenden hypothetischen Glcksspiel teilzunehmen. Stellen Sie sich vor, es sei Ihnen gestattet, dieses Spiel neun Durchgnge lang zu spielen. Sie sitzen vor einer

Armatur mit zwei kleinen Tren, und bei jedem Durchgang drfen Sie eine der beiden Tren ffnen. Wenn sich hinter der Tr ein Euro befinden, gewinnen Sie den. Die folgenden Regeln bestimmen, ob sich hinter einer Tr ein Euro befindet oder nicht: Fr jede Tr gibt es eine modifizierte Roulette-Drehscheibe, die vor jedem Durchgang gedreht wird. Die Gewinnwahrscheinlichkeit liegt bei 0,l fr das Roulette-Rad fr Tr 1 und 0,2 fr das Rad fiir Tr 2. Beim ersten Durchgang des Spiels knnte sich deshalb hinter beiden Tren, hinter einer oder hinter keiner ein Euro befinden. Fr welche Tr wrden Sie sich beim ersten Durchgang entscheiden? Zwei zustzliche Regeln finden fr die nchsten acht Durchgnge Anwendung:1. Nachdem ein Euro hinter einer Tr deponiert wird, verbleibt er dort, bis Sie ihn einsammeln. Wenn also bei Durchgang 4 ein Euro hinter Tr I deponiert wird, wird er dort bleiben, bis Sie Tr 1 im, sagen wil; siebten Durchgang whlen.

2. Zu jedem gegebenen Zeitpunkt befindet sich hinter einer Tr nie mehr als ein Euro. Wenn also zum Beispiel bei Durchgang 4 ein Euro hinter Tr 1 deponiert wird und sie sammeln ihn bis zum siebten Durchgang nicht ein, dann ist das Drehen des RouletteRades bei Durchgang 5, 6 und 7 irrelevant, da hinter Tr 1 keine weiteren Euros deponiert werden. Das Drehen des Roulette-Rades fur Tr 2 ist aber bei diesen Durchgngen weiterhin wichtig, denn es knnte sich bei jedem Ersuch lohnen. Mit anderen Worten: Was bei Tr 1 passiert, hat keinen Einfluss auf Tr 2 und umgekehrt.

Bevor Sie weiterlesen, schreiben Sie auf, fr welche Tr Sie sich bei den neun Durchgngen jeweils entscheiden.I

,

I

I

I

Fr eine solche Situation sagt die Momentary-Maximization-Theorie voraus, dass eine Versuchsperson sich immer fr die Alternative entscheiden wird, die beim jeweiligen Durchgang die hhere Wahrscheinlichkeit eines Verstrkers hat. Bei Durchgang 1 ist die Wahrscheinlichkeit fr einen Verstrker hinter Tr 1 (bezeichnet als pl) 0,l und die Wahrscheinlichkeit fr einen Verstrker hinter Tr 2 (bezeichnet als p2) 0,2, so dass die Momentary-Maximization-Theorie eine Wahl fr Tr 2 voraussagt. Beim zweiten Durchgang ist die Situation etwas anders. Nehmen wir an, beim ersten Durchgang fiel die Wahl auf Tr 2, dann ist p2 immer noch 0,2, egal ob beim ersten Durchgang ein Euro gefunden wurde oder nicht. Doch pl wird beim zweiten Durchgang hher sein, denn es gibt zwei Mglichkeiten, wie ein Euro deponiert worden sein knnte: Das Roulette-Rad fr Tr 1 hat beim ersten Durchgang einen Euro verfgbar gemacht (der darauf wartet gefunden zu werden) oder dann beim zweiten Durchgang. Es kann gezeigt werden (mit einigen grundlegenden Regeln der Wahrscheinlichkeitsrechnung, die hier aber nicht nher erklrt werden sollen), dass pl beim zweiten Durchgang 0,19 ist. Dies ist immer noch etwas weniger als p2, SO dass die Momentary-Maximization-Theorie vorhersagt, dass wiederum Tr 2 gewhlt wird. Es kann gezeigt werden, dass nach zwei Wahlen fr Tr 2 pl 0,271 betragen wird (denn nun sind es drei Durchgnge, bei denen hinter Tr 1 ein Euro deponiert sein knnte) und p2 immer noch gleich 0,2 ist. Beim dritten Durchgang wrde sich ein momentaner Maximierer deshalb fr Tr 1 entscheiden. Beim vierten Durchgang jedoch gibt es zwei Mglichkeiten, bei Tr 2 zu gewinnen (durch eine Auszahlung entweder bei Durchgang 3 oder 4), so dass p2 wiederum grer als pl ist und Tr 2 gewhlt werden sollte. Es stellt

sich heraus, dass das Muster, dem ein momentaner Maximierer bei den neun Durchgngen folgt, 2, 2, 1, 2, 2, 1, 2,2, 1 ist und dass sich dieses zyklische Muster bei allen weiteren Durchgngen wiederholen wrde. Sie knnen Ihre Wahl prfen, um zu sehen, ob Sie der Strategie der Momentary-Maximization-Theorie gefolgt sind. Dieses hypothetische Glcksspiel ist gleichzeitig ablaufenden VI-NI-Plnen ziemlich hnlich. Die beiden Roulette-Rder sind zwei unabhngig voneinander laufenden VITimern ahnlich, und genau wie diese beherbergen die Roulette-Rder immer nur einen Verstrker auf einmal. Sie knnen deshalb wahrscheinlich schon vorwegnehmen, was die Momentary-Maximization-Theorie ber das Verhalten eines Versuchsobjekts bei solchen Plnen vorhersagt: Es besagt, dass die Wahlen eines Tieres von Durchgang zu Durchgang ein regelmiges zyklisches Muster aufweisen sollten. Natrlich erkennen die Befrworter der Momentary-Maximization-Theorie (Shimp, 1966, 1969; Silberberg, Hamilton, Ziriax & Casey, 1978) an, dass Tiere begrenzte Kapazitten beim Erinnern und Treffen von Entscheidungen haben, und sie erwarten nicht, dass perfektes Verhalten gem der Momentary-Maximization-Theorie auftritt. (Schlielich haben selbst Menschen Schwierigkeiten, die Wahrscheinlichkeiten in Situationen wie dem oben beschriebenen Glcksspiel zu bestimmen.) Was sie jedoch vorhersagen, ist, dass Tiere zumindest eine gewisse Neigung haben, die Alternative zu whlen, bei der die Wahrscheinlichkeit der Verstrkung hher ist. Nachdem ein Tier zum Beispiel mehrere Reaktionen hintereinander auf den besseren von zwei VI-Plnen reagiert hat, sollte es dazu neigen, zum anderen VI-Plan umzuschalten (da in der Zwischenzeit bei diesem VI-Plan ein Verstrker htte deponiert worden sein knnen). Nach der Momentary-Maximization-Theorie ist Matching-Verhalten ein zuflliges Nebenprodukt der regelmigen Wahlen eines Tieres von Durchgang zu Durchgang. Im Gegensatz dazu sagen molare Auswahltheorien nicht voraus, dass das Verhalten eines Tieres von Durchgang zu Durchgang irgendwelche regelmigen Muster zeigen wird, da diese Theorien davon ausgehen, dass das Verhalten eines Tieres von Variablen gesteuert wird (zum Beispiel die Gesamtverstrkungsrate), die sich nicht von Durchgang zu Durchgang verndern. Wenn Tiere Matching-Verhalten an den Tag legen, gibt es nun in ihrem Verhalten regelmige Muster von Durchgang zu Durchgang oder nicht? Es mag scheinen, dass die Beantwortung dieser Frage leicht sei, doch die Resultate von mehreren Experimenten sind alles andere als eindeutig. Einige Studien fanden solche Muster (Shimp, 1966; Silberberg und andere, 1978), andere wiederum nicht (Heyman, 1979; Nevin, 1969, 1979). Nevin (1979) zum Beispiel analysierte seine Daten auf der Suche nach regelmigen Reaktionssequenzen auf mehrere Arten, fand aber keine. Auf der molaren Ebene jedoch waren die Daten ziemlich regelmig: Die Wahl der Tauben wurde insgesamt durch das Gesetz des Matching gut beschrieben. Nevin zog den Schluss, dass die Momentary-Maximization-Theorie keine korrekte Erklrung liefert, warum Tiere Matching-Verhalten zeigen, denn dieses Verhalten zeigt sich selbst dann, wenn die Wahlen der Tiere von Durchgang zu Durchgang zufllig erscheinen. In einem Folgeartikel benutzten Hinson und Staddon (1983) eine andere Analysemethode und kamen zu anderen Schlussfolgerungen. Statt sich Sequenzen von Reaktionen anzuschauen, wie es bei allen vorherigen Studien getan worden war, zeichneten Hinson und Staddon fortlaufend die Zeit auf, ab der eine Taube auf jede der beiden VI-Tasten gepickt

hatte. Sie argumentierten, die Zeit sei die kritische unabhngige Variable, da es bei VIPlnen der Zeitverlauf und nicht die Anzahl der Reaktionen sei, die tatschlich die Verfgbarkeit eines Verstrkers bestimmt. Sie zeigten, dass ihre Tauben einer momentanen Maximierungsstrategie folgen konnten, wenn sie eine recht einfache Regel benutzten: Wenn Plan 1 zum Beispiel dreimal so viele Verstrker wie Plan 2 liefert, dann sollten Sie Plan 2 berprfen, wenn die Zeit, seit der Sie ihn das letzte Mal geprft haben, mehr als dreimal so lang ist wie die Zeit, seit der Sie das letzte Mal Plan 1 geprft haben. Hinson und Staddon zeigten, dass das Verhalten ihrer Tauben vom Standpunkt der Momentary Maximization-Theorie keinesfalls perfekt war, doch eine Mehrzahl ihrer Reaktionen folgten tatschlich dieser Regel. Die Momentary-Maximization-Theorie wurde neben dem Matching auch auf andere Verhaltensweisen angewendet. So stellten zum Beispiel Silberberg, Warren-Boulton und Asano (1998) die These auf, dass die Theorie erklren kann, weshalb Interresponse Times (IRT, Zeiten zwischen Reaktionen) und Reaktionsraten bei VI-Plnen gemaigt statt sehr lang oder sehr kurz sind. Eine IRT kann man als eine Verzgerung betrachten, whrend der ein Tier warten muss, bevor es reagieren und vielleicht einen Verstrker erhalten kann. Bei langen IRTs ist die Verzgerung lang, doch die Wahrscheinlichkeit, einen Verstrker zu erhalten, ist hoch. Bei kurzen IRTs ist die Verzgerung kurz, doch die Wahrscheinlichkeit, einen Verstrker zu erhalten, ist gering. Silberberg und seine Mitarbeiter sagten, dass Tiere den ,,momentanen Wert" jeder Reaktion bei Erzeugung von IRTs mittlerer Zeitdauer, die eine nur mige Verzgerung, doch eine angemessene Wahrscheinlichkeit einer Verstrkung beinhalten, maximieren.

14.2.5

Andere Auswahltheorien

Als Resultat des groen Interesses am Wahlverhalten unter denen, die die operante Konditionierung untersuchen, wurden neben den Theorien, die wir bereits untersucht haben, eine ganze Reihe anderer Theorien aufgestellt. Einige dieser Studien beinhalten ziemlich komplexe mathematische Berechnungen, und wir wollen an dieser Stelle nicht in die Einzelheiten solcher Studien gehen. Wir knnen jedoch einen kurzen Blick auf einige der greren Trends in diesem Forschungsfeld werfen. Nicht alle molekularen Auswahltheorien gehen davon aus, dass Tiere den Prinzipien der Momentary-Maximization-Theoriey folgen. Obwohl die Wahlen von Tieren dadurch beeinflusst werden knnen, wie schnell der Verstrker verabreicht wird, whlen sie nicht unbedingt immer die Alternative mit der krzeren Verzgerung oder der hheren momentanen Wahrscheinlichkeit. Als Beispiel fr eine alternative molekulare Theorie wies Vaughan (1985; Vaughan und Miller, 1984) darauf hin, dass verschiedene Wahlreaktionen durch ihre kurzfristigen Konsequenzen in unterschiedlich groem Ausma gestrkt wrden. Eine Wahlreaktion, der ein verzgerter Verstrker folgt, werde weniger gestrkt als eine, der unmittelbar ein Verstrker folgt, und als Resultat werde die zweite Reaktion in Zukunft hufiger ausgefhrt. Doch anders als die Momentary-Maximization-Theorie sagt Vaughans Theorie keine ausschlieliche Prferenz fr die Reaktion mit der greren Strke voraus - solange jede eine gewisse Strke aufweist, wird sie manchmal gewhlt.

Andere Auswahltheorien knnte man als Hybrid-Theorien bezeichnen, denn sie gehen davon aus, dass sowohl molare als auch molekulare Variablen die Wahl beeinflussen. Eine populre Theorie, bekannt unter der Bezeichnung Verzgerungsreduktions-Theorie (engl.: delay reduction theory, Fantino, 1969; Fantino, Preston & Dunn, 1993), beinhaltet zum Beispiel die grundlegende Idee des Matching-Gesetzes, doch zustzlich geht sie davon aus, dass die Wahlen von Tieren darauf ausgerichtet sind, welche Alternative eine strkere Reduktion der Verzgerungszeit bis zum nchsten Verstrker hervorbringt. Mit anderen Worten, diese Theorie beinhaltet sowohl eine molare Komponente (Matching von Reaktionsproportionen zu Verstrkungsproportionen) als auch eine molekulare (Kontrolle durch die krzere Verzgerungszeit bis zur Verstrkung). Andere Theorien dieser Art sind Killeens (1982) Anreiztheorie (engl.: incentive theory) und Grace' (1994) Kontextwahlmodell (engl.: contextual choice model). Ein weiterer neuerer Trend in der Erforschung des Wahlverhaltens ist ein wachsendes Interesse an der Dynamik der Wahl - wie sich Wahlverhalten an eine Vernderung der Verstrkungsalternativen anpasst (Couvillon & Bitterman, 1991; Devenport & Devenport, 1994; Dragoi & Staddon, 1999). Betrchtliche Forschungsarbeit ist dem Versuch gewidmet, die Strken und Schwchen unterschiedlicher mathematischer Theorien zum Wahlverhalten auszuwerten (Mazur, 2000). Unabhngig davon, welche Theorie sich als die beste erweist, kann niemand die allgemeinere Behauptung der molekularen Theorien in Frage stellen, dass kurzfristige Faktoren eine groe Auswirkung auf Wahlverhalten haben. Dies sollte nicht berraschen, denn die vorherigen Kapitel haben gezeigt, dass der Zusammenhang zwischen Reaktion und Verstrker in der operanten Konditionierung sehr wichtig ist. Der nchste Abschnitt zeigt: Wenn ein kleiner, aber unmittelbar erfolgender Verstrker gegen einen groen, aber mit Verzgerung verabreichten Verstrker antritt, wird oft der kleine unmittelbare Verstrker vorgezogen.

14.3

Wahlverhalten und Selbstkontrolle

Jeden Tag treffen Menschen viele Wahlen, die einen Konflikt zwischen ihren kurz- und langfristigen Interessen darstellen. Betrachten Sie die Situation einer Studentin, die einen Kurs belegt hat, in dem die Anwesenheit frh an jedem Montagmorgen wichtig ist. Am Sonntagabend stellt die Studentin ihren Wecker, so dass sie frh genug aufwacht, um es rechtzeitig zum Kurs zu schaffen. Die Studentin hat beschlossen, zum Unterricht zu gehen (und die erhhten Chancen auf eine gute Note zu nutzen), statt eine Sunde lnger zu schlafen. Dies klingt vielleicht nach einer besonnenen Wahl, doch leider hat die Studentin noch viel Zeit, ihre Meinung zu ndern. Wenn der Wecker am Montagmorgen klingelt, scheinen die Wrme und Behaglichkeit des Bettes doch attraktiver zu sein: Die Studentin stellt den Wecker ab und schlft wieder ein. Spter am Tag bereut sie vielleicht ihr Verhalten und gelobt sich selbst, nicht noch einmal dem Kurs fernzubleiben. Dieses Beispiel ist eine typische Wahlsituation, die Selbstkontrolle beinhaltet, bzw. eine, in der die Wahl besteht zwischen einem kleinen, unmittelbar erhltlichen und einem greren, aber weiter entfernten Verstrker. Der kleine Verstrker ist die Extrastunde Schlaf und der grere verzgerte Verstrker ist die bessere Note, die vielleicht aus der Anwe-

I

,

senheit resultiert. Eine bemerkenswerte Eigenschaft von Selbstkontrollsituationen ist, dass die Prferenzen einer Person ber die Zeit hinweg systematische Vernderungen zeigen. Am Sonntagabend zog es die junge Frau in unserem Beispiel vor, am nchsten Tag den Kurs zu besuchen (und die langfristigen Vorteile daraus zu ziehen), statt eine Stunde lnger zu schlafen. Am nchsten Morgen hatten sich ihre Prferenzen verndert und sie zog es vor, eine Stunde lnger zu schlafen. Spter am Tag bereut sie ihre Wahl und beschliet, sich in Zukunft anders zu entscheiden. Falls Sie nicht davon berzeugt sein sollten, dass Selbstkontrollsituationen alltglich sind, betrachten Sie sich die folgenden Alltagsentscheidungen. Sie sollten imstande sein, sowohl die kleineren unmittelbareren Verstrker als auch die greren, verzgerten Verstrker in jedem Fall zu erkennen:1. Eine Zigarette zu rauchen oder nicht zu rauchen. 2. Den Thermostat in den Wintermonaten auf 19" C einzustellen oder ihn hher zu stellen und um Ende des Monats mit einer hheren Heizkostenrechnung konfrontiert zu werden.

II

3. Wenn Sie eine Dit machen, zwischen Joghurt mit niedrigem Fettanteil oder einem kalorienreichen Sahneeis als Dessert zu whlen.4. Ihren Mitbewohner wtend anzuschreien oder ihr Gemt im Zaum zu halten und vermeiden etwas zu sagen, was Sie nicht so meinen. 5. Geldfur ein grogeres Anschafingsobjekt (wie etwa ein Auto) zu sparen oder es jedes Wochenendefur Parties auszugeben.

Bei jedem Beispiel sollten Sie auch sehen knnen, wie sich die eigene Prferenz ber die Zeit hinweg verndert. Es ist leicht fr Sie zu sagen, dass Sie eine Dit beginnen - ab morgen. Am Montag oder Dienstag ist es leicht zu beschlieen, ein ruhiges Wochenende zu verbringen und anzufangen, fr das Auto zu sparen. Es ist allerdings viel schwerer, die getroffenen Vorstze einzuhalten, wenn die Zeit gekommen ist, Ihre endgltige Wahl zu treffen. Herrnstein und Mazur (1987) argumentierten, dass diese Neigung, nach Ablauf einer gewissen Zeit die Prferenzen bei Selbstkontrollentscheidungen zu verlagern, einer der strksten Belege gegen die Optirnierungstheorie sei. Wrden Menschen der Strategie folgen, die ihre Zufriedenheit langfristig optimieren wrde, wrden sie unverndert die eine oder andere Alternative whlen. Menschen unterscheiden sich anscheinend in ihrer Bereitschaft, auf grere, aber erst mit einiger Verzgerung eintretende Belohnungen zu warten. In einer Studie stellten Green, Fry und Myerson (1994) Menschen unterschiedlichen Alters eine Reihe von Fragen zu hypothetischen Geldsummen wie etwa: ,,Wrden Sie lieber heute 500 Dollar erhalten oder lieber 1000 Dollar in einem Jahr?" Sie fanden heraus, dass Erwachsene im Alter von 60 und darber eher die grere, aber erst spter erhltliche Belohnung vorzogen als 20jhrige College-Studenten, und 12-jhrige Kinder wollten noch weniger auf die verzgerte Belohnung warten. Andere Studien fanden heraus, dass Raucher eher als Nichtoder Exraucher den kleineren, aber sofort erhltlichen Geldbetrag vorzogen, wenn ihnen Fragen wie die obigen gestellt wurden (Bickel, Odum & Madden, 1999; Mitchell 1999).

Obwohl dies Korrelationsstudien sind, zeigen sie die Mglichkeit, dass die Tendenz zu einer impulsiven Wahl (die kleinere, aber sofort erhltliche Belohnung zu whlen) zwischen verschiedenen Arten von Wahlsituationen hin und her wechseln kann. Warum verndern sich die Prferenzen von Menschen in solchen Selbstkontrollsituationen? Knnen Menschen irgendetwas tun, um ihre Selbstkontrolle zu verbessern, sodass eine impulsive Wahl (des kleineren, unmittelbar erhltlichen Verstrkers) weniger wahrscheinlich ist? Um Fragen wie diese zu beantworten, entwickelten Howard Rachlin (1970, 1974) und George Ainslie (1975) unabhngig voneinander hnliche Ideen zur Selbstkontrolle. Die Ainslie-Rachlin-Theorie, wie sie auch genannt wird, besagt, dass Vernderungen der Prferenz in Selbstkontrollsituationen verstndlich sind, wenn man betrachtet, wie eine Verzgerung die Effektivitt eines Verstrkers verndert.

Die Ainslie-Rachlin-Theoriesubjektiver Wert einer guten Note

- - - subjektiver Wert einerExtrastunde Schlaf

P

r

sonntagJ abend

'~ontagmorgen Zeit

Ende des Semesters

Abbildung 14.7: Eine Anwendung der Ainslie-Rachlin-Theorie auf ein i m Text beschriebenes hypothetisches Beispiel. Die obere Darstellung zeigt, wie sich der subjektive Wert einer guten Note ber die Zeit hinweg erhht, je nher der Zeitpunkt ihrer Vergabe rckt. Die untere Darstellung zeigt, dass auch der Wert einer Extrastunde Schlaf sich erhht, je nher sie rckt. Aufgrund der Wertvernderungen bevorzugt eine Person wohl manchmal die gute Note (wie etwa Sonntagabend) und die Extrastunde Schlaf zu anderen Zeiten (wie etwa Montagmorgen).

Das Beispiel der Studentin, die eine Wahl zwischen Schlaf und einem wichtigen Kurs treffen muss, kann benutzt werden, um die Merkmale dieser Theorie darzustellen. Ihre erste Annahme ist, dass sich der Wert eines Verstrkers verringert, je lnger die Verzgerungszeit zwischen der Wahl und dem Erhalt des Verstrkers ist. Die obere Hlfte von Abbildung 14.7 zeigt, dass der Verstrkerwert einer guten Note am Ende des Zeitraums

hoch ist, doch am fraglichen Sonntag und Montag ist der Wert viel niedriger, weil er so weit in der Zukunft liegt. In der unteren Hlfte der Abbildung wird zustzlich der Wert einer Extrastunde Schlaf zu verschiedenen Zeitpunkten gezeigt, und dieselbe Regel gilt auch fr diesen Verstrker: Mit lngeren Verzgerungszeiten zwischen der Wahl und der Verabreichung des Verstrkers sinkt sein Wert. Die zweite (und sehr vernnftige) Annahme der Theorie ist, dass ein Individuum den Verstrker whlt, der zum Zeitpunkt der Wahl den hheren Wert hat. Beachten Sie, dass der Kurvenverlauf in Abbildung 14.5 zeigt, dass der Wert einer guten Note am Sonntagabend hher ist, was erklrt, warum die Studentin mit der Absicht, am Unterricht teilzunehmen, ihren Wecker stellt. Am Montagmorgen hat sich jedoch der Wert der Extrastunde Schlaf wegen ihrer unmittelbaren Verfgbarkeit enorm erhht. Da ihr Wert nun hher als der einer guten Note ist, entscheidet sich die Studentin fr den unmittelbar erhltlichen Verstrker. Sollten Sie Schwierigkeiten haben, die Kurvenverlufe in Abbildung 14.7 zu verstehen, ist es vielleicht hilfreich, eine Analogie zwischen Zeit und Entfernung zu ziehen. Abbildung 14.8 zeigt die Darstellung einer langen Strae mit zwei Gebuden auf der linken Straenseite. Die Gebude entsprechen den beiden Verstrkern in der Selbstkontrollsituation. Gebude 2 ist eindeutig grer, doch fr eine Person am Punkt A wrde Gebude 1 einen greren Sehwinkel haben. Wir knnten sagen: Aus der Perspektive von Punkt A erscheint Gebude 1 grer (obwohl Menschen offensichtlich die Fhigkeit haben, die Entfernungen zu bercksichtigen, und deshalb nicht dieser Illusion erliegen wrden). Wenn die Person andererseits zu Punkt B liefe, wrden beide Gebude kleiner erscheinen, doch nun wre der Sehwinkel von Gebude 2 grer. Wenn eine Person also von beiden Gebuden etwas zurcktritt, hat sie eine bessere Perspektive und kann deren relative Gren besser erkennen. In hnlicher Weise kann eine Person zwei Verstrker (wie etwa eine Extrastunde Schlaf und eine bessere Note) aus einiger Entfernung (wie etwa die Nacht vor dem Unterricht) betrachten und eine bessere Perspektive erlangen, was die Werte der beiden Verstrker betrifft, und whlt wahrscheinlich den greren der beiden.

I

I

I

Abbildung 14.8: Fr eine Person an Punkt A hat Gebude 1 einen greren Sehwinkel als Gebude 2. Das Gegenteil gilt fr eine Person an Punkt B. Diese Situation entspricht ungefhr einer Selbstkontrollsituation, wenn wir die rumliche Entfernung als zeitliche betrachten u n d das groe, weit entfernte Gebude als groen, verzgerten Verstrker ansehen u n d das kleinere nhere Gebude als kleineren, unmittelbar verfgbaren Verstrker.

Wie Sie wohl sehen knnen, ist das Problem der Studentin, dass es ihr freisteht, am Montagmorgen ihre Meinung zu ndern, wenn die unmittelbare Verfgbarkeit der Extrastunde Schlaf ihr eine verzerrte Sicht der relativen Werte gibt. Wenn es fr sie einen Weg gbe, ihre Wahl am Sonntagabend unverrckbar festzulegen, htte sie bessere Chancen, den greren verzgerten Verstrker zu erhalten. Eine Technik, die sich dieser Mglichkeit bedient, bezeichnet man als Precommitment (Vorausverpflichtung): Die Person trifft im Voraus eine Entscheidung, die zu einem spteren Zeitpunkt schwierig oder gar nicht zu ndern ist. So knnte die Studentin zum Beispiel am Sonntagabend eine Freundin aus demselben Kurs bitten, am Montagmorgen vorbeizuschauen und sie mitzunehmen - und kein ,,Neinu als Antwort zu akzeptieren. Dies wrde es zwar nicht unmglich fr die Studentin machen, ihre Meinung zu ndern, aber es wre schwieriger und auch peinlicher, wenn sie im Bett bliebe. Kurz, die Studentin wrde ein Precomrnitment eingehen, zum Kurs zu gehen, indem sie sich von einer Freundin abholen lsst. Die PrecommitmentTechnik ist eine ntzliche Methode, impulsives Wahlverhalten zu vermeiden, und der nchste Abschnitt zeigt, dass sie sowohl fr Tiere als auch fr Menschen wirksam sein kann.

14.3.2

Tierstudien zur Selbstkontrolle

Ein groer Teil der Forschungsarbeiten, die die Ainslie-Rachlin-Theorie untersttzen, fand im Rahmen von Tierstudien statt, und diese Arbeiten zeigen, wie es oft mglich ist, einfache Laboranalogien komplexer Situationen in der realen Lebenswelt zu entwerfen. Der Hauptunterschied zwischen den oben beschriebenen Selbstkontrollsituationen und den folgenden Tierversuchen ist der einbezogene Zeitrahmen. Mit Tauben, Ratten und anderen Tieren kann eine Verzgerung von einigen Sekunden oft den Unterschied zwischen Selbstkontrolle und Impulsivitt ausmachen. Eine Studie von Green, Fischer, Perlow und Sherman (1981) zeigte die Art von Prferenzwechsel, die wir erwarten wrden, wenn die Ainslie-Rachlin-Theorie korrekt ist. Tauben erhielten jeden Tag viele Durchgnge, und bei jedem Durchgang whlte der Vogel, indem er nur einmal auf eine von zwei Tasten pickte. Ein Picken auf die rote Taste lieferte zwei Sekunden lang Futter, und ein Picken auf die grne Taste lieferte sechs Sekunden lang Futter. Es gab jedoch eine kurze Verzgerungsphase zwischen dem Picken und der Verabreichung des Verstrkers. In einem Fall gab es zum Beispiel eine zweisekndige Verzgerung des 2-Sekunden-Verstrkers und eine sechssekndige Verzgerung des 6-Sekunden-Verstrkers. Unter diesen Umstnden zeigten die Vgel bei fast jedem Durchgang impulsives Verhalten und whlten den 2-Sekunden-Verstrker. Diese Wahl beschleunigte die zuknftigen Durchgnge nicht, denn Durchgnge erfolgten alle 40 Sekunden, unabhngig davon, welche Wahl getroffen wurde. Es sollte klar sein, dass dieses Verhalten nicht im Einklang mit der Optimierungstheorie steht, da die optimale Lsung bei jedem Durchgang die Wahl des 6-Sekunden-Verstrkers gewesen wre. Dadurch, dass die Tiere durchweg den kleineren, aber schneller erhltlichen Verstrker whlten, entging ihnen etwa zwei Drittel des potenziell erhltlichen Futters.

In einem anderen Fall stellten die Versuchsleiterjedem Verstrker eine 18-sekndigeVerzgerungsphase voran, so dass die Verzgerungszeiten nun 20 bzw. 24 Sekunden betrugen. Wenn die Vgel so weit im Voraus eine Wahl treffen mussten, war ihr Verhalten nahezu optimal; bei ber 80 Prozent aller Durchgnge whlten sie den 6-Sekunden-Verstrker. Diese Verlagerung der Prferenz, wenn beide Verstrker zeitlich weiter entfernt sind, ist genau das, was die Ainslie-Rachlin-Theorie vorhersagt. Ainslie (1974) fhrte ein ausgeklgeltes Experiment durch, dass zeigt, dass zumindest einige Tauben den Gebrauch der Strategie des Precornmitment erlernen knnen, um impulsive Wahl zu vermeiden. Ainslies Vorgehensweise ist in Abbildung 14.9 dargestellt. Jede Taube erhielt 50 Durchgnge pro Tag, und jeder Durchgang dauerte genau 19 Sekunden, egal was die Taube tat. Die oberste Darstellung in Abbildung 14.9 zeigt die Abfolge der Ereignisse, die auftraten, wenn die Taube berhaupt nicht auf die Reaktionstaste pickte. Die Taste leuchtete zuerst fr einige Sekunden grn auf, dann folgte eine Dunkelphase von einigen Sekunden, dann leuchtete sie drei Sekunden lang rot auf, worauf der Vogel fr vier Sekunden Zugang zum Futter hatte. Indem der Vogel also nichts tat, konnte er sicher sein, vier Sekunden lang Futter zu erhalten. Die mittlere Darstellung in Abbildung 14.9 zeigt jedoch, dass - wenn der Vogel zu irgendeinem Zeitpunkt auf die Taste pickte, whrend sie rot aufleuchtete - er sofort zwei Sekunden lang Futter erhielt. Ainslie fand, dass jede Taube fast immer auf die Taste pickte, whrend sie rot aufleuchtete; offensichtlich zog sie einen sofortigen Erhalt von zwei Sekunden Futter dem Erhalt von vier Sekunden Futter nach einer Verzgerung von nur drei Sekunden vor. Wenn die Taste rot aufleuchtete, pickten die Vgel in mehr als 95 Prozent aller Flle auf die Taste.Durchgnge ohne Picken Taste leuchtet Futter fr 4 Sek.

Durchgnge mit Picken auf rote Taste Taste leuchtet Futter

picken

fr 2 Sek. Durchgnge mit Picken auf grne Taste

Taste leuchtet Futter fr 4 Sek.

Sekunden

Abbildung 14.9: Eine Darstellung von Ainslies (1 974) Verfahrensweise. Die drei Darstellungen zeigen von oben nach unten die Ereignisse bei Durchgngen ohne Picken, mit einem Picken auf die rote Taste und mit einem Pikken auf die grne.

Wie die unterste Darstellung in Abbildung 14.9 zeigt, war der Zweck der Initialphase, als die Taste grn aufleuchtete, dem Vogel eine Chance zu geben, ein Precornmitment fr den greren Verstrker einzugehen. Beachten Sie: Als die Taste grn aufleuchtete, waren beide Verstrker noch einige Sekunden entfernt, so dass der unmittelbare 2-SekundenVerstrker nicht so verlockend sein sollte. Wenn das Tier einmal auf die grne Taste gepickt hatte, traf es eine unumkehrbare Wahl fr den 4-Sekunden-Verstrker. Die Taste leuchtete nie rot auf, so dass es keine Gelegenheit mehr gab, auf die rote Taste zu picken und sofort zwei Sekunden lang Futter zu erhalten. Drei von Ainslies zehn Tauben lernten den Gebrauch der Precommitment-Option und pickten in mehr als der Hlfte aller Durchgnge auf die grne Taste. Die anderen Tiere pickten sehr selten auf die grne Taste. Der Grund, weshalb das von Ainslie ersonnene Precommitment-Verfahren fr einige Tiere schwer zu beherrschen war, war, dass ein Precommitment eine aktive Reaktion erforderte (ein Picken auf die grne Taste), wohingegen kein Precommitment nichts weiter erforderte, als die Zeit bis zur Verabreichung des Verstrkers abzuwarten. Wir knnten annehmen: Wenn die Tauben eine aktive Wahl fr oder gegen das Precommitment htten treffen mssen, bevor der Durchgang fortgesetzt wrde, dann htten sie vielleicht hufiger auf die Precommitment-Strategie zurckgegriffen. Ein Experiment von Rachlin und Green (1972) zeigte, dass dies der Fall ist. Bei jedem Durchgang musste der Vogel entweder auf eine Taste picken und ein Precommitment fr einen greren Verstrker eingehen oder auf eine zweite Taste picken und spter die Wahl zwischen einem groen Verstrker oder einem kleineren, aber unmittelbar erhltlichen Verstrker treffen. Bei dieser Vorgehensweise whlten vier von fnf Tauben in der Mehrzahl aller Flle die PrecommitmentTaste, und ein fnftes Tier whlte auch gelegentlich diese Taste. Zusammengefasst kann man sagen: Precommitment scheint zu funktionieren, da das Individuum eine unumkehrbare Wahl treffen kann, wenn kein Verstrker unmittelbar verfgbar ist - wenn das Individuum eine bessere Perspektive" auf die relativen Gren der Verstrker hat (wie in Abbildung 14.7 und 14.8 dargestellt). Wenn die Alternativen in einer Selbstkontrollsituation Bestrafungen statt Verstrkungen sind, haben sie auf die Wahl den umgekehrten Einfluss. In einer Studie neigten Ratten dazu, einen strkeren, aber verzgerten Elektroschock einem kleineren, aber sofort verabreichten vorzuziehen. Wenn sie jedoch einige Sekunden vor Beginn des Durchgangs ein Precommitment fr den kleineren, aber sofort auftretenden Elektroschock eingehen konnten, so taten sie das oft (Deluty, Whitehouse, Mellitz & Hineline, 1983). Diese Studie liefert ein weiteres Beispiel, wie Bestrafungen und Verstrkungen symmetrische, aber gegenteilige Auswirkungen auf Verhalten haben. Andere Forschungsarbeiten mit Tieren untersuchten die Faktoren, die es mehr oder weniger wahrscheinlich machen, einen bevorzugten, aber verzgerten Verstrker zu wahlen. Grosch und Neuringer (1981) benutzten ein Verfahren hnlich dem von Ainslie, nur gab es keine Mglichkeit zu einem Precommitment: Eine Taube konnte entweder 15 Sekunden warten und dann ein bevorzugte Sorte Futter fressen, oder sie konnte auf eine Taste picken und erhielt sofort eine weniger bevorzugte Sorte Futter. (Ein weiterer Unterschied war also, dass die beiden Verstrker sich in ihrer Qualitt statt in ihrer Menge unterschieden.) Die Tauben mussten eine starke Prferenz fr den verzgerten Verstrker haben, denn Grosch und Neuringer fanden, dass die Tiere in 80 Prozent aller Durchgnge auf diesen Verstrker warteten. Die Versuchsleiter nahmen dann eine kleine nderung an der

Verfahrensweise vor: Die beiden Futtersorten waren nun fr die Tauben whrend der Wartezeit sichtbar (hinter einem durchsichtigen Hindernis). Waren die Verstrker sichtbar, verhielten sich die Tauben viel impulsiver und warteten nur in 10 bis 15 Prozent aller Flle auf den bevorzugten Verstrker. Der Anblick des Futters stellte offensichtlich eine zu groe Versuchung dar, der die Tiere nicht widerstehen konnten. In einer anderen Studie fanden Grosch und Neuringer, dass die mit den Futterverstrkern assoziierten Stimuli eine hnliche Wirkung hatten. In diesem Fall war whrend der Wartezeit kein Futter sichtbar, doch die Futterklappen leuchteten in denselben Farben auf, die normalerweise die Verabreichung des Futters begleiteten. Wie das Futter selbst lieen die aufleuchtenden Farblichter die Tauben eher das sofort verfgbare, aber weniger bevorzugte Futter whlen. Grosch und Neuringer fanden ebenfalls, dass ihre Tauben eher auf den verzgerten Verstrker warteten, wenn sie die Gelegenheit hatten, sich whrend der Verzgerungsphase mit einer bestimmten Aktivitt zu beschftigen. Wir sahen, dass die Tauben nur in 15 Prozent aller Durchgnge auf das bevorzugte Futter warteten, wenn das Futter fr sie sichtbar war. Grosch und Neuringer brachten den Vgeln dann bei, auf eine Taste irn hinteren Teil der Kammer zu picken, die zunchst Futter auf einem FR-20-Plan lieferte. Es war nicht berraschend, dass die Vgel es fr einfacher hielten, auf das bevorzugte Futter zu warten, wenn sie die Verzgerungsphase mit der Arbeit an einem FR-20-Plan verbringen konnten. berraschender war die Tatsache, dass die Vgel fr die restliche Zeit des Experiments ohne Zeichen von Extinktion weiter auf diese Taste pickten, auch wenn sie keine Verstrker mehr lieferte. Diese Studien zeigen einige der Faktoren, die die Wahl von Versuchstieren in Selbstkontrollsituationen beeinflussen. Der nchste Abschnitt zeigt, dass dieselben Faktoren das Wahlverhalten kleiner Kinder beeinflussen.

I

14.3.3

Faktoren, die die Selbstkontrolle bei Kindern beeinflussen

Die Experimente von Grosch und Neuringer waren einer Reihe von Experimenten mit Kindern von Walter Mischel und seinen Kollegen nachempfunden (Mischel, 1966, 1974). In einem Experiment (Mischel & Ebbesen, 1970) wurden Vorschulkinder (die einzeln getestet wurden) vor die Wahl gestellt, entweder 15 Minuten auf einen bevorzugten Verstrker (wie etwa Brezel) zu warten oder einen weniger bevorzugten Verstrker (wie etwa Kekse) sofort zu erhalten. Innerhalb der 15-mintigen Wartezeit konnte das Kind den Durchgang jederzeit abbrechen und den weniger bevorzugten Snack erhalten. Wie bei den Tauben von Grosch und Neuringer war es fr die Kinder wesentlich schwieriger zu warten, wenn die Verstrker sichtbar waren (in einer offenen Keksdose vor dem Kind). In einer weiteren Studie mit einem anderen Verstrker sagten Mischel, Ebbesen und Zeiss (1972) einigen Kindern, sie knnten ,,an den Marshmallow und die Brezel so lange denken, wie sie mchten". Anderen Kindern wurden solche Anweisungen nicht gegeben. Die Kinder, die dazu ermutigt wurden, ber die Verstrker nachzudenken, zogen es hufiger vor, den Durchgang abzubrechen und den weniger bevorzugten Verstrker zu bekommen.

Mischel und seine Mitarbeiter fanden auch heraus, dass die Kinder eher auf den bevorzugten Verstrker warteten, wenn sie sich whrend der Wartezeit mit irgendeiner Aktivitt beschftigen konnten (einem Teil der Kinder wurde eine Spiralfeder zum Spielen gegeben). Studien von Mischel und anderen haben gezeigt, dass es groe individuelle Unterschiede zwischen Kindern bezglich ihrer Selbstkontrollfhigkeiten gibt: Einige Kinder knnen lange auf einen verzgerten Verstrker warten, andere nicht. Diese individuellen Unterschiede knnen schon bei Kindern im Alter von zwei Jahren beobachtet werden (Silverman & Ragusa, 1990). Es scheint, als ob zwei- oder dreijhrige Kinder bereits die Strategie erlernt haben, ihr