37
Lernen (2) Lernen (2) Operantes Operantes Konditionieren Konditionieren Prof. Dr. Ralph Prof. Dr. Ralph Viehhauser Viehhauser

Lernen (2) Operantes Konditionieren Prof. Dr. Ralph Viehhauser

Embed Size (px)

Citation preview

Lernen (2)Lernen (2)Operantes Operantes

KonditionierenKonditionieren

Prof. Dr. Ralph ViehhauserProf. Dr. Ralph Viehhauser

Thorndikes Puzzle-Box

Operantes Operantes KonditionierenKonditionieren

Operant:Operant: Das Verhalten eines Organismus, Das Verhalten eines Organismus, das sich anhand der beobachtbaren Effekte das sich anhand der beobachtbaren Effekte auf die Umwelt beschreiben lässt.auf die Umwelt beschreiben lässt.

Operantes Konditionieren:Operantes Konditionieren: Eine Eine Lernform, bei der sich die Lernform, bei der sich die Wahrscheinlichkeit einer Reaktion Wahrscheinlichkeit einer Reaktion aufgrund einer Veränderung ihrer aufgrund einer Veränderung ihrer Konsequenzen ändert.Konsequenzen ändert.

Skinner-Box

KontingenzKontingenz

Unter Kontingenz (bei der Unter Kontingenz (bei der Verstärkung) versteht man eine Verstärkung) versteht man eine zuverlässige Beziehung zuverlässige Beziehung zwischen einer Reaktion und zwischen einer Reaktion und den dadurch hervorgerufenen den dadurch hervorgerufenen Änderungen in der Umwelt. Änderungen in der Umwelt.

VerstärkungVerstärkung Verstärker:Verstärker: Jeder Reiz, der, wenn er Jeder Reiz, der, wenn er

kontingent auf eine Reaktion erfolgt, die kontingent auf eine Reaktion erfolgt, die Wahrscheinlichkeit der Reaktion erhöht.Wahrscheinlichkeit der Reaktion erhöht.

Positive Verstärkung:Positive Verstärkung: Auf ein Verhalten Auf ein Verhalten (Reaktion) folgt ein angenehmer Reiz, der die (Reaktion) folgt ein angenehmer Reiz, der die Wahrscheinlichkeit der Reaktion erhöht.Wahrscheinlichkeit der Reaktion erhöht.

Negative Verstärkung:Negative Verstärkung: Auf ein Verhalten Auf ein Verhalten (Reaktion) folgt die Entfernung eines (Reaktion) folgt die Entfernung eines aversiven Reizes. Dadurch erhöht sich die aversiven Reizes. Dadurch erhöht sich die Wahrscheinlichkeit der Reaktion.Wahrscheinlichkeit der Reaktion.

Operante Operante LöschungLöschung

Wenn ein Verhalten nicht länger Wenn ein Verhalten nicht länger vorher-sagbare Konsequenzen vorher-sagbare Konsequenzen zeigt, geht seine zeigt, geht seine Auftretenshäufigkeit auf das Auftretenshäufigkeit auf das Niveau zurück, dass es vor dem Niveau zurück, dass es vor dem operanten Konditionieren besaß.operanten Konditionieren besaß.

BestrafungBestrafung Bestrafungsreiz:Bestrafungsreiz: Jeder Reiz, der unter Jeder Reiz, der unter

Kontingenzbedin-gungen mit einer Reaktion Kontingenzbedin-gungen mit einer Reaktion die Wahrscheinlichkeit dieser Reaktion senkt.die Wahrscheinlichkeit dieser Reaktion senkt.

Bestrafung 1. ArtBestrafung 1. Art (positive Bestrafung): Auf (positive Bestrafung): Auf ein Verhalten folgt ein aversiver Reiz, der die ein Verhalten folgt ein aversiver Reiz, der die Wahr-scheinlichkeit des Verhaltens senkt.Wahr-scheinlichkeit des Verhaltens senkt.

Bestrafung 2. ArtBestrafung 2. Art (negative Bestrafung): (negative Bestrafung): Auf ein Verhalten folgt der Wegfall eines Auf ein Verhalten folgt der Wegfall eines angenehmen Reizes, wodurch die angenehmen Reizes, wodurch die Wahrscheinlichkeit dieses Verhaltens sinkt.Wahrscheinlichkeit dieses Verhaltens sinkt.

Klassifikation von Klassifikation von Verstärkern (1)Verstärkern (1)

Primäre Verstärker:Primäre Verstärker: Biologisch begründete Biologisch begründete Verstärker wie beispielsweise Nahrung oder Verstärker wie beispielsweise Nahrung oder Wasser.Wasser.

Konditionierte (sekundäre) VerstärkerKonditionierte (sekundäre) Verstärker:: Im Im Rahmen des klassischen Konditionierens werden Rahmen des klassischen Konditionierens werden aus zuvor neutralen Stimuli Verstärker.aus zuvor neutralen Stimuli Verstärker.

Generalisierte Verstärker:Generalisierte Verstärker: sind eine sind eine Sonderform sekundärer Verstärker. Ihre Sonderform sekundärer Verstärker. Ihre Besonderheit besteht darin, mit sehr vielen Besonderheit besteht darin, mit sehr vielen primären und/oder sekundären Verstärkern primären und/oder sekundären Verstärkern assoziierbar zu sein und in diese umgetauscht assoziierbar zu sein und in diese umgetauscht werden zu können (z.B. Geld, Tokens)werden zu können (z.B. Geld, Tokens)

Klassifikation von Klassifikation von Verstärkern (2)Verstärkern (2)

Materielle Verstärker:Materielle Verstärker: z.B. Nahrung, z.B. Nahrung, attraktive Gegenstände, Fleißbildchen, attraktive Gegenstände, Fleißbildchen, GeldGeld

Soziale Verstärker:Soziale Verstärker: z.B. Lob, z.B. Lob, anerkennende Worte, zustimmendes anerkennende Worte, zustimmendes Nicken, Lächeln, StreichelnNicken, Lächeln, Streicheln

Aktivitätsverstärker:Aktivitätsverstärker: jede als angenehm jede als angenehm erlebte Tätigkeit kann verstärkend erlebte Tätigkeit kann verstärkend wirken (z.B. nach der Erledigung der wirken (z.B. nach der Erledigung der Hausaufgaben zum Spielen gehen)Hausaufgaben zum Spielen gehen)

VerstärkerpläneVerstärkerpläne Verstärkerpläne:Verstärkerpläne: Muster der Gabe oder Zurückhaltung Muster der Gabe oder Zurückhaltung

von Verstärkern beim operanten Konditionieren.von Verstärkern beim operanten Konditionieren.

Grundsätzlich lassen sich unterscheiden:Grundsätzlich lassen sich unterscheiden: Kontinuierliche Verstärkung:Kontinuierliche Verstärkung: Verstärkung nach jeder Reaktion Verstärkung nach jeder Reaktion Intermittierende Verstärkung:Intermittierende Verstärkung: Verstärkung hin und wieder Verstärkung hin und wieder

Intermittierende Verstärkung kann entweder nach einem Intermittierende Verstärkung kann entweder nach einem Quotenplan oder nach einem Intervallplan erfolgen: Quotenplan oder nach einem Intervallplan erfolgen: Quotenplan:Quotenplan: Verstärkung nach einer bestimmten Anzahl von Verstärkung nach einer bestimmten Anzahl von

Reaktionen.Reaktionen. Intervallplan:Intervallplan: Verstärkung nach einem bestimmten Zeitintervall. Verstärkung nach einem bestimmten Zeitintervall.

In beiden Fällen kann das Muster der Verstärkung In beiden Fällen kann das Muster der Verstärkung entweder: entweder: konstant und somit konstant und somit fixiert fixiert oder oder unregelmäßig und somit unregelmäßig und somit variabelvariabel sein. sein.

LöschungsresistenzLöschungsresistenz Reaktionen, die unter Plänen Reaktionen, die unter Plänen

intermittierender Verstär-kung erworben intermittierender Verstär-kung erworben wurden, sind löschungsresistenter als wurden, sind löschungsresistenter als Reaktionen, die unter kontinuierlichen Reaktionen, die unter kontinuierlichen Verstärkerplä-nen erworben wurden. Verstärkerplä-nen erworben wurden.

Variable Quotenpläne produzieren den Variable Quotenpläne produzieren den größten Löschungswiderstand (siehe z.B. größten Löschungswiderstand (siehe z.B. Spielautomaten)Spielautomaten)

Verhaltensgleichung Verhaltensgleichung (Bsp. zur positiven Verstärkung)(Bsp. zur positiven Verstärkung)

Situation (S) Reaktion (R) Konsequenz (C)

Johannes im Heim

Weglaufen besondere Fürsorge (C+)

Verhaltensgleichung Verhaltensgleichung (Bsp. zur negativen (Bsp. zur negativen

Verstärkung)Verstärkung)

Situation (S) Reaktion (R) Konsequenz (C)

Nachbarin anwesend

Mutter kauft Süßigkeit

Tochter hört mit Quengeln auf (C-)

VerhaltensgleichVerhaltensgleichung ung (Bsp. zur Bestrafung (Bsp. zur Bestrafung

durch Verstärkerentzug)durch Verstärkerentzug)

Situation (S) Reaktion (R) Konsequenz (C)

Termin keine Übung durchgeführt

Termin wird beendet (C+)

Situation (S) Reaktion (R) Konsequenz (C)

Beratungs-gespräch

offene Mitteilung

Berater macht Vorhaltungen (C-)

VerhaltensgleichVerhaltensgleichung ung (Bsp. zur Bestrafung (Bsp. zur Bestrafung

durch aversiven Reiz)durch aversiven Reiz)

Beispiel für eine operante Beispiel für eine operante AnalyseAnalyse

Immer wenn Katrin zu Bett gebracht wird, Immer wenn Katrin zu Bett gebracht wird, fängt sie zu jammern und zu weinen an. Die fängt sie zu jammern und zu weinen an. Die Mutter kommt dann zu ihr ins Mutter kommt dann zu ihr ins Kinderzimmer, setzt sich neben sie ans Bett, Kinderzimmer, setzt sich neben sie ans Bett, streichelt sie und erzählt eine Geschichte, streichelt sie und erzählt eine Geschichte, woraufhin Katrin ruhig einschläft. woraufhin Katrin ruhig einschläft.

Wie könnte eine operante Analyse aussehen? Wie könnte eine operante Analyse aussehen? Was würden Sie der Mutter raten?Was würden Sie der Mutter raten?

Zwei-Faktoren-Theorie (von Zwei-Faktoren-Theorie (von Mowrer) zur Erklärung des Bsp. Mowrer) zur Erklärung des Bsp.

HundephobieHundephobie In der ersten Phase:In der ersten Phase: bildet sich durch klassische bildet sich durch klassische

Konditionie-rung eine Angstreaktion, der zufolge ein Konditionie-rung eine Angstreaktion, der zufolge ein Reiz aversive CS-Qualität gewinnt und die CR "Angst" Reiz aversive CS-Qualität gewinnt und die CR "Angst" auslöst. Wurde eine Person von einem Hund gebissen, auslöst. Wurde eine Person von einem Hund gebissen, lernt sie auf diese Weise, Hunde zu fürchten (UCS = lernt sie auf diese Weise, Hunde zu fürchten (UCS = Biss; UCR = Schmerz; CS = Hund; CR = Angst). Biss; UCR = Schmerz; CS = Hund; CR = Angst).

In der zweiten PhaseIn der zweiten Phase bildet sich auf der Grundlage bildet sich auf der Grundlage operanten Lernens ein Verhalten, das zur Beseitigung operanten Lernens ein Verhalten, das zur Beseitigung des angstauslösenden konditionierten Reizes führt. Für des angstauslösenden konditionierten Reizes führt. Für die hundeängstliche Person wird die konditionierte die hundeängstliche Person wird die konditionierte Angstreaktion also zu einem diskriminativen Stimulus Angstreaktion also zu einem diskriminativen Stimulus (SD), der die Auswahl eines Weges (R), auf dem man (SD), der die Auswahl eines Weges (R), auf dem man keinem Hund begegnet, anregt und auf diese Weise keinem Hund begegnet, anregt und auf diese Weise dazu führt, dass die Person keine Angst mehr zu haben dazu führt, dass die Person keine Angst mehr zu haben braucht. Das Nachlassen der Angst wirkt dabei als braucht. Das Nachlassen der Angst wirkt dabei als negative Verstärkung. negative Verstärkung.

Intermittierende Verstärkung Intermittierende Verstärkung zur Erklärung abergläubischen zur Erklärung abergläubischen

VerhaltensVerhaltens Abergläubisches Verhalten kommt oft vor, Abergläubisches Verhalten kommt oft vor,

wenn Organismen (intermittierend) wenn Organismen (intermittierend) verstärkenden Ereig-nissen ausgesetzt waren, verstärkenden Ereig-nissen ausgesetzt waren, die von ihrem Verhalten unabhängig sind. Die die von ihrem Verhalten unabhängig sind. Die Organismen haben keine Kontrolle darüber, ob Organismen haben keine Kontrolle darüber, ob der Verstärker gegeben wird, aber sie der Verstärker gegeben wird, aber sie verhalten sich so, als ob sie Kontrolle darüber verhalten sich so, als ob sie Kontrolle darüber hätten. hätten.

Bsp.: Würfelrituale um eine „sechs“ zu Würfeln.Bsp.: Würfelrituale um eine „sechs“ zu Würfeln.

Positive Verstärkung am Bsp. Sucht

Negative Verstärkung am Bsp. Sucht

Chronischer Drogengebrauch – Chronischer Drogengebrauch – ein verhaltenstheoretisches ein verhaltenstheoretisches

ParadoxonParadoxon Trotz der erheblichen negativen (aversiven) Konsequenzen Trotz der erheblichen negativen (aversiven) Konsequenzen

(wie gesundheitlicher und psychosozialer Folgeschäden), (wie gesundheitlicher und psychosozialer Folgeschäden),

trotz der Abnahme der subjektiv erfahrenen trotz der Abnahme der subjektiv erfahrenen Verstärkerwirkung wird das Drogen-Verhalten Verstärkerwirkung wird das Drogen-Verhalten aufrechterhalten. aufrechterhalten.

Das verhängnisvolle Paradoxon ergibt sich v.a. aus der Das verhängnisvolle Paradoxon ergibt sich v.a. aus der unter-schiedlichen Wirkung von kurz- vs. langfristigen unter-schiedlichen Wirkung von kurz- vs. langfristigen Konsequenzen: Selbst minimale (positiv oder negativ) Konsequenzen: Selbst minimale (positiv oder negativ) verstärkende Wirkungen haben – wenn sie unmittelbar auf verstärkende Wirkungen haben – wenn sie unmittelbar auf ein Verhalten folgen mehr Einfluss auf das Verhalten als ein Verhalten folgen mehr Einfluss auf das Verhalten als massive aversive Folgen, wenn diese mit einer deutlichen massive aversive Folgen, wenn diese mit einer deutlichen zeitlichen Verzögerung auftreten.zeitlichen Verzögerung auftreten.

Operantes Lernen am Bsp. Operantes Lernen am Bsp. Sucht (1)Sucht (1)

Suchtmittel (SM) wirken i.S. einer positiven und/oder Suchtmittel (SM) wirken i.S. einer positiven und/oder negativen Verstärkung.negativen Verstärkung.

Durch negative Verstärkung erhöht sich die Durch negative Verstärkung erhöht sich die Auftretenswahr-scheinlichkeit von Vermeidungsverhalten.Auftretenswahr-scheinlichkeit von Vermeidungsverhalten.

Vermeidung verhindert die Löschung der problemat. S-R-Vermeidung verhindert die Löschung der problemat. S-R-Verknüpfung. Verknüpfung.

Wegen der fehlenden Übung kommt es zu einem Defizit an Wegen der fehlenden Übung kommt es zu einem Defizit an alternativen Verstärkern und Bewältigungsmöglichkeiten.alternativen Verstärkern und Bewältigungsmöglichkeiten.

Generalisierungseffekte und der Mangel an alternativen Generalisierungseffekte und der Mangel an alternativen Verstärkern führen zu einer Inflation der Konsum-Anlässe. Verstärkern führen zu einer Inflation der Konsum-Anlässe.

Operantes Lernen am Bsp. Operantes Lernen am Bsp. Sucht (2)Sucht (2)

Im Verlauf der Problementwicklung hat das SM Im Verlauf der Problementwicklung hat das SM zunehmend mehr die Funktion der negativen zunehmend mehr die Funktion der negativen Verstärkung. Der SM-Konsum ist zwingend notwendig, Verstärkung. Der SM-Konsum ist zwingend notwendig, um Unangenehmes zu vermeiden. um Unangenehmes zu vermeiden.

SM-Konsum als Problemlöseversuch und SM-Konsum als Problemlöseversuch und Verstärkerquelle ist selbst zum Problem geworden mit Verstärkerquelle ist selbst zum Problem geworden mit einer Fülle negativer Konsequenzen.einer Fülle negativer Konsequenzen.

Versuche den Konsum zu reduzieren sind sehr Versuche den Konsum zu reduzieren sind sehr schwierig, weil der gelegentliche Konsum zum Faktum schwierig, weil der gelegentliche Konsum zum Faktum einer intermittierenden Verstärkung (= hohe einer intermittierenden Verstärkung (= hohe Löschungsresistenz) führt und kurzfristige Belohnungen Löschungsresistenz) führt und kurzfristige Belohnungen eine sehr viel verhaltenssteuernde Wirkung haben als eine sehr viel verhaltenssteuernde Wirkung haben als langfristig negative Konsequenzen.langfristig negative Konsequenzen.

Kognition und Kognition und operante operante

KonditionierungKonditionierungBeim operanten Konditionieren Beim operanten Konditionieren spielen auch kognitive Prozesse spielen auch kognitive Prozesse eine Rolle!eine Rolle!

Beispiel „Latentes Lernen“Beispiel „Latentes Lernen“ Ratten tendieren dazu, ohne offensichtliche Belohnung Ratten tendieren dazu, ohne offensichtliche Belohnung

ein Labyrinth zu erkunden. Sie scheinen eine ein Labyrinth zu erkunden. Sie scheinen eine kognitive Landkartekognitive Landkarte zu entwickeln. Wenn ein zu entwickeln. Wenn ein Versuchsleiter dann eine Belohnung in den Ausgang Versuchsleiter dann eine Belohnung in den Ausgang des Labyrinths legt, verhalten sich die Ratten ebenso des Labyrinths legt, verhalten sich die Ratten ebenso wie die Ratten, die mit Futter für den Labyrinthgang wie die Ratten, die mit Futter für den Labyrinthgang belohnt wurden.belohnt wurden.

Bei ihren Erkundungsgängen scheinen die Ratten Bei ihren Erkundungsgängen scheinen die Ratten latentes Lernenlatentes Lernen zu praktizieren: eine Form des zu praktizieren: eine Form des Lernens, die nur dann sichtbar wird, wenn es einen Lernens, die nur dann sichtbar wird, wenn es einen Anreiz gibt, sie zu zeigen. Anreiz gibt, sie zu zeigen.

Daraus folgt, dass Daraus folgt, dass Lernen auch ohne VerstärkungLernen auch ohne Verstärkung oder Bestrafung stattfinden kann. oder Bestrafung stattfinden kann.

Korrumpierung des Korrumpierung des intrinsischen Interesses durch intrinsischen Interesses durch

extrinsische Belohungextrinsische Belohung Die kognitive Perspektive hat auch zu einer Die kognitive Perspektive hat auch zu einer

wichtigen Ein-schränkung hinsichtlich des wichtigen Ein-schränkung hinsichtlich des Einflusses von Belohnungen geführt: Unnötige Einflusses von Belohnungen geführt: Unnötige Belohnungen wirken sich manchmal auch negativ Belohnungen wirken sich manchmal auch negativ aus. aus.

In Versuchen zeigte sich, dass Kinder, denen Geld In Versuchen zeigte sich, dass Kinder, denen Geld versprochen wurde, wenn sie mit einem versprochen wurde, wenn sie mit einem interessanten Spielzeug spielten, später seltener interessanten Spielzeug spielten, später seltener mit diesem Spielzeug spielten als Kinder, die nicht mit diesem Spielzeug spielten als Kinder, die nicht fürs Spielen bezahlt wurden (Deci et al. 1999). fürs Spielen bezahlt wurden (Deci et al. 1999).

Operantes Lernen – Operantes Lernen – Zusammenfassung (1)Zusammenfassung (1)

Operantes Lernen:Operantes Lernen: Lernen aufgrund der Lernen aufgrund der Konsequenzen eines Verhaltens.Konsequenzen eines Verhaltens.

4 grundlegende Konsequenzen:4 grundlegende Konsequenzen: Positive Verstärkung: Hinzufügen eines angenehmen Reizes Positive Verstärkung: Hinzufügen eines angenehmen Reizes Negative Verstärkung: Entfernen eines aversiven Reizes Negative Verstärkung: Entfernen eines aversiven Reizes Bestrafung 1. Art: Hinzufügen eines aversiven Reizes Bestrafung 1. Art: Hinzufügen eines aversiven Reizes Bestrafung 2. Art: Entfernen eines VerstärkersBestrafung 2. Art: Entfernen eines Verstärkers

Klassifikation von Verstärkern und Strafreizen:Klassifikation von Verstärkern und Strafreizen: primäre, sekundäre (konditionierte), generalisierte; primäre, sekundäre (konditionierte), generalisierte; materielle, soziale und aktivitätsbezogenematerielle, soziale und aktivitätsbezogene

Verstärkerpläne: Verstärkerpläne: kontinuierliche vs. kontinuierliche vs. intermittierendeintermittierende (fixierte vs. variable Quoten- vs. (fixierte vs. variable Quoten- vs. Intervall-) Pläne haben einen großen Einfluss auf Intervall-) Pläne haben einen großen Einfluss auf den Erwerb und die Stabilität eines Verhaltens.den Erwerb und die Stabilität eines Verhaltens.

Operantes Lernen – Operantes Lernen – Zusammenfassung (2)Zusammenfassung (2)

Das Wissen zum operanten Lernen kann praktisch Das Wissen zum operanten Lernen kann praktisch genutzt werden: genutzt werden: zur zur ErklärungErklärung menschlichen Verhaltens (z.B. operante Analyse menschlichen Verhaltens (z.B. operante Analyse

zwischenmen-schlicher Interaktionen; Entwicklung zwischenmen-schlicher Interaktionen; Entwicklung problematischer Gewohnheiten).problematischer Gewohnheiten).

für eine systematische für eine systematische VeränderungVeränderung von Verhalten: zum Aufbau von Verhalten: zum Aufbau (bzw. zur Festigung) erwünschten Verhaltens und/oder zum (bzw. zur Festigung) erwünschten Verhaltens und/oder zum Abbau problematischen Verhaltens.Abbau problematischen Verhaltens.

Einschränkend muss bedacht werden, dass im Zuge des Einschränkend muss bedacht werden, dass im Zuge des operanten Lernens auch operanten Lernens auch Kognitionen Kognitionen eine Rolle spielen eine Rolle spielen (latentes Lernen) und sich (latentes Lernen) und sich unnötige Belohnungenunnötige Belohnungen manchmal auch negativ auswirken können manchmal auch negativ auswirken können (Korrumpierung des intrinsischen Interesses durch (Korrumpierung des intrinsischen Interesses durch extrinschische Belohnung).extrinschische Belohnung).