Reaktionen lernen: Operante Konditionierung Übersicht 1.Wurzeln des deskriptiven Behaviorismus...

Preview:

Citation preview

Reaktionen lernen:Operante Konditionierung

Übersicht

1. Wurzeln des deskriptiven Behaviorismus

2. Funktionale Analyse des Verhaltens

3. Lernprinzipien– Verstärkungsformen– Verstärkungspläne– Verhaltensformung– Stimuluskontrolle– Verwendung aversiver Reize

Wurzeln des deskriptiven Behaviorismus

• Radikaler Behaviorismus

• Effektgesetz

• Neobehaviorismus

Radikaler Behaviorismus

Reaktion der amerikanischen Psychologie auf den Introspektionismus in der deutsch-sprachigen (überwiegend Denk-) Psychologie der Würzburger Schule

Introspektion

Verfahren, bei dem die Person selbst Auskunft gibt über Empfindungen, Vorstellungen, Gedanken (Zugang zu „höheren seelischen Vorgängen“, Wilhelm Wundt, Oswald Külpe)

Kritik: objektive Erfassung der Untersuchungs-gegenstände durch Introspektion nicht möglich, da Ausmaß der subjektiven Verfälschung nicht feststellbar

J.B. Watson (1914)

„Die Zeit scheint gekommen zu sein, in der die Psychologie jede Bezugnahme auf das Bewusstsein aufgeben muss und in der sie sich nicht länger einem trügerischen Denken hingeben darf, das seelische Vorgänge zum Objekt ihrer Beobachtung macht ... Es ist möglich, eine Psychologie zu schreiben und niemals die Begriffe Bewusstsein, seelischer Zustand, Geist, Inhalt, Wille, Phantasie und dgl. zu gebrauchen“.

Kennzeichen des radikalen Behaviorismus

• Analyse des Verhaltens (behavior) im Zentrum

• Lernen als Veränderung des Verhaltens anstelle von Sinneswahrnehmung und Denken (1920-50: Psychologie = Lernforschung)

• Reflex als Grundlage der Verhaltens-forschung

... weitere Kennzeichen des radikalen Behaviorismus

• innere Vorgänge sind durch physiologische Vorgänge repräsentiert (Gedächtnisbilder = kinästhetische Reizungen, Denken als innerer sensumotorischer Vorgang)

• Bewusstsein entzieht sich wissenschaftlicher Analyse

• Experimentelle Methode

Voreingenommenheit für das Beobachtbare

Effektgesetz

Grundprinzip des operanten Konditionierens:

Lernen erfolgt durch Effekte, die der Organismus in der Umwelt hervorruft

Verhalten ist operant, d.h von den Auswirkungen abhängig, die es in der Umwelt hervorruft

Lernergebnis

Einschränkung des Verhaltensrepertoires auf eine einzige Reaktion...

(... als Ergebnis des positiven Effekts der Reaktion in der Umwelt für den Organismus)

Effektgesetz von Thorndike (1911)

Von mehreren Reaktionen auf die gleiche Situation hin werden diejenigen, die bei dem Tier von Befriedigung

begleitet oder dicht gefolgt sind, bei Gleichheit aller Bedingungen stärker mit der Situation verbunden, so dass,

wenn die Situation wieder eintritt, sie wahrscheinlicher werden; diejenigen, welche bei dem Tier von Unbehagen begleitet oder dicht gefolgt sind, werden - bei Gleichheit

aller anderen Bedingungen - ihre Verbindung mit der Situation schwächen, so dass, wenn die Situation wieder eintritt, sie mit geringerer Wahrscheinlichkeit eintreten. Je

größer die Befriedigung oder das Unbehagen, desto größer ist die Stärkung oder die Schwächung der

Verbindung.

Bedingungen für Lernen

• bestimmter (motivationaler) Zustand des Organismus (z.B. Hunger)

• Aktivität des Organismus• der Aktivität folgende Konsequenz

(Befriedigung, Unbehagen)

Neobehaviorismus

Clark L. Hull (1884-1952)

K.W. Spence (1907-1967)

Weiterentwicklung des Behaviorismus von einem empiristischen zu einem nomothetischen Ansatz.

Systematische Verhaltenstheorie

Hypothetische Konstrukte

Notwendigkeit der Einführung hypothe-tischer Konstrukte (Trieb, Gewohnheit etc.) und intervenierender Prozesse (z.B. motivationale Prozesse), da sich viele Phänomene nicht allein durch Rückführung auf Reflexe erklären ließen.

Motivation

Auswirkungen von Belohnung

(1) Verstärkt die Reaktion

(2) Aktiviert den Organismus und richtet das Verhalten in spezifischer Weise aus

Auf welche Weise führen belohnende Reize zu Motivation?

• Reize am Ziel werden zum CS für Nahrung

• Reize am Start lösen bereits Bruchteile der Zielreaktion aus (antizipatorische Ziel-reaktionen = rg), da sie mit Belohnung (S) verknüpft werden

• rg lösen propriozeptive Reize (sg) aus• Zusammenwirken von sg + S am Start löst

Laufen (R) aus

Funktionale Analyse des Verhaltens von B.F. Skinner

• Reduktion auf objektiv beobachtbare Variablen• Beschreibung des Verhaltens (Induktion statt

Deduktion)• Einbeziehen der Vorgeschichte des Verhaltens• Feststellen systematischer Zusammenhänge

(Verzicht auf kausale Erklärungen)• Statt intervenierender Variablen oder hypothetischer

Konstrukte „black box“

Respondentes und operantes Verhalten

Respondentes Verhalten

(antwortendes, Reflexverhalten)

Konditionierung vom TYP S

S ----------R

Operantes Verhalten

(spontanes, emittiertes Verhalten)

Konditionierung vom TYP R

R -----------S

Verhaltenskontingenz

Operante Analyse sozialen Verhaltens

3. Lernprinzipien

–Verstärkungsformen

–Verstärkungspläne

–Verhaltensformung

–Stimuluskontrolle

–Verwendung aversiver Reize

Verstärkungsformen

Aufbau und Abbau von Verhalten

Verstärkungspläne

• Kontinuierlich – intermittierend

• Quotenverstärkung: reaktionsabhängig

• Intervallverstärkung: zeitabhängig

• variabel – fest (fixiert)

Kontinuierliche Verstärkung

Aneignungsphase von Verhalten

schneller Verhaltenserwerb, aber schneller Abbau bei Ausbleiben der Verstärkung; d.h. geringe Löschungsresistenz

Intermitttierende Verstärkung

Längerfristige Aufrechterhaltung des Verhaltens

langsamer Abbau bei Ausbleiben der Verstärkung; d.h. hohe Löschungsresistenz

Verstärkerpläne

Fest Variabel

Reaktion Fixierter

Quotenplan (FR)

Vertreter

Variabler

Quotenplan (VR)

Glücksspiel

Zeit Fixierter

Intervallplan (FI)

Monatliche

Bezahlung

Variabler

Intervallplan (VI)

Klausuren in

unregelmäßigen

Abständen

Verhaltensformung (shaping)

Erklärung des Auftretens „neuer“ Ver-haltensweisen, d.h. solcher die noch nicht im Verhaltensrepertoire sind

stufenweise Annäherung des Verhaltens durch gezielte Verstärkung einzelner Verhaltenselemente, die dem Zielverhalten näherkommen Diskriminationslernen

Stimuluskontrolle

• Assoziative Verknüpfung von diskriminativen Reizen mit verstärkenden Reizen

• diskriminativer Reiz: Reiz, bei dessen Auftreten eine hohe Aussicht auf Verstärkung besteht

• Organismus lernt Reize der Umgebung zu unterscheiden

Instrumentelles Verhalten wird damit situationsabhängig

Aversive Reize

• Bestrafung ist lerntheoretisch gesehen jeglicher Prozess, der zum Abbau von Verhaltenswahr-scheinlichkeit führt; dies kann auch durch den Einsatz von aversiven Reizen erfolgen.

• Darbietung aversiver Reize führt nicht nur zur Unterdrückung von Verhalten (Bestrafung); mit Hilfe aversiver Reize lässt sich auch Verhalten aufbauen (Vermeidungsverhalten)

Bedingungen für den effektiven Einsatz aversiver Reize (Azrin & Holz, 1966)

• Der aversive Reiz muss so verabreicht werden, dass kein Ausweichen möglich ist.

• Der aversive Reiz sollte so intensiv wie möglich sein.

• Die Häufigkeit der Verabreichung des aversiven Reizes sollte so hoch wie möglich sein.

• Der aversive Reiz sollte unmittelbar auf die Reaktion folgen.

Bedingungen ... (Fortsetzung)

• Der aversive Reiz sollte von Anfang an mit maximaler Intensität verabreicht und nicht graduell gesteigert werden.

• Ausgedehnte Bestrafungsphasen sollten vermieden werden, da sich insbesondere bei Anwendung milder aversiver Reize das fragliche Verhalten sonst "erholen" könnte. Insbesondere bei Verwendung "milder" aversiver Reize sollte die Dauer der Applikation nur kurz sein.

Bedingungen ... (Fortsetzung)

• Es ist sorgfältig darauf zu achten, dass es keine Vermischung mit verstärkenden Reizen gibt, da die aversiven Reize sonst verstärkende Eigen-schaften erwerben können.

• Der aversive Reiz sollte ein Signal dafür werden, dass eine Löschungsphase für ein bestimmtes Verhalten im Gange ist.

Effektivität des Einsatzes aversiver Reize

Abhängig von:• Härte (Intensität/Dauer)• Auftretenswahrscheinlichkeit (jedesmal,

unmittelbar)• Motivation (sollte gering sein)

Beispiel: durch Wiese mit Brennnesseln gehen – schnelles Autofahren

Strafe (Einsatz aversiver Reize) als Erziehungsmittel?

Grundschullehrer – Schüler: 70% der Interaktionen sind durch Einsatz aversiver Reize gekennzeichnet

Hohe Wirksamkeit wg. Zusammenhang mit Angst Angst hemmt bestraftes Verhalten

Probleme bei Strafe vor allem wegen Zusammenhang mit Angst

Nachteile des Einsatzes aversiver Reize

• Wegen der Assoziation mit Schmerz und Angst fördern intensive und über langen Zeitraum eingesetzte Strafmaßnahmen die Neigung zu Flucht- und Vermeidensreaktionen; d.h. das Individuum versucht, sich der Wirkung der aversiven Reize zu entziehen.

• Aversive Reize können Ärger-Reaktionen nach sich ziehen, Ärger kann zu aggressivem Verhalten führen; aggressives Verhalten wird durch erhöhtes Erregungsniveau begünstigt.

Nachteile ... (Fortsetzung)

• Zusammenhang mit psychosomatischen Folgen (Magengeschwüre, Gewichtsverlust) sind im Tierversuch belegt.

• Selbstwertgefühl wird negativ beeinflusst, langfristige Folgen für das Selbstkonzept.

• Wegen Generalisierung der konditionierten Angstauslöser werden außer den unmittelbaren Reaktionen auch die um Umfeld liegenden Verhaltensweisen gehemmt und eingeschränkt.

Nachteile ... (Fortsetzung)

• Bestrafende Person ist Modell für bestrafte Person.

• Auswirkungen auf die Beziehung zwischen Strafendem und Bestraftem.

• Dem Bestraften wird nicht angegeben, welches Verhalten er zeigen soll; es findet kein Aufbau, sondern nur Abbau von Verhalten statt.

Literaturhinweise

Azrin, N.H. & Holz, W.C. (1966). Punishment. In W.K. Honig (Ed.), Operant behavior: Areas of research and application. New York: Appleton-Crofts

Skinner, B.F. (1938). The behavior of organisms: An experimental analysis. New York: Appleton-Crofts

Watson, J.B. (1913). Psychology as the behaviorist views it. Psychological Review, 20, 158-177

Watson, J.B. (1925). Behaviorism. Dt. (1976): Behaviorismus. Frankfurt. Fachbuchverlag

Schönen Dank für Ihre Aufmerksamkeit

!

Recommended