Entscheidungstheorien Christian Kaernbach. Gliederung Der Einfluß von Kosten und Nutzen auf die...

Preview:

Citation preview

Entscheidungstheorien

Christian Kaernbach

Gliederung

• Der Einfluß von Kosten und Nutzen auf die Entscheidung• Darstellung von Entscheidungsdaten als Tabelle / als Graphik• Die Eigenschaften der ”Receiver Operating Characteristics”• klassisches Modell: Gaußsches Modell mit gleicher Varianz

Asymmetrie der DatenRettungsversuche für das Gaußsche Modell

• Schwellenmodelle• Poissonmodell • Modellvergleich• Anwendung: Sprache in Rauschen bei Leichtgläubigen

Statistische EntscheidungstheorieStatistical Decision Theory, SDT• Beispiel: Entscheidungsverhalten an der

Wahrnehmungsschwelle,Signalentdeckungstheorie, Signal Detection Theory, SDT– sensorische Komponente (Urteilsbasis)– strategische Komponente (Kosten/Nutzen)

– zwei Reizkonstellationen• Rauschen (kein Signal), Signal plus Rauschen

– zwei Antwortmöglichkeiten• Ja (Signal war vorhanden), Nein (kein Signal)

Tabellarische Datendarstellung

Ja Nein

Signal + Rauschen Treffer Auslasser73 27 100

falscher korrekte Rauschen Alarm Zurückweisung

11 89 100

Motivation

Ja Nein

S+R +1 € -1 €

R -1 € +1 €

• Nach Golde drängt, am Golde hängt doch alles (Goethe, Faust)

• Laborexperimente: Manipulation mittels Kosten/Nutzen-Matrix (payoff matrix)

Graphische Datendarstellung

0

0.5

1

0 0.5 1

pT

pFA

FA KZ

T

AWo ist der Datenpunkt,

wenn die Versuchsperson alles richtig macht? alles falsch macht? immer mit „Ja“ antwortet? immer „Nein“ antwortet? per Münzwurf entscheidet? im „Normalfall“?

Trefferwahrscheinlichkeit (pT) als Funktion der Falschalarmwahrscheinlichkeit (pFA).

Wohin wandert der Datenpunkt, wenn Auslasser stärker bestraft werden?

Receiver Operating Characteristics ROC

0

0.5

1

0 0.5 1

pT

pFA

Daten:EmpiriepraktikumUniversität LeipzigWS 96/97

0

0,5

1

0 0,5 1

pT

pFA

FA KZ

T

A

Drehsymmetrie des ROC(anti-kooperatives Verhalten)

0

0,5

1

0 0,5 1

pT

pFA

FA KZ

T

A

KZ

A

FA

T

Drehsymmetrie des ROC(anti-kooperatives Verhalten)

Der ROC ist konvexAROC BROC ABROC

0

0.5

1

0 0.5 1

pT

pFA

Geraden gleichen Payoffs

• Payoff-Matrix

Ja NeinS+R +10 –40 R –5 +10

• mittlerer Payoff:Pay = 0,5 · (10 · pT – 40 · (1–pT)) +

0,5 · (–5 · pFA + 10 · (1–pFA))

0

0,5

1

0 0,5 1

pT

pFA

Geraden gleichen Payoffs

• Payoff-Matrix

Ja NeinS+R +10 –40 R –5 +10

• mittlerer Payoff:Pay = 0,5 · (10 · pT – 40 · (1–pT)) +

0,5 · (–5 · pFA + 10 · (1–pFA))

0

0,5

1

0 0,5 1

pT

pFA

0+5

5

10

15

20

+10

Geraden gleichen Payoffs

• Payoff-Matrix

Ja NeinS+R mT mA

R mFA mKZ

• mittlerer Payoff:Pay = 0,5 · (mT · pT + mA · (1–pT)) +

0,5 · (mFA · pFA+ mKZ · (1–pFA))

0

0,5

1

0 0,5 1

pT

pFA

0+5

5

10

15

20

+10

• verhaltensbestimmend:die Steigung(mKZ – mFA) / (mT – mA)

Ein Würfelspiel

• Signal: Münzwurf (Kopf: 2, Zahl 0)

• Rauschen: Summe zweier Würfel (2...12)

• Aufgabe: Erraten, ob Kopf gefallen ist, gegeben ein bestimmtes Gesamtergebnis

0

0,1

0,2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Gesamtergebnis

Wah

rsch

einl

ichk

eit R

S+R

ROC aus Wahrscheinlichkeitsdichten auf der „Entscheidungsachse“(decision axis, internal response, ...)

0

0,5

1

0 0,5 1

pT

pFA

-3 -2 -1 0 1 2 3 4 5

R

S+R

k „ja“„nein“

Je weiter rechts die innere Antwort auf der Entscheidungsachse, desto wahrscheinlicher ist das Signal.

Die Versuchsperson sagt „Ja“, wenn der Wert auf der Entscheidungsachse ein bestimmtes Kriterium k überschreitet.

Rückt k ein infinitisemales Stück nach rechts, dann werden sowohl pFA als auch pT

kleiner.

Das Verhältnis pT / pFA ist dieSteigung des ROC

und läßt sich berechnen als Bruch derWahrscheinlichkeitsdichten S+R / R.

S+RR

Welche Verteilung?

-3 -2 -1 0 1 2 3 4 5

N(0,1)

0

0,5

1

-3 -2 -1 0 1 2 3 4 5

0,16

Normalverteilung

kumulative Normalverteilung,KNV

Gaußsches Modell mit gleicher Varianz

0

0,5

1

0 0,5 1

pT

pFA

-3 -2 -1 0 1 2 3 4 5

R

S+R

S*+R

k

d'

„ja“„nein“

S+R = N(0,1)S+R = N(d‘,1)

2 Parameter:Sensitivität d‘ (Kurve)Kriterium k (Punkt)

k‘ = KNV1(FA)d‘ = KNV1(T) KNV-1(FA)

Gaußsches Modell: Symmetrie

0

0,5

1

0 0,5 1

pT

pFA

-3 -2 -1 0 1 2 3 4 5

R

S+R

S*+R

k

d'

„ja“„nein“

S+R = N(0,1)S+R = N(d‘,1)

2 Parameter:Sensitivität d‘ (Kurve)Kriterium k (Punkt)

k‘ = KNV1(FA)d‘ = KNV1(T) KNV-1(FA)

Asymmetrie realer Daten

0

0.5

1

0 0.5 1

original

gespiegelt

ROC nach Gauß (gl. Varianz) zu symmetrisch

0

0,5

1

0 0,5 1

pT

pFA

0

0.5

1

0 0.5 1

pT

pFA

-3 -2 -1 0 1 2 3 4 5

R

S+R

k

d'

s

Gaußsches Modell mit ungleicher Varianz

S+R = N(0,1)S+R = N(d‘,s)

3 Parameter:Sensitivität d‘ (Kurve)Streuung S+R s (Kurve)Kriterium k (Punkt)

ROC nicht konvex

00.20.40.60.81

D D

R

S+R

0

0.5

1

0 0.5 1

pT

pFA

Hochschwellenmodell (Blackwell, 1953)

S+R = {1, 0}S+R = {1, }

2 Parameter:p(D|S+R) = (Kurve)Kriterium (Punkt)

unrealistisch: Falschalarmrate = 0

00.20.40.60.81

D D

R

S+R

S'+R

0

0.5

1

0 0.5 1

pT

pFA

Niedrigschwellenmodell (Luce, 1963)

S+R = {1, }S+R = {1, }

3 Parameter:p(D|R) = (Schar)p(D|S+R) = (Kurve)Kriterium (Punkt)

perfekte Leistung unmöglich

00,20,40,60,81

D D D*

RS+R

S'+R

0

0.5

1

0 0.5 1

pT

pFA

Hoch/Niedrigschwellenmodell (Krantz, 1969)

S+R = {1, , 0}S+R = {1, , }

4 Parameter:p(D|R) = (Schar)p(D|S+R) = (Kurve)p(D*|S+R) = (Kurve)Kriterium (Punkt)

zuviele Parameter

Kontinuierliche und diskrete Modelle• Kann man ROCs aus kontinuierlichen

Verteilungen (z.B. Gauß) von ROCs aus Modellen mit wenigen diskreten Zuständen (Schwellenmodelle: Blackwell, Luce, Krantz) an der „Eckigkeit“ unterscheiden?

• ROCs aus Rating-Daten sind „rund“:– VP gibt Sicherheit für „Ja“ auf kontinuierlicher Skala an (Bleistiftstrich)

– VL setzt post-hoc verschiedene Schwellen für „Ja“

• Krantz argumentiert gegen „runde Rating-ROCs“– gegeben zwei Zustände, D und D.

– verschmiertes Antwortverhalten aus Skala, Gaußverteilungen für D und D.

– > runder ROC

0

0,5

1

0 0,5 1

pT

pFA

„Nein“ „Ja“

0

0.2

0.4

0.6

0.8

0 1 2 3 4 5 6 7 8

RS+R

S'+R

0

0.5

1

0 0.5 1

pT

pFA

Das Poissonmodell (Egan, 1975)

3 Parameter:µ(R) (Schar)µ(S+R) (Kurve)Kriterium (Punkt)

va bene

Übergänge

• Poisson µ(R) = 0 Hochschwellenmodell

• Poisson µ(R) < .2 Hoch/Niedrigschwellenmodell

• Poisson µ(R) Gaußsches Modell mit gleicher Varianz

Modellvergleich

Sparsamkeit Kompatibilität

Parameter

Schar Kurve Punkt Probleme

Gauß• mit gleicher Varianz 0 1 1 nur symmetrische Daten• mit ungleicher Varianz 0 2 1 ROC nicht konvex• Hochschwellen 0 1 1 FA-Rate = 0• Niedrigschwellen 1 1 1 erreicht nicht „perfekt“• Hoch/Niedrigschw. 1 2 1 zu viele Parameter• Poisson 1 1 1

Sprache in Rauschen beiLeichtgläubigen

• Diplomarbeiten von Gerit Haas und Ulrike Jury, Universität Graz, 2007

• 245 Versuchspersonen füllen Online-Fragebogen aus– Persönlichkeitsmerkmal “Magical Ideation” (MI) erheben mit 30 Items wie

• Ich vollführe ab und zu kleine Rituale, um ungünstige Ereignisse abzuwenden.

• Es gibt Leute, bei denen ich spüre, wenn sie an mich denken.

• Wenn bestimmte Leute mich ansehen oder mich berühren, habe ich manchmal das Gefühl, Energie zu gewinnen oder zu verlieren.

• Ich glaube, ich könnte lernen, die Gedanken Anderer zu lesen, wenn ich nur wollte.

• Die Regierungen halten Informationen über UFOs zurück.

• ...

– Extremgruppenvergleich• 8 Personen mit niedrigem MI-Wert (1,25 1,3)

• 9 Personen mit hohem MI-Wert (22 2,4)

Sprache in Rauschen beiLeichtgläubigen

• Semantisches Priming

• Regelentdeckung in einem Computerspiel

• Erkennen von Objekten in visuellen Rauschbildern

• Erkennen von Wörtern in Rauschen– behaviorale Untersuchung:

• 100 Durchgänge, davon – 60 mal nur Rauschen– 20 mal Rauschen plus sehr leises Wort– 20 mal Rauschen plus leises Wort

• Aufgabe: War da ein Wort?Vierstufiges Rating

– sicher ja– eher ja– eher nein– sicher nein

– bildgebendes Verfahren (NIRS) zu Wörtern in Rauschen

Sprache in Rauschen beiLeichtgläubigen

• Erkennen von Wörtern in Rauschen– Asymmetrie: Hinweis auf Poissonverteilung

– MI-hoch und MI-niedrig produzieren gleiche ROC-Kurve

– Position der Punkte auf ROC-Kurve unterscheidet sich deutlich

– basale Wahrnehmungsprozesse sind identisch (liefern gleiche Information)

– Kriterien beim Auswerten dieser Information sind unterschiedlich

Hausaufgaben

• Es werden 200 Versuche gemacht, davon 100 mit S+R, 100 mit R.Die VP macht 16 falsche Alarme und 50 Treffer.

• Wie groß ist k?

• Wie groß ist d‘?

• Wie viele Treffer und falsche Alarme würde die VP an dem Punkt machen, der an der Gegendiagonale gespiegelt ist?

• Wie groß ist d‘ für diesen Punkt?

• Wie groß muß k sein, damit die VP diesen Punkt erzeugt?

• Und weil‘s so schön war: Eine andere VP macht bei der gleichen Lautstärke 16 falsche Alarme und 84 Treffer. Gleiche Fragen wie oben...

Recommended