Wahrn TEIL 1.ppt1 WAHRNEHMUNG Wie werden Objekte, Lebewesen etc. erkannt ? Frage der Identität...

Preview:

Citation preview

Wahrn TEIL 1.ppt 1

WAHRNEHMUNG

Wie werden Objekte, Lebewesen etc. erkannt ?

Frage der Identität (wahrgenommene Welt-wirkliche Welt)

objektive Welt in uns repräsentiert subjektive Repräsentation

subjektive Repräsentation = objektive Wirklichkeit ???

Dagegen, z.B.: Wahrnehmungstäuschungen , z.B. Müller-LyerDreieckstäuschungWasserfalltäuschungBewegung im FilmBlinder Fleck

2

Müller-Lyer (1889)

3

4

Poggendorf (1860)

5

Blinder Fleck - z.B. from: Glynn: An anatomy of thought (1999)

6

Trotz der Wahrnehmungstäuschungen:

Übereinstimmung zwischen Realität und subjektiver Repräsentation muss hoch sein, sonst wäre Überleben ernstlich gefährdet_____________________________________________________

7

spezielle Literatur zur Wahrnehmung:

Bruce,V., Green, P.R & Georgeson, M.A. .: Visual Perception. 4th ed. Hove and London: Erlbaum, 2003

Schiffman,H.R.: Sensation and Perception: An integrated approach. 5th ed. New York: Wiley, 2000

LINKS:

http://www.yorku.ca/eye/http://Krantzj.hanover.edu/krantz/art/http://psychlab1.hanover.edu/classes/Sensation/

8

VORSCHAU (Aus Zeitgründen Beschränkung auf visuelle Wahrnehmung)

Entdeckung von Einfachen Signalen1 (klassische) Psychophysik2 Signalentdeckungstheorie ( Spada, 2006, Kap.2.3.1)

Tiefenwahrnehmung

1 Monokulare Hinweisreize2 binokulare Hinweisreize3 Hinweisreize aus der Eigenbewegung4 Kombination von Hinweisreizen

Erkennen von Objekten

Eysenck & Keane

Kap 2 & 3

9

Erkennen von Objekten

1 Gestaltpsychologie

2 Mustererkennen ( Pattern Recognition )2.1 Schablonentheorien - Template theories2.2 Merkmalsanalyse - Feature Theories2.3 Strukturbeschreibung - Structural Description

3 Computationale Theorie der Visuellen Wahrnehmung3.1 Grundsätzliche Überlegungen zum Wahrnehmungsprozess3.2 Basisprozesse

3.3 Objekterkennung

10

Ziel

Aneignung von Grundwissen zur Wahrnehmung

Die wichtigsten theoretischen Ansätze und ihren empirischen Status kennen

Erkennen der Komplexität bereits der einfachen

Reizwahrnehmung

11

ENTDECKUNG VON EINFACHEN SIGNALEN

1 (KLASSISCHE) PSYCHOPHYSIK

Fechner (1860) Elemente der Psychophysik

physikalischer Reiz (Stimulus)

Sinnessystem

Transformierung der Stimulusenergie in

neurale Ereignisse

Entdeckung des Signales

subj. Intensität des wahrgenommenen Stimulus

12

Grundproblem :

Verhältnis:

physikalische Stimulusintensität - subjektive Empfindung

z.B.wahrgenommenes Gewichtwahrgenommene Länge von Streckenwahrgenommene Süssewahrgenommene Lautstärkesubjektiver Geldwert

13

FECHNER:

• Wie stark muss ein Reiz sein (über obj. Nullpunkt) , damit er überhaupt wahrgenommen wird?

Absolutschwelle – “eben merkliche Empfindung”

• Wie gross muss der Mindestunterschied zwischen zwei Reizen sein, damit sie als verschieden wahrgenommen werden?

Unterschiedsschwelle - "eben merklicher Unterschied" jnd - just noticeable difference

Bestimmung der Schwellenwerte: 3 Methoden

Herstellungsmethode (Reize gleich machen) Grenzmethode (auf-absteigende Serien, ab wann) Konstanzmethode (zufällige Abfolge, ja/nein)

14

Hypothese über Verhältnis: physikalische Stimulusintensität - subjektive Empfindung

historisch: Fechnersches-Gesetz (Weber-Fechnersches-Gesetz)

Aktuell: POWER LAW Stevens (1961) (Potenzgesetz)

S = k Ib

S ... subj Empfindungsstärke/ subj.Grösse I ... physik. Stimulusintensität /obj. Grösse k ... Konstante b ... Exponent, konstant für: Sinnesdimension

Person

Exponent b: >, <, oder = 1

15

Beispiel: obj. Geldbetrag - subj.Wert

W = aGb mit a=1 und b=0.5: W = G.5 ( x0.5 = x )

G (obj.Betrag) W (subj.Wert)

0 0.00

1 1.00

5 2.24

10 3.16

100 10.00

259...

16.09...

16

0

1

2

3

4

5

6

7

8

obj. Geldbetrag

subj. Wert

W = G0.5

10 20 30 40

Berechnung von b aus bekannten objektiven und subjektiven Werten

17

Exponent b > 1, b < 1, b = 1

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100 (willkürliche Einheiten)

b > 1

b < 1

b = 1

18

Table 2.5 aus: Schiffman (1982):

Representative exponents of the power functions relating psychological magnitude to stimulus magnitude

MeasuredContinuum Exponent Stimulus Condition

Loudness 0.6 BinauralLoudness 0.54 MonauralBrightness 0.33 5º1 target, dark-adapted eyeBrightness 0.5 Very brief flashSmell 0.55 CoffeeSmell 0.6 HeptaneTaste 1.3 Sucrose, human subjectsTaste 1.3 SaltTemperature 1.0 Cold on armTemperature 1.6 Warmth on arm

19

Fortsetzung

MeasuredContinuum Exponent Stimulus Condition

Vibration 0.95 60 Hz on finger

Vibration 0.6 250 Hz on finger

Duration 1.1 White noise stimuli

Finger span 1.3 Thickness of blocks

Pressure on palm 1.1 Static force on ski

Heaviness 1.45 Lifted weights

Force of handgrip 1.7 Hand dynamometer

Electric shock 3.5 Current through fingers

Tactual roughness 1.5 Rubbing emery cloths

Tactual hardness 0.8 Squeezing rubber

Visual length 1.0 Projected line

Visual area 0.7 Projected square

20

Vorteil der Exponentialfunktion des Power-Laws:

Verhältnis zweier Signale,

z.B. Verhältnis gedruckter Buchstabe - Papier,

bleibt unverändert bei unterschiedlichen

Beleuchtungsbedingungen!

Beweis siehe Ylmaz (1967)

21

2 SIGNALENTDECKUNGSTHEORIE

Swets & Tanner (1961)

Überblick: Spada Schiffman

Entdeckung eines schwachen Signals (geringe Intensität)

Signal vermischt mit Störsignalen (Rauschen)

22

Reaktion des Beobachters nicht nur von Reizintensität abhängig

d.h. es gibt keine konstante Schwelle i.S der Psychophysik

notwendige UNTERSCHEIDUNG:

Beobachter Beobachter als Sensor als Entscheider Wahrnehmungsschwelle - Reaktionsschwelle

klassische Psychophysik untersucht nur Reaktionsschwelle

23

Reaktion des Beobachters abhängig von

1 objektive Signalstärke: objektives Verhältnis Signal-Rauschen

2 Beobachter:

(1) Sensitivität (Beobachter als Sensor)

(2) Erwartung des Beobachter z.B.: heute viele Vögel auf Radarschirm, weil Flugzeit

weint mein Kind häufig? ist der Brandalarm so eingestellt,

dass er sehr leicht anspricht

(3) Bewertung der Konsequenzen Ist das Signal wichtig für mich ist es schlimm, wenn ich es

übersehe

24

KONSEQUENZENMATRIX:

REAKTION DES BEOBACHTERS

JA("Signalvorhanden")

NEIN("Signal NICHTvorhanden")

STIMULUS

SIGNAL(Signal +Rauschen)

TREFFER(HIT)

VERPASSER(MISS)

KEIN SIGNAL(nurRauschen)

FALSCHERALARM

KORREKTEVERNEINUNG

25

im Labor: subj Wert der Konsequenzen und Erwartung

leicht variierbar

Beispiel: Variationen des subj Wertes der Konsequenzen (z.B. durch Geld Belohnung oder Strafe)

Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. _____________________________________

Signal +5 -5 _____________________________________

kein Signal -5 +5 _____________________________________

26

Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________

Signal +25 -8 ____________________________________

kein Signal -5 +7 ____________________________________

Konsequenzen begünstigen JA-Reaktion

27

Reaktion des Beob Ja Nein Signal vorh. Signal nicht vorh. ____________________________________ Signal +5 -5 ____________________________________ kein Signal -50 +5 ____________________________________

Konsequenzen begünstigen NEIN-Reaktion

28

Generell: Ergebnisse der Signalentdeckungstheorie gut bestätigt:

Wahrsch für Signaldetektion (d.h. Reaktion "ja") steigt mit

SensitivitätErwartung: subj Wahrsch für AuftretenKonsequenzen: in Abhängigkeit davon, welche

Konsequenz belohnt/bestraft wird

Anwendung signalentdeckunstheoretischer Ideen

z.B.: GedächtnispsychologieDiagnostikRechtssprechung

29

Wichtige Konsequenz der Resultate der Signalentdeckungstheorie

Bereits bei elementaren Signalentdeckungsaufgaben:kognitive und motivationale Komponenten

Problem:Elementare Signalentdeckungsaufgaben behandeln nur Detail des Wahrnehmungsprozesses.

Ihre Untersuchung trägt kaum etwas bei zur Klärung der Frage:Wie werden Objekte, Lebewesen etc. erkannt ?

30

TIEFENWAHRNEHMUNG

Netzhautbild allein kann über Form, Lage, Grösse und Entfernung von Gegenständen keine eindeutige Antwort geben.

Relevant für Objekterkennung - von mehreren Faktoren determiniert

31

Daher: andere Grundlagen der Raumwahrnehmung notwendig.

3 Typen von Hinweisreizen (cues) für die Wahrnehmung von Tiefe

Monokulare Hinweisreize

Binokulare Hinweisreize

Hinweisreize aus der Eigenbewegung

Kombination von Hinweisreizen

32

1 MONOKULARE HINWEISREIZE

z.B.

Überlappung/VerdeckungNahe Objekte verdecken oft

fernere Objekte.

Schattierung Dreidimensionale Formen meist

nicht überall gleich beleuchtet.

33

Lineare PerspektiveFluchtpunkt, systematisches Kleinerwerden nach hinten

Texturinsbes. Gibson (1950)

viele Oberflächen haben Feinstruktur (=Textur),z.B.: Fell, Stoff, Rinde, Baumkrone, Gras

Elemente der Textur

rücken mit wachsender Entfernung näher zu- sammen & werden kleiner

34

35

relative Grösse

36

2 BINOKULARE HINWEISREIZE

optische Achsen der zwei Augen treffen sich im FixationspunktFovea centralis (empfindlichster Bereich in Netzhaut, die meisten Sehzellen, schärfstes Sehen)

Augen werden auf Fixationspunkt so eingestellt, dass Bild auf fovea centralis projiziert wird

Bilder auf Netzhaut verschieden

37

Konvergenzwinkel

verändert sich mit Entfernung zum Fixationspunkt

je näher, desto grösser ("Schielen")

jedoch: Konvergenzwinkel erlaubt nur sehr grobe Bestimmung der Entfernung (nah-fern)

38

Steropsis

Querdisparation (binoculare Parallaxe)

Augenabstand ca. 5 - 7.6 cm (beim Menschen)

daher: Augen liefern leicht verschiedene Bilder

aus dieser Differenz auch Info über Entfernung

39

3 HINWEISREIZE AUS DER EIGENBEWEGUNG

VerschiebungBilder aus verschiedenen Standpunkten liefern räumliche Info(analog zur Querdisparation)

optisches Flussmuster / Fliessmuster (Gibson, 1950, 1982)mit Bewegung des Betrachters entstehen Muster von kontinuierlichen Veränderungen (Flussmuster)daraus auch räumliche Info ableitbar

Fliessmuster abhängig von1 Richtung und Geschwindigkeit der Eigenbewegung2 Lage des Fixationspunktes3 räumliche Verteilung der Oberflächen relativ zur

Blicklinie

40

Eigenbewegung

41

Eigenbewegung

42

Eigenbewegung

43

Eigenbewegung

44

Eigenbewegung

45

KOMBINATION von HINWEISREIZEN

Additive Verknüpfung oder Selektion?

Experimente von Bruno & Cutting (1988) legen nahe, dass meist additiv verknüpft wird ( hilft, Fehler zu minimieren)

Wahrn TEIL 2.ppt 46

1 Gestaltpsychologie

2 Mustererkennen ( Pattern Recognition )

3 Computationale Theorie der Visuellen Wahrnehmung

GESTALTPSYCHOLOGIEca. 1890-1920 Max Wertheimer, Wolfang Köhler, Kurt Koffka

Zwei Phänomene der Wahrnehmung müssen erklärt werden:

Formkonstanz

Grössenkonstanz

ERKENNEN VON OBJEKTEN

47

FormkonstanzWahrgenommene Form eines Objektes ändert sich nicht, auch wenn sich Netzhautbild ändert (z.B. bei Änderung des Blickwinkels)

Grössenkonstanz Wahrgenommene Grösse eines Objektes ändert sich nicht, auch wenn sich die Grösse des Netzhautbildes ändert (z.B. bei zunehmender Entfernung)

Annahme der Gestaltpsychologie:

Elementare Reize im Wahrnehmungsfeld werden durch

Organisationsgesetze (= Gestaltgesetze)

strukturiert.

48

Einige wichtige Regeln:

Figur und GrundIm Wahrnehmungsfeld heben sich bestimmte Teile von anderen ab.Teil, der sich mit scharfen Umgrenzungen und bestimmter Form abhebt, ist Figur, der Rest ist Grund.

49

BinnengliederungÜbereinandergelegte Figuren werden in der Regel in möglichst einfache Figuren zerlegt

50

Prägnanzprinzip (Prinzip der guten Gestalt)

Wichtiges Gliederungsprinzip der GestalttheorieWenn mehrere alternative Strukturierungen möglich: es setzt sich diejenige durch, welche die einfachste, einheitlichste, "beste" Gestalt ergibt.

51

z.B. Prinzip der Nähe:

Reize, die einander nahe sind, werden als zusammengehörig betrachtet

. . . . .. .. .. ..

Probleme der Gestaltpsychologie

• Keine Erklärung, wie natürliche Objekte erkannt werden

• Die explizite Annahme (zumind. frühe Gestaltpsych), dass nur Reizkonfiguration für Wahrnehmungsinhalt verantwortlich, nicht haltbar

• Für jedes Gestaltgesetz Gegenbeispiele, daher immer neue Annahmen notwendig

52

. . . . . . . . .. . . .

lt. Gesetz der Nähe gehören diesebeiden Punkte zusammen,

trotzdem werden sie als zu den beiden verschiedenen Balken des Y gehörend wahrgenommen

53

2 MUSTERERKENNEN( Pattern Recognition )

Hauptsächlich mit zweidimensionalen Stimuli erforscht(z.B.: Buchstaben)

Schablonentheorie

Merkmalsanalyse

Strukturbeschreibung

54

2.1 SCHABLONENTHEORIEN - Template theory

Schablone: mentale Kopie des wahrgenommenen Objektes die im LZG gespeichert ist

Stimuli

SchablonenA B C …

R E A S

55

ABRR E A S

R E A SR E A S

Schablonen:

A B C …

56

Probleme mit Drehung, kursiv, Grösse,...durch Transformation lösbar

B K A I F

57

Probleme:unsaubere Buchstabenverkehrte, unvollständige BuchstabenKontext-Effekte

BANK BERN

58

59

Hauptkritik an Schablonenvergleich-Theorie

1 Verzerrungen bei realistischem 3-dimensionalem Input nicht durch einfache Transformation umkehrbar

2 Schablonenvergleich funktioniert nur bei klar isolierten zweidimensionalen Wahrnehmungsobjekten (z.B. Buchstaben auf Papier)

3 Schon bei einfachen zweidimensionalen Stimuli treten Probleme auf, die zeigen, dass die Schablonentheorie nicht stimmen kann

60

2.2 MERKMALSANALYSE - Feature Theories

- einzelne Merkmale (z.B.) von Buchstaben analysisert

- Mini-Schablonen für einfache geometrische Merkmalez.B.:

z.B.: A

H

61

Was spricht für die Merkmalsanalyse ?

1 Neurophysiologie

neurale Detektoren für Kanten, Striche, etc. ( Hubel & Wiesel, 1963 )auf höherer Ebene unabhängig von der Lokation auf Retina

2 Fehleranalyse beim Erkennen von Buchstaben

Vorhersage von mehr Fehlern je mehr gemeinsame Merkmale

z.B. 250 Paare von Buchstaben präsentiert

E F 39 Verwechslungen

T I 22 Verwechslungen

E W 3 Verwechslungen

T O 0 Verwechslungen

62

Probleme der Merkmalsanalyse

1 Minischablonen für natürliche Formen?z.B.: Pferd [globale Merkmale (Kopf) unbrauchbar]

2 räumliche Beziehung zwischen Merkmalen unberücksichtigt ( nur Art und Zahl )

A oder 3 3-dimensionale Objekte

63

2.3 STRUKTURBESCHREIBUNG - Structural DescriptionBruce & Green (1990)

Berücksichtigt Relationen zwischen Merkmalen

Strukturbeschreibungen aus elementaren Propositionen (Aussagen)

Beschreibt Komponenten einer Konfiguration und deren Anordnung

64

z. B.: Strukturbeschreibung eines T

Es gibt zwei TeileEin Teil ist eine horizontale LinieEin Teil ist eine vertikale LinieDie vertikale Linie trägt die horizontaleDie vertikale Linie halbiert die horizontale

65

Probleme der Strukturbeschreibung

1 Strukturbeschreibung für natürliche Formen?

2 3-dimensionale Objekte

66

3 COMPUTATIONALE THEORIE DER VISUELLEN WAHRNEHMUNG

Marr, D.: Vision. San Francisco: Freeman, 1982

Zwei fundamentale Probleme der traditionellen Ansätze

1 Keine klare Abgrenzung von Perzeption und Kognition

z.B.:

Erkennen des Quadrates ist unabhängig von der Art, wie Begrenzung identifiziert wirdBegrenzung kann gesehen werden, ohne dass Figur erkannt zu werden braucht

d.h. diese Prozesse (Identifikation von Begrenzungen, Erkennen von Formen) sind unabhängig voneinander

67

a a a a a a a a a a a aa aa aa aa aa a a a a a a a a a

erkennbar:

• Form unabhängig von Begrenzung

• Begrenzung unabhängig von Form

68

Zwei fundamentale Probleme der traditionellen Ansätze

2 Keine klare Problemanalyse

d.h. es wird nicht spezifiziert, was man durch die Theorie erreichen will

welcher Prozess soll erklärt werdenwelcher Input, welches Ergebnis

69

3.1 GRUNDSÄTZLICHE ÜBERLEGUNGEN ZUM WAHRNEHMUNGSPROZESS

Aufgabe des Wahrnehmungsprozesses:

Dreidimensionale Wirklichkeit muss aus zweidimensionalem Netzhautbild rekonstruiert werden

dabei Schwierigkeiten, z.B.Teile des Gegenstandes können auf Netzhautbild

verdeckt sein Gegenstände verschieden scharf

Schatten, Spiegelungen, Oberflächenstrukturen, ...

70

Unterscheidung von zwei globalen Verarbeitungsstufen:

Basisprozesse (visuelle Perzeption)eher von Sinnesdaten und allgemeinen Verarbeitungsprinzipien bestimmtProzess der Extraktion von Informationen aus Daten, ohne spezielle Annahmen über wahrgenommene ObjekteEher datengetrieben (bottom-up)

Objekterkennung (visuelle Kognition) Prozess der ErkennungInformation aus den Basisprozessen mit der im Gedächtnis gespeicherten Information verglichen eher erwartungsgetrieben (top-down), d.h.: spezielle Annahmen und spezielles Wissen über wahrgenommene Objekte einbezogen

71

Annahme Marr’s: Wahrnehmungsprozess beinhaltet eine Serie von Repräsentationen unserer visuellen Umwelt, die zunehmend detailliertere Informationen enthält.

bei Marr 3 Haupttypen der Repräsentation:

• Erstskizze (Primal sketch)

• 2 1/2-D Skizze

• Repräsentation in Form eines 3-D Modelles

72

Erstskizze (Primal sketch)2-dimensionale Beschreibung von Änderungen der Licht-Intensität im visuellen Input, dazu Information über Kanten, Konturen und Fleckenbeobachterzentriert

2 1/2-D SkizzeBeschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung (unter Ausnutzung der Hinweisreize zur Tiefenwahrnehmung)beobachterzentriert

Repräsentation in Form eines 3-D ModellesBeschreibt 3-dimensional Form und relative Position von ObjektenUnabhängig vom Beobachterstandpunkt!

73

3.3 BASISPROZESSE

ERSTSKIZZE (Primal sketch)

Roh-Erstskizze (Raw Primal sketch)Information über Lichtintensität

Voll-Erstskizze (Full Primal sketch)Linienrepräsentation von Umrissen, Kanten

Oft: Änderung der Lichtintensität an Kanten des Objektesaber: z.B. Schatten, Spiegelungen, TexturDaher nur Änderung der Lichtintensität nicht ausreichend

74

Zerlegung der Bildfläche in kleine Elemente: Pixels.

Problem: Lichtintensität auf jedem Pixel fluktuiert ständig, dadurch könnte die Roh-Erstskizze verzerrt werden.

Lösung: Zusammenfassung (Durchschnitt) der Lichtintensität benachbarter Pixels,

das führt aber zur Vergöberung (Verschwimmen - blurring) der

Bildauflösung.

Daher: Mehrere Analysen des Bildes mit unterschiedlichen Graden von Vergröberung.

Information aus diesen mehrfachen Analysen wird zur Roh-Erstskizze verarbeitet.

75

Ergebnis: einfache Elemente wie Kanten, Balken, Flecken, Enden

Voll-Erstskizze:

Gruppierung derartiger Elemente zu grösseren Einheiten

Gruppierungsprinzipien:NäheAusrichtung

iterativer Prozess

76

nach neueren Ergebnissen: Vermutlich Gruppierung nicht nur im zweidimensionalen Raum

Endergebnis der Erstskizze: Linienrepräsentation

enthält aber auch irrelevante Linien beobachterzentriert

Abbildung (Bild 110 aus Frisby [1979])

77

78

2 1/2 D-SKIZZE

Beschreibung der sichtbaren Oberflächen, ihre Tiefe (Entfernung) und Orientierung

Ausgangspunkt: Bild- "Zellen"Jede Zelle entspricht einem Bildausschnitt aus der Sicht des BetrachtersInformation aus Zellen wird zusammengefasst.

Verwendete Information:Tiefeninformation aus monokularen/binokularen Hinweisreizen etc.

2 1/2D-Skizze enthält Information über die sichtbaren Oberflächen

beobachterzentriert

79

Siehe Abbildung ( Marr, 1982)

80

2 1/2 D-Skizze ermöglicht nicht Vergleich mit Gedächtnisinhalt:

1 Nur sichtbare Oberflächen repräsentiert

2 Alles nur aus einem speziellen Blickwinkeld.h. alle Distanzen und Orientierungen relativ zum momentanen BlickpunktÄndert sich Standpunkt des Betrachters, ändert sich auch die Repräsentation

3 Objekte und ihre Teile nicht explizit abgegrenzt

81

Neuropsychologische Hinweise, die als Bestätigung für Annahme einer 2 1/2 D-Skizze interpretiert werden können:

Wenn nur Prozess der Konstruktion der 2 1/2 D-Skizze geschädigt:

•Patient kann Helligkeitsunterschiede, Bewegung kleiner Objekte erkennen (Leistung der Erstskizze)

•Patient kann Objekte mithilfe anderer Sinnesmodalitäten erkennen

(z.B. Tasten, Hören)

•Patient kann Objekt nur mithilfe visueller Information nicht erkennen

Benson & Greenberg (1969)

82

3.4 OBJEKTERKENNUNG

Marr (1982)Biederman (1987)Kosslyn et al. (1990)( Konnektionistische Ansätze )

MARR (1982) , Marr & Nishihara (1978)

3-dim Modell aus Komponenten konstruiert

Basiselemente: Zylinder mit Hauptachse

Hierarchische Organisation: Grobform+Orientierung Details(Hauptachse des globalen Objektes stimmt oft

nicht überein mit Hauptachsen von Details)

3-D Modell wird mit Modellen im Gedächtnis verglichen(dazu Identifikation der Hauptachse notwendig)

83

hierarchische Struktur des menschl KörpersMarr & Nishihara (1978)

84

Orientierung der Hand unterschiedlich bei Bewegung von Schulter und Ellenbogen

Orientierung der Hand auf Retina unterschiedlichrelative Lage von Hand und Unterarm gleich

85

BIEDERMAN (1987, etc.): Recognition-by-components-theory

Objekte aus Basiskomponenten (geons) zusammengesetzt:BlockZylinderKugelBogenKeiletc.

insgesamt 36 geons (Analogie zu Wörtern aus Lauten)

86

87

Verlauf der Objekt-Erkennung nach Biederman

Determination der Geons und ihrer Relationen

Vergleich mit Gedächtnisrepräsentationen(Geon-Beschreibungen von Objekten)

Kanten-Extraktion

Identifikation von nicht-zufälligen Eigenschaften

Zerlegung des Objektes

88

Zerlegung des Objektes (Parsing of regions of concavity)

basiert auf geometrischer Regularität: Wenn Objekt aus zwei Teilen gebildet, an der Verbindgsstelle üblicherweise konkave (nach innen ins Objekt gerichtete) Diskontinuität

Baum

89

Detektion von relevanten (nicht-zufälligen) Eigenschaften(Detection of non-accidental properties)

Charakteristiken, die aus wechselnden Blickwinkeln unverändert bleibenWerden durch Analyse der Kanten identifiziert:

Kurvatur einer Kante

Parallele Kanten

Kanten mit gemeinsamen Endpunkt

Symmetrische Kanten

Gerade Kanten

Geons aus diesen Invarianten konstruiert

Annahme: nicht-zufällige Merkmale in der Repräsentation entsprechen nicht-zufälligen Merkmalen in der Wirklichkeit

90

Warum können Objekte auch unter suboptimalen Bedingungen erkannt werden (schlechte Beleuchtung, Teilverdeckung)?

1 Invariante Merkmale bleiben oft auch unter suboptimalen Bedingungen erhalten

2 Fehlende Teile können ergänzt werden (sofern Konkavität erhalten bleibt)

3 üblicherweise Redundanz

91

Empirischer Status

+ Biederman, Ju & Clapper (1985): Erkennen auch unvollständiger komplexer Objekte ( 90%)

Biederman (1987): Erkennen unvollständiger Objekte schwieriger, wenn Information über Konkavität fehlt.

Erkennen von Objekten wird durch Farbe nicht gefördert (nicht einmal dort, wo Farbe wichtig ist - Banane)

- Komplexe Objekte werden oft zunächst global verarbeitet (z.B. Kimchi, 1992) (wie bei Marr).

Zentrale theoretische Annahmen (derzeit) nicht direkt prüfbar (36 geons).

92

intakte Figur Info über Struktur erhalten

Info über Struktur nicht erhalten

Biederman (1987)

93

Hauptproblem der Theorien von Marr und Biederman:

Behandeln relativ einfache/grobe Erkennungsaufgaben (z.B.: Hund oder Kuh), nicht differenzierte Unterscheidungen (z.B.: bestimmter Schäferhund Rex)Rolle anderer Hinweisreize (ausser den Kanten) noch zu wenig untersucht (z.B. Farbe)

Vorteile

Bisher einzige Theorie des Objekterkennens

auch Kontexteffekte können wenigstens Teilweise erklärt werden (Reihenfolge der Gedächtnissuche),

Recommended