78
Computer Vision 4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische räumliche Beschreibung (parametrisierte Modelle für Szene,Objekte, Beleuchtung, Abbildung) Modellausprägungen (Parametersätze) Parameterschätzung, Klassifikation Merkmale, Primitive Modellelemente Projektion Modellwelt-Bild Digitalisiertes Bild Modellwelt Synthetisches Bild, Szenenskizze Bildsensor Display Signal- verarbeitung Bildauswertung Synthese Bestimmt Art Verfahren extrahieren Bestimmt Art Modifiziert

Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Embed Size (px)

Citation preview

Page 1: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 1

Erste Stufe der Informationsgewinnung

Interpretationszyklus für Einzelbilder

Zuordnung von Modellausprägungen zu Bilddaten

Generische räumliche Beschreibung(parametrisierte Modelle für Szene,Objekte, Beleuchtung, Abbildung)

Modellausprägungen(Parametersätze)

Parameterschätzung,Klassifikation

Merkmale,Primitive

Modellelemente

ProjektionModellwelt-Bild

DigitalisiertesBild

Modellwelt

Synthetisches Bild,Szenenskizze

Bildsensor Display

Signal-verarbeitung

Bildauswertung

Synthese

BestimmtArt

Verfahrenextrahieren

BestimmtArt

Modifiziert

Page 2: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 2

Objektberandung Grauwertunterschiede Lokalisierung(Geometrie) Texturunterschiede Segmentierung

FreiheitsgradeForm

Oberflächeneigenschaft Grauwert Klassifikation(Radiometrie) Textur

Modellähnlichkeit Klassifikation(geometrisch, radiometrisch)

Bildmerkmale Informationsgewinnung

Bild

Merkmal 1-Bild

Merkmal N-Bild

......Merkmal 1 - Operator

Merkmal N - Operator

N Kanten-bilder

N Fleck-bilder

...

Kanten-operator

Fleck-operator

Page 3: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 3

Diskrete Signale

Videokamera

TDDn xnxnxnr ,,, 2211

D

dddde xnnxxxxd

1

22´´´ )(),(

D

dddb nnxxd

1

´´),(

´

,...,1

´ max),( ddDd

c nnxxd

Abstandsmaße im diskreten Gitter

Euklidische Distanz

City-block-Distanz

Schachbrett-Distanz

Aliasing räumlich und zeitlich:Signale halbe Abtastfrequenz!

Page 4: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 4

Textur-Deskriptoren• Texturelle• Statistische• Fourier

Berandungsdeskriptoren• Einfache• shape numbers• Fourier• Momente

Regionale Deskriptoren• Einfache• Topologische

Merkmale Informationsgewinnung

Page 5: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 5

Grauwert-Deskriptoren: Textur

Keine formale Beschreibung von Textur.Maße für Glattheit, Rauhigkeit, Regelmäßigkeit, etc.

Drei Ansatzpunkte zur Beschreibung von Textur:• Statistisch: glatt, rauh, körnig,grob• Strukturell: Anordnung geometrischer Primitive (z.B. reguläre Anordnung v. Linien)• Spektral: Detektion globaler Periodizitäten als Peaks im räumlichen Frequenzspektrum

Merkmale Informationsgewinnung

Rauhfraktal

homogen

periodisch

Page 6: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 6

Textur: Statistische Ansätze

Merkmale Informationsgewinnung

Rauhfraktal

homogen

.

.

.

.

.

.

0 255 g

h

1. Auswertung des Histogrammsdes durch die Maske definierten Bildbereichs

h

0 255 g

Page 7: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 7

Textur: Statistische Ansätze: Momente des Grauwerthistogramms

0 255 g

h

L

iii

L

ii

nin

ghgm

ghmgg

1

1

)(

)()()(

Wenn L die Anzahl der Grauwerte ist und h(gi) das Histogramm in der Maske, so sind die n-ten Momente:

Das zweite Moment heisst Varianz und wird mit ² bezeichnet. Es ist ein Maß des Grauwertkontrasts. Z.B. ist

R=0 für konstanten Grauwert und geht gegen 1 für große .n=3: Skewness des Histogrammsn=4: relative Plattheit des Histogramms

h

0 255 g 21

11

R

Merkmale Informationsgewinnung

Page 8: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 8

Ergibt die und damitMatrix Cooccurrence

Matrix

ci,j ist ein Schätzwert für die bedingte Wahrscheinlichkeit, dass ein Paar von Punkten, das P erfüllt die Werte i,j hat.

Textur: Statistische Ansätze: 2. Auswertung der Coocurrence-Matrix

Nachteil der reinen Histogramm-Ansätze: keine Information über relativen Position der Pixel zueinander (Phase).

Information über die Positionen von Pixeln mit gleichem oder ähnlichem Grauwert: Coocurrence-Matrix.Positionsoperator Pk,l : In Bezug auf aktuellen Punkt (u,v) wähle aus Punkt (u+k, v+l).Anzahl der unterschiedlichen Grauwerte GMatrix A mit GxG Elementen ai,j : Anzahl, wie oft g(u,v)=i und g(u+k,v+l)=j. Coocurrence-Matrix C: Matrix A dividiert durch Anzahl der Punktpaare, die P erfüllen.

Beispiel:G=3: g {0,1,2}; Positionsoperator P1,1

10100

02011

00122

11011

21000Angewendetauf das Bild

021

232

024

AD

021

232

024

16

1CD

Merkmale Informationsgewinnung

Page 9: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 9

Textur: Statistische Ansätze: Coocurrence-Matrix

Aus der Coocurrence-Matrix C können Maße zur Charakterisierung einer Textur gewonnen werden. Eine solche Menge von Deskriptoren ist z.B.:

(1) Maximale Wahrscheinlichkeit Stärkste Antwort auf P

(2) Moment der Elemente-Differenz der Ordnung k relativ kleiner Wert, wenn hohe Werte nahe Hauptdiag.

(3) Moment der inversen Elemente-Differenz der Ordnung k Gegenteiliger Effekt wie (2)

(4) Entropie Maß für die Unordnung

(5) Gleichförmigkeit Entgegengesetzt zu (4)

i jij

iji j

ij

i jk

ij

i jij

k

ijji

c

cc

ji

c

cji

c

2

,

)(log

)(

)(

)(max

Merkmale Informationsgewinnung

Page 10: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 10

Textur: Statistische Ansätze: Unser´s Summen- und DifferenzhistogrammeVereinfachung gegenüber Coocurrence-Matrix

Bildfenster gleicher Größe, deren Mitte um du und dv gegeneinander verschoben ist:{gm´,n´ } = {gm+du, n+dv }, m = 1, ... ,M; n = 1, ... ,N

Summen und Differenzen der Grauwerte:

Summen- und Differenzhistogramme:

}{}{};{}{ ,,,,,, vuvu dndmnmnmdndmnmnm ggdggs

is

ssnmnmsvus iN

iNihissAnzahliNddiN)(

)()();|}({)(),;( ,,

id

ddnmnmdvud iN

iNihiddAnzahliNddiN)(

)()();|}({)(),;( ,,

Merkmale Informationsgewinnung

Page 11: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 11

du

dvgm,n

sm,n = gm,n + gm+du,n+dv dm,n = gm,n - gm+du,n+dv

gm+du,n+dv

is

ss iN

iNih)(

)()(

id

dd iN

iNih)(

)()(

0 i

hshd

0 i

Merkmale Informationsgewinnung

Page 12: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 12

Textur: Statistische Ansätze: Unser´s Summen- und Differenzhistogramme

Maße aus den normierten Histogrammen:

können berechnet werden für verschiedene du und dv, meist(1,0), (1,1), (0,1), (-1,0)

G

Gidd

UnserEntrds

G

is

UnserEntrs

G

Gid

UnserMitd

UnserKontrd

G

is

UnserMits

UnserKontrs

G

Gid

UnserZwMomd

G

is

UnserZwMoms

G

Gid

UnserMitd

G

is

UnserMits

ihihMihihM

ihMiMihMiM

ihMihM

ihiMihiM

)(ln)();(ln)(

)()(;)()(

)(;)(

)(;)(

,

2

0,

2,,

2

0

2,,

2,

2

0

2,

,

2

0,

Merkmale Informationsgewinnung

Page 13: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 13

Textur: Statistische Ansätze: Momente

Zweidimensionale, kontinuierliche Funktion f(x,y): Moment der Ordnung (p+q):

für p,q = 0,1,2,...Wenn f(x,y) kontinuierlich und nicht-verschwindende Elemente nur in einem Teil derxy-Ebene, existieren Momente jeder Ordnung und sind eindeutig durch f(x,y) bestimmt.Die Menge aller Momente bestimmt seinerseits f(x,y).

Zentrale Momente

Für ein digitales Bild wird daraus

dydxyxfyxm qppq ),(

00

01

00

10),()()(m

myund

m

mxmitdydxyxfyyxx qp

pq

x y

qppq yxfyyxx ),()()(

Merkmale Informationsgewinnung

Um Schwerpunkt verschoben: translationsinvariant

Page 14: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 14

Textur: Statistische Ansätze: MomenteZentrale Momente bis zur Ordnung 3:

;23),()()(

;22),()()(

;22),()()(

;23),()()(

;),()()(

;2

),()()(

;),()()(

;0;0),()()(

012

020330

03

012

20112112

21

102

02111221

12

102

203003

30

00

201

0220

02

00

210

2000

210

00

210

2002

20

00

011011

1111

010000

1010

0110

mymymyxfyyxx

mxmymxmyxfyyxx

mymxmymyxfyyxx

mxmxmyxfyyxx

m

mmyxfyyxx

m

mm

m

m

m

mmyxfyyxx

m

mmmyxfyyxx

mm

mmyxfyyxx

x y

x y

x y

x y

x y

x y

x y

x y

Normierte zentrale Elemente: ,...3,21200

qpfürqp

mitpqpq

Merkmale Informationsgewinnung

Skaleninvarianz durchNormierung

Page 15: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 15

Textur: Statistische Ansätze: Invariante Momente

Eine Menge von 7 invarianten Momenten aus den zweiten und dritten Momenten:

Translations-, rotations- und skaleninvariant

])()(3)[)(3(

])(3))[()(3(

))((4])())[((

])()(3)[)(3(

)]3(3)[())(3(

)()3(

)3(

4)(

20321

2123003123012

20321

21230123003217

03211230112

03212

120302206

20321

2123003210321

12302

1230123012305

20321

212304

212303

211

202202

02201

C

Merkmale Informationsgewinnung

Page 16: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 16

Textur: Vergleich der Trennungswirksamkeit von Texturmerkmalen

Merkmale Informationsgewinnung

Quelle: Handbook of Computer Vision

Page 17: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 17

Detektion von Diskontinuitäten• Kanten• Linien• Punkte

Detektion von Ähnlichkeiten

Segmentierung Informationsgewinnung

Page 18: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 18

Detektion von DiskontinuitätenKanten

Segmentierung

Grauwertprofil erste Ableitung zweite Ableitung(Gradient) (Laplace)

Page 19: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 19

Merkmal Gradient

Motivation: Wenn Objekte homogen bezüglich Grauwert oder Texturmerkmal sind, dann treten an Objektgrenzen starke Gradienten auf.

Grauwertbild Gradientenbild

Bildmerkmale

Page 20: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 20

Merkmal Gradient

Bildmerkmale

yyxg

xyxg

eyxgyxg

y

yxg

x

yxgyxg

yxi

T

),(

),(

arctan

),(),(

),(,

),(),(

),(

Betrag gibt Stärke des Grauwertübergangs.• Rotationsinvariant• Invariant gegen homogene GW-ÄnderungenPhase gibt Richtung.• Invariant gegen homogene GW-Änderungen

Diskretisierung im Bild -> Differenzenquotienten

Page 21: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 21

Merkmal Gradient

Bildmerkmale

T

y

yxg

x

yxgyxg

),(,

),(),(

Diskretisierung im Bild -> Differenzenquotienten

x

yxxfyxxfx

yxfyxxfx

yxxfyxf

x

yxf

2

),(),(

),(),(

),(),(),( Rückwärts-x-Gradient –Dx

Vorwärts-x-Gradient +Dx

Symmetrischer-x-Gradient SDx

Ergibt Faltungsmaske

1,0,12

1x

SD

Analog y, z.B.:

1

0

1

2

1y

SD

Page 22: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 22

Erinnerung: Faltung

Bildmerkmale

0

10

20

30

40

50

60

70

80

90

100

1 3 5 7 9 11 13 15 17 190

5

10

15

20

25

30

-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9

j k

knjmgkjKnmgnmKnmg ),(),(),(),(),(~

j

jmgjKmgmKmg )()()()()(~

0

10

20

30

40

50

60

70

80

90

100

1 3 5 7 9 11 13 15 17 19

g(m) K(m)

m=17

Eindimensional, diskret

2D, diskret

ddyxgKyxgyxKyxg ),(),(),(),(),(~2D, kontinuierlich

Page 23: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 23

Erinnerung: Faltung

Bildmerkmale

2D, diskret, endl. Faltungskern

g1,1 g1,2 g1,3 g1,4 g1,5 g1,6 g1,7 g1,8 g1,9 g1,9 ...

g2,1 g2,2 g2,3 g2,4 g2,5 g2,6 g2,7 g2,8 g2,9 g2,9 ...

g3,1 g3,2 g3,3 g3,4 g3,5 g3,6 g3,7 g3,8 g3,9 g3,9 ...

g4,1 g4,2 g4,3 g4,4 g4,5 g4,6 g4,7 g4,8 g4,9 g4,9 ...

g5,1 g5,2 g5,3 g5,4 g5,5 g5,6 g5,7 g5,8 g5,9 g5,9 ...

g6,1 g6,2 g6,3 g6,4 g6,5 g6,6 g6,7 g6,8 g6,9 g6,9 ...

g7,1 g7,2 g7,3 g7,4 g7,5 g7,6 g7,7 g7,8 g7,9 g7,9 ...

g8,1 g8,2 g8,3 g8,4 g8,5 g8,6 g8,7 g8,8 g8,9 g8,9 ...

g9,1 g9,2 g9,3 g9,4 g9,5 g9,6 g9,7 g9,8 g9,9 g9,9 ...

... ... ... .... ... ... ... ... ... ... ...

K-1,-

1

K-1,0 K-1 1

K0,-1

XK0,0

K0,1

K1,-1 K1,0 K1,1

Bild {gm,n}, 0 m M, 0 n N Faltungskern {Km,n}

K

K

K

K

J

Jj

K

Kkhshs knjmKknjmgnmg ),(),(),(~

)1,1()3,3(

)0,1()4,3()1,1()5,3(

)1,0()3,4()0,0()4,4(

)1,0()5,4()1,1()3,5(

)0,1()4,5()1,1()5,5(

),()4,4()4,4(~1

1

1

1

Kg

KgKg

KgKg

KgKg

KgKg

kjKkjggj k

Beispiel:m = 4, n = 4, mhs=0Jk = 1, Kk = 1, nhs=0

K-1,-

1

K-1,0 K-1 1

K0,-1

XK0,0

K0,1

K1,-1 K1,0 K1,1

Page 24: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 24

Merkmal Gradient

Einige gängige Gradienten-Operatoren:

Bildmerkmale

121

000

121

101

202

101

121

000

121

101

202

101

111

000

111

101

101

101

10

01

01

10Roberts

Prewitt

Sobel

Isotrop

Page 25: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 25

Merkmal Gradient

Gradienten-Operatoren verstärken Rauschen:Vorzugsweise Operatoren mit Glättungseigenschaften

Sobel

Alternativ: Tiefpassfilterung mit Gaussfunktion und anschließende AbleitungGaussfunktion

Bildmerkmale

)2()2(

121

000

121

101

202

101

131211333231 ggggggDDD xyx

)()(2

1

2

1

2

1),(

2

2

2

2

2

22

22

22

yGxG

ee

eyxG

yx

yx

Page 26: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 26

Merkmal Gradient

Faltung mit der Ableitung der Gaussfunktion: Canny-Filter

Bildmerkmale

),(,1

,2

1),(

22

4

2

22

yxGyxyxeyxGyx

Separierbar in x und y

Page 27: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 27

Merkmal Laplace

Laplace-Operator einer 2-dimensionalen Funktion f(x,y):Im Fall einer diskreten 3x3-Maske:

Laplace-Operatoren verstärken Rauschen:Glättung mit Gauss-Funktion

Nulldurchgänge des Hildreth-Marr-gefilterten Bildes geben Kantenpixel-Kandidaten.Überschwellige Pixel des Gradientenbildes geben Kantenpixel-Kandidaten.

Bildmerkmale

2

2

2

22

y

f

x

ff

)(4

010

141

010

3,22,32,11,22,222 gggggfDdamitD

2

22

2

22

2

22

2

22

22224

22

2222

1

),(),(

yxyx

yxyx

eyxe

yxfeyxfe

Hildreth-Marr- oder Mexican Hat-Operator

2

2

22

222

2

2

1

yx

eGH

Page 28: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 28

Konturpunktextraktion beim Canny-Operator1. Faltung mit Filter

2. Im faltungsgefilterten Bild: Gradientenbetragsmaximum in Gradientenrichtung

Konturextraktion

),(,1

,2

1),(

22

4

2

22

yxGyxyxeyxGyx

dy

ydgyxGygycGyxG

)(),()(),(),(

BCD

AME

HGF

45°90°135°

180°

225° 270° 315°

Gradienten-Richtung in M Maximumbedingung1°...22°, 158°...202°, 338°...360° b(A) b(M) und b(E) b(M)23°...67°, 203°...247° b(B) b(M) und b(F) b(M)68°...112°, 248°...292° b(C) b(M) und b(G) b(M)113°...157°, 293°...337° b(D) b(M) und b(H) b(M)

Wenn M Maximum, trage in Ergebnisbild Betrag und Richtung ein, sonst 0.

Page 29: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 29

Konturpunktextraktion beim Canny-Operator1. Faltung mit Filter

Konturextraktion

Betra

g

Richtung

Page 30: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 30

Konturpunktextraktion beim Canny-Operator2. Gradientenbetragsmaximum in Gradientenrichtung

Konturextraktion

Page 31: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 31

Konturpunktextraktion beim Canny-Operator1. Faltung mit Filter

Betra

g

Richtung

Konturextraktion

Page 32: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 32

Konturpunktextraktion beim Canny-Operator2. Gradientenbetragsmaximum in Gradientenrichtung

Konturextraktion

Page 33: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 33

Kantenpixel-Verkettung

Vorgestellte Methoden liefern Intensitäts-DiskontinuitätenLeider nicht immer Objektränder: Zusätzliche Struktur undKantenunterbrechungen durch Rauschen und

Beleuchtungsdiskontinuitäten. Daher weitere Verarbeitung zur Zusammenstellung von

Kantenpixelkandidaten zu Rändern.

1. Unterdrückung zusätzlicher Strukturen:I.A. kleiner GradientenbetragVorgehen:Zwei Schwellen zur Unterdrückung: 1. Größere Schwelle zur Filterung ausgeprägter Konturpunkte2. Dort Verfolgung der Kontur mit kleinerer Schwelle

Konturextraktion

Page 34: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 34

2. Verdünnung auf pixelbreite Strukturen:Durch Diskretisierung bis zu 3 Pixel breite Strukturen.Gütekriterium in 3x1-Maske in Gradientenrichtung (Lacroix)

3. Lokale Verarbeitung:Analyse in einer kleinen Nachbarschaft (z.B. 3x3 oder 5x5) um einenKandidaten:Alle ähnlichen Kandidaten werden verbunden. Rand von Pixeln ähnlicher Eigenschaft.Verwendete Maße: (1) Gradientenstärke und (2) Gradientenrichtung

TyxyxTyxgyxg ´)´,(),(´)´,(),(

Konturextraktion

Page 35: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 35

Histogramm-Auswertung

Bild eines Merkmals, das sich für das Objekt charakteristisch ausprägt:

Bildsegmentierung durch Schwellwerte

0

200

400

600

800

1000

1200

1400

20 40 60 80 100 120 140 160 180 200 220 240 260

An

zah

l B

ild

pu

nkte

Helligkeit (Grauwert)

Hintergrund Objekt

Histogrammsegmentierung

Schwelle T

g(x,y) H(x,y)=0, wenn g(x,y) TH(x,y)=1, wenn g(x,y) T

SegmentierungMerkmalsbild

Page 36: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 36

Auffinden der Schwelle mittels Histogramm-Auswertung (1)

Verteilungsfunktionen (Wahrscheinlichkeitsdichten) eines Merkmals z für Objekt pO(z) und Hintergrund pH(z)

mit a priori Auftrittswahrscheinlichkeiten von Objektpunkten PO und Hintergrundpunkten PH. Bedingung PO + PH = 1.

Ergibt Gesamtwahrscheinlichkeitsdichte p(z) = PO pO(z) + PH pH(z)

Im Gauss´schen Fall:

Bildsegmentierung durch Schwellwerte

2

2

2

2

2

)(

2

)(

22)( H

H

O

O z

H

H

z

O

O eP

eP

zp

Page 37: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 37

Auffinden der Schwelle mittels Histogramm-Auswertung (2)

Wahrscheinlichkeit einer Fehlzuordnung E:

Minimierung von E

Gauss´sche pO und pH: Einsetzen, logarithmieren und vereinfachen ergibt quadratische Gleichung

mit

Bildsegmentierung durch Schwellwerte

HO

OHHOOHHOOHHOHO

HHOO

T

OOO

T

HH

P

PCBA

CTBTA

TpPTpPdT

TdE

dzzpPPdzzpPTE

ln2);(2;

0

)()(0!)(

)()()(

2222222222

2

Page 38: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 38

Auffinden der Schwelle mittels Histogramm-Auswertung (3)

Vorgehen nach obiger Methode:

1. Trainingsstichprobe Bildmaterial2. Histogramm für Objektpixel hO

3. Histogramm für Hintergrundpixel hH

4. Berechnung von O und O aus hO

5. Berechnung von H und H aus hH

6. Berechnung von A, B und C:

7. Berechnung der Schwelle durch Lösung der quadratischen Gleichung

8. Anwenden der Schwelle auf neues Bildmaterial

Bildsegmentierung durch Schwellwerte

HO

OHHOOHHOOHHOHO P

PCBA

ln2);(2; 2222222222

02 CTBTA

Page 39: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 39

Darstellung der Objekt-Berandung: Ketten-Code

Darstellung und Beschreibung

x x X

x X

X X

X x

X X

X X

X X

X x

2

21

10 0 6

7

Kettencode-Erstellung:Folge der Richtungen entlang der Kontur ab beliebigem Startpunkt.Beispiel: 22110067665654323

Anfangspunktinvarianz1. Startpunkt-Normierung:Verschiebe zirkular so, dass die Sequenz eine Zahl minimaler Größe bildet.Beispiel: 22110067665654323 00676656543232211

Rotationsinvarianz2. Rotationsnormierung:Erste Differenz: Anzahl der Richtungen, die zwei aufeinanderfolgende Elemente des Codes trennen.Beispiel: 22110067665654323 07070617071777717

Anfangspunkt- und RotationsinvarianzKettencode Rotationsnormierung StartpunktnormierungBeispiel: 22110067665654323 07070617071777717 06170717777170707

1

0

23

4

5 6 7

1

0

23

4

5 6 7

7

654

3

21

Page 40: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 40

Darstellung der Objekt-Berandung: Polygon-Approximationen

Polygon-Approximationen einer digitalen Berandung mit beliebiger Genauigkeit.Aber gesucht: Repräsentation der wesentlichen Berandungseigenschaften mit

möglichst kleiner Anzahl an Segmenten.Nicht-triviales Problem iterativer Suche.

Einfache Methode für Polygone mit minimalem Umfang:

1. BedeckungRandkurve mitrechtwinkligangeordnetenQuadraten

Darstellung und Beschreibung

2. Gerade Verbindungen der Außenecken des „Quadrate-schlauches“

Page 41: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 41

Beschreibung der Objekt-Berandung: Polardarstellung

Darstellung und Beschreibung

r

Schwerpunkt

Ar

Schwerpunkt

A

r

r

A/2 A/2

A/2

Page 42: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 42

Beschreibung der Objekt-Berandung: Momente

1. Umwandlung einer Berandung in eine 2. Berechnung Momente der Kurve

eindimensionale Kurve (z.B. Polardarst.)

Darstellung und Beschreibung

r

Schwerpunkt

A

r

A/2

A/2

K

iii

K

ii

nin

K

iii

K

ii

nin

r

mit

g

ellungPolardarstBei

p

mit

p

1

1

1

1

)(

)()()(

:

)(

)()()(

Page 43: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 43

Beschreibung der Objekt-Berandung: Fourier-Deskriptoren

Rand ermittelt: Zähler s längs Berandung ergibt Menge {x(s),y(s)} s=0,...,L-1Als komplexe Zahl: u(s) = x(s) + iy(s)L-periodisch für geschlossene Konturen.

DFT:

a(k): Fourier-Deskriptoren der Berandung.

Transformationseigenschaften:Identität u(s) -> a(k)Translation u´(s) = u(s)+u0 -> a´(k) = a(k)+ u0(k)Skalierung u´(s) = u(s) -> a´(k) = a(k) Anfangspunkt u´(s) = u(s-s0) -> a´(k) = a(k) exp(-is0k/L)Rotation u´(s) = u(s) exp(i2) -> a´(k) = a(k) exp(i2)

Darstellung und Beschreibung

10,)()(

10,)(1

)(

1

0

2

1

0

2

Lkesuka

LsekaL

su

L

s

L

ksi

L

k

L

ksi

Page 44: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 44

Beschreibung der Objekt-Berandung: Fourier-Deskriptoren

Ähnlichkeit der Form von Randkurven mit Fourier-DeskriptorenRandkurven u(s) und v(s) mit a(k) und b(k):

Ist für mittelwertfreie u(s) und v(s) erfüllt, wenn

Darstellung und Beschreibung

1

0

2

00,,,

00 )()(min),,,(00

L

s

i

suuessvsusud

2)(

0*

2

0

)()(min)(min

/2,)()()(

)cos()(

)sin()(tan

)(

)cos()(

0

ki

i

kk

kk

k

kk

ekbkadddann

Lsekckbkamit

kkc

kkc

kb

kkc

u

k

d kann für jedes = (s0) berechnet werden.Das Minimum ergibt dann d, welches dann ein Ähnlichkeitsmaß für die Formen ist.

Page 45: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 45

Ortsraum - Frequenzraum

Signale können als Überlagerung (Summe) periodischer Funktionen

mit Frequenzen undmit Amplituden F

dargestellt werden:

Transformation in Frequenzraum

Diskrete Fourier-(Rück)Transformation

Frequenzraum-Darstellung gibt an,mit welcher Häufigkeit jeweilsperiodische Funktionen vorkommen.

Darstellung im Frequenzraum

Cosinus Funktionen Sinus Funktionen

xN

kkFxN

kkF

NkxkFxkFxy

o

N

ke

kko

N

kke

2sin)(

2cos)(

2;sin)(cos)()(

1

0

1

0

y(x)

Page 46: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 46

Ortsraum - Frequenzraum

Im Frequenzraum sind viele Operationen günstiger.Alle linearen Operationen z.B.

Hochpass, Tiefpass, Bandpass und Bandsperremit hoher Güte

Erkennung periodischer StrukturenManipulation periodischer Strukturen

Nach einer Bearbeitung im Frequenzraum Fe(k)→Fe

~(k) und Fo(k)→Fo~(k)

kann wieder in den Ortsraum zurück transformiert werden.

Darstellung im Frequenzraum

xN

kxy

NkFx

N

kxy

NkF

N

kxxy

NkFxxy

NkF

N

xo

N

xe

kk

N

xo

N

xke

2sin)(

1)(;

2cos)(

1)(

2;sin)(

1)(;cos)(

1)(

1

0

1

0

1

0

1

0

Signal y im Ortsraum, Abtastwerte y(i)

Analyse:TransformationOrtsraum Frequenzraum

Synthese:TransformationFrequenzraum Ortsraum

xN

kkFxN

kkF

NkxkFxkFxy

o

N

ke

kko

N

kke

2sin)(

2cos)(

2;sin)(cos)()(~

~1

0

~

~1

0

~

Page 47: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 47

Ortsraum – Frequenzraum

Polare Notation – komplexe Schreibweise

Darstellung im Frequenzraum

Fe(k)

Fo(k)

F(k)

)(

)(arctan)(

;)()()( 22

kF

kFk

kFkFkF

e

o

oe

Amplitude (Magnitude)

Phase)](sin[)()(

)](cos[)()(

kkFkF

kkFkF

o

e

Komplexe Schreibweise )()()( kiekFkF

|F(k

)|

xN

kxy

NkFx

N

kxy

NkF

N

kxxy

NkFxxy

NkF

N

xo

N

xe

kk

N

xo

N

xke

2sin)(

1)(;

2cos)(

1)(

2;sin)(

1)(;cos)(

1)(

1

0

1

0

1

0

1

0

1

0

1

0

)()(;2

;)(1

)(N

x

xik

N

x

xi kk ekFxyN

kexy

NkF

Page 48: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 48

Ortsraum – Frequenzraum

Filterung der abgetasteten Funktion y:1. Analyse

2. Multiplikation mit Filterfunktion

3. Synthese

Darstellung im Frequenzraum

Filterfunktion, Abtastwerte f(k)

)()()(~

)()()(~

kFkfkF

kFkfkF

oo

ee

xN

kxy

NkFx

N

kxy

NkF

N

kxxy

NkFxxy

NkF

N

xo

N

xe

kk

N

xo

N

xke

2sin)(

1)(;

2cos)(

1)(

2;sin)(

1)(;cos)(

1)(

1

0

1

0

1

0

1

0

N

xkkF

N

xkkF

N

xkkFkFxy

o

N

ke

kko

N

kke

2sin)(

~2cos)(

~

2;sin)(

~cos)(

~)(~

1

0

1

0

Page 49: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 49

Ortsraum – FrequenzraumEigenschaften der Fourier-Transformation

Darstellung im Frequenzraum

Aus: Handbook of Computer Vision

Page 50: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 50

Ortsraum – Frequenzraum

Eigenschaften der Fourier-Transformation

Darstellung im Frequenzraum

Aus: Handbook of Computer Vision

Page 51: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 51

Ortsraum – FrequenzraumBezüglich Fourier-Transformation invariante Funktionen

Darstellung im Frequenzraum

Aus: Handbook of Computer Vision

Page 52: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 52

Ortsraum – FrequenzraumWichtige Fourier-Transformationspaare

Darstellung im Frequenzraum

Aus: Handbook of Computer Vision

Page 53: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 53

Ortsraum – Frequenzraum2-Dimensionale diskrete Fourier-Transformation

Darstellung im Frequenzraum

1

0

1

0

)v(2

1

1

0

1

0

)v(2

)v,(1

)v,()k,(

),(1

),()v,(

N

j

N

k

kujN

i

N

j

N

k

kujN

i

eugN

ugFjg

ekjgN

kjgFug

Page 54: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 54

Beschreibung der Objekt-Berandung: Umschreibendes Rechteck (Bounding box)

Darstellung und Beschreibung

1. Große Halbachse: Gerade, welche die am weitesten entfernten Punkte der Objektberandung verbindet.

2. Kleine Halbachse: Zur großen Halbachse senkrechte kürzeste Gerade, so dass die Objektberandung im damit gebildeten Rechteck liegt.

3. Exzentrizität: Verhältnis von großer zu kleiner Halbachse

Page 55: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 55

Bildfolgen: statische Kamera Bewegte Kamera

Merkmale aus Bildfolgen

Zeit

Original

Aufgaben:•Detektion sich bewegender Objekte•Verfolgung sich bewegender Objekte•Objektklassifikation anhand Bewegungsmuster

Zeit

Aufgaben:•Eigenbewegungsschätzung•Detektion sich bewegender Objekte•Verfolgung sich bewegender Objekte•Objektklassifikation anhand Bewegungsmuster

Page 56: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 56

Merkmale aus Bildfolgen

Im Bildstapel ergeben

Statische Objektpunktesenkrechte Geraden

Sich bewegende Bildpunktegleichförmige Bewegung:

geneigte GeradenBeschleunigte Bewegung:

gekrümmte Kurven

Page 57: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 57

Merkmale aus Bildfolgen

Differenzbilder für statischen Hintergrund mitsich bewegenden Fahrzeugen

Dynamik eines Bildpunktes

Page 58: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 58

Bildfolgen: statische Kamera: Raum-Zeit-Kanten

Merkmale aus BildfolgenZeit

Flugzeug-Template

Raumkanten

Original

Raum-Zeit-Kanten

Raumkantenbild

Grauwertbild

Raum-Zeit-Kantenbild

Page 59: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 59

Bildfolgen: statische Kamera: Raum-Zeit-Kanten

Merkmale aus Bildfolgen

Interpretation einer BildfolgeGt1(x,y), Gt2(x,y), ..., GtN(x,y)

als dreidimensionales FeldG(x,y,t)

Raum-Zeit-Kantenz.B. durch3-D Sobel-Operator

Beispiel: Infrarotbildfolge (Luftbild) eines Ausschnitts der Meeresoberfläche

Page 60: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 60

Bildfolgen: statische Kamera: Bewegungssegmentierung

Differenzbildverfahren:

Merkmale aus Bildfolgen

01

1

-1

1

Empfindlich gegen

BeleuchtungsänderungRauschenPeriodische Vorgänge

Page 61: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 61

Bildfolgen: statische Kamera: Bewegungssegmentierung

Hintergrundschätzung:Betrachtung der Vergangenheit zur Modellierung des „Normalprozesses“Ein Pixel:

Merkmale aus Bildfolgen

g(t)

t

g(t)

t

g(t)

t

g(t)

t

g(t)

t

Ideal konstant Konstant mit Rauschen Einmaliges Ereignis

Langsame Veränderung Periodische Schwankung

Page 62: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 62

Konstant mit Rauschen

Bildfolgen: statische Kamera: Bewegungssegmentierung

Hintergrundschätzung:Betrachtung der Vergangenheit zur Modellierung des „Normalprozesses“Histogramm über M Bilder:

Merkmale aus Bildfolgen

H(g)

g

H(g)

g

H(g)

g

H(g)

g

H(g)

g

Ideal konstant Einmaliges Ereignis

Langsame Veränderung Periodische Schwankung

N

i

gg

i

iM

iie

h

NgH

1

2

1 22

2

1)(

ge

Änderung, wenn HM(g) < HSchwelle

Page 63: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 63

Bildfolgen: statische Kamera: Bewegungssegmentierung

Hintergrundschätzung: VorgehensweiseBetrachtung der Vergangenheit zur Modellierung des „Normalprozesses“Berechnung eines Bewegungssegment-Bildes (binär Bewegtobjekt-stat.

Hintergrund):Für jedes Pixel1. Histogramm über die M letzten Bilder2. Modellierung des Histogramms als Summe von Gaussfunktionen3. Aktueller Grauwert in Modell?

Ja: Eintrag als Hintergrund-Pixel (z.B. 0 für unverändert), Update ModellNein: Eintrag als Vordergrund-Pixel (z.B. 1 für verändert), Update Modell

Merkmale aus Bildfolgen

...

H(g)

g

H(g)

g

...

Letzte M Bilder aktuelles Bild

Histogramm für jedes Pixel

In Modell

In ModellBewegungssegment-Bild

Page 64: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 64

Bildfolgen: Kamera-BewegungsschätzungBildstabilisierung („Wackelkompensation“): Anwendung z. B.

Handycams

Annahmen: Translationen der Kamera vernachlässigbar, nur wenige sich in der Szene bewegende Objekte.Drehung der Kamera um Achsen des Bildsensors (Nick- und Gier-, kein Rollwinkel)

Merkmale aus Bildfolgen

Feste Szenengegenstände

Kamera-drehung

Bildsensor

Bild Bild

Verschiebung

Page 65: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 65

Bildfolgen: Kamera-BewegungsschätzungBildstabilisierung („Wackelkompensation“): Anwendung z. B.

Handycams

Vorgehen: 1. Schätzung der Translation: Lage des Kreuzkorrelationsmaximums zweier Frames2. Korrektur der Translation

Berechnung z.B. mittels FFT:

Merkmale aus Bildfolgen

*21

1 )},({)},({),( yxgFyxgFFyxKKF tt

... ...

xmaxymax

Lage des Maximums der Kreuzkorrelationsfunktion:xmax, ymax

Page 66: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 66

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen1. „Blockmatching“Vollständige Suche eines Bildausschnitts in einer Umgebung um

Ursprungsposition

Merkmale aus Bildfolgen

+

Bild zur Zeit t Bild zur Zeit t+

t

t+

Page 67: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 67

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen1. „Blockmatching“: Prinzip

Merkmale aus Bildfolgen

t t+ t+Ausschnitt aus Bild zur Zeit t:Template zur Suche imnächsten Bild

Suche im Bild zur Zeit t+:An welcher Stelle „passt“ dasTemplate am besten?Suche beschränkt auf Suchbereichum Templatepos. im Bild z. Zeit t.

Position im Bild zur Zeit t+, an derdas Template der Bildstruktur amÄhnlichsten ist.

Page 68: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 68

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen1. „Blockmatching“: Vorgehen

Merkmale aus Bildfolgen

• Messung der Ähnlichkeit eines Bildausschnitt B(t) von Bild zur Zeit t mit einem darunter liegenden Ausschnitt B(t+) gleicher Form und Größe von Bild zur Zeit t+. Ein Ähnlichkeitsmaß wird für eine Menge von Verschiebungen von B(t) gegenüber der Ursprungsposition berechnet.• Verschiebung, bei der die Ähnlichkeit maximal ist und einen Schwellwert überschreitet, gibt eine Schätzung für die Blockbewegung.• Ähnlichkeitsmaße: Euklidische Distanz (Unähnlichkeit) Kreuzkorrelation (Ähnlichkeit)

t t+

Page 69: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 69

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen1. „Blockmatching“: Ähnlichkeitsmaße

Merkmale aus Bildfolgen

i

i

j

j

ji

K

Km

K

KnnjminjmijiE tggjid 2

,, )(),,,(

i

i

j

j

i

i

j

j

ji

i

i

j

j

ji

K

Km

K

Kn

K

Km

K

Knnjminjmi

K

Km

K

Knnjminjmi

jiKK

tgtg

tgtg

jid2

,2

,

,,

)()(

)()(2

),,,(

-Ki, -Kj

-Ki, +Kj

+Ki, -Kj

+Ki, +Kj

Template „Block“

Verschiebungen i und j um Ursprungsposition i,j des Templates

Normierte Kreuzkorrelation:

Euklidischer Abstand:

i

i

j

j

ji

K

Km

K

KnnjminjmijiCB tggjid ,, )(),,,(

City-Block-Distanz:

Page 70: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 70

Bildfolgen: BewegungsschätzungOptischer Fluss

Grundsätzliche Annahme:

Jedes Pixel zur Zeit t+1 einer Bildsequenz kann modelliert werden als ein Pixel zur Zeit t, das um einen Vektor (x, y)T verschoben wurde: Konstanz der Beleuchtung.

Optischer Fluss: Finde ein Vektorfeld (x(x,y), y(x,y))T, das die opt. Fluss Gleichung löst.

Problem: UnterbestimmtheitBetrachte Grauwertbild mit 8 Bit Dynamik und 512x512 Pixel: Durchschnittlich 1024 Pixel/Grauwert.

Zusätzliche Einschränkungen nötig:1. Glattheit des Flussfeldes2. Kleine Flussvektoren

Merkmale aus Bildfolgen

)),,(),,(()1,,( tyxyyyxxxFtyxF

Page 71: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 71

Bildfolgen: BewegungsschätzungOptischer Fluss

Zusätzliche Einschränkungen:1. Glattheit des Flussfeldes2. Kleine Flussvektoren

Dann Entwicklung der opt. Fluss Gleichung in Taylor-Reihe und Vernachlässigung quadratischer und höherer Glieder:

Lokale Gleichung erster Ordnung „optical flow constraint equation“Nicht an jedem Punkt lösbar, da zwei Unbekannte.Nimm gleiche Flussvektoren in kleiner Umgebung um Punkt (x,y) an (Glattheitsannahme) überbestimmtes Gleichungssystem

Einschränkung: x und y klein genug für Abbruch der Taylor-Reihe.Abhängig von Bildinhalt, gewährleistet nur bei kleiner ein Pixel.

Merkmale aus Bildfolgen

),(),(),(),(),( yxy

Fyxyyx

x

Fyxxyx

t

F

x

g

t t+t

x

gg(x0,t)

g(x0,t+t)

x0

dx

dgxmxg

Page 72: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 72

Bildfolgen: BewegungsschätzungOptischer Fluss

Merkmale aus Bildfolgen

ty

tx

y

x

yyx

yxx

yxRyxtyx

tyyxx

yyxxt

FF

FF

FFF

FFF

yxyxRFFF

yx

FFF

FFF

yxy

Fyxyyx

x

Fyxxyx

t

F

DD

,v

vv,WmitvW

:ergibtsetzenNullvundvnachEvonAbleitung

).,(umRegion:),(mitvvE

sFehlertermdesgMinimierundurch),(Punktanv

vvvonBestimmung

0vvequationconstraintflowoptical

vvbweiseKurzschreiinoder

),(),(),(),(),(

2

2

yx

0000),(),(

2yx

y

x

00

Page 73: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 73

Bildfolgen: BewegungsschätzungOptischer Fluss

Merkmale aus Bildfolgen

0.vPunkt dieseman setze und Null als betrachte ,1Wenn

.,nach , Sortiere

:Maßnahme

kt.unbeschrängkeit Geschwindi Null n)(Gradiente von Elemente alle sinddann ,0Wenn

undsingulär ist dann ,0Wenn

und ergibt Einsetzen

:0,wenn

, nEigenwertedenmitundren EigenvektodieinLösungdergEntwicklun

.Eigenwertenegativenichtreelledefinit,semipositivundhsymmetriscistWMatrix

,v

vv,WmitvW

max

maxmin21

1

2222

2

22

1

11

221121

2121

2

2

D

D

DD

D

DD

W

W

WW

v

FF

FF

FFF

FFF

T

TT

ty

tx

y

x

yyx

yxx

Page 74: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 74

Bildfolgen: BewegungsschätzungOptischer Fluss

Berechnungsvorschrift

Merkmale aus Bildfolgen

),(),(2

1),(

)1,()1,(2

1),(

),1(),1(2

1),(

:nDifferenze zentrale als tung Zeitableiund Gradienten

.100: Bedingungfür WahlMögliche

:ichkeitenerungsmöglImplementi

10

00

00

00

minmaxminmax

minmax

max

2211

maxmax

yxFyxFyxF

yxFyxFyxF

yxFyxFyxF

sonst

für

für

v

ttttt

tty

ttx

Page 75: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 75

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen2. Verfolgung von Monotonie-Operator-Blobs

Betrachte das „Grauwertgebirge“ eines Bildes:„Kuppen“ und „Senken“ sind stabile Merkmale von ObjektenQuadratische Formen: Zweite Ableitung konstant in Nähe Kuppe bzw.

Senke

Merkmale aus Bildfolgen

Page 76: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 76

Bildfolgen: Bewegungsschätzung

Verfolgung von Merkmalen2. Verfolgung von Monotonie-Operator-Blobs

Am Boden einer Senke bzw. an der Decke einer Kuppe ist die dritte Ableitung klein.

Merkmale aus Bildfolgen

Page 77: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 77

Bildfolgen: Flussvektor-Schätzer nach Lukas und KanadeErmittlung der Verschiebung eines kleinen Blocks an Position x,y in Bild zur Zeit t2

gegenüber Bild zur Zeit t1: dx, dy

Merkmale aus Bildfolgen

Blockyx

yxyx dydxIyxIddE,

221 ,,,

Blockyx

yxyx

yx

yx

dydxIdydxIyxI

yx

ddE

,

221

,,,2

,

yxyx d

y

yxId

x

yxIyxIdydxI

,,,, 22

22

Page 78: Computer Vision4_Seite 1 Erste Stufe der Informationsgewinnung Interpretationszyklus für Einzelbilder Zuordnung von Modellausprägungen zu Bilddaten Generische

Computer Vision

4_Seite 78

Bildfolgen: Flussvektor-Schätzer nach Lukas und KanadeErmittlung der Verschiebung eines kleinen Blocks an Position x,y in Bild zur Zeit t2

gegenüber Bild zur Zeit t1: dx, dy

Merkmale aus Bildfolgen

BlockyxyxId

dyxIyxI

BlockyxyxIyxIdy

yxId

x

yxI

Blockyxdy

yxId

x

yxIyxIyxI

BlockyxdydxIyxIyx

ddE

ty

xyx

yx

yx

yxyx

,),(),(),(

,),(),(),(),(

,0),(),(

),(),(

,0),(),(0),(

1222

2221

21