Gesichtserkennung mit SVD

Preview:

Citation preview

Gesichtserkennung mit Hilfe von

SVD/SDD und Tensoren

Marc Simon, INF07

Gliederung

1. Wiederholung relevanter Gebiete

2. Begriff der Ähnlichkeit

3. Einsatz von SVD

4. Circular Hough Transformation (CHT)

Definition Tensor

Der Tensor ist ein mathematisches Objekt aus

der Algebra und Differentialgeometrie. Ein

Tensor ist eine multilineare Abbildung,

also eine Abbildung, welche in jeder

Variablen linear ist. Anschaulich, aber

mathematisch unpräzise, kann man sich den

Tensor als eine mehrdimensionale Matrix

vorstellen.

Definition SVD

Die Singulärwertzerlegung (Singular Value

Decomposition) einer Matrix bezeichnet

deren Darstellung als Produkt dreier

spezieller Matrizen. Daraus kann man die

Singulärwerte der Matrix ablesen. Diese

charakterisieren, ähnlich den Eigenwerten,

Eigenschaften der Matrix. Singulärwerte

lassen sich für jede (auch nichtquadratische)

Matrix bestimmen

Zerlegung in Singulärwerte

• A=UΣV*

• wobei

– U unitäre m×m-Matrix

– Σ m×n-Diagonalmatrix

– V* adjungierte Matrix von V

– V unitäre n×n-Matrix

Besonderheiten bei SDD

• Semi Discrete Decomposition (SDD)

funktioniert grundlegend ähnlich wie die

SVD

• Einschränkung: Matrizen U und V* dürfen

nur die Einträge {-1;0;1} enthalten

Was ist Ähnlichkeit?

Was ist Ähnlichkeit?

• Software wird programmiert, bestimmte

Muster zu vergleichen

• Hier kann z. B. Haarfarbe,

Gesichtssymmetrie, Augenfarbe, etc…

genommen werden

• Wie erhalte ich eine zuverlässige

Erkennung, wenn der Kopf nicht gerade ist?

Wo kann SVD helfen?

• SVD zerlegt eine Matrix in gewichtete,

geordnete und unterscheidbare Matrizen

• Bei der Bildverarbeitung können so

einzelne Aspekte hervorgehoben oder

vertuscht werden

• Einsatz vor allem in biologischen System,

beispielsweise beim Gabor Filter

Gabor Filter

• Filter, um Kanten oder Texturen in einem

Bild zu verdeutlichen

• Ähnlich dem menschlichen Seh-System

• Wird auch eingesetzt zur

Handschriftenerkennung, Iris-Erkennung

und beim Fingerprint

• Siehe GaborFilter.html und Videos

Gabor Filter - mathematisch

Circular Hough Transformation

• Nach der Eck-Bestimmung im Ursprungsbild wird

im Zielbild um jeden Eckpunkt ein Kreis mit

gewünschtem Radius gezeichnet

Bresenham‘s Algorithmus

• Algorithmus zum Zeichnen von Kreisen

und Geraden auf Rasteranzeigen

• Besonderheit: Minimiert Rundungsfehler,

die durch Diskretisierung kontinuierlicher

Werte entstehen

Erkennungs-Algorithmus

1. Für gegebenes Grauwertbild Kanten bestimmen

2. Ermitteln der großen und kleinen Eigenwerte für

die Kovarianz-Matrix des Kanten-Bildes

3. Das Verhältnis von großen zu kleinen

Eigenwerten für verschiedene Winkel ermitteln

4. Die größte und kleinste Achsenlänge aus den

Eigenwerten bestimmen

Erkennungs-Algorithmus

5. CHT ausführen, um das Zentrum der

Ellipse zu bestimmen

6. Ausrechnen der Begrenzungspunkte der

Ellipse mit Bresenham‘s Raster Scan-

Algorithmus

7. Den Inhalt der Ellipse aus dem Bild

ausschneiden

Erkennung bei gedrehtem Kopf

Gesichtserkennung bei Rauschen

Zusammenfassung

• 2 Möglichkeiten Gesichter zu erkennen:

– Über Gesichtsmetriken

– Durch elliptisches Ausschneiden des Gesichts

und Vergleich

• Erkennung funktioniert noch nicht 100%

sicher, aber selbst bei Rauschen bis 60%

sehr zuverlässig

Recommended