17
Vortrag zum Thema: Entwicklung und Implementierung von Algorithmen zur maschinengestützten Erkennung von manipulierten Bilddateien auf der Basis von Merkmalsvektoren Fakultät 1 – Engineering 11.04.2014 Martin Rojak

Vortrag zum Thema - rojakSchlussfolgerung •Die Anwendung robuster Hash-Werte ist eine wirksame Ergänzung bei der Untersuchung affiner Bilddateien •Sie ist auf einen bestimmten

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Vortrag zum Thema:

Entwicklung und Implementierung von Algorithmen zur maschinengestützten

Erkennung von manipulierten Bilddateien auf der Basis von Merkmalsvektoren

Fakultät 1 – Engineering

11.04.2014 Martin Rojak

Agenda

Theorie

• Motivation

• Aufgabenstellung

• Vorstellung der Algorithmen

• Einordnung ihrer Leistungsfähigkeit

• Schlussfolgerung

Praxis (optional)

• Vorführung „forpix“

11.04.2014 2

Motivation

• Erkennen bekannter Bilddateien anhand kryptologischer Hash-Werte (MD5, SHA-1, …)

• In der KTU: Automatisiertes erkennen durch weiße oder schwarze Listen

11.04.2014 3

MD5: 3336aa6775ddce28d0b22d6967df455d

Motivation

• Kryptologische Hash-Werte werden bei minimaler Bildmanipulation wirkungslos

11.04.2014 4

MD5: 3336aa6775ddce28d0b22d6967df455d MD5: 95de3920d70da65252a3742132ffaf11

affin

Aufgabenstellung

• Erkennen affiner Bilddateien mit vergleichbarer Handhabung

• Entwurf von Algorithmen zur Erstellung von robusten Hash-Werten

• Messen der graduellen Distanz zwischen Bilddateien

• Umsetzung der Algorithmen in Software zur Anwendung in der Kriminaltechnik

11.04.2014 5

Algorithmen Anforderungen

• Verarbeitung spezieller Bildmerkmalen, die trotz Manipulation nicht gänzlich verändert werden

• Bildmerkmale müssen robust gegenüber definierte Manipulationen sein: Konvertierung, Kompression, Rotation, Skalierung, Überlagerung, Zuschnitt

11.04.2014 6

Algorithmen Gliederung

Struktur der Algorithmen

1. Allgemeines Herabsetzen der Genauigkeit darstellbarer Inhalte

2. Feststellen und spezielles Herabsetzen der Genauigkeit eines bestimmten Bildmerkmals

3. Erstellen eines Hash-Wertes

4. Distanzberechnung

11.04.2014 7

Algorithmen Bildmerkmale

• Gradientenfeld (Konvertierung, Kompression,Skalierung, Überlagerung)

• Histogramm (Rotation)

• DCT-Koeffizientenmatrix (Zuschnitt)

11.04.2014 8

0 1 2 3

0

1

2

3

𝐴 =

𝑎1 1 𝑎1 2

𝑎2 1 𝑎2 2

⋯ 𝑎1 32

⋯ 𝑎2 32

⋮ ⋮𝑎32 1 𝑎32 2

⋱𝑎32 32

Algorithmen

Gradient-Hash

• Bildskalierung

• Umwandlung in Graustufen

• Gradientenberechnung

• Extrahieren des Merkmalsvektors

• Codierung

• Homogene Distanzberechnung

Histogramm-Hash

• Bildskalierung

• Umwandlung in Graustufen

• Erstellung des Histogramms

• Extrahieren des Merkmalsvektors

• Codierung

• Homogene Distanzberechnung

11.04.2014 9

Algorithmen

DCT-Hash

• Bildskalierung

• Umwandlung in Graustufen

• Berechnen der Koeffizientenmatrix der Diskrete Cosinus-Transformation

• Reduzierung der Koeffizientenmatrix

• Codierung

• Heterogene Distanzberechnung

11.04.2014 10

Algorithmen Distanzberechnung

Beispiel

11.04.2014 11

Bild a) Bild b)

Einordnung der Leistungsfähigkeit

• Anhand des Beurteilungsverfahrens biometrischer Identifizierungssysteme

11.04.2014 12

Einordnung der Leistungsfähigkeit

• Adaption des Identifizierungssystems

11.04.2014 13

zuge-schnitten

über-lagert

skaliert

rotiert

daten-reduziert

1.440 Bilder

Datenbank45.333 Bilder

dateiformat-konvertiert

unbekannt

Einordnung der Leistungsfähigkeit

• Klassifizierungsmatrix der Hash-Algorithmen nach Eignung

11.04.2014 14

Schlussfolgerung

• Die Anwendung robuster Hash-Werte ist eine wirksame Ergänzung bei der Untersuchung affiner Bilddateien

• Sie ist auf einen bestimmten Dateityp beschränkt

• Das Ergebnis aus einem Vergleich muss inhaltlich stets von einem Menschen kontrolliert werden

11.04.2014 15

Praxis

• Vorführung des Programms forpix

11.04.2014 16

http://rojak.de/le/forpix.php

11.04.2014 17