1 Dipl.-Ing.(FH) Oliver Schulte In Kooperation mit Thema : Objektorientierte Realisierung eines...

Preview:

Citation preview

1Dipl.-Ing.(FH) Oliver Schulte

In Kooperation mit

Thema :Objektorientierte Realisierung eines Programms zur Erkennung von Vogelstimmen

mit Hilfe Neuronaler Netze

Dipl.-Ing. (FH) Oliver Schulte

2Dipl.-Ing.(FH) Oliver Schulte

Gliederung

• Aufgabenstellung der Diplomarbeit

• Projekteinteilung

• Anwendung

• Ausblick

• Vorverarbeitung

• Modellierung der Klassifikation

• Nachverarbeitung

3Dipl.-Ing.(FH) Oliver Schulte

Aufgabenstellung

• Erstellung eines Programmes zur Erkennung von Vogelstimmen

• Zu verwendende Mittel

• Datenbasis

• Erstellung des Programmes in C++ mit Hilfe von UML

• Fouriertransformation zur Signalanalyse

• MultiLayerPerzeptron (mit Feedforward-Algorithmus)

• Rufe von 62 verschiedenen Vogelarten in 321 Dateien mit 44,1KHz Samplerate

4Dipl.-Ing.(FH) Oliver Schulte

Projekteinteilung

• Vorverarbeitung

• Klassifikation der extrahierten Merkmale

• Nachverarbeitung

• Extraktion markanter Merkmale• Frequenzanalyse mit gefensterter Fouriertransformation

• Formatieren der Merkmale als Eingangsdaten• Prognose durch das MLP

• Aufbereitung der Ausgangsdaten des MLP• Ermittelung der Vogelart

5Dipl.-Ing.(FH) Oliver Schulte

Vorverarbeitung

• Fragestellungen • Beschreibung repräsentativer Merkmale

• Triggerung der Analyse

• Nur 4 Datensätze pro Vogelart

6Dipl.-Ing.(FH) Oliver Schulte

Vorverarbeitung

• Einteilung der Rufe in Worte

• Ermöglicht die Triggerung der Datenanalyse• Erhöhung der Anzahl der Datensätze

7Dipl.-Ing.(FH) Oliver Schulte

Vorverarbeitung

• Bei Überschreitung der Triggerschwelle im Zeitbereich wird die Analyse gestartet

8Dipl.-Ing.(FH) Oliver Schulte

Vorverarbeitung

• Der Verlauf der Frequenzmaxima ist charakteristisch für die einzelnen Worte

9Dipl.-Ing.(FH) Oliver Schulte

Vorverarbeitung

• Merkmalsextraktion

• Einteilung der Worte in 10 Abschnitte• Ermittelung der lokalen Frequenzmaxima

10Dipl.-Ing.(FH) Oliver Schulte

Klassifikation

• Klassifikation

• Eingangsvektor

• Ausgangsvektor

• 2 Maxima pro Wortteil• 20 Mittelwerte aus dem Zeitbereich• Länge des Wortes in Sample

• MLP mit 41 Eingängen und 115 Ausgängen

• Trainiert unter Verwendung von NN-Tool(Feedforward-Algorithmus)

• Einen Ausgang für jedes der 115 Worte

11Dipl.-Ing.(FH) Oliver Schulte

Klassifikation

• Netzstruktur

• 11600 Datensätze(80% Lernset, 20% Testset)

• Datenmatrix von 11600 x (41+115) Zahlenwerten

• Durchschnittlich 20 Neuronen pro Ausgang

• Ca. (41 x 20) + (115 x 20) Werte

• Datenbasis

12Dipl.-Ing.(FH) Oliver Schulte

Nachverarbeitung

• Auswerten des Prognosevektors

• Ermitteln der Vogelart• Zuordnung der prognostizierten Worte zur Vogelart• Ermittelung des Vogels aus der Häufigkeit des Vorkommens

• Ermitteln des Wortes mit dem höchsten Prognoseergebnis• Verifizieren des Ergebnisses mit Hilfe der Wortlänge

13Dipl.-Ing.(FH) Oliver Schulte

Anwendung

• Oberfläche der erstellten Anwendung

14Dipl.-Ing.(FH) Oliver Schulte

Ausblick

• Vorverarbeitung

• Nachverarbeitung• Verwendung von Kontextwissen (Region, Zeit,…)• Erweiterung der Vogelarterkennung

• Multiskalenmethoden zur Signalanalyse• Berücksichtigung der Maximaformen• Einbeziehung der Maximawerte

• Klassifikation• Untersuchung weiterer Netztopologien/ Klassifikationsalgorithmen

15Dipl.-Ing.(FH) Oliver Schulte

In Kooperation mit

Ich danke Ihnen für Ihre Aufmerksamkeit!

Recommended