Upload
poldi-zenk
View
105
Download
1
Embed Size (px)
Citation preview
1Dipl.-Ing.(FH) Oliver Schulte
In Kooperation mit
Thema :Objektorientierte Realisierung eines Programms zur Erkennung von Vogelstimmen
mit Hilfe Neuronaler Netze
Dipl.-Ing. (FH) Oliver Schulte
2Dipl.-Ing.(FH) Oliver Schulte
Gliederung
• Aufgabenstellung der Diplomarbeit
• Projekteinteilung
• Anwendung
• Ausblick
• Vorverarbeitung
• Modellierung der Klassifikation
• Nachverarbeitung
3Dipl.-Ing.(FH) Oliver Schulte
Aufgabenstellung
• Erstellung eines Programmes zur Erkennung von Vogelstimmen
• Zu verwendende Mittel
• Datenbasis
• Erstellung des Programmes in C++ mit Hilfe von UML
• Fouriertransformation zur Signalanalyse
• MultiLayerPerzeptron (mit Feedforward-Algorithmus)
• Rufe von 62 verschiedenen Vogelarten in 321 Dateien mit 44,1KHz Samplerate
4Dipl.-Ing.(FH) Oliver Schulte
Projekteinteilung
• Vorverarbeitung
• Klassifikation der extrahierten Merkmale
• Nachverarbeitung
• Extraktion markanter Merkmale• Frequenzanalyse mit gefensterter Fouriertransformation
• Formatieren der Merkmale als Eingangsdaten• Prognose durch das MLP
• Aufbereitung der Ausgangsdaten des MLP• Ermittelung der Vogelart
5Dipl.-Ing.(FH) Oliver Schulte
Vorverarbeitung
• Fragestellungen • Beschreibung repräsentativer Merkmale
• Triggerung der Analyse
• Nur 4 Datensätze pro Vogelart
6Dipl.-Ing.(FH) Oliver Schulte
Vorverarbeitung
• Einteilung der Rufe in Worte
• Ermöglicht die Triggerung der Datenanalyse• Erhöhung der Anzahl der Datensätze
7Dipl.-Ing.(FH) Oliver Schulte
Vorverarbeitung
• Bei Überschreitung der Triggerschwelle im Zeitbereich wird die Analyse gestartet
8Dipl.-Ing.(FH) Oliver Schulte
Vorverarbeitung
• Der Verlauf der Frequenzmaxima ist charakteristisch für die einzelnen Worte
9Dipl.-Ing.(FH) Oliver Schulte
Vorverarbeitung
• Merkmalsextraktion
• Einteilung der Worte in 10 Abschnitte• Ermittelung der lokalen Frequenzmaxima
10Dipl.-Ing.(FH) Oliver Schulte
Klassifikation
• Klassifikation
• Eingangsvektor
• Ausgangsvektor
• 2 Maxima pro Wortteil• 20 Mittelwerte aus dem Zeitbereich• Länge des Wortes in Sample
• MLP mit 41 Eingängen und 115 Ausgängen
• Trainiert unter Verwendung von NN-Tool(Feedforward-Algorithmus)
• Einen Ausgang für jedes der 115 Worte
11Dipl.-Ing.(FH) Oliver Schulte
Klassifikation
• Netzstruktur
• 11600 Datensätze(80% Lernset, 20% Testset)
• Datenmatrix von 11600 x (41+115) Zahlenwerten
• Durchschnittlich 20 Neuronen pro Ausgang
• Ca. (41 x 20) + (115 x 20) Werte
• Datenbasis
12Dipl.-Ing.(FH) Oliver Schulte
Nachverarbeitung
• Auswerten des Prognosevektors
• Ermitteln der Vogelart• Zuordnung der prognostizierten Worte zur Vogelart• Ermittelung des Vogels aus der Häufigkeit des Vorkommens
• Ermitteln des Wortes mit dem höchsten Prognoseergebnis• Verifizieren des Ergebnisses mit Hilfe der Wortlänge
13Dipl.-Ing.(FH) Oliver Schulte
Anwendung
• Oberfläche der erstellten Anwendung
14Dipl.-Ing.(FH) Oliver Schulte
Ausblick
• Vorverarbeitung
• Nachverarbeitung• Verwendung von Kontextwissen (Region, Zeit,…)• Erweiterung der Vogelarterkennung
• Multiskalenmethoden zur Signalanalyse• Berücksichtigung der Maximaformen• Einbeziehung der Maximawerte
• Klassifikation• Untersuchung weiterer Netztopologien/ Klassifikationsalgorithmen
15Dipl.-Ing.(FH) Oliver Schulte
In Kooperation mit
Ich danke Ihnen für Ihre Aufmerksamkeit!