6
Data Mining Cup 2012 Projektvorstellung Team DataMineCraft Data Mining / Wissensextraktion Fakultät für Ingenieurwissenschaften Karsten Diepelt Ramona Goesch Hannes Wiencke

Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

  • Upload
    chuck

  • View
    54

  • Download
    3

Embed Size (px)

DESCRIPTION

Data Mining / Wissensextraktion. Data Mining Cup 2012 Projektvorstellung Team DataMineCraft. Fakultät für Ingenieurwissenschaften Karsten Diepelt Ramona Goesch Hannes Wiencke. 2. Gliederung. Vorgehensweise Angewendete Modelle/Algorithmen Ergebnisse. 3. 1. Vorgehensweise. - PowerPoint PPT Presentation

Citation preview

Page 1: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012

Projektvorstellung Team DataMineCraft

Data Mining / Wissensextraktion

Fakultät für Ingenieurwissenschaften

Karsten DiepeltRamona GoeschHannes Wiencke

Page 2: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012 – Projekt von Diepelt, Goesch, Wiencke 2

Gliederung

1. Vorgehensweise

1. Angewendete Modelle/Algorithmen

1. Ergebnisse

Page 3: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012 – Projekt von Diepelt, Goesch, Wiencke 3

1. Vorgehensweise

a) Datenvisualisierung (Verteilung der Verkaufszahlen)

a) Entwicklung erster Testworkflow (PNN DDA) in Knime (insb. zur Fehlerauswertung) ca. 1200 eukl. Fehlerpunkte

a) Nach genauerer Analyse der Trainingsdaten → Aufteilung in Cluster → erhebliche Verbesserung

a) Anwendung verschiedener Modelle/Algorithmen auf Cluster

a) Ergebnisoptimierung anhand verschiedener Clusterparameter

Page 4: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012 – Projekt von Diepelt, Goesch, Wiencke 4

2. Angewendete Modelle/Algorithmen

a) Neuronales Netz (PNN DDA)

a) Entscheidungsbaum

a) Lineare Regression

a) SVM

a) Bayes

Page 5: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012 – Projekt von Diepelt, Goesch, Wiencke 5

3. Ergebnisse

PNN:

7 Cluster (Mittelwert, Summe, std. Abweichung) → 614

8 Cluster (Varianz, 300 Iterationen) → 617

4 Cluster (Mittelwert, Summe, std. Abweichung) → 654

Lineare Regression:

8 Cluster (Mittelwert, Summe, std. Abweichung) → 510

8 Cluster (Mittelwert, std. Abweichung) → 513

3 Cluster (Mittelwert, std. Abweichung) → 526

Page 6: Data Mining Cup 2012 Projektvorstellung Team DataMineCraft

Data Mining Cup 2012 – Projekt von Diepelt, Goesch, Wiencke 6

Danke!