24
Self Organizing Tree Algorithm Bastian Jarzembinski Enrico Bade Tobias Aagard

Self Organizing Tree Algorithm

  • Upload
    maxine

  • View
    126

  • Download
    4

Embed Size (px)

DESCRIPTION

Self Organizing Tree Algorithm. Bastian Jarzembinski Enrico Bade Tobias Aagard. Gliederung. Theorie Hintergrund Lernverfahren Experimente Attributskalierung Wachstumssteuerung Bewertung Vergleich mit anderen Verfahren Einsatz. Theorie. Hintergrund Lernverfahren. - PowerPoint PPT Presentation

Citation preview

Page 1: Self Organizing Tree Algorithm

Self Organizing Tree Algorithm

Bastian JarzembinskiEnrico Bade

Tobias Aagard

Page 2: Self Organizing Tree Algorithm

2

Gliederung

Theorie Hintergrund Lernverfahren

Experimente Attributskalierung Wachstumssteuerung

Bewertung Vergleich mit anderen Verfahren Einsatz

Page 3: Self Organizing Tree Algorithm

3

Theorie Hintergrund Lernverfahren

Page 4: Self Organizing Tree Algorithm

4

Theorie Hintergrund

Bioinformatik Microarrays

Ähnliches Aussehen = Ähnliche Funktion?

Page 5: Self Organizing Tree Algorithm

5

Theorie Lernverfahren

n-dimensionale Vektoren mit metrischen Attributen

Knoten bilden Clusterzentren Knoten mit größter Varianz wird geteilt

Page 6: Self Organizing Tree Algorithm

6

Theorie Lernverfahren

Inputvektor

Repräsentant

Distanz

Lernrate

Fehler

Page 7: Self Organizing Tree Algorithm

7

Theorie LernverfahrenWurzel

Blatt

Zuordnung

Page 8: Self Organizing Tree Algorithm

8

Theorie Lernverfahren

Ressource /mittlere Abweichung

Variability /Spannweite

Page 9: Self Organizing Tree Algorithm

9

Theorie Lernverfahren

Page 10: Self Organizing Tree Algorithm

10

Theorie Lernverfahren

?

Page 11: Self Organizing Tree Algorithm

11

Theorie Lernverfahren

Ancestor / Vorfahre

Sister / Schwester

Page 12: Self Organizing Tree Algorithm

12

Experimente Attributskalierung Fallbeispiel

Page 13: Self Organizing Tree Algorithm

Experimente Attributskalierung Parameter in KNIME können das

zyklisches Wachsen des Treesbeeinflussen: Lerningrates min. variablity und min. ressource

nur bei „Use variablity“ berücksichtigt

min. Error Distance: Euclid. Oder Cosinus

Clustern ohne Zielattribut

Page 14: Self Organizing Tree Algorithm

Experimente Fallbeispiel IRIS-Datenset

4 Attribute, metrisch skaliert Zielattribut mit 3 Klassen LIVE DEMO

Quantitativer Vergleich zu Klassifikationsalgorithmen i.d.F. k-Means Keine signifikanten Unterschiede

Anwendung des SOTA auf Daten mit und ohne Zielattribut Keine signifikanten Unterschiede

Page 15: Self Organizing Tree Algorithm

15

Bewertung Vergleich mit anderen Verfahren Einsatz

Page 16: Self Organizing Tree Algorithm

16

Bewertung Vergleich mit anderen Verfahren Eigenschaften k-Means

Wenige Iterationen Einfaches Verfahren Anfällig für Rauschen / Ausreißer Ergebnis von initialen Zerlegung abhängig

Page 17: Self Organizing Tree Algorithm

17

Bewertung Vergleich mit anderen Verfahren Eigenschaften k-Means

Wenige Iterationen Einfaches Verfahren Anfällig für Rauschen / Ausreißer Ergebnis von initialen Zerlegung abhängig

Annähernd lineares LaufzeitverhaltenPunkt für k-Means

ResistentUnabhängig

Eigenschaften SOTA

Page 18: Self Organizing Tree Algorithm

18

Bewertung Vergleich mit anderen Verfahren

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Page 19: Self Organizing Tree Algorithm

19

Hierarchisches Clustern

Divisiv oder agglomerativ

Knoten sind einfache Darstellung der Teilmengen

Zwischenschritte sind irreversibel

Bewertung Vergleich mit anderen Verfahren

Divisives Verfahren

Knoten sind Mittelwerte sämtlicher folgenden Knoten

Zuordnung wird ständig angepasst

Eigenschaften SOTA

Page 20: Self Organizing Tree Algorithm

20

Bewertung Vergleich mit anderen Verfahren Self Organizing Map (Kohonen Map)

Ähnliches Verfahren, aber andere Topologie SOM: vorgegebenes Netz, wird bestmöglich an den

Eingaberaum angepasst SOTA: wächst dynamisch, um den Eingaberaum

bestmöglich darzustellen; Hierarchie vorhanden

Page 21: Self Organizing Tree Algorithm

21

Bewertung Einsatz

Methodisch vielversprechend Erfolge nicht reproduzierbar Mögliche Ursachen

Ungeeignete Daten Ungeeignete Parameterjustierung Mangelndes (Aufgaben-)Verständnis

Weitere Untersuchung Hintergrundwissen Bioinformatik Microarray-Datensätze wählen

Page 22: Self Organizing Tree Algorithm

22

Fin

Page 23: Self Organizing Tree Algorithm

23

Theorie Hintergrund

Page 24: Self Organizing Tree Algorithm

24

Theorie Hintergrund