15
Name des Vortragenden Slide 1 Datum Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität München Julian Kolarz, Florian Wirth, Michael Spitzer

Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 1Datum

Hauptseminar:Data Science 2016Ludwig-Maximilians-Universität München

Julian Kolarz, Florian Wirth, Michael Spitzer

Page 2: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 2Datum

– Hashtags:– Abgeschlossene Informationseinheit

– Durch User vergeben

– Geodaten:

– Ursprung

– Lokale Verbreitung

– Raum-zeitliche Dynamik

=> Visualisierung auf einer Karte

Page 3: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 3Datum

Pre-processing

Page 4: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 4Datum

Auswahl betrachteterHashtags über Heuristik:

– Unregelmäßige Ereignisse VSgleichmäßiges Rauschen

– Ermittlung über Varianz in derAnzahl von Tweets pro Tag

Page 5: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 5Datum

Visualisierung

Page 6: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 6Datum

Visualisierung

Features:

– ClusterMap– HeatMap– verschiedene Kartenstyles– Time-Slider– Zeit-Graphen– Fullscreen-Modus– …

Problem:- sehr große Menge an Geo-Daten (200k +) auf einer interaktiven Karte zu visualisieren

Page 7: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 7Datum

Visualisierung

Page 8: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 8Datum

Live-Betrieb

Page 9: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 9Datum

Live-Betrieb

Use-Case #1: Use-Case #2:

Page 10: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 10Datum

Live-Betrieb

Use-Case #1:Nachträgliche Analyse vergangener Daten

– Verwendung der REST API oder eigenem Datensatz– Filtern nach gewünschtem Hashtag– Speichern und Weiterverarbeiten der Daten

Probleme:– Geringe Speicherdauer der Tweets– Gespeicherte Tweets sind vorselektiert– Limitierte Anzahl an Queries

Page 11: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 11Datum

Live-Betrieb

Use-Case #2:Aufzeichnung kommender Tweets

– Verwendung der Streaming API– Filtern nach gewünschtem Hashtag– Speichern und Weiterverarbeiten der Daten

Problem:– Hardware / Skript muss kontinuierlich aktiv sein

Page 12: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 12Datum

Future Work

Page 13: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 13Datum

Future Work

– Implementierung Live-Betrieb

– Hinzufügen neuer Features (Sentiment-Analysis, …)

– …

Page 14: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 14Datum

Live-Demohttp://www.cip.ifi.lmu.de/~kolarz/demo.html

Page 15: Hauptseminar: Data Science 2016 Ludwig-Maximilians …kolarz/downloads/Presentation.pdf · 2016. 7. 7. · Name des Vortragenden Datum Slide 1 Hauptseminar: Data Science 2016 Ludwig-Maximilians-Universität

Name des Vortragenden Slide 15Datum

Happy Hunting