Datenprodukte für Deutschlands größten Fahrzeugmarkt
Vortrag beim BITKOM Big Data Summit
am 16. Februar 2017 in Hanau
2
Was darf dieses Auto kosten?
Quelle: mobile.de
3
Vortragende
Benjamin Eckart
Manager Software DevelopmentTrust & Safety
mobile.de
Dr. Christoph Tempich
Head of Consulting
inovex GmbH
4
MOBILE.DEDEUTSCHER MARKTFÜHRER
13,53 MIO UNIQUE USER IM MONAT
1,4 MIO FAHRZEUGE
65%TRAFFIC ÜBER MOBILE ENDGERÄTE
5
290MITARBEITER
DREILINDEN / FRIEDRICHSHAIN BERLINFIRMENSITZ
GEBRAUCHTWAGEN
NEUWAGEN
ADVERTISING
WICHTIGSTEGESCHÄFTSELDER
inovex ist ein IT-Projekthaus für die Digitale Transformation:
‣ Agile Development & Management
‣ Web · UI/UX · Replatforming · Microservices
‣ Mobile · Apps · Smart Devices · Robotics
‣ Big Data & Business Intelligence Platforms
‣ Data Science · Data Products · Search · Deep Learning
‣ Data Center Automation · DevOps · Cloud · Hosting
‣ Trainings & Coachings
Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.
inovex gibt es in Karlsruhe · Pforzheim · München · Köln · Hamburg. Und natürlich unter www.inovex.de
7
Agenda
Fragestellungen bei mobile.de
Vorgehen
Ergebnisse
Ausblick
8
Fragestellungen und Vorgehen
9
Fragestellungen
Welche Infrastruktur ist geeignet?
Wie ist das Datenprodukt-Management
organisiert?
Welche Strategie verfolgen wir mit
Datenprodukten?
Welche Datenprodukte haben einen Mehrwert?
Welche Datenprodukte können wir wann
umsetzen?
Wie findet ein datengetriebener Ansatz Einzug in
die Produktentwicklung?
Datenstrategie Datenprodukte
10
Ziele
Verkürzung der Cycle Times
Jedes Produkt wird A/B-getestet
Jeder Cycle trägt zur Erkenntnis bei
Fokus im Projektverlauf
1. Build: Aufbau der Basis Infrastruktur, Datenintegration
2. Measure: Richtige Zielgrößen für den A/B-Test
3. Idea: die richtigen Datenprodukte
Lean Startup*
IDEA
BUILD
PRODUCT
MEASURE
DATA
LEARN
MVP
* Eric Ries – The Lean Startup
Vorgehen
11
Ergebnisse
12
Architektur-Überblick
Datenschutzkonforme Datenspeicherung innerhalb der EU
Integration zahlreicher Datenquellen
Gelöste Herausforderungen Aktuelles Thema
Echtzeitfähige Datenprodukte auf dem Data Stream
13
Größenordnungen
Technische Daten
Events: 5.000-10.000 pro Sekunde
Ungefähr 10 MB pro Sekunde
50 Data Nodes, 1.400 Cores, 10 TB Memory im Cluster
Aussicht auf Ausbau auf 90 Nodes
2 PB konfiguriert für das HDFS
Websites ähnlicher Größenordnung*
* Monatliche Unique visitors nach AGOF, statista.de, 2016.
14
Statistisches Modell
Nutzung der Informationen verschiedener Anzeigen, um ein Preismodell zu erzeugen
Berechnung des „fairen“ Preises auf Basis der eingegebenen Informationen auf der Webseite
Modellierung des Fair Value
Verschiedene Anzeigen
1
2
15
-10.7%+10.6%
-21.1% +26.8% 225k kürzlich gelöschte Anzeigen
-0.4%
1.1%
Modell
[Vorhersage] – [Tatsächlicher Preis]
[Tatsächlicher Preis]100
Ergebnis – Vorhersage vs. Online-Preis
Abweichung der Vorhersage vom Online-Preis
16
Quelle: mobile.de; https://de.wikipedia.org/wiki/AWZ_P70
2.700 € im Ursprungs-zustand
17
Herausforderung:
Integration von Wunsch und Möglichkeit
Die Lösung von Data-Science-Problemen
ist in der Regel nicht trivial
Eine genaue Schätzung ist schwierig
Es werden die gleichen Skills für die
Evaluierung der Lösungsoptionen wie für
deren Implementierung benötigt
Discovery
DeliveryLiefern
Lernen
Prozess
18
Start als Team innerhalb der CFO-Organisation
Nutzung der vorhandenen Kenntnisse über Datenquellen und Integration
Nutzung der crossfunktionalen Vernetzung zur Etablierung des Themas
Inkubator zum Testen
CFO CIO
… BI…
Data team
Site OPS …
Dev
PM
CPO
…
Integration von Produktmanagement, IT und Daten unter einem CPTO
Stärkere Integration in den Entwicklungsprozess
Weniger Reibungsverluste in der Kommunikation
Schnellere Produktentwicklungszyklen
CFO
BI…
Data team
Site OPS …
Dev
PM
CPTO
…
Organisation: Von der BI-Abteilung in den Technikbereich
19
Ausblick
20
Empfehlungen auf der Homepage
21
Zusammenfassung
Die technische Infrastruktur wurde aufgebaut.
Das Nutzungserfahrung konnte nachweislich verbessert werden.
Die Organisation bekommt ein Gefühl für die Möglichkeiten von Datenprodukten.
Die Prozesse zur Erstellung von Datenprodukten sind etabliert.
Die Pipeline ist gefüllt.
22
Welche Datenprodukte bauen Sie gerade?