28
Big-Data- and Data- Science-Day 2018 KONZEPTION EINES TRACKING-BASIERTEN SYSTEMS ZUR SPIELERBEWERTUNG IM FUßBALL

Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Big-Data- and Data-Science-Day 2018KONZEPTION EINES TRACKING-BASIERTEN SYSTEMS ZUR SPIELERBEWERTUNG IM FUßBALL

Page 2: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Agenda1. Einführung

2. Opta Daten

3. Methoden

4. Designprinzipien

5. Implementierung der Artefakte

6. Ergebnisse

7. Evaluation

8. Limitationen

9. Fazit und Ausblick

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 3: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

EinführungZiel der Arbeit:

▪ Erstellung eines Systems zur individuellen Spielerbewertung

▪ Top 10 Spieler identifizieren

Datenbasis:

▪ Opta Event Daten

Verwendete Technologien:

▪ RapidMiner

▪ Tableau

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 4: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Opta Daten

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ 306 Spiele der 1. Bundesliga Saison 2016/17

▪ Je Spiel 1500 bis 2200 Events

▪ → 575.078 aufgezeichnete Events

Page 5: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

MethodenExpected Goals:

▪ Reines XG-Modell

▪ Zonenbasiertes XG-Modell

Expected Possession Value:

▪ Bewertung ob ein Ballbesitz sich positiv oder negativ ausgewirkt hat

▪ Problem: Nur die Position des aktuellen Spielers des Events bekannt

▪ Lösung: XG-Zonenmodell als Bewertungskriterium

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 6: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Methoden – Expected Goal

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Reines XG-Modell:

▪ Tore ÷ Schüsse

▪ Wird häufig auf Teamebene verwendet

Zonenbasiertes XG-Modell:

▪ Einteilung des Spielfelds

▪ Bewertung der einzelnen Zonen (nicht Spieler)

Bildquelle: Cronin, B. (2017): An analysis of different expected goals models

Page 7: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Methoden – Expected Possession Value

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Kommt ursprünglich aus dem Basketball

▪ Bewertet Aktion bezüglich der Veränderung der potentiellen Wahrscheinlichkeit zu Punkten

Bildquelle: Cervone, D.; D‘Amour, A.; Bronn, L.; Goldsberry, K. (2014):POINTWISE: Predicting Points and Valuing Decisions in Real Time with NBA Optical Tracking Data

Page 8: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Expected Goal Zonen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

XG-Modell erstellen:

▪ Schüsse & Tore den Zonen zuweisen

▪ Zonenwert = Tore/Schüsse

Page 9: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Expected Goal Berechnung

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Eigentore

Schüsse & ToreSchüsse & Tore

Inklusive Zonen

Tore

Inklusive Zonen

Page 10: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Rekonstruktion des Laufwegs

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Es handelt sich beim ersten Event um ein Event vom Typ Pass

▪ Der Startpunkt des zweiten Events ist ungleich dem Zielpunkt des ersten Events

▪ Beide Events werden vom gleichen Team durchgeführt

▪ Der Ausgang des ersten Events war positiv

Page 11: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Designprinzipien1. Extraktion der Zielkoordinaten

2. Generierung der Zonen

3. Elfmeter und Eigentore entfernen

4. Erstellung Expected Goal Modell

5. Erstellung Expected Possession Value Modell

6. Kombination XG-Modell, EPV-Modell & Zonen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 12: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung - Einlesen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Über alle 306 Spiele iterieren

▪ Umwandeln der XML Struktur in tabellarische Form

→ Pro Event 50 Attribute

Ergebnis:

Collection mit 306 Example Sets

Page 13: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung - Qualifier▪ Loop über alle

Example Sets

▪ Entfernen von nicht benötigten Attributen

▪ Passzielkoordinaten und Elfmeter als eigene Attribute aus den Qualifiern erzeugen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 14: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung - Qualifier

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 15: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – Zonen hinzufügen▪ Startkoordinaten eines

Events mit Zonenraster abgleichen

→ Attribut: Startzone

▪ Bei Events, die Zielkoordinaten besitzen diese ebenfalls abgleichen

→ Attribut: Zielzone

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 16: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – XG Werte der Zonen▪ Prozess wird zwei mal in

unterschiedlicher Parametrisierung durchlaufen

1. Schüsse + Tore

2. Tore

▪ Anzahl je Zone ermitteln und abspeichern

▪ Die XG Werte der einzelnen Zonen können mit den Outputs dieses Prozesses berechnet werden

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 17: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – individuelle Spielerbewertung 1

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 18: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – individuelle Spielerbewertung 2

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Zuvor errechnete XG Werte für Start- und Zielzonen als neue Attribute hinzufügen

▪ Lag einbauen → damit aufeinanderfolgende Events verglichen werden können

▪ Berechnen der Differenz von Start- und Zielzone, wenn es sich um Dribbel handelt

Page 19: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – individuelle Spielerbewertung 2

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Bedingung:

▪ Start ≠ Ziel

▪ Team ID identisch

▪ Outcome = 1

▪ Type_id = 1

→ Differenz Start- und Zielzone Spieler aus E2 zuschreiben

Page 20: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Implementierung – individuelle Spielerbewertung 3

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

▪ Schleife iteriert so häufig über den Subprozess, wie es Attributausprägungen für die Spieler ID gibt

▪ Filtern auf aktuelle Spieler ID

▪ Summieren aller XG Veränderungen

▪ Hinzufügen der Spieler ID zu neuem „Example“

Page 21: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Ergebnisse – Top 10 Spieler

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 22: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Evaluation – Abgleich mit den Bewertungen von Kicker und LigaInsider

Vorgehensweise:

▪ Mapping der Bewertungen: Kicker 215 Spieler, LigaInsider 274 Spieler

▪ Normalisieren der Daten → Skala von 0 – 100

▪ RMSE und MAE des Zonenmodells und Kicker bzw. LigaInsider berechnen

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

𝑧𝑖 = 100 ∗𝑥𝑖 −min 𝑥

max 𝑥 − min 𝑥

σ𝑖=1𝑛 |𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖(𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒)|

𝑛MAE =

σ𝑖=1𝑛 𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖 𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒

2

𝑛RMSE =

Page 23: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Evaluation – RMSE & MAE

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kennzahl Vergleichsbewertung Wert

RMSE Kicker 26,10

RMSE Kicker gefiltert auf offensiv 22,22

RMSE LigaInsider 23,48

MAE Kicker 22,55

MAE Kicker gefiltert auf offensiv 19,18

MAE LigaInsider 21,00

Page 24: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Evaluation – Designprinzipien

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kicker RMSE LigaInsider RMSEKicker mittlerer absoluter Fehler

LigaInsider mittlerer absoluter Fehler

Zonenmodell - bereinigt 26,10 23,48 22,55 21,00

Zonenmodell - nicht bereinigt 34,69 29,92 31,57 35,32

reine XG Werte 39,18 33,22 36,25 33,98

Page 25: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Evaluation – Abgleich Top 15Kicker LigaInsider Zonenmodell

A. Robben T. Alcântara A. Robben

F. Ribery A. Robben O. Dembélé

R. Lewandowski R. Lewandowski F. Ribéry

E. Forsberg E. Forsberg P. Aubameyang

P. Lahm M. Kruse T. Alcântara

T. Alcântara H. Çalhanoğlu P. Lahm

O. Dembelé P. Aubameyang T. Werner

M. Kruse F. Ribéry A. Kramaric

T. Werner N. Keita E. Forsberg

N. Keita M. Ferreira de Souza T. Müller

S. Rudy A. Vidal J. Brandt

M. Reus O. Dembélé S. Zuber

K. Demirbay P. Lahm Wendell

A. Modeste X. Alonso M. Gómez

M. Javi T. Werner S. Wagner

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Kicker +Zonenmodell= 7 Übereinstimmungen

LigaInsider +Zonenmodell= 8 Übereinstimmungen

Page 26: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Limitationen

▪ Modell eignet sich nur für offensive Spieler

▪ Daten sind beschränkt auf eine Saison

▪ Spielzeit wurde nicht miteinbezogen

▪ Opta Daten:

▪ Nur die Position des Spielers, der das aktuelle Event durchführt ist bekannt

▪ Beschränkung der Bewertungsfaktoren auf Ballbesitz

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 27: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Fazit und AusblickFazit:

▪ Modell eignet sich als Indikator für die Bewertung von offensiven Leistungen

▪ Für eine umfassendere Bewertung muss das Modell angepasst oder ergänzt werden

Ausblick:

▪ Zonenmodell verbessern:▪ Feinere Zonen

▪ Geschwindigkeit und Distanz eines Sprints miteinbeziehen

▪ Modell für Defensivleistungen▪ Zonenmodell erweitern

▪ Separates Modell

BACHELORKOLLOQUIUM CHRISTOPHER FUNKE

Page 28: Big-Data- and Data- Science-Day 2018download.hdm-server.eu/BDD18/BDDS18-FUNKE.pdf · 2018. 5. 23. · S. Rudy A. Vidal J. Brandt M. Reus O. Dembélé S. Zuber K. Demirbay P. Lahm

Vielen Dank für Ihre Aufmerksamkeit