20
1 Same Same but Different? Clusterung von Länderdaten zu Metaregionen mittels Machine Learning Methoden Clara Orthofer Wien, 14. Februar 2019

Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

1

Same Same but Different?

Clusterung von Länderdaten zu Metaregionen mittels Machine Learning Methoden

Clara Orthofer

Wien, 14. Februar 2019

Page 2: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

2

Globale Energiesystemmodelle – Wer bekommt wieviel vom Kuchen?

Für das 1.5°C Ziel bedarf es drastischer Veränderung aller Energiesysteme der Welt. Wollen wir das Zeit erreichen müssen erneuerbare Energien die fossilen Energieträger ablösen.

Page 3: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

3

Traditionelle Modellregionenbildung

Globale Energiesystemmodelle teilen die Welt traditionell in rund 10-20 Regionen auf, die v.a. die geographischen Gegebenheiten sowie nicht quantifizierbare qualitative “soft facts” berücksichtigen.

Herleitung: - v.a. historisch bedingt- Berücksichtigung geografischer Nähe & politsicher

Ausrichtung Viel über Erfahrung der Modellierer

Einflussfaktoren:- Staatsform und Staatshistorie- Mitgliedschaft in Handels- und/oder politischen

Unionen- Ökonomische Situation- Geschwindigkeit des technologischen Wandels- Demografische Entwicklung- politische Ambitionen und Ziele

Modell Version RegionenTIMES -TIAM UCL 16

NZ 16ETSAP 15

OSeMOSYS GENeSYS-MOD 10POLES JRC 66MESSAGE GEA 11

Page 4: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

4

Traditionelle Modelregionenbildung

Die Welt abbildende Energiemodelle teilen die Welt traditionell in rund 10-20 Regionen auf, die v.a. die geographischen Gegebenheiten sowie nicht quantifizierbare qualitative “soft facts” berücksichtigen.

Herleitung: - v.a. historisch bedingt- Berücksichtigung geografischer Nähe & politsicher

Ausrichtung Viel über Erfahrung der Modellierer

Einflussfaktoren:- Staatsform und Staatshistorie- Mitgliedschaft in Handels- und/oder politischen

Unionen- Ökonomische Situation- Geschwindigkeit des technologischen Wandels- Demografische Entwicklung- politische Ambitionen und Ziele

Abb.: Die 11 MESSAGE Regionen

Page 5: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

5

Untersuchte Features Datenpunkte je Jahr und Land

- Primärenergiebedarf 1- Endenergieverbrauch 1- Umwandlungseffizienz 1- Detaillierte aufgeschlüsselte erneuerbare Energien-Potentiale >150- aufgeschlüsselte fossile Ressourcen und Reserven bis zu 10- spezifische Primär- und Endenergieverbräuche pro BIP und pro Kopf 2- …

- Bruttoinlandsprodukt (absolut und pro Kopf) 2- Moodies Rating 1- Human Development Index (HDI) 1- Elektrifizierungsgrad 1- Urbanisierungsgrad 1- Anteil erneuerbarer Energien am Energiemix 10- …

Explorative Datenanalyse: Identifikation & Erzeugung relevanter Features

Visuelle und quantitative Analyse mehrere duzend Parameter zur Identifikation eines nachvollziehbaren Featuresetszur Abbildung von EE-getriebener Energiesystementwicklung.

Page 6: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

6

Explorative Datenanalyse: Reduktion der EE-Potentialbeschreibung

Zur Reduktion der komplexen Beschreibung der erneuerbaren Energien Potentiale wurde der Solar- und der Windenergiefaktor als Maß der Potentialgröße eingeführt.

𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝐹𝐹𝑃𝑃𝐹𝐹𝑃𝑃𝑃𝑃𝐹𝐹𝐿𝐿 =∑𝑑𝑑,𝑘𝑘𝐷𝐷,𝐾𝐾 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙

𝑇𝑇𝑃𝑃𝑇𝑇𝑇𝑇𝑙𝑙

Größe ∝ TPES 2017

Windschwach

Solarschwach𝑑𝑑,𝐷𝐷 … 𝐷𝐷𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝐷𝐷 𝐷𝐷𝑧𝑧𝑧𝑧 𝑉𝑉𝑃𝑃𝐹𝐹𝑉𝑉𝐹𝐹𝑃𝑃𝑧𝑧𝑉𝑉𝑉𝑃𝑃𝐹𝐹

𝑃𝑃, 𝐿𝐿 … 𝐿𝐿𝑃𝑃𝑃𝑃𝑑𝑑𝐹𝐹,𝐾𝐾 … 𝐾𝐾𝑃𝑃𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝐾𝑃𝑃𝐷𝐷 − 𝐾𝐾𝑃𝑃𝑃𝑃𝑃𝑃𝐾𝐾𝑃𝑃𝐹𝐹𝑃𝑃𝑃𝑃

𝑇𝑇𝑃𝑃𝑇𝑇𝑇𝑇…𝑃𝑃𝐹𝐹𝑃𝑃𝑧𝑧𝐾𝐹𝐹𝑃𝑃𝑃𝑃𝑃𝑃𝐹𝐹𝐾𝐾𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝐹𝐹𝑉𝑉𝐹𝐹𝑃𝑃𝑧𝑧𝑉𝑉𝑉

Page 7: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

7

Explorative Datenanalyse: Reduktion der EE-Potentialbeschreibung

Zur Bewertung der Potentiale und zur Unterscheidung ihrer Güte wurden die gemittelten Stromgestehungskosten sowie die gemittelten Volllaststunden definiert und berechnet.

Stromgestehungskosten je Distanz- und Kapazitätskategorie:

𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑑𝑑,𝑘𝑘,𝑙𝑙 =𝑃𝑃𝑃𝑃𝑃𝑃.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙 + 𝐴𝐴𝑃𝑃𝐷𝐷𝑉𝑉𝑉𝑃𝑃𝑧𝑧𝐷𝐷𝐷𝐷𝐹𝐹𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑

𝐿𝐿𝑃𝑃𝑉𝑉𝑃𝑃𝑃𝑃𝐷𝐷𝑑𝑑𝑃𝑃𝑧𝑧𝑃𝑃𝐹𝐹 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙+𝑓𝑓𝑃𝑃𝑖𝑖.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙

+ 𝑃𝑃𝑃𝑃𝐹𝐹.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙𝑑𝑑,𝐷𝐷 … 𝐷𝐷𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝐷𝐷 𝐷𝐷𝑧𝑧𝑧𝑧 𝑉𝑉𝑃𝑃𝐹𝐹𝑉𝑉𝐹𝐹𝑃𝑃𝑧𝑧𝑉𝑉𝑉𝑃𝑃𝐹𝐹

𝑃𝑃, 𝐿𝐿 … 𝐿𝐿𝑃𝑃𝑃𝑃𝑑𝑑𝐹𝐹,𝐾𝐾 … 𝐾𝐾𝑃𝑃𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝐾𝑃𝑃𝐷𝐷 − 𝐾𝐾𝑃𝑃𝑃𝑃𝑃𝑃𝐾𝐾𝑃𝑃𝐹𝐹𝑃𝑃𝑃𝑃

Page 8: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

8

Explorative Datenanalyse: Reduktion der EE-Potentialbeschreibung

Zur Bewertung der Potentiale und zur Unterscheidung ihrer Güte wurden die gemittelten Stromgestehungskosten sowie die gemittelten Volllaststunden definiert und berechnet.

Stromgestehungskosten je Distanz- und Kapazitätskategorie:

Gewichtete Kosten- & VLh der kostengünstigsten Kategorien:

𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑑𝑑,𝑘𝑘,𝑙𝑙 =𝑃𝑃𝑃𝑃𝑃𝑃.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙 + 𝐴𝐴𝑃𝑃𝐷𝐷𝑉𝑉𝑉𝑃𝑃𝑧𝑧𝐷𝐷𝐷𝐷𝐹𝐹𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑

𝐿𝐿𝑃𝑃𝑉𝑉𝑃𝑃𝑃𝑃𝐷𝐷𝑑𝑑𝑃𝑃𝑧𝑧𝑃𝑃𝐹𝐹 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙+𝑓𝑓𝑃𝑃𝑖𝑖.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙

+ 𝑃𝑃𝑃𝑃𝐹𝐹.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙

∅𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑙𝑙 =∑𝑑𝑑,𝑘𝑘𝐷𝐷,𝐾𝐾 𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙

𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

∀ 𝐹𝐹,𝑑𝑑 ∈�𝑑𝑑,𝑘𝑘

𝐷𝐷,𝐾𝐾

𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙 ≤ 𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

∅𝑉𝑉𝐿𝐿𝑉𝑙𝑙 =∑𝑑𝑑,𝑘𝑘𝐷𝐷,𝐾𝐾 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙

𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

𝑑𝑑,𝐷𝐷 … 𝐷𝐷𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝐷𝐷 𝐷𝐷𝑧𝑧𝑧𝑧 𝑉𝑉𝑃𝑃𝐹𝐹𝑉𝑉𝐹𝐹𝑃𝑃𝑧𝑧𝑉𝑉𝑉𝑃𝑃𝐹𝐹

𝑃𝑃, 𝐿𝐿 … 𝐿𝐿𝑃𝑃𝑃𝑃𝑑𝑑𝐹𝐹,𝐾𝐾 … 𝐾𝐾𝑃𝑃𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝐾𝑃𝑃𝐷𝐷 − 𝐾𝐾𝑃𝑃𝑃𝑃𝑃𝑃𝐾𝐾𝑃𝑃𝐹𝐹𝑃𝑃𝑃𝑃

berücksichtigt

TPES

Page 9: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

9

Explorative Datenanalyse: Reduktion der EE-Potentialbeschreibung

Zur Bewertung der Potentiale und zur Unterscheidung ihrer Güte wurden die gemittelten Stromgestehungskosten sowie die gemittelten Volllaststunden definiert und berechnet.

Stromgestehungskosten je Distanz- und Kapazitätskategorie:

Gewichtete Kosten- & VLh der kostengünstigsten Kategorien:

𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑑𝑑,𝑘𝑘,𝑙𝑙 =𝑃𝑃𝑃𝑃𝑃𝑃.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙 + 𝐴𝐴𝑃𝑃𝐷𝐷𝑉𝑉𝑉𝑃𝑃𝑧𝑧𝐷𝐷𝐷𝐷𝐹𝐹𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑

𝐿𝐿𝑃𝑃𝑉𝑉𝑃𝑃𝑃𝑃𝐷𝐷𝑑𝑑𝑃𝑃𝑧𝑧𝑃𝑃𝐹𝐹 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙+𝑓𝑓𝑃𝑃𝑖𝑖.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙

+ 𝑃𝑃𝑃𝑃𝐹𝐹.𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝑙𝑙

∅𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑙𝑙 =∑𝑑𝑑,𝑘𝑘𝐷𝐷,𝐾𝐾 𝐿𝐿𝐿𝐿𝐿𝐿𝑇𝑇𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙

𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

∀ 𝐹𝐹,𝑑𝑑 ∈�𝑑𝑑,𝑘𝑘

𝐷𝐷,𝐾𝐾

𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙 ≤ 𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

∅𝑉𝑉𝐿𝐿𝑉𝑙𝑙 =∑𝑑𝑑,𝑘𝑘𝐷𝐷,𝐾𝐾 𝑉𝑉𝐿𝐿𝑉𝑑𝑑,𝑘𝑘,𝑙𝑙 ∗ 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑑𝑑,𝑘𝑘,𝑙𝑙

𝑇𝑇𝐹𝐹𝐿𝐿𝑙𝑙

Ante

il So

lare

nerg

ie a

m E

E-St

rom

mix

01

0.8

0.6

0.4

0.2

𝑑𝑑,𝐷𝐷 … 𝐷𝐷𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝑃𝑃𝐷𝐷 𝐷𝐷𝑧𝑧𝑧𝑧 𝑉𝑉𝑃𝑃𝐹𝐹𝑉𝑉𝐹𝐹𝑃𝑃𝑧𝑧𝑉𝑉𝑉𝑃𝑃𝐹𝐹

𝑃𝑃, 𝐿𝐿 … 𝐿𝐿𝑃𝑃𝑃𝑃𝑑𝑑𝐹𝐹,𝐾𝐾 … 𝐾𝐾𝑃𝑃𝐾𝐾𝑃𝑃𝐷𝐷𝑃𝑃𝑃𝑃𝐾𝑃𝑃𝐷𝐷 − 𝐾𝐾𝑃𝑃𝑃𝑃𝑃𝑃𝐾𝐾𝑃𝑃𝐹𝐹𝑃𝑃𝑃𝑃

Page 10: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

10

Feature Auswahl: Definition der Beschreibenden Parameter

Welche Parameter beeinflussen die Nutzung erneuerbarer Energien heute? Welche in der Zukunft?

Heute noch kaum Einfluss –Zukünftig aber ev. limitierender Faktor

Ante

il So

lare

nerg

ie a

m E

E-St

rom

mix

01

0.8

0.6

0.4

0.2

Page 11: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

11

Feature Auswahl: Definition der Beschreibenden Parameter

Welche Parameter beeinflussen die Nutzung erneuerbarer Energien heute? Welche in der Zukunft?

Verfügbare Landfläche ist heute schon relevant –Zukünftig noch relevanter?

Anteil Solarenergie am EE-Strommix

0 10.80.60.40.2

5 x Endenergiebedarf1 x Endenergiebedarf

Page 12: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

12

Feature Auswahl: Definition der Beschreibenden Parameter

Welche Parameter beeinflussen die Nutzung erneuerbarer Energien heute? Welche in der Zukunft?

Ante

il So

lare

nerg

ie a

m E

E-St

rom

mix

01

0.8

0.6

0.4

0.2

BIP & Kosten sind heute schon relevant –Bleibt das so?

Page 13: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

13

Feature Selektion:- Erhöht Interpretierbarkeit- Vermeidung von „Overfitting“- Berechenbarkeit sicherstellen

Ausgewählte Features:- BIP pro Kopf- Primärenergiebedarf pro Kopf - Gewichtete gemittelte Stromgestehungskosten- Gewichtete gemittelte Volllaststunden- Landnutzung zur fünffachen Deckung des

Endenergiebedarfs- (Region)

Feature Auswahl: Definition der Beschreibenden Parameter

Um die Nachvollziehbarkeit der Clusterergebnisse zu gewährleisten, wurden die, über 200 pro Land und Jahr zu Verfügung stehenden Parametern auf ein Set von fünf Parametern reduziert.

Page 14: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

14

k-Means - deterministisches Modell- Clusterzentrum ist arithmetische Mittel der

Clusterpunkte- Punkt ist immer näher an eigenem als an

anderem Clusterzentrum

Clusteranalyse: Vergleich der Clusteralgorithmen

Quelle: Jake VanderPlas - Python Data Science Handbook

N = 4N = 4

GaussianMixture - probabilistisches Modell- Punkte bestehen aus Gaußschen Verteilungen

unbekannter Parameter- Zugehörigkeitswahrscheinlichkeit zu Cluster

bestimmt Zuordnung

Page 15: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

15

Algorithmus Set 1 Set 2

KMeans 0,457 0,382

GaussianMixture 0,402 0,294

Unüberwachtes lernen - Bewertungsmetrik

Im unüberwachten lernen gibt es kein „richtig“ und „falsch“. Die Bewertungsmetrik, der Silhouettenkoeffizient, bezieht sich daher ausschließlich auf Eindeutigkeit der Zuordnung.

Region ist der dominante Faktor.

Page 16: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

16

Clusterung: Bewertung der Clusterung mittels Kmeans und Set 2

Einige intuitive Cluster – aber auch viele „Ausreißer“ und „alles andere“ Cluster.

Page 17: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

17

Clusterung: Bewertung der Clusterung mittels Kmeans und Set 2

Einige intuitive Cluster – aber auch viele „Ausreißer“ und „alles andere“ Cluster.

BIP pro Kopf TPES pro Kopf Gemittelte VLh Gestehungskosten Landnutzung

Page 18: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

18

Clusterung: Bewertung der Clusterung mittels GaussianMixture und Set 2

Einige intuitive Cluster – aber auch viele „Ausreißer“ und „alles andere“ Cluster.

Page 19: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

19

Clusterung: Bewertung der Clusterung mittels GaussianMixture und Set 2

Einige intuitive Cluster – aber auch viele „Ausreißer“ und „alles andere“ Cluster.

BIP pro Kopf TPES pro Kopf Gemittelte VLh Gestehungskosten Landnutzung

Page 20: Same Samebut Different? Clusterung von Länderdaten zu ...€¦ · 3. Traditionelle Modellregionenbildung. Globale Energiesystemmodelle teilen die Welt traditionell in rund 10- 20

20

Herausforderung: kluge Regionenbildung für globale Energiesystemmodelle

Traditioneller Ansatz: Aggregation auf Expertenbasis (geographische, politisch-historische Ähnlichkeit, ect)

Neuer Ansatz: machine learning mit Fokus auf die Wind- und Solarenergiepotenziale

Ergebnis: schwache strukturelle Abgrenzung (qualitative Informationen fehlen)

Fazit: die Clusteranalyse kann- den herkömmlichen Ansatz nicht ersetzten- unterstützendes Tool für die traditionelle Vorgehensweise werden - der prototypische Bildung von Regionen dienen - ein erster Startpunkt sein einer Expertenbasierten Analyse sein - helfen um mögliche Ausreißer zu identifizieren

Zusammenfassung, Ausblick und Fazit

Fragen oder Anregungen?Clara Orthofer

[email protected] Zipperle

[email protected]