21
1 Komponenten und Phasen des Data Warehousing Simon König

1 Komponenten und Phasen des Data Warehousing Simon König

Embed Size (px)

Citation preview

Page 1: 1 Komponenten und Phasen des Data Warehousing Simon König

1

Komponenten und Phasen des Data Warehousing

Simon König

Page 2: 1 Komponenten und Phasen des Data Warehousing Simon König

2

Einführung

• Arbeitskreis „Konzepte des Data Warehousing“ der GI

• Ziele– Schaffung einer einheitlichen Terminologie– Ausgangspunkt für den Vergleich

bestehender und die Empfehlung für geplante Data-Warehouse-Systeme

Page 3: 1 Komponenten und Phasen des Data Warehousing Simon König

3

Datenquellen: Auswahl

• Zweck• Verfügbarkeit

– rechtlich– sozial– technisch– organisatorisch

• Preis

• Qualität– Genauigkeit

(Granularität)– Vollständigkeit– Konsistenz– Relevanz– Korrektheit

Anschließend: Klassifikation

Page 4: 1 Komponenten und Phasen des Data Warehousing Simon König

4

Extraktion

• Umfang– Struktureller Extrakt– Inhaltlicher Extrakt– Aggregierter Extrakt

• Arbeitsbereich

• Zeitliche Steuerung– Periodisch– Anfragegesteuert– Ereignisgesteuert– Sofort

Page 5: 1 Komponenten und Phasen des Data Warehousing Simon König

5

Monitor

• Überwachungsstrategie– Snapshot– Log– Zeitstempel– Replikation– Trigger

• Anwendungsunterstützt

Page 6: 1 Komponenten und Phasen des Data Warehousing Simon König

6

Transformation

• Schematransformation– Integration der Einzelschemata– Einmalige Durchführung– Ziele

• Vollständigkeit• Korrektheit• Minimalität• Verständlichkeit

Page 7: 1 Komponenten und Phasen des Data Warehousing Simon König

7

Transformation

• Schematransformation– Konflikte

• Semantische Konflikte• Beschreibungskonflikte• Heterogenitätskonflikte• Strukturkonflikte

Page 8: 1 Komponenten und Phasen des Data Warehousing Simon König

8

Transformation

• Datentransformation– Überführung der Daten in neue Schemata– Durchführung bei jeder Transformation– Synonym-, Homonymkonflikte– Vereinheitlichung von Kodierungen– Integritätsbedingungen

Page 9: 1 Komponenten und Phasen des Data Warehousing Simon König

9

Transformation

• Datenbereinigung– Durchführung bei jeder Transformation– Korrektur fehlerhafter bzw. Ergänzung

unvollständiger Daten– Referenzielle Integrität beachten

• Gewährleistung hoher Datenqualität– Nachvollziehbarkeit

Page 10: 1 Komponenten und Phasen des Data Warehousing Simon König

10

Basisdatenbank

• Zentrale Komponente: Datenlager• Inhalt (Inmon)

– Themenorientierte Daten (subject-oriented)– Integrierte Daten (integrated)– Dauerhafte Daten (non-volatile)– Historische Daten (time-variant)

• Ausgangspunkt für Data Warehouses

Page 11: 1 Komponenten und Phasen des Data Warehousing Simon König

11

Konsistenz

Page 12: 1 Komponenten und Phasen des Data Warehousing Simon König

12

Data Warehouse

• Extraktion der Daten aus der Basis-datenbank

• Umfang– Struktureller Extrakt– Inhaltlicher Extrakt– Aggregierter Extrakt

• Zeitliche Steuerung– Periodisch– auf Anfrage– Ereignisgesteuert– Sofort

Page 13: 1 Komponenten und Phasen des Data Warehousing Simon König

13

Nabe-Speiche-Architektur

Page 14: 1 Komponenten und Phasen des Data Warehousing Simon König

14

Data Warehouse

• Data Marts– Verteilung des Data Warehouse– abhängige und unabhängige Data Marts– Abgrenzung zum Data Warehouse

problematisch• Ansatzpunkt für die Analyse

Page 15: 1 Komponenten und Phasen des Data Warehousing Simon König

15

Data Marts

abhängig unabhängig

Page 16: 1 Komponenten und Phasen des Data Warehousing Simon König

16

Metadaten

• Definition– „Daten über Daten“– fachliche und technische Metadaten– Informationen über Datenstrukturen,

Datentransformationen, Veränderungen von Metadaten

• Erleichtern das Wiederfinden von Informationen

Page 17: 1 Komponenten und Phasen des Data Warehousing Simon König

17

Analyse

• Drei Ansätze– Data Access– Online Analytical Processing (OLAP)

• Rotation oder Pivotierung• Roll-up, drill-down, drill-across• Slice and dice

– Data Mining

Page 18: 1 Komponenten und Phasen des Data Warehousing Simon König

18

OLAP

Page 19: 1 Komponenten und Phasen des Data Warehousing Simon König

19

OLAP

• Rotation• Roll-up• Drill-down• Drill-across• Slice• Dice

Page 20: 1 Komponenten und Phasen des Data Warehousing Simon König

20

Architekturbeispiel

Page 21: 1 Komponenten und Phasen des Data Warehousing Simon König

21

Vielen Dank für Ihre Aufmerksamkeit