04 Data Warehousing mit SAP BI DW Strukturen (5/16)

Embed Size (px)

Citation preview

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    1/27

    DW Strukturen

    Prof. Dr. Norbert Ketterer - HS Fulda1

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    2/27

    Der Cube auf der DB

    Schauen Sie sich an, wie der Cube WD_SD_C03 auf der DB abgebildet wird: Versuchen Sie zu begreifen, wie die Daten auf der Datenbank abgelegt wurden, um den

    Cube darzustellen

    Was sind Datenfelder der Datenbanktabellen? Was sind Schlssel (Keys)?

    Wie wurden die Daten gespeichert ?

    Hinweise: Sie knnen die Struktur von Datenbanktabellen mit Hilfe der Transaktion SE11 betrachten,

    die Inhalte mit SE16 (oder via Navigation aus SE11)

    Die fr Sie interessanten Tabellen sind alle unter dem Namensbereich: /BIC/*WD_SD_C03*auffindbar

    Der Grafik-Button ist hilfreich

    Der Index-Button zeigt Ihnen die DB-Indizes auf

    Fertigen Sie eine Skizze der DB-Struktur an

    Ebenso knnen Sie sich die Struktur des Cubes im Metadaten-Repository ansehen

    Prof. Dr. Norbert Ketterer - HS Fulda2

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    3/27

    Dimensionshierachien

    Eine Dimension, die ein Material referenziert, kann aus Auswertungsgrnden eine Gruppierungenthalten, um eine hher aggregierte Auswertung zu ermglichen

    Ein Beispiel, welches wir in der bung Der Cube auf der DB kennengelernt haben, ist dieBeziehung zwischen Land und Region:

    Eventuell sind Sie in der Anal se an Kennzahlwerten etwa Verkufen in Deutschland interessiert; eventuell

    wollen Sie die Auswertung aber detaillierter durchfhren: etwa die Verkufe in Hessen

    Die Beziehung Hessen -> Deutschland muss innerhalb der Strukturen des Cubes hinterlegt sein

    Die Dimensionselemente entlang der Kante eines Wrfels lassen sich zu Gruppenzusammenfassen

    Beispiel: Jedes Material kann einem oder mehreren Werken zugewiesen sein, zudem kann es Teil einerbestimmten Warengruppe sein (etwa Sthle, le, etc) oder auch einer bestimmten Materialart (etwa Roh,

    Fertigware, etc) Durch die Gruppierung knnen die Dimensionen Hierarchien bilden diese Hierarchien knnen

    als Konsolidierungspfade innerhalb der Auswertung gelten

    Prof. Dr. Norbert Ketterer - HS Fulda3

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    4/27

    Dimensionshierarchien Teil 2

    Strukturbestandteile in Dimensionen [HA04]: Basiselemente auf der untersten Ebene definieren die Granularitt

    des Cubes -> die detaillierteste speicherbare Information

    r ge emente s n a ge e tete ver c tete emente

    Prof. Dr. Norbert Ketterer - HS Fulda4Basiselemente (maximale Granularitt)

    Hierarchiestufen bzw.Konsolidierungsebene(Level)

    Abgeleitete bzw. verdichteteElemente

    Dimensionselemente

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    5/27

    Hierarchietypen

    Flache Strukuren [HA04]: Gleichwertig nebeneinander stehende Elemente ungeeignet fr multidimensionale Strukturen

    Ist Budget Prognose

    Balancierte Baumstrukturen [HA04]: Sehr typische Dimensionsstruktur alle Elemente sind ber gleich viele Stufen verbunden

    Zu jedem Element genau ein bergeordnetes

    Frage: Wie flexibel ist diese Struktur ?

    Prof. Dr. Norbert Ketterer - HS Fulda5

    2003

    Q1/03 Q2/03 Q3/03 Q4/03

    Jan/03 Feb/03 Mar/03 Apr/03 Mai/03 Jun/03 Jul/03 Aug/03 Sep/03 Okt/03 Nov/03 Dez/03

    Drilldownpfade sind mit einem Pfeil gekennzeichnet

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    6/27

    Hierarchietypen Teil 2

    Balancierte Waldstrukturen [HA04]: Hinzufgen weiterer Wurzelelemente mglich

    Zusammenschluss mehrerer Baumstrukturen

    erreichen?

    Prof. Dr. Norbert Ketterer - HS Fulda6

    2003

    Q3/03 Q4/03

    Jul/03 Aug/03 Sep/03 Oct/03 Nov/03 Dez/03

    2004

    Q1/04 Q2/04

    Jan/04 Feb/04 Mar/04 Apr/04 Mai/04 Jun/03

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    7/27

    Hierarchietypen Teil 3

    Unbalancierte Baum-/ Waldstrukturen [HA04]: Diese Strukturen haben Lcken die Wege sind nicht immer gleich lang

    Beispiel: Produktstruktur (erinnern Sie sich noch an SOP aus der ERP-

    Welche Vorteile sehen Sie in solchen Strukturen?

    Prof. Dr. Norbert Ketterer - HS Fulda7

    PG 1

    P1 P2 P3

    PG2

    PSG1 PSG2

    P4 P5 P6 P7 P8

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    8/27

    Hierarchietypen Teil 4

    Parallele Hierarchien/ verschiedene Hierarchien innerhalb einer Dimension [HA04]: Basiselemente sind auf unterschiedliche Formen aggregierbar

    Beispiel: Aggregation von Kunden via Region oder via logischen Aspekten (etwa Premium, Normal, Schuft)

    Beispiel 2: Unterscheidung zwischen Kalenderjahr und Geschftsjahr (Fiskaljahr)

    Prof. Dr. Norbert Ketterer - HS Fulda8

    CY03

    Jul/03 Aug/03 Sep/03 Oct/03 Nov/03 Dez/03

    CY04

    Jan/04 Feb/04 Mar/04 Apr/04 Mai/04 Jun/03

    FY03/04 FY04/05FY02/03

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    9/27

    Hierarchieattribute

    Eine Dimensionsstruktur ist formal ein gerichteter Graph [HA04]: Richtung von der obersten zur untersten Verdichtungsebene

    Wie knnen wir nun eine andere Hierarchie innerhalb einer Dimension erhalten? Es kann betriebswirtschaftlich sinnvoll sein, innerhalb der gleichen Dimension unter anderen Gesichtspunkten zu aggregieren (Frage: was ist im Zusammenhang mit

    anderen Dimensionen?)

    Dimensionshierarchie kann in sinnvolle Konsolidierungsstufen unterteilt werden abhngig von Attributen, die dem Dimensionselementzugewiesen sind. Hierarchieattribute sind Merkmale, die von anderen Hierarchiemerkmalen abhngig sind.

    Bezeichung der Hierachieattribute in SAP: Navigationsattribute

    Beispiel eines Attributes: Preisgruppe

    Prof. Dr. Norbert Ketterer - HS Fulda9

    PG2

    PSG1 PSG2

    P4 P5 P6 P7 P8

    Dimension

    selemente

    Wir wollen nun nach Preisgruppe gegliedertauswerten nicht nach PG

    Die Dimensionselemente(PN = Produkt N)besitzeneinen Indikator:Preisgruppe (PG) PG 01 02 01 02 02

    PG Produkt Sales

    01

    P4 100

    P6 50

    Sum 150

    02

    P5 20

    P7 30

    P8 80

    Sum 130

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    10/27

    Strukturen im Zusammenhang mit dem DW

    Im Zusammenhang mit dem DW haben wir esmit einer Reihe von Strukturen zu tun [JUE10]

    ese ru uren re en e an versc e enenStellen einer Data-Warehouse-Landschaft an Transaktionale Strukturen

    Flache Strukturen Star-Schema

    Snow-Flake-Schema

    Prof. Dr. Norbert Ketterer - HS Fulda10

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    11/27

    Transaktionale Strukturen

    Transaktionale Strukturen speichern operationale Daten eines OLTP-Systems auf der Datenbank

    Die Speicherung erfolgt auf einer atomaren Ebene Redundanzvermeidung wird angestrebt genauso wie einePerformanceoptimierung fr die zugreifenden Applikationen

    Oftmals (aber nicht immer) Speicherung in der dritten Normalform (-> DB-Vorlesung)

    Fr OLAP sind diese Strukturen kaum geeignet analytische Anwendungen knnen keinen Nutzen aus der

    Wir finden diese Strukturen im DW nur indirekt: im OLTP-System wird aus ihnen extrahiert und die Daten werden inanderer Form ins DW geladen

    Prof. Dr. Norbert Ketterer - HS Fulda11[JUE10]

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    12/27

    Transaktionale Strukturen

    Bezogen auf die Referenzarchitekturen befindenwir uns hier:

    Prof. Dr. Norbert Ketterer - HS Fulda12

    Operative Vorsysteme

    ExterneDaten

    Ref 1:

    Ref 2:

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    13/27

    Flache Strukturen

    Flache Strukturen verwenden die Daten bewusst denormalisiert (erste NF)

    Sie werden im DW oft fr den Datenaustausch eingesetzt speziell im Eingangsbereich/ Stagingund zur einfachen Speicherung operationaler Daten

    Sie eignen sich auch sehr gut, um Datenbereinigungen/ Konsolidierungen zu untersttzen

    - , -

    Operationen sind sie jedoch nicht geeignet

    Prof. Dr. Norbert Ketterer - HS Fulda13[JUE10]

    Flache Strukturen werden durch relationaleDatenbanken abgebildet.

    In SAP-BI erfolgt die Abbildung durch sogenannte

    Data-Store-Objekte (DSO).

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    14/27

    Flache Strukturen

    ta-Marts

    Bezogen auf die Referenzarchitekturenbefinden wir uns im Bereich:

    Des Staging

    Dem Operationalen Datenspeicher

    Des eigentlichen DW

    In Data-Marts, die aus (irgendwelchen)Grnden als relationale Strukturen

    abgelegt wurden (dies ist nicht derNormalfall)

    Prof. Dr. Norbert Ketterer - HS Fulda14

    Data-Warehouse

    ROLAPDa

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    15/27

    Das klassische Star-Schema

    Info-Cubes sind in spezifischen Strukturen organisiert diese Strukturen optimieren das flexibleReporting

    Dimensionen der Faktentabelle werden ber Schlssel normalisiert

    Dimensionen-Tabellen sind nicht normalisiert

    Zugriff auf die Fakten-Tabelle via der Dimensionen-Tabelle

    Prof. Dr. Norbert Ketterer - HS Fulda15

    Dimension-Key 1Dimension-Key 2Dimension-Key 3Dimension-Key 4

    ....

    Dimension-Key 1Dimension-Key 2Dimension-Key 3Dimension-Key 4

    ....

    Fact 1Fact 2Fact 3...

    Fact 1Fact 2Fact 3...

    Dimension-Key 1Dimension-Key 1

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Key 2Dimension-Key 2

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Key 3Dimension-Key 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Key 4Dimension-Key 4

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Warum erleichtert dieses Schema das Reporting?

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    16/27

    Beispiel des klassischen Star-Schemas

    Prof. Dr. Norbert Ketterer - HS Fulda16

    Stammdaten sind

    Teil der

    Dimensionstabelle

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    17/27

    Dimensionswahl und Cubegre

    Die Dimensionswahl bestimmt die Gre derDimensionstabellen des Cubes

    Die Faktentabellen bleiben davon unberhrt warum

    muss dies so sein ?) Die Dimensionszuordnungen werden aber idealerweise

    so gewhlt, dass Abhngigkeiten in einer Tabellekodiert werden falls betriebswirtschaftlich sinnvoll

    Ein Beispiel einer guten und schlechten Wahl derDimensionszuordnungen zeigt die folgende Slide

    Prof. Dr. Norbert Ketterer - HS Fulda17

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    18/27

    Optionen in Dimensionswahl

    Durch unterschiedlicheZuordnung der

    eher schlecht

    Dimensionsattribute zu

    Dimensionen werdenverschiedene Gren derDimensionstabellen erreicht

    Beachten Sie bitte: Jede Anfragewird zuerst ber die

    Dimensionstabellen zugreifen Die Faktentabelle bleibt von der

    Entscheidung unberhrt

    Prof. Dr. Norbert Ketterer - HS Fulda18eher gut [JUE10]

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    19/27

    Snow-Flake Schema

    Info-Cubes knnen auch als Snow-Flake-Schema existieren.

    Ein spezifisches DW wird aber normalerweise ein spezifisches Schema untersttzen

    Unterschiede zum Star-Schema: Dimensionen sind normalisiert (3NF)

    Fr die Attribue innerhalb der Dimensionen existieren wiederum Attributstabellen Keine Update-Probleme auf Datenbank Erfordert kom lexere Join-Strukturen

    Prof. Dr. Norbert Ketterer - HS Fulda19

    Dimension-Key 1Dimension-Key 2Dimension-Key 3Dimension-Key 4....

    Dimension-Key 1Dimension-Key 2Dimension-Key 3Dimension-Key 4....

    Fact 1Fact 2Fact 3...

    Fact 1Fact 2Fact 3...

    Dimension-Key 1Dimension-Key 1

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Key 2Dimension-Key 2

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Key 3Dimension-Key 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Attr 4Dimension-Attr 5

    Dimension-Key 4Dimension-Key 4

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3 Dimension-Key 5Dimension-Key 5

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Key 6Dimension-Key 6

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3Dimension-Key 8Dimension-Key 8

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

    Dimension-Attr 1Dimension-Attr 2Dimension-Attr 3

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    20/27

    Beispiel eines Snow-Flake-Schemas

    Prof. Dr. Norbert Ketterer - HS Fulda20

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    21/27

    Selektionen von Star-/ Snowflake

    Prof. Dr. Norbert Ketterer - HS Fulda21 21

    Jedes n-fache Join mit der Faktentabelle kann durch einen Lauf ber die Faktentabelleermittelt werden.

    Einfach zu erweitern -> Erweiterung einer Spalte der Faktentabelle/ Dimensionstabelle

    Frage: Was bedeuten diese Zugriffe fr die Notwendigkeit der Indexerzeugung auf derDB?

    Achtung: die IDs werden im Falle von SAP durch Surrogatschlssel reprsentiert eswerden also auf der DB keine Businessdaten gespeichert.

    (SAP)

    (SAP)

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    22/27

    Cube-Strukuren

    Cube-Strukturen finden wirrimr zu Zwecken des

    Front-End

    Reportings Manchmal werden Sie auch

    verwendet, um EDW-Rollenzu bernehmen dies ist

    jedoch kein wirklich gutesDesign des DW, da die

    feingranulare Speicherungsuboptimal ist

    Prof. Dr. Norbert Ketterer - HS Fulda22

    MDB/ OLAPData-Ma

    rts

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    23/27

    Das SAP-Star-Schema

    Prof. Dr. Norbert Ketterer - HS Fulda23

    Das SAP-Star-Schema hnelt

    dem Snow-Flake-Schema Wir besitzen einen

    spezifischen und einenallgemeinen Teil

    Der allgemeine Teil enthltStammdaten, die auch inanderen Strukturen verwendetwerden knnen (Stammdaten-

    Tabellen, Text-Tabellen,Hierarchien)

    Was ist der Vorteil hiervon?

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    24/27

    Beispiel des SAP-Star-Schemas

    Prof. Dr. Norbert Ketterer - HS Fulda24

    (SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    25/27

    Beispiel: SAP-Star-Schema zwischen Cubes

    Stammdaten:

    Hauptziel:

    Erhalte Konsistenz zwischen denverschiedenen Cubes

    Prof. Dr. Norbert Ketterer - HS Fulda25

    Text: Beschreibung der Stammdaten Beispiel: Lieferanten-Nummer and

    Lieferanten-Name

    Attribute:

    Zusatzinformation ber einStammdatum

    Beispiel: Land des Lieferanten

    Hierarchie: Definition alternativer Sichten auf die

    Daten basierend auf Hierarchienausserhalb des Cubes

    Beispiel: Materialhierarchien(SAP)

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    26/27

    Beispiel der vollstndigenAbbildung eines Cubes

    Link des SID zueinem Werk

    Prof. Dr. Norbert Ketterer - HS Fulda26Dimensionstabelle -> SIDs

    Inhalte derDimensionstabelle

  • 7/29/2019 04 Data Warehousing mit SAP BI DW Strukturen (5/16)

    27/27

    Zusammenfassung: Strukturen des SAP-BI

    SAP-BI besitzt drei Strukturen, die durchden Benutzer zur Datenspeicherungdefiniert werden knnenEigenschaften:

    Es existieren daneben noch folgendeStrukturen (die wir uns spter noch genaueransehen):

    PSAs diese werden nicht explizit durch denBenutzer definiert, sondern auf Basis derSatzstrukturen definiert. Namen etc. werdenintern vergeben.

    Virtuelle Provider diese werden durch den

    Benutzer definiert, speichern aber selbst keineDaten hnlich nicht materialisierten DB-Views

    Prof. Dr. Norbert Ketterer - HS Fulda27

    (SAP)

    Granularitt: niedrig Dimensionale Modellierung

    Daten werden angefgt Historie der Ladevorgnge

    Eigenschaften: Eindeutiger Schlssel und

    Datenbereich berschreiben der Daten gem

    Schlssel Hohe Granularitt

    Eigenschaften: Navigationsattrib ute Zeitabhngigkeit Sprachabhngigkeit