35
Sätze variabler Länge 1 Grundlagen der Datenbanksysteme II SÄTZE MIT VARIABLER LÄNGE Generellere Struktur von Datensätzen: Ersetzen von Felder durch Gruppen von Feldern. Beispiel: E 1 E 2 n m e 11 e 12 e 21 e 22 e 23 e 24 e 1 e 2 variable Länge Logische Datei mit Sätzen variabler Länge

SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

  • Upload
    doliem

  • View
    224

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 1

Grundlagen der Datenbanksysteme II

SÄTZE MIT VARIABLER LÄNGE

Generellere Struktur von Datensätzen:

• Ersetzen von Felder durch Gruppen von Feldern.

Beispiel:

E1 E2n m

e11 e12 e21 e22 e23 e24

e1 e2

variable Länge

Logische Datei mit Sätzen variabler Länge

Page 2: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 2

Grundlagen der Datenbanksysteme II

Definition von Sätzen mit variabler Länge

1. Ein Satz mit variabler Länge ist eine Liste von „Elementen“.

2. Ein Element ist entweder ein einfaches Feld oder eine

variable Gruppe mit Null oder mehr Sätzen variabler Länge.

Notation:

Wie bei regulären Ausdrücken,

( )α * ist eine Gruppe mit mehreren Elementen

α α α α1 2 3 K n

Page 3: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 3

Grundlagen der Datenbanksysteme II

Beispiel:

Datei mit (amerikanischen Bundes-) Staaten und der Interstate-

Highways innerhalb der Staaten.

Struktur:

STATE (HIGHWAY)*

r1

r2

r3

New Jersey

Alaska

North California

178 180 195

148 180 160 190

Erweitertes Beispiel:

STATE POPULATION (HIGHWAY)*

r1

r2

New Jersey

Alaska

178 180 1957.000.000

800.000

Page 4: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 4

Grundlagen der Datenbanksysteme II

Beispiel: (Fortsetzung)

STATE POPULATION (HIGHWAY

LENGTH (TERMINAL)* )*

r1

r2

Hessen

Bayern

A66 1006.000.000

Wiesbaden FrankfurtA3 120 Kassel Darmstadt

……

Page 5: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 5

Grundlagen der Datenbanksysteme II

Wie kann dies in einem Block gespeichert werden?

1. Die Information über den Datentyp jedes Elements muß

vorhanden sein.

Diese Information kann entweder im Blockheader abgelegt

oder mit jedem Feld mitgeführt werden.

2. Jeder Satz mit variabler Länge kann durch einen oder

mehrere Sätze fester Länge repräsentiert werden, dafür gibt

es drei verschiedene Ansätze:

a) Reserved Space Method.

b) Pointer Method.

c) Combined Method (a + b).

Page 6: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 6

Grundlagen der Datenbanksysteme II

RESERVED SPACE METHOD

Annahme: Es gibt eine obere Grenze c von auftretenden

Wiederholungen in einer Gruppe.

( )WERT_ A WERT_ *max

Bc=

Dann kann die sich wiederholende Gruppe durch c Gruppen

von Feldern ersetzt werden.

WERT_ A WERT WERT_ _B BcK

1 24444 34444

Falls weniger als c Wiederholungen auftreten, dann

• Werden die fehlenden Wiederholungen durch Null-Werte ersetzt, oder

• ein Zähler, der die tatsächlich auftretenden

Wiederholungen zählt, wird geführt.

Page 7: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 7

Grundlagen der Datenbanksysteme II

Beispiel:

( )

STATE POPULATION

HIGHWAY LENGTH TERMINAL * ) * max = 2

(

STATE POPULATION

HIGHWAY LENGTH TERMINAL1 TERMINAL2 ) * max = 10

(

STATE POPULATION COUNTHIGHWAY1 LENGTH1 TERMINAL1.1 TERMINAL1.2

HIGHWAY10 LENGTH10 TERMINAL10.1 TERMINAL10.2

M

Page 8: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 8

Grundlagen der Datenbanksysteme II

POINTER METHOD

Wenn eine obere Grenze für die Anzahl der Wiederholungen

nicht angegeben werden kann, dann kann eine Gruppe durch

einen Zeiger auf den ersten Block einer Kette von Blöcken mit

den Sätzen der Gruppe ersetzt werden:

WERT_A ( WERT_B )*

Block

Zeiger

WERT_A , P

Page 9: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 9

Grundlagen der Datenbanksysteme II

Beispiel:

Wir nehmen an, unser Highway-Beispiel wird mittels der

Pointer-Methode so dargestellt:

STATE POPULATION HPTR

HIGHWAY LENGTH TPTR

TERMINAL

Gespeichert in Blocks sieht das dann so aus:

... N.J. 7,168,164 ...

11 I78 55 180 73 –

10 I95 68

11 Phillipsburg Newark –

11 Hainesburg Ft. Lee –

11 W. Trenton Ft. Lee –

full/empty bits

block of file

Page 10: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 10

Grundlagen der Datenbanksysteme II

COMBINED METHOD

• Es können auch die beiden vorangegangenen Methoden

miteinander kombiniert werden.

• Es kann z.B. eine Gruppe durch einen Zeiger und eine

andere Gruppe durch eine feste Anzahl von

Wiederholungen abgebildet werden.

• Eine feste Anzahl von Wiederholungen ist dann

vorzuziehen, wenn es eine obere Grenze von

Wiederholungen gibt und die durchschnittliche Anzahl

von Vorkommen nahe am Maximum liegt.

• Wenn das durchschnittliche und das maximale

Vorkommen zu sehr voneinander abweichen, ist die

Pointer Methode wegen Speicherersparnis vorzuziehen.

• Die Pointer Methode spart Platz, verbraucht aber mehr

Blockzugriffe um ein bestimmtes Feld zu finden.

Page 11: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 11

Grundlagen der Datenbanksysteme II

1. Variante der Combined Method:

Eine Gruppe mit fester Anzahl, eine andere Gruppe durch

die Pointer Methode:

WERT_A ( WERT_B )* ( WERT_C )*

max = c Zeiger

WERT_A Pc

Page 12: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 12

Grundlagen der Datenbanksysteme II

2. Alternative Variante:

Ein Teil Gruppe wird durch eine kleine Anzahl von festen

Wiederholungen repräsentiert, dazu kommt ein Zeiger, der

auf eventuelle zusätzliche Vorkommen verweist.

A , x1 , x2 , … , xn

*

A , x1 , x2 , P

A , count, x1 , x2 , P

Page 13: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 13

Grundlagen der Datenbanksysteme II

Beispiel:

Als Beispiel dienen wieder die Staaten mit ihren Highways.

Annahme:

Es wird Platz für einen Staat und 3 Highways in einem

Satz reserviert, weitere Highways sollen per Zeiger

adressiert werden.

STATE ( HIGHWAY )*

STATE COUNT HIGHW1 HIGHW2 HIGHW3 Pointer

HIGHW4 HIGHW5 HIGHW6

: :

Page 14: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 14

Grundlagen der Datenbanksysteme II

Operationen auf Sätzen mit variabler Länge

Gegeben ist eine logische Datei mit Sätzen variabler Länge, die

durch eine Hauptdatei mit Sätzen fester Länge repräsentiert

wird (evtl. mit Zeigern auf Blocks, die nicht Teil der Hauptdatei

sind).

Einige Felder in dem Teil mit fester Länge formen den

Schlüssel für die Sätze der logischen Datei.

Zur Erinnerung: Die Motivation für Sätze variabler Länge war

es, many-to-many- oder many-to-one-Beziehungen abbilden zu

können.

E1 E2n m

e1

e2

e2’

Page 15: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 15

Grundlagen der Datenbanksysteme II

Die Operationen

• Suchen (Lookup)

• Einfügen (Insertion)

• Löschen (Deletion)

• Ändern (Modification)

funktionieren hier genauso wie bei Sätzen mit fester Länge.

Page 16: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 16

Grundlagen der Datenbanksysteme II

Neue Operationen sind aber die Einfüge, und Löschoperation

auf Vorkommen von Feldern innerhalb einer Gruppe.

Man kann jede Gruppe als eine eigene kleine Datei ansehen.

Auf diese Weise können auch hier wieder die bekannten

Verfahren angewendet werden.

Im Falle von pinned-down Sätzen innerhalb der Gruppe gelten

für das Einfügen und Löschen besondere Regeln, die bereits

bei den Hash-Dateien besprochen wurden (Bucket mit pinned

Records).

Page 17: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 17

Grundlagen der Datenbanksysteme II

DATENSTRUKTUREN FÜR SUCHE IN

FELDERN AUSSERHALB DES SCHLÜSSELS.

Eine Datenbank erlaubt meist auch Anfragen (Queries) in

denen in Feldern gesucht wird, die nicht dem Schlüssel

angehören.

z.B.:

1. Suche alle Dinosaurier aus dem Jura.

2. Suche nach den Habitaten der fleischfressenden Saurier.

3. Finde alle Dinosaurier die an Land gelebt haben und

mindestens 50 Fuß lang waren.

Page 18: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 18

Grundlagen der Datenbanksysteme II

Sekundärindex

r (Record, Satz)

F (Field, Feld)

Domäne von F = D

Ein Sekundärindex für das Feld F ist eine Beziehung zwischen

der Domäne D und der Menge von Sätzen der Datei.

Page 19: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 19

Grundlagen der Datenbanksysteme II

Ein Sekundärindex stellt sich als eine logische Datei mit Sätzen

variabler Länge dar und wird auch als invertierte Datei bezeichnet:

WERT ( SATZ )*

Eine Instanz von WERT ist ein Wert aus der Domäne D. Eine

Instanz von SATZ ist entweder

1. Ein Zeiger auf einen Satz mit dem entsprechenden

Wert in Feld F, oder

2. Ein Schlüsselwert für einen Satz mit dem entsprechen

Wert in Feld F.

1: ( 55, p1, p2, p3 ) 2: ( 55, Schmidt, Otto, Müller )

Page 20: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 20

Grundlagen der Datenbanksysteme II

1. Falls die erste Option gewählt wird, kann der Zeiger auf

• einen Block

• einen Subblock

• ein Bucket

zeigen. Die Sätze der Hauptdatei sind dann pinned-down (!!).

2. Falls die zweite Option gewählt wird, dann sind die Sätze

nicht pinned-down, aber es werden weitere Blockzugriffe

benötigt, um den entsprechenden Satz zu finden.

Page 21: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 21

Grundlagen der Datenbanksysteme II

SPEICHERSTRUKTUREN FÜR RELATIONEN

Darstellung einer Relation:

Datei, deren Sätze den Tupeln der Relation entsprechen.

HEAP:

Einfachste Struktur: Datei ungeordnet.

Vorteilhaft nur bei sehr kleinen Relationen.

INDEX:

Der Index muß sich nicht unbedingt auf Schlüsselattribute

beziehen (Sekundärindex). Damit wird eine Verwendung

mehrerer Indizes auf eine Datei möglich

(Achtung!! pinned Records!).

Page 22: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 22

Grundlagen der Datenbanksysteme II

Mögliche Indexarten:

• Index mit pinned Records (INGRES).

• Hashorganisation (INGRES, UNIFY)

• B*-Baum auf Dense Index (SystemR, Oracle, Adabas D)

CLUSTERING INDEX:

Index über ein oder mehrere Attribute, so daß Tupel mit

demselben Attributwert für diese Attribute beieinander

gespeichert sind.

Page 23: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 23

Grundlagen der Datenbanksysteme II

Speicherung von Relationen in INGRES:

• Relationen werden als UNIX Dateien gespeichert.

• Datei = Folge von Blöcken mit jeweils 512 Bytes.

• Tupel Satz Block

Page 24: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 24

Grundlagen der Datenbanksysteme II

In INGRES bestehen drei Möglichkeiten die Relationen zu

organisieren:

1. Heap, unsortiert, keine Zugriffsstruktur, Voreinstellung für

alle Relationen.

2. Hash. Eine Relation kann in Hash-Organisation gebracht

werden, indem man folgendes DDL-Statement ausführt:

modify R to hash on A1,…,Ak

Die Attribute A1 bis Ak formen hierbei den Schlüssel.

3. Index. Eine Organisationsform mit Sparse-Index kann mit

dieser DDL-Anweisung erreicht werden:.

modify R to isam on A1,…,Ak

Page 25: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 25

Grundlagen der Datenbanksysteme II

4. Eine vierte Option, die in INGRES möglich ist, ist das

Anlegen eines Sekundärindex:

index on R is S(A1,…,Ak)

Die Relation S wird damit zum Sekundärindex über den

Attributen A1,…,Ak. Die Datei für S wird automatisch als

ISAM Datei mit Sparse-Index angelegt, dies kann aber durch

ein modify Kommando geändert werden.

Page 26: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 26

Grundlagen der Datenbanksysteme II

Speicherung von Relationen in Oracle und ADABAS D

• Relationen werden als Dateien des Dateisystems oder als

sogenannte Raw-Partition gespeichert. Letzteres ist ein

unformatierter nicht vom Dateisystem verwalteter Abschnitt

einer Platte.

• Datei = Folge von Blöcken mit fester Länge,

in Oracle abhängig vom Betriebssystem,

in ADABAS D 4 kByte.

• Tupel Satz Block

Page 27: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 27

Grundlagen der Datenbanksysteme II

Die Relationen sind grundsätzlich als B*-Baum über einem

Dense-Index organisiert.

Dense Index

Hauptdatei

B*-Baum

Page 28: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 28

Grundlagen der Datenbanksysteme II

Sekundärindizes werden ebenfalls über B*-Bäume realisiert.

Achtung!: Dies ist nur durch Verwendung eines Dense-Index

möglich, da die Sätze der Hauptdatei durch das verwenden

mehrere Indizes pinned-down sind.

Datei mit primär- und sekundär-Index:

Dense Index

Hauptdatei

B*-Baum

Dense Index

Primärindex

Sekundärindex

Index überSekundärindex

Page 29: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 29

Grundlagen der Datenbanksysteme II

In ADABAS D werden die Blätter des B*-Baumes miteinander

verkettet, um das Durchlaufen der Datei in sequentieller

Reihenfolge zu ermöglichen (evtl. auch in Oracle).

Page 30: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 30

Grundlagen der Datenbanksysteme II

CLUSTERING

Abspeichern von Tupeln verschiedener Relationen mit

gleichen Werten bestimmter Attribute im gleichen Block

(Prejoin).

Immer ein Satz der einen Relation befindet sich in einem Block

mit mehreren Sätzen der anderen Relation.

(Vergleiche: Hierarchisches Datenmodell)

Page 31: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 31

Grundlagen der Datenbanksysteme II

Beispiel: Cluster aus logischer Sicht

Nicht geclusterte Tabellen DEPT & EMP

DEPT

DMPTNO DNAME LOC

10 ACCOUNTING NEW YORK

20 RESEARCH DALLAS

30 SALES CHICAGO

40 OPERATIONS BOSTON

EMP

EMPNO ENAME JOB MGR SAL COMM DEPTNO

7369 SMITH CLERK 7902 800 20

7499 ALLEN SALESMAN 7698 1600 300.00 30

7521 WARD SALESMAN 7698 1250 500 30

7566 JONES MANAGER 7839 3975 20

7654 MARTIN SALESMAN 7698 1250 1400 30

7782 CLARK MANAGER 7839 2450 10

7839 KING PRESIDENT 5000 10

Page 32: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 32

Grundlagen der Datenbanksysteme II

Erzeugen eines DEPT zu EMP Clusters:

CREATE CLUSTER DEPT_EMP(DEPTNO NMBER);

DEPT Tabelle zum Cluster hinzufügen:

ALTER CLUSTER DEPT_EMP

ADD TABLE DEPT

WHERE DEPT.DEPTNO = DEPT_EMP.DEPTNO;

EMP Tabelle zum Cluster hinzufügen:

ALTER CLUSTER DEPT_EMP

ADD TABLE EMP

WHERE EMP.DEPTNO = DEPT_EMP.DEPTNO;

Page 33: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 33

Grundlagen der Datenbanksysteme II

Geclusterte EMP und DEPT Tabelle:

CLUSTER 10

ACCOUNTING NEWYORK

7782 CLARK MANAGER 7839 2450

7839 KING PRESIDENT 5000

CLUSTER 20

RESEARCH DALLAS

7369 SMITH CLERK 7902 800

7566 JONES MANAGER 7839 2975

CLUSTER 30

SALES CHICAGO

7499 ALLEN SALESMAN 7698 1600 300

7521 WARD SALESMAN 7698 1250 500

7654 MARTIN SALESMAN 7698 1250 1400

Page 34: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 34

Grundlagen der Datenbanksysteme II

Typischerweise wendet man Clustering an, wenn folgendes

gegeben ist:

Zwei Relationen R und S und eine Menge von Attributen X, mit

1. X ist in R und in S

2. X ist Schlüssel von R

3. Wenn t ∈ S, dann gilt ∃ t’ ∈ R mit:

t’[x] = t [x].

Clustering ist aus dem Netzwerkmodell entliehen, es wird durch

das Set-Konstrukt verwirklicht.

Page 35: SÄTZE MIT VARIABLER LÄNGE - bigdata.uni-frankfurt.de · Sätze variabler Länge 2 Grundlagen der Datenbanksysteme II Definition von Sätzen mit variabler Länge 1. Ein Satz mit

Sätze variabler Länge 35

Grundlagen der Datenbanksysteme II

Alternative: Ring Struktur

R S

Vergleich zwischen :

• Cluster R, S und

• Ring Struktur R, S