31
On the Consistency of Spatial Semantic Integrity Constraints Konsistenzprüfung von räumlichen semantischen Integritätsregeln Stephan Mäs

PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Embed Size (px)

DESCRIPTION

Stephan Mäs PHD defense On the consistency of spatial semantic integrity constraints University of the Bundeswehr Munich

Citation preview

Page 1: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

On the Consistency of Spatial

Semantic Integrity Constraints

Konsistenzprüfung von räumlichen

semantischen Integritätsregeln

Stephan Mäs

Page 2: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 2 / 31

Problemstellung

Geographische Daten werden immer häufiger dezentral gehalten und mithilfe vernetzter Dienste ausgetauscht

Detailliertes Wissen über die jeweiligen Daten ist notwendig für deren Beurteilung und Nutzung

Modellbasierter Datenaustausch objektstrukturierter Geodaten

das Datenmodell wird zusammen mit den Daten bereitgestellt

semantische Integritätsregeln sind Teil dieser Datenmodelle und Teil der Qualitätsbeschreibung der Daten

Häufig mehrere tausend Integritätsregeln in einem Datenmodell

Prüfung der Integritätsregeln über hardcodierte Prüfroutinen

Management und Transfer der Integritätsregeln kaum möglich

Vergleich und Prüfung der internen Konsistenz der Regelsätze ist bisher nicht möglich

Methodik zum Vergleich und zur Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Page 3: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 3 / 31

Beispiel

Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.

Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.

Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.

Page 4: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 4 / 31

Beispiel

Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.

Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.

Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.

Page 5: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 5 / 31

Beispiel

Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.

Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.

Alle Auwälder sind disjunkt (disjoint) von allen Atomkraftwerken.

Alle Auwälder beinhalten (contains) ein Atomkraftwerk.

Page 6: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 6 / 31

Gliederung

1. Wissenschaftliche Grundlagen

Definition von semantischen Integritätsregeln

Logisches Schließen auf Basis von räumlichen Relationen

2. Ansatz für das Logische Schließen mit semantischen Integritätsregeln

Trennung von Instanz- und Klassenrelationen

Komposition von Klassenrelationen

3. Anwendungsszenario Daten Integration

4. Zusammenfassung & Ausblick

Page 7: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 7 / 31

Arten von Integritätsregeln

Domain Constraints

z.B. Einschränkungen von Attributwerten

Key and Relationship Constraints

z.B. Eindeutigkeit von Schlüsselattributen, Kardinalitätseinschränkungen

Semantic Integrity Constraints

schränken Relationen zwischen den Elementen des Datenmodells ein

spezifizieren wie die Semantik des Datenmodells im Datensatz umgesetzt / erzwungen wird

i.d.R. werden die eingeschränkten Relationen nicht explizit abgespeichert

Fokus der Arbeit liegt auf:

Semantischen Integritätsregeln welche auf binären räumlichen Relationen zwischen Objektklassen basieren

Page 8: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 8 / 31

Räumliche semantische Integritätsregeln

Beispiele aus der natürlichen Sprache:

Topologische Einschränkungen:

Höhenlinien dürfen sich nicht mit Seen überschneiden.

Auwälder müssen innerhalb einer Flussaue liegen.

Orientierung / Richtungseinschränkungen:

Ein Hinterhof muss sich immer hinter einem Gebäude befinden.

Metrische Einschränkungen:

Eine Tankstelle muss mindestens 300m Abstand zu Schulen haben.

Untersuchungsziel:

Konsistenzprüfung von solchen Regelsätzen durch logisches Schließen.

Page 9: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 9 / 31

Arten semantischer Integritätsregeln

Page 10: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 10 / 31

Logisches Schließen mit räumlichen Relationen

Komposition von räumlichen Relationen

A B C

Finites Set von räumlichen Relationen

Komposition Beispiel: Explizites Wissen:

A berührt (meet) B

B beinhaltet (contains) C

Implizites Wissen:

A ist disjunkt (disjoint) von C

Page 11: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 11 / 31

Komposition von räumlichen Relationen

Egenhofer, M. (1994): Deriving the Composition of Binary Topological Relations.

Page 12: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 12 / 31

Constraint Satisfaction Problems

Herleitung von implizitem Wissen und Detektion von Inkonsistenzen und Redundanzen in Relationennetzen

Knoten repräsentieren Objekte

Kanten repräsentieren die (räumlichen) Relationen

Konsistenzprüfung der Relationen aller Objekttriple

Page 13: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 13 / 31

Komposition Semantischer Integritätsregeln

Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.

Alle Flussauen sind disjunkt (disjoint) von allen Atomkraftwerken.

???

Page 14: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 14 / 31

Lösungsansatz

Aufteilung in 2 Ebenen:

getrennte Betrachtung der Kompositionen

von Instanzrelationen und

Kardinalitätseinschränkungen

Kombinierte

Kompositionen der

Klassenrelationen

Kompositionen der

Kardinalitätseinschränkungen

Klassenebene

Kompositionen der

Instanzrelationen

Instanzebene

Page 15: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 15 / 31

Komposition von Klassenrelationen

k1

inside disjoint

k2

k3

f1

f2

f3

a1

a2

a3

a4

Page 16: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 16 / 31

Komposition von Klassenrelationen

Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)

k1

inside disjoint

k2

k3

f1

f2

f3

a1

a2

a3

a4

Page 17: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 17 / 31

Komposition von Klassenrelationen

Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)

k1

inside disjoint

k2

k3

f1

f2

f3

a1

a2

a3

a4

Klassenebene: Alle Auwälder stehen in Relation r1 zu genau einer Flussaue ;

Alle Flussauen stehen in Relation r2 zu allen Atomkraftwerken

Alle Auwälder stehen in Relation r3 zu allen Atomkraftwerken.

Page 18: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 18 / 31

Komposition von Klassenrelationen

Instanzebene: inside(a,f ) ; disjoint(f ,k) disjoint(a .,k)

k1

inside disjoint

k2

k3

f1

f2

f3

a1

a2

a3

a4

Klassenebene: Alle Auwälder stehen in Relation r1 zu genau einer Flussaue ;

Alle Flussauen stehen in Relation r2 zu allen Atomkraftwerken

Alle Auwälder stehen in Relation r3 zu allen Atomkraftwerken.

Kombinierte Komposition der Klassenrelationen:

Page 19: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 19 / 31

Berücksichtigte Kardinalitätsbedingungen

Links-Totalität:

Jedes a steht in einer Relation r zu mindestens einem b.

Rechts-Totalität:

Jedes b steht in einer Relation r zu mindestens einem a.

To

tal

Pa

rtic

ipa

tio

n

Rechts-Eindeutigkeit:

Kein a steht in einer Relation r zu mehr als einem b.

Links-Eindeutigkeit:

Kein b steht in einer Relation r zu mehr als einem a.

Ca

rdin

ali

ty

Ra

tio

Page 20: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 20 / 31

Definition von Klassenrelationen

RLD (A,B)

RRD (A,B)

RLT (A,B)

RRT (A,B)

RLD RD LT (A,B)

RLD RD RT (A,B)

RLD LT RT (A,B)

RRD LT RT (A,B)

RLD RD LT RT (A,B)

17 Abstrakte Klassenrelationen

RLD RD (A,B)

RLD LT (A,B)

RLD RT (A,B)

RRD LT (A,B)

RRD RT (A,B)

RLT RT (A,B)

Alle Auwälder liegen innerhalb (inside) genau einer Flussaue.

INSIDE RD LT (Auwälder, Flussauen)

links-total rechts-eindeutig

Sonderfall: RLT RT-all (A,B)

Rsome (A,B)

Page 21: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 21 / 31

Komposition von Klassenrelationen

Page 22: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 22 / 31

Prototypische Umsetzung

Page 23: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 23 / 31

Anwendungsszenario: Datenintegration

Hochwasser-analyse

Integration möglich?

Brauchbarkeit?

Datenquelle 2 Datenquelle 1

Implizite Restriktionen?

Implizite Restriktionen?

Page 24: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 24 / 31

Instanzebene: contains(fa,a); meet(a,f)

contains covers overlap(fa,f)

Alle Auwälder müssen an mindestens einem Fluss liegen (meet).

Alle Auwälder müssen innerhalb

(inside) einer Flussaue liegen.

Klassenebene:

Anwendungsszenario: Datenintegration

Page 25: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 25 / 31

Datenquelle 2 Datenquelle 1

overlapcoverscontains

overlapcoveredBy

insidemeetdisjoint

Anwendungsszenario: Datenintegration

Page 26: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 26 / 31

Datenquelle 2 Datenquelle 1

overlapcoverscontains

overlapcoveredBy

insidemeetdisjoint

Anwendungsszenario: Datenintegration

Page 27: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 27 / 31

Datenquelle 2 Datenquelle 1

overlapcoverscontains

overlapcoveredBy

insidemeetdisjoint

Widersprüche ?

Anwendungsszenario: Datenintegration

Page 28: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 28 / 31

Datenquelle 2 Datenquelle 1

overlapcoverscontains

overlapcoveredBy

insidemeetdisjoint

Widersprüche ?

Anwendungsszenario: Datenintegration

Page 29: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 29 / 31

Auflösung des Beispiels

Hochwasser-analyse

Integration ist möglich

Konsistenzprüfung notwendig

Datenquelle 2 Datenquelle 1

Implizite Restriktionen

vorhanden

Implizite Restriktionen

vorhanden

Page 30: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 30 / 31

Zusammenfassung

Kategorisierung von semantischen Integritätsregeln

Konsistenzprüfung von räumlichen semantischen Integritätsregeln / Klassenrelationen

Formale Beschreibung der semantischen Integritätsregeln

Generische Methodik zur Erkennung von Konflikten und Redundanzen

Die entwickelte Methodik ermöglicht die Erkennung von:

impliziten Restriktionen

widersprüchlichen Integritätsregeln

semantische Heterogenitäten und Konflikte in verschiedenen Datenmodellen

redundanten Restriktionen

Anwendungsgebiete:

Qualitätssicherung

Management von semantischen Integritätsregeln

Datenintegration

• Heterogenitäten der Qualitätsanforderungen

• Qualitätsunzulänglichkeiten in Bezug auf eine bestimme Nutzung

Page 31: PHD Defense: Konsistenzprüfung von räumlichen semantischen Integritätsregeln

Stephan Mäs Konsistenzprüfung von räumlichen semantischen

Integritätsregeln 31 / 31

Ausblick

Erweiterungsmöglichkeiten:

Vererbung von semantischen Integritätsregeln

Ternäre Relationen (a befindet sich zwischen b und c)

Erweiterung der Formalisierung (z.B. 0..2 als Kardinalität)

Berechnung von minimalen Regelsätzen

Minimierung des Rechenaufwandes bei der Qualitätssicherung

Räumliche Relationen und ihre Kompositionen

Relationen über mehrere räumliche Aspekte

Kognitive Plausibilität

Weitere Anwendungsgebiete:

Ontologien und konzeptionelle Datenmodellierung

Messung semantischer Ähnlichkeit (Semantic Similarity Measurement)