35
Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet: Multimedia und Internetanwendungen (Univ.-Prof.Dr.-Ing. M.L. Hemmje) Thema: Daten-, Informations- und Wissensmanagement im Internet FernUniversität Hagen ws2006/07- Christina Sergel

Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

Embed Size (px)

Citation preview

Page 1: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

Ontologie-basierte Informationsnutzung

2. Kapitel aus dem Buch

Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen

Lehrgebiet: Multimedia und Internetanwendungen

(Univ.-Prof.Dr.-Ing. M.L. Hemmje)

Thema: Daten-, Informations- und Wissensmanagement im Internet

FernUniversität Hagen ws2006/07- Christina Sergel

Page 2: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

1.0 Inhalt

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 3: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

1.0 Semantische Heterogenität

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 4: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

1.1 Semantische Heterogenität

• Konflikte durch semantische Heterogenität:– Verwechslungskonflikte: Käfer = Auto oder Tier? – Skalierungskonflikte: 3-Sterne Hotel = traumhaftes

Hotel?– Namenskonflikte: Lehrer = Angestellter = Person

• Mangel für ein gemeinsames Verständnis: – nicht eindeutig, dadurch

Kommunikationsschwierigkeiten – Unterschiedliche Spezifizierungen für ein System

Ontologien als Lösung

Page 5: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.0 Ontologien

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 6: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2. Ontologien

1. Der Begriff Ontologie

2. Was sind Ontologien

3. Konzeptualisierung

4. Gemeinsam genutztes Vokabular

5. Spezifikation des Wissenskontexts

6. Sinnvolle Anwendungen

Bild: Zoologische Staatssammlung München

Page 7: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.1 Der Begriff Ontologie

• Disziplin der Philosophie – die Lehre vom Sein.

• Im Kontext der Informationstechnologie „An Ontology is a formal, explicit specification of a shared conceptualization“ [Gruber,1993]

• besteht aus 4 Komponenten: Konzepte, Instanzen Relationen, Axiome.Bild: DERRIDA‘S MACHINES 2004:Polycontextural modelling of polysemy

Page 8: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.2 Was sind Ontologien

• Ontologie als ein kontrolliertes VokabularEine Menge von Begriffen mit sehr detaillierter und eindeutigen Beschreibung. Einigung auf gemeinsame Sprache

• Ontologie als Taxonomienhierarchisch strukturierte IST-EIN-Beziehung von Konzepten und Begriffen: Branchenbuch,ISO-Nr.

• Ontologie & Schemata–Schemata beschreiben die Definition von Bedingungen, zB Typen, Schemata werden entworfen für eine spez. Applikation

• Web-Ontologie sind Taxonomien mit InferenzregelnDas Ziel ist ein bestimmtes Fachgebiet mit einer großen Community zu konzeptualisieren.

Bild: Zoologische Staatssammlung München

Page 9: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.3 Konzeptualisierung

• ein abstraktes Modell von Konzepten und seinen Beziehungen für ein allgemein anerkanntes Weltbild

• Ein Konzept ist eine gedankliche Vorstellung über ein reales Ding in der Welt.

• Eine explizite Spezifizierung gibt den Konzepten und Beziehungen des abstrakten Modells explizit Namen und Eigenschaften.

Semantisches Dreieck von Ogden et al.

Page 10: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.4 Gemeinsam genutztes Vokabular

Eigenschaften von begrifflichen Ordnungssystemen [RWTH01]

Für ein gemeinsames Verständnis für Mensch und Maschine: • Erstellung eines standardisierten und „kontrollierten“ Vokabulars,

das von allen Beteiligten allgemein anerkannt und genutzt wird. • Vokabular muss einschränkend + spezifisch genug sein, • hinreichend flexibel + so allgemein wie möglich, • Disjunkt (Pizza<> Eis )und vollständig (Länder einer Welt)

Martin Pflüglmayer: Computerbasierte Terminologie:“Medizinische Ordnungssysteme, Terminologien und Ontologien“; Aachen 2001

Page 11: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.4.1 Commen Sense Knowledge CyC

Die CyC-Wissens-Pyramide

• hunderttausende Begriffe

• Formt eine Upper-Ontologie

• Seit April 2006 unabhängige non-profit Organisation OpenCyC

• Ontologisches Wissen + passende Inferenzmechanismen

• Eigene CyCL-Sprache

Quelle: http://www.cyc.com/

Page 12: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.5 Die Spezifikation des Wissenskontext

dieser Apfel ist rotRot (X) karmesinrot ist ein rot diese Person ist ein rot(er) [Quelle:Guarino: The ontological Level ‚95]

• Wissen implementierungsunabhängig auf dem Wissenslevel in einer Repräsentationsform beschreiben

• Wissen implementierungsabhängig von Programmiersprache und – konzepte spezifizieren.

Page 13: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.5.1 Grad der Formalität

• Total informal: Lose formulierter Text• Semi- informal

– Kontrolliertes Vokabular reduziert Mehrdeutigkeiten :Glossare

• Semi-formal- mit Regelsystemen kann Wissen schnell und einfach in Regeln

ausgedrückt werden. Nachteil: Beschreibung komplexer Problembereiche - Frames, ein Modell zur Darstellung von Konzepten, meist als OO-

Datenmodell implementiert- Semantische Netze, Knoten mit gerichteten Graphen

• Rigoros FormalPrädikatenlogik mit verschiedenen Ableitungsregeln (HORN-Logik,

Resolutionskalkül, Transitivität,Inverse) ermöglicht automatische Konsistenzüberprüfung und Inferenzfähigkeit: DL, TOVE, relationale Datenbanken

Bild: D. Oberle, S. Staab, R Volz: Three Dimensions of Knowledge Representation in WonderWeb

Page 14: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.5.2 Maß der Definitionstiefe

Kriterien: Ausdrucksstärke, Inferenzmächtigkeit und Entscheidbarkeit

• XML: Syntax für strukturierte Dokumente, keine Semantik• RDF: Datenmodell, dass Relationen zwischen Ressourcen

eindeutig mit URIs beschreibt• RDFS: Stellt Mechanismen bereit, um Relationen zw.

Attributen und Ressourcen zu definieren. • OIL: Ontology Interchange L.. Enthält entscheidbare

Fragmente der Prädikatenlogik (DL)• OWL-L, OWL-DL, OWL-FULLBild: Fensel, van Harmelen:OIL:An Ontology Infrastructure for the Semantic

Web, 2001

Page 15: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.6 Sinnvolle Anwendungsbereiche

Ontologie

Kommu-nikation

InformationRetrieval

Inter-operabilität

System-technik

Page 16: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.6.1 Kommunikation

– Normatives Modell: Ontologien als ein gemeinsamer Wissensspeicher (Archive, Gesetzestexte, Regeln)

– Beziehungsnetzwerke: Ontologien stellen wirtschaftliche und soziale Beziehungsnetze bereit (FOAF) P2P-Systeme

– Konsistenz und Mehrdeutigkeiten: konsistente Ontologie durch Reasoners

– Integration von verschiedenen Ansichten: ffPoirot

ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996

Page 17: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.6.2 Systemtechnik

• Spezifikation: von Anforderungen für ein IT-System (Dokumentation)

• Zuverlässigkeit: informale bzw. formale Konsistenzüberprüfung

• Wiederverwendbarkeit: easy to re-use-Bibliothek, Aufbau der Ontologie-Bibliotheken.

• Erweiterbarkeit, Offenheit: Ontologie-Bibliotheken müssen erweiterbar sein

Page 18: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.6.3 Interoperabilität

• Ontologien als Austauschformat (KIF)

Gemeinsam genutztes Vokabular erleichtert InteroperabilitätQuelle:ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael

Gruninger ,1996

Page 19: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

2.6.4 Information Retrieval

• für die qualitative Suche (informal und formal)

besseres Verständnis

• Für die Wissensgewinnung

• Ontologien für die Evaluation von Wissenssystemen

Content Management Systeme (OntoWeb)

ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996

Page 20: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

Ontologien in der Informationintegration

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 21: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.1 Welche Rollen haben Ontologien

• Repräsentation des InhaltsAufgabe der O. ist Wissensrepräsentation – Single-Ontologie-Ansatz

– Multiple-Ontologie-Ansatz

– Hybrid-Ansatz

• Query-ModellZugriff auf die Wissensbasis

• VerifikationWartung der Integration und Extension

Page 22: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.1.1 Single-Ontologie-Ansatz: SIMS

• Eine zentrale Ontologie globale Sicht auf unterschiedl. Sourcen

• Gemeinsam genutztes Vokabular

• Vergleich d. O. einfach, • Enge Kopplung• Keine Wiederverwendung v. O.• Anfällig für Source-

Änderungen• Semantische Datenintegration?

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translationsekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

Page 23: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.1.2 Multi-Ontologie-Ansatz:zB. OBSERVER

•Jede Informationsquelle hat seine eigene Ontologie (lokal View)•Kein gemeinsam genutztes Vokabular autonom•Lose Kopplung, keine ontologische Übereinstimmung•Vereinfacht Integration•Komplexität des O-Mapping O(n2) 1:1-Mapping beim OBSERVER, worst case: one way Mapping

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

.

Page 24: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.1.3 Hybrid-Ansatz: z.B. COIN

• Jede Ressource hat seine eigene Ontologie

• Aufgebaut aus dem global gemeinsam genutzten Vokabular

• Neue Ressourcen können leicht hinzugefügt werden

• Unterstützt Evolution und Erwerb • Ontologien sind vergleichbar• Query-Prozessing ist komplex• Keine Wiederverwendung von O.

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

Page 25: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.2.0 Query-Modell

Zentrale Aufgabe von Ontologien: • Inferenzen auf und Abfragen von Ontologien

– Abfrage auf Ontologiestruktur – Abfrage von Fakten,

Kriterien für ein Query-Modell:• Verständlichkeit: Abfrage mit O-Begriffen intuitiv? für

welche Aufgaben kann es genutzt werden? Antworten klar und einfach ?

• Query Plan: klare Beschreibungen für jeden Interaktionsschritt zwischen den Ontologien.

• Optimierung: kann die Abfrage dramatisch beschleunigen.

Page 26: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

3.3.0 Verifikation

• Verifikation: nicht die Ontologie wird überprüft, sondern die Korrektheit nach Mappings von Globalen zu lokalen Ontologien und umgekehrt

• Validation einer Ontologie: in wieweit entspricht die Ontologie dem Realitätsausschnitt, den sie abbilden soll

• Nur möglich bei formalsprachlicher Spezifikation, die vollständig ist. (Query containment)

• Qualität der Überprüfung ist von der Vollständigkeit einer Ontologie abhängig.

Page 27: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

4.0 Framework für die Informationsnutzung

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 28: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

4.1 Framework für die ontologiebasierte Informationsnutzung

2 prinzipielle Methoden für gemeinsame Nutzung von Informationen:

• Retrieval

• Integration

mit standardisiertem Vokabular

Wiederverwendung von Ontologien

Page 29: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

4.2 Infrastruktur eines Framework

• Architektur: Hybrid-Ansatz

• 3-Schichten Infrastruktur:– Unterste Ebene: Daten,

Metadaten und Ressourcen

– Middleware-Ebene: Mapping-Regeln, Verifikation, Transformation, Queries, Reformulierungen

– Oberste Ebene: wiederverwendbare Ontologien und gemeinsam genutztes Vokabular

Quelle: M.Doerr: The CIDOC CRM, an Ontological Approach to Schema Heterogeneity, 2005

Page 30: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

5.0 Ontologische Vereinbarungen

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 31: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

5.1 Ontologische Vereinbarung

• Minimale Kodierungsabweichung

Konzeptualisierung auf der Wissensebene

• Minimal ontological commitment:

• Zuviele Einschränkung begrenzt die Offenheit

• Zuwenige erhöht Inkonsistenz u. inkorrekte Modulierung

Bild: Stuckenschmidt/Van Harmelen: Information Shraring 2003

Page 32: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

5.2 Der Übersetzungsprozess

• Merging

• Mapping

• Ontology Aligning

Quelle: SEKT:D4.2.2 State-of-the-art survey on Ontology Merging and Aligning V2, 2003

Ontologienimportieren

Ähnlichkeiten finden

Mapping spezifizieren

Page 33: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

6.0 Ontologie-Engineering

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

Page 34: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

6.0 Ontologie-Engineering

1. Zweck und Anwendungsbereich identifizieren

2. Ontologie – Aufbau1. Klassifizieren

2. Strukturieren ,

3. Integration von existierenden Ontologien

3. Validieren, Verifizieren

4. Verfeinern

5. Verwalten und Benutzbarkeit testen

6. Evaluieren Bild: [Buitelaar: Human Language Technology for the

Semantic Web; 2005]

Ontologischer Lebenszyklus

Page 35: Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen Lehrgebiet:

6.0 Zusammenfassung

• Ontologien reduzieren semantische Heterogenität

• Domain-Ontologien erfassen und formalisieren semantik-erhaltendes Wissen durch ein standardisiertes eindeutiges Vokabular

• Applikations-Ontologien nutzen Ontologien für das Wissensmanagement (ecommerce, Medizin, Umwelt, Recht)

• Die Verwaltung von schwach-strukturierten Ressourcen wird durch semi-automatisierte Übersetzung erleichtert