Ontologie-basierte Informationsnutzung 2. Kapitel aus dem Buch Information Sharing on the Semantic...

Preview:

Citation preview

Ontologie-basierte Informationsnutzung

2. Kapitel aus dem Buch

Information Sharing on the Semantic Web von Heiner Stukenschmidt und van Harmelen

Lehrgebiet: Multimedia und Internetanwendungen

(Univ.-Prof.Dr.-Ing. M.L. Hemmje)

Thema: Daten-, Informations- und Wissensmanagement im Internet

FernUniversität Hagen ws2006/07- Christina Sergel

1.0 Inhalt

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

1.0 Semantische Heterogenität

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

1.1 Semantische Heterogenität

• Konflikte durch semantische Heterogenität:– Verwechslungskonflikte: Käfer = Auto oder Tier? – Skalierungskonflikte: 3-Sterne Hotel = traumhaftes

Hotel?– Namenskonflikte: Lehrer = Angestellter = Person

• Mangel für ein gemeinsames Verständnis: – nicht eindeutig, dadurch

Kommunikationsschwierigkeiten – Unterschiedliche Spezifizierungen für ein System

Ontologien als Lösung

2.0 Ontologien

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

2. Ontologien

1. Der Begriff Ontologie

2. Was sind Ontologien

3. Konzeptualisierung

4. Gemeinsam genutztes Vokabular

5. Spezifikation des Wissenskontexts

6. Sinnvolle Anwendungen

Bild: Zoologische Staatssammlung München

2.1 Der Begriff Ontologie

• Disziplin der Philosophie – die Lehre vom Sein.

• Im Kontext der Informationstechnologie „An Ontology is a formal, explicit specification of a shared conceptualization“ [Gruber,1993]

• besteht aus 4 Komponenten: Konzepte, Instanzen Relationen, Axiome.Bild: DERRIDA‘S MACHINES 2004:Polycontextural modelling of polysemy

2.2 Was sind Ontologien

• Ontologie als ein kontrolliertes VokabularEine Menge von Begriffen mit sehr detaillierter und eindeutigen Beschreibung. Einigung auf gemeinsame Sprache

• Ontologie als Taxonomienhierarchisch strukturierte IST-EIN-Beziehung von Konzepten und Begriffen: Branchenbuch,ISO-Nr.

• Ontologie & Schemata–Schemata beschreiben die Definition von Bedingungen, zB Typen, Schemata werden entworfen für eine spez. Applikation

• Web-Ontologie sind Taxonomien mit InferenzregelnDas Ziel ist ein bestimmtes Fachgebiet mit einer großen Community zu konzeptualisieren.

Bild: Zoologische Staatssammlung München

2.3 Konzeptualisierung

• ein abstraktes Modell von Konzepten und seinen Beziehungen für ein allgemein anerkanntes Weltbild

• Ein Konzept ist eine gedankliche Vorstellung über ein reales Ding in der Welt.

• Eine explizite Spezifizierung gibt den Konzepten und Beziehungen des abstrakten Modells explizit Namen und Eigenschaften.

Semantisches Dreieck von Ogden et al.

2.4 Gemeinsam genutztes Vokabular

Eigenschaften von begrifflichen Ordnungssystemen [RWTH01]

Für ein gemeinsames Verständnis für Mensch und Maschine: • Erstellung eines standardisierten und „kontrollierten“ Vokabulars,

das von allen Beteiligten allgemein anerkannt und genutzt wird. • Vokabular muss einschränkend + spezifisch genug sein, • hinreichend flexibel + so allgemein wie möglich, • Disjunkt (Pizza<> Eis )und vollständig (Länder einer Welt)

Martin Pflüglmayer: Computerbasierte Terminologie:“Medizinische Ordnungssysteme, Terminologien und Ontologien“; Aachen 2001

2.4.1 Commen Sense Knowledge CyC

Die CyC-Wissens-Pyramide

• hunderttausende Begriffe

• Formt eine Upper-Ontologie

• Seit April 2006 unabhängige non-profit Organisation OpenCyC

• Ontologisches Wissen + passende Inferenzmechanismen

• Eigene CyCL-Sprache

Quelle: http://www.cyc.com/

2.5 Die Spezifikation des Wissenskontext

dieser Apfel ist rotRot (X) karmesinrot ist ein rot diese Person ist ein rot(er) [Quelle:Guarino: The ontological Level ‚95]

• Wissen implementierungsunabhängig auf dem Wissenslevel in einer Repräsentationsform beschreiben

• Wissen implementierungsabhängig von Programmiersprache und – konzepte spezifizieren.

2.5.1 Grad der Formalität

• Total informal: Lose formulierter Text• Semi- informal

– Kontrolliertes Vokabular reduziert Mehrdeutigkeiten :Glossare

• Semi-formal- mit Regelsystemen kann Wissen schnell und einfach in Regeln

ausgedrückt werden. Nachteil: Beschreibung komplexer Problembereiche - Frames, ein Modell zur Darstellung von Konzepten, meist als OO-

Datenmodell implementiert- Semantische Netze, Knoten mit gerichteten Graphen

• Rigoros FormalPrädikatenlogik mit verschiedenen Ableitungsregeln (HORN-Logik,

Resolutionskalkül, Transitivität,Inverse) ermöglicht automatische Konsistenzüberprüfung und Inferenzfähigkeit: DL, TOVE, relationale Datenbanken

Bild: D. Oberle, S. Staab, R Volz: Three Dimensions of Knowledge Representation in WonderWeb

2.5.2 Maß der Definitionstiefe

Kriterien: Ausdrucksstärke, Inferenzmächtigkeit und Entscheidbarkeit

• XML: Syntax für strukturierte Dokumente, keine Semantik• RDF: Datenmodell, dass Relationen zwischen Ressourcen

eindeutig mit URIs beschreibt• RDFS: Stellt Mechanismen bereit, um Relationen zw.

Attributen und Ressourcen zu definieren. • OIL: Ontology Interchange L.. Enthält entscheidbare

Fragmente der Prädikatenlogik (DL)• OWL-L, OWL-DL, OWL-FULLBild: Fensel, van Harmelen:OIL:An Ontology Infrastructure for the Semantic

Web, 2001

2.6 Sinnvolle Anwendungsbereiche

Ontologie

Kommu-nikation

InformationRetrieval

Inter-operabilität

System-technik

2.6.1 Kommunikation

– Normatives Modell: Ontologien als ein gemeinsamer Wissensspeicher (Archive, Gesetzestexte, Regeln)

– Beziehungsnetzwerke: Ontologien stellen wirtschaftliche und soziale Beziehungsnetze bereit (FOAF) P2P-Systeme

– Konsistenz und Mehrdeutigkeiten: konsistente Ontologie durch Reasoners

– Integration von verschiedenen Ansichten: ffPoirot

ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996

2.6.2 Systemtechnik

• Spezifikation: von Anforderungen für ein IT-System (Dokumentation)

• Zuverlässigkeit: informale bzw. formale Konsistenzüberprüfung

• Wiederverwendbarkeit: easy to re-use-Bibliothek, Aufbau der Ontologie-Bibliotheken.

• Erweiterbarkeit, Offenheit: Ontologie-Bibliotheken müssen erweiterbar sein

2.6.3 Interoperabilität

• Ontologien als Austauschformat (KIF)

Gemeinsam genutztes Vokabular erleichtert InteroperabilitätQuelle:ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael

Gruninger ,1996

2.6.4 Information Retrieval

• für die qualitative Suche (informal und formal)

besseres Verständnis

• Für die Wissensgewinnung

• Ontologien für die Evaluation von Wissenssystemen

Content Management Systeme (OntoWeb)

ONTOLOGIES: Principles, Methods and Applications von Mike Uschold & Michael Gruninger ,1996

Ontologien in der Informationintegration

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

3.1 Welche Rollen haben Ontologien

• Repräsentation des InhaltsAufgabe der O. ist Wissensrepräsentation – Single-Ontologie-Ansatz

– Multiple-Ontologie-Ansatz

– Hybrid-Ansatz

• Query-ModellZugriff auf die Wissensbasis

• VerifikationWartung der Integration und Extension

3.1.1 Single-Ontologie-Ansatz: SIMS

• Eine zentrale Ontologie globale Sicht auf unterschiedl. Sourcen

• Gemeinsam genutztes Vokabular

• Vergleich d. O. einfach, • Enge Kopplung• Keine Wiederverwendung v. O.• Anfällig für Source-

Änderungen• Semantische Datenintegration?

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translationsekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

3.1.2 Multi-Ontologie-Ansatz:zB. OBSERVER

•Jede Informationsquelle hat seine eigene Ontologie (lokal View)•Kein gemeinsam genutztes Vokabular autonom•Lose Kopplung, keine ontologische Übereinstimmung•Vereinfacht Integration•Komplexität des O-Mapping O(n2) 1:1-Mapping beim OBSERVER, worst case: one way Mapping

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

.

3.1.3 Hybrid-Ansatz: z.B. COIN

• Jede Ressource hat seine eigene Ontologie

• Aufgebaut aus dem global gemeinsam genutzten Vokabular

• Neue Ressourcen können leicht hinzugefügt werden

• Unterstützt Evolution und Erwerb • Ontologien sind vergleichbar• Query-Prozessing ist komplex• Keine Wiederverwendung von O.

Quelle: Tzi: methodolgies for Ontology-Based Semantic Translation; sekt-d-4-2-2-SOA: Survey on ontology Merging and Aligning

3.2.0 Query-Modell

Zentrale Aufgabe von Ontologien: • Inferenzen auf und Abfragen von Ontologien

– Abfrage auf Ontologiestruktur – Abfrage von Fakten,

Kriterien für ein Query-Modell:• Verständlichkeit: Abfrage mit O-Begriffen intuitiv? für

welche Aufgaben kann es genutzt werden? Antworten klar und einfach ?

• Query Plan: klare Beschreibungen für jeden Interaktionsschritt zwischen den Ontologien.

• Optimierung: kann die Abfrage dramatisch beschleunigen.

3.3.0 Verifikation

• Verifikation: nicht die Ontologie wird überprüft, sondern die Korrektheit nach Mappings von Globalen zu lokalen Ontologien und umgekehrt

• Validation einer Ontologie: in wieweit entspricht die Ontologie dem Realitätsausschnitt, den sie abbilden soll

• Nur möglich bei formalsprachlicher Spezifikation, die vollständig ist. (Query containment)

• Qualität der Überprüfung ist von der Vollständigkeit einer Ontologie abhängig.

4.0 Framework für die Informationsnutzung

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

4.1 Framework für die ontologiebasierte Informationsnutzung

2 prinzipielle Methoden für gemeinsame Nutzung von Informationen:

• Retrieval

• Integration

mit standardisiertem Vokabular

Wiederverwendung von Ontologien

4.2 Infrastruktur eines Framework

• Architektur: Hybrid-Ansatz

• 3-Schichten Infrastruktur:– Unterste Ebene: Daten,

Metadaten und Ressourcen

– Middleware-Ebene: Mapping-Regeln, Verifikation, Transformation, Queries, Reformulierungen

– Oberste Ebene: wiederverwendbare Ontologien und gemeinsam genutztes Vokabular

Quelle: M.Doerr: The CIDOC CRM, an Ontological Approach to Schema Heterogeneity, 2005

5.0 Ontologische Vereinbarungen

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

5.1 Ontologische Vereinbarung

• Minimale Kodierungsabweichung

Konzeptualisierung auf der Wissensebene

• Minimal ontological commitment:

• Zuviele Einschränkung begrenzt die Offenheit

• Zuwenige erhöht Inkonsistenz u. inkorrekte Modulierung

Bild: Stuckenschmidt/Van Harmelen: Information Shraring 2003

5.2 Der Übersetzungsprozess

• Merging

• Mapping

• Ontology Aligning

Quelle: SEKT:D4.2.2 State-of-the-art survey on Ontology Merging and Aligning V2, 2003

Ontologienimportieren

Ähnlichkeiten finden

Mapping spezifizieren

6.0 Ontologie-Engineering

1. Semantische Heterogenität

2. Ontologien

3. Ontologien in der Informationsintegration

4. Framework für die ontologiebasierte Informationsnutzung

5. Ontologische Vereinbarungen

6. Ontologie-Engineering

6.0 Ontologie-Engineering

1. Zweck und Anwendungsbereich identifizieren

2. Ontologie – Aufbau1. Klassifizieren

2. Strukturieren ,

3. Integration von existierenden Ontologien

3. Validieren, Verifizieren

4. Verfeinern

5. Verwalten und Benutzbarkeit testen

6. Evaluieren Bild: [Buitelaar: Human Language Technology for the

Semantic Web; 2005]

Ontologischer Lebenszyklus

6.0 Zusammenfassung

• Ontologien reduzieren semantische Heterogenität

• Domain-Ontologien erfassen und formalisieren semantik-erhaltendes Wissen durch ein standardisiertes eindeutiges Vokabular

• Applikations-Ontologien nutzen Ontologien für das Wissensmanagement (ecommerce, Medizin, Umwelt, Recht)

• Die Verwaltung von schwach-strukturierten Ressourcen wird durch semi-automatisierte Übersetzung erleichtert

Recommended