44
1 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe Integrationsansätze: Überblick und Potentiale semantischer Technologien Andreas Schmidt Abteilungsleiter im Forschungsbereich Information Process Engineering FZI Forschungszentrum Informatik, Karlsruhe [email protected] http://www.fzi.de/ipe

Integrationsansätze: Überblick und Potentiale semantischer Technologien

Embed Size (px)

DESCRIPTION

Vortrag auf dem Business Integration Forum 2007, Mainz, 25.4.07

Citation preview

Page 1: Integrationsansätze: Überblick und Potentiale semantischer Technologien

1 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe

Integrationsansätze: Überblick und Potentiale semantischer Technologien

Andreas Schmidt

Abteilungsleiter im Forschungsbereich Information Process

EngineeringFZI Forschungszentrum Informatik, Karlsruhe

[email protected]://www.fzi.de/ipe

Page 2: Integrationsansätze: Überblick und Potentiale semantischer Technologien

2Business Integration Forum 2007

Agenda

Strukturierung der Integrationsproblematik• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene

Potentiale semantischer Technologien• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene

Fazit

Page 3: Integrationsansätze: Überblick und Potentiale semantischer Technologien

3Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

Page 4: Integrationsansätze: Überblick und Potentiale semantischer Technologien

4Business Integration Forum 2007

Informationsperspektive

Einzubindende „Quellen“ sind Informationsquellen

Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma

Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen

Hauptproblem: • Überwindung der semantischen Heterogenität

(Datenmodell, Schema, Instanzdaten)• Architekturen zur konsistenten Datenhaltung

(Aktualisierung!)

Page 5: Integrationsansätze: Überblick und Potentiale semantischer Technologien

5Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Logische Ebene:Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

Page 6: Integrationsansätze: Überblick und Potentiale semantischer Technologien

6Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

Page 7: Integrationsansätze: Überblick und Potentiale semantischer Technologien

7Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

Page 8: Integrationsansätze: Überblick und Potentiale semantischer Technologien

8Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

Page 9: Integrationsansätze: Überblick und Potentiale semantischer Technologien

9Business Integration Forum 2007

Ebenen der semantischen Integration

Schemaintegration (bzw. Integration auf Schemaebene)• Zusammenführen und semantische Vereinheitlichung allein auf

der Basis von Schemainformationeno Typen, Klassen, Attribute, Vererbungsrelation etc.o Abbildung wird auf alle Instanzen angewendet

• Mapping-Tools

Instanzintegration (bzw. Integration auf Instanzebene)• Zusammenführen von Informationen über einzelne Instanzen

(oder Objekte)o auf der Basis von Werteno typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität,

wertabhängige Abbildungsregelno Schemainformation reicht als Information nicht aus!

Page 10: Integrationsansätze: Überblick und Potentiale semantischer Technologien

10Business Integration Forum 2007

Konflikte auf Instanzebene

Probleme• Duplikate • Veraltete Daten• falsche Daten

WBeschreibung WPreis hergestelltVonWaren

Name Strasse Stadt PlzAbnehmer

Land

HName HStrasse HStadt HPlzHersteller

Kunde Ware BestMengebestellt

Datum PreisProduzentversorgt

Abnehmer Ware MengeDatum

VBrancheVerband

PName PStrasse PStadt PPlzProduzent

PLand betreutVon

KName KStrasse KStadt KPlzKunden

Blau AG Domstr. 3 Köln 50033... ... ... ...

Blau AG Zement 10020.05.01... ... ......

BLAU... ... ... ... ...

Neuestr. 8, Heidelberg, 69115, Deutschland

System 1 System 2

Page 11: Integrationsansätze: Überblick und Potentiale semantischer Technologien

11Business Integration Forum 2007

Aufbau einer zentralen Datenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar

materialisierter Ansatza priori Integration (eager)

Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt:

virtueller AnsatzIntegration bei Bedarf (lazy)

Architektur : Virtuell vs. materialisiert

Page 12: Integrationsansätze: Überblick und Potentiale semantischer Technologien

12Business Integration Forum 2007

Materialisierter Ansatz

Zentrale Datenbasis

(periodischer) Import in diezentrale Datenbasis

Quellen

Anwendung

für Anfragen wird nur die zentrale Datenbasis genutzt

Page 13: Integrationsansätze: Überblick und Potentiale semantischer Technologien

13Business Integration Forum 2007

Virtuelle Integration

WrapperWrapper Wrapper

Mediator

Facilitator

Mediator

Quellenauswahl

Schema- undInstanzintegrati

on

Datenmodell-integration

Page 14: Integrationsansätze: Überblick und Potentiale semantischer Technologien

14Business Integration Forum 2007

Materialisierter Ansatz – Vorteile

Einfach zu realisieren• Anwendungsentwicklung unterscheidet sich durch

zentrale Datenbasis kaum vom Ein-Quellen-Fall• Mehr Informationen über vorhandene Daten

Performant • Direkte Datenbankzugriffe für Anfrageauswertung• Entkopplung von (evtl. langsamen, nur teilweise

verfügbaren) externen Systemen• gezielte Optimierungen möglich

Nachbearbeitungsoperationen möglich• Von den Fremdanbietern gelieferte Daten können

(auch aufwendig) geprüft und bereinigt werden• Aggregation von Daten ebenfalls leicht möglich

Page 15: Integrationsansätze: Überblick und Potentiale semantischer Technologien

15Business Integration Forum 2007

Materialisierter Ansatz: Nachteile

(redundante) Speicherung evtl. großer Datenmengen• leistungsfähige Infrastruktur erforderlich

Aktualität der Daten ist nicht gewährleistet• klassisches Caching-Problem

Aktualisierung • auf Initiative der Datenquellen

o organisatorische Maßnahmen erforderlicho Insbesondere: wir brauchen ein Austauschformat!

• Aktualisierung auf Initiative des Portalso bei großen Datenmengen häufig unpraktikabelo keine Information, was geändert wurde

Keine Kontrolle des Urhebers mehr über die Daten!

Page 16: Integrationsansätze: Überblick und Potentiale semantischer Technologien

16Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

Page 17: Integrationsansätze: Überblick und Potentiale semantischer Technologien

17Business Integration Forum 2007

Dienstperspektive

Einzubindende Systeme sind Dienste• klar definierte Schnittstelle und zu erbringende

Funktionalität• deutlich spezifischer als Anfrageschnittstellen

Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden=> Dienstorientierte Architekturen

Hauptprobleme• Wie mache ich Dienste interoperabel?• Wie finde ich benötigte Dienste?• Wie beschreibe ich Dienste?

Page 18: Integrationsansätze: Überblick und Potentiale semantischer Technologien

18Business Integration Forum 2007

Kernprobleme für dienstorientierte Architekturen

Kommunikationsprotokoll (technische Ebene)• Kodierung von Methodenaufruf und Parameterübergabe• Authentifizierung, Sicherheit etc.

Dienstbeschreibung• Konkrete Adresse (wie erreiche ich den Dienst)• Dienstschnittstelle (wie rufe ich ihn auf)• Semantik des Dienstes (was tut der Dienst)• Organisatorisches (was kostet der Dienst o.ä.)

Verzeichnisdienste

Möglichkeiten zur Aggregierung von Diensten

Page 19: Integrationsansätze: Überblick und Potentiale semantischer Technologien

19Business Integration Forum 2007

Dienstorientierte Architekturen – Lose Kopplung

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Implementie-rungen werden

austauschbar

Mehrere Dienstehinter derselben

Fassade

mehrschrittigeVerarbeitung

Page 20: Integrationsansätze: Überblick und Potentiale semantischer Technologien

20Business Integration Forum 2007

Prozessperspektive

Auf der Abstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge.• hier ist auch die wichtige Brücke zwischen der IT-Sicht

und der Geschäfts-Sicht

Dementsprechend spielt auch die Prozessintegration eine große Rolle.• viele Versuche, Prozess- und Dienstebene voneinander

zu trennen• allerdings: klare und eindeutige Trennung ist nicht so

einfach möglich

Page 21: Integrationsansätze: Überblick und Potentiale semantischer Technologien

21Business Integration Forum 2007

Die Web-Service-Welt

NachrichtenMetadaten

RessourcenTransaktionenZuverlässigkeitSicherheit

Geschäftsprozesse Management

WSDLWS-Discovery

UDDI

WS-PolicyWS-Metadata-Exchange

SOAP WS-Notification WS-Adressing

Web ServicesResources Framework

WS-Business ActivityWS-Atomic Transact.WS-Coordination

WS-ReliabilityWS-Reliable Messag.

WS-SecurityWS-TrustWS-Security PolicyWS-FederationWS-Secure Conversat.

BPELWS-ChoreographyWS-Choreography Description Language

BPMLWSMFWS-ManagementMUWS

WS-EventsMOWSWSMF-WSM

Page 22: Integrationsansätze: Überblick und Potentiale semantischer Technologien

22Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

Page 23: Integrationsansätze: Überblick und Potentiale semantischer Technologien

23Business Integration Forum 2007

Präsentationsebene

Grundidee ist hier: einheitliche Darstellung von unterschiedlichen Inhalten

Ansätze• Einbindung gerenderter Inhalte, also HTML-Fragmente

(=> Portlets)• reine Overlay-Techniken• Einbindung von GUI-Steuerelementen

Page 24: Integrationsansätze: Überblick und Potentiale semantischer Technologien

24Business Integration Forum 2007

Google Maps Mashups

Page 25: Integrationsansätze: Überblick und Potentiale semantischer Technologien

25 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe

Potentiale semantischer Technologien

Page 26: Integrationsansätze: Überblick und Potentiale semantischer Technologien

26Business Integration Forum 2007

Motivation

Hauptherausforderung bei der Informationsintegration ist die Überwindung der semantischen Heterogenität

Dabei steht die prinzipielle Machbarkeit außer Frage.

Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff?• kann nur durch einen höheren Grad der Automatisierung

erreicht werden• und durch Spezifikationen auf höherer Abstraktionsebene

Page 27: Integrationsansätze: Überblick und Potentiale semantischer Technologien

27Business Integration Forum 2007

Semantische Technologien...

... sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren.

Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik.

Prominenteste Vision dieser Technologieansätze ist das Semantic Web.

Page 28: Integrationsansätze: Überblick und Potentiale semantischer Technologien

28Business Integration Forum 2007

Arten von Semantik

[Uschold (2002), “Where are the Semantics in the Semantic Web?”]

Page 29: Integrationsansätze: Überblick und Potentiale semantischer Technologien

29Business Integration Forum 2007

Ontologien in der Informatik

Eine Ontologie [in der Informatik] ist eine

• explizite Spezifikation einer Konzeptualisierung [explicit specification of a conceptualization] (Gruber 1993)

• ein gemeinsames Verständnis einer bestimmten Domäne [shared understanding of a domain of interest] (Uschold & Grüninger 1996)

Formalitätsgrad kann variieren:• von kontrollierten Vokabularen bis hin zu

schwergewichtigen Ontologien mit logischer Axiomatisierung

Page 30: Integrationsansätze: Überblick und Potentiale semantischer Technologien

30Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

DiensteDienstsemantikDienstfindung, -orchestrierung

Page 31: Integrationsansätze: Überblick und Potentiale semantischer Technologien

31Business Integration Forum 2007

Grundidee

Modellierung von Konzepten und Relationen der Anwendungswelt als Ontologie (= konzeptuelle Modellierung)

Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen

Zur Laufzeit: Ausführung dieser Abbildungsregeln

Fortgeschritten:• semiautomatische Entdeckung diese Abbildungsregeln

Page 32: Integrationsansätze: Überblick und Potentiale semantischer Technologien

32Business Integration Forum 2007

Anwendungen: Datenaustausch

RDBMS 1RDBMS 1 RDBMS 2RDBMS 2XMLXML XMLXML

OntologieOntologie

XSL-TXSL-T

Export-Werkzeugedes RDBMS

Import-Werkzeugedes RDBMS

BezugXML-Struktur Ontologie

BezugXML-Struktur Ontologie

XSL-TWerkzeug

automatisierter Vorgangmanueller Vorgang

Page 33: Integrationsansätze: Überblick und Potentiale semantischer Technologien

33Business Integration Forum 2007

Bewertung

Ontologien sind wohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn• viel Domänenwissen benötigt wird• mit unvollständigen Informationen umgegangen wird

Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen

Page 34: Integrationsansätze: Überblick und Potentiale semantischer Technologien

34Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

DiensteDienstsemantikDienstfindung, -orchestrierung

Page 35: Integrationsansätze: Überblick und Potentiale semantischer Technologien

35Business Integration Forum 2007

Motivation

Bislang hat sich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt• Überprüfung, ob syntaktisch korrekter Aufruf• Generierung von sprachspezifischen Bindings

Aber:• keine Suche nach Diensten, die etwas Bestimmtes tun• keine automatisierte Kopplung• keine Prüfung von Qualitätsbeschreibungen

Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht.

Page 36: Integrationsansätze: Überblick und Potentiale semantischer Technologien

36Business Integration Forum 2007

Dienste: Was wollen wir semantisch beschreiben?

Semantik der übertragenen Parameter • Mittel: semantische Annotation der Nachrichtenschemata• Zweck: Interoperabilität/Mediation

Semantik der Dienstfunktionalität• Mittel: Annotation, ggf. mit Vor-/Nachbedingungen• Zweck: Dienstfindung und -komposition

Semantik der Dienstgüte • Mittel: formale Beschreibung der Dienstgüte / SLAs• Zweck: Dienstfindung und Überprüfbarkeit

Ausführungssemantik • Mittel: formale Modellierung der Abläufe• Zweck: Validierung, Verifikation

Page 37: Integrationsansätze: Überblick und Potentiale semantischer Technologien

37Business Integration Forum 2007

Beispiel: SemanticUDDI

Grundidee:• UDDI-Dienstverzeichnisse sind derzeit für Fachexperten

nur schwer zu benutzen• deshalb: Annotation um Fachsemantik• dies kann allerdings nur durch die Fachexperten selbst

erfolgen

Lösung• Kopplung eines UDDI-Verzeichnisses an ein

SemanticWiki-System

Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg

Page 38: Integrationsansätze: Überblick und Potentiale semantischer Technologien

38Business Integration Forum 2007

Ontologiezentrierter Architekturstil

Page 39: Integrationsansätze: Überblick und Potentiale semantischer Technologien

39Business Integration Forum 2007

Ontologie für die Lernunterstützungh

ttp://p

rofe

ssion

al-

learn

ing

.eu

Page 40: Integrationsansätze: Überblick und Potentiale semantischer Technologien

40Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

ProzesseTraceability, Compliance

Page 41: Integrationsansätze: Überblick und Potentiale semantischer Technologien

41Business Integration Forum 2007

Semantik für die Geschäftsprozessmodellierung

Traceability• Explizite semantische Zusammenhänge zwischen

Prozessmodellen und technischen Diensten• dadurch leichteres Change Management• erste Anwendungen im eGovernment

Überprüfung der Compliance• Beschreibung von Ausführungsbedingungen• damit z.B. Risikomanagement automatisierbar

Page 42: Integrationsansätze: Überblick und Potentiale semantischer Technologien

42Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

ProzesseTraceability, Compliance

Page 43: Integrationsansätze: Überblick und Potentiale semantischer Technologien

43Business Integration Forum 2007

Fazit: Semantische Technologien

Ontologiegestützte semantische Technologien sind mächtige Werkzeuge• standardisierte Technologien (Sprachen, Werkzeuge) für die

breite Anwendung vorhanden• erste Implementierungserfahrungen• bieten Vorteile in Richtung modellgetriebener Entwicklung• bessere Beherrschbarkeit komplexer Systeme durch höhere

Abstraktionsebene

Allerdings sollte ihr Einsatz wohldosiert erfolgen• Berücksichtigung von Skalierbarkeit• Aufwendige Entwicklung von Ontologien• Nutzen von Ontologien liegt vor allem im Umgang mit

o unvollständigen Informationeno hohem Maß an Hintergrundwissen

Page 44: Integrationsansätze: Überblick und Potentiale semantischer Technologien

44Business Integration Forum 2007

Kontakt

Andreas SchmidtAbleitungsleiter Forschungsbereich Information Process EngineeringFZI Forschungszentrum Informatik, [email protected]://www.fzi.de/ipe