Integrationsansätze: Überblick und Potentiale semantischer Technologien

  • View
    2.549

  • Download
    2

  • Category

    Business

Preview:

DESCRIPTION

Vortrag auf dem Business Integration Forum 2007, Mainz, 25.4.07

Citation preview

1 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe

Integrationsansätze: Überblick und Potentiale semantischer Technologien

Andreas Schmidt

Abteilungsleiter im Forschungsbereich Information Process

EngineeringFZI Forschungszentrum Informatik, Karlsruhe

Andreas.Schmidt@fzi.dehttp://www.fzi.de/ipe

2Business Integration Forum 2007

Agenda

Strukturierung der Integrationsproblematik• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene

Potentiale semantischer Technologien• Informationsebene• Anwendungsebene• Prozessebene• Präsentationsebene

Fazit

3Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

4Business Integration Forum 2007

Informationsperspektive

Einzubindende „Quellen“ sind Informationsquellen

Interaktion mit den externen Quellen läuft über das Anfrage-Ergebnis-Paradigma

Es existiert eine zentrale Stelle, an der alle Informationen zusammenlaufen

Hauptproblem: • Überwindung der semantischen Heterogenität

(Datenmodell, Schema, Instanzdaten)• Architekturen zur konsistenten Datenhaltung

(Aktualisierung!)

5Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Logische Ebene:Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

6Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

7Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

8Business Integration Forum 2007

Arten von Integrationskonflikten

Datenmodell

Schema

DatenInstanzen

Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen

Relational, Objektorientiert, XML, Semistrukturiert

Freiheitsgrade in der Modellierung der realen Welt

klassische »Schemaintegration«

Zusammenführen von Instanzen(Objektidentität/Duplikaterkennung)

Widersprüchlichkeit, Inkonsistenzen, Subjektivität

9Business Integration Forum 2007

Ebenen der semantischen Integration

Schemaintegration (bzw. Integration auf Schemaebene)• Zusammenführen und semantische Vereinheitlichung allein auf

der Basis von Schemainformationeno Typen, Klassen, Attribute, Vererbungsrelation etc.o Abbildung wird auf alle Instanzen angewendet

• Mapping-Tools

Instanzintegration (bzw. Integration auf Instanzebene)• Zusammenführen von Informationen über einzelne Instanzen

(oder Objekte)o auf der Basis von Werteno typisch: Ähnlichkeitsmaße, paarweise Vergleich, Objektidentität,

wertabhängige Abbildungsregelno Schemainformation reicht als Information nicht aus!

10Business Integration Forum 2007

Konflikte auf Instanzebene

Probleme• Duplikate • Veraltete Daten• falsche Daten

WBeschreibung WPreis hergestelltVonWaren

Name Strasse Stadt PlzAbnehmer

Land

HName HStrasse HStadt HPlzHersteller

Kunde Ware BestMengebestellt

Datum PreisProduzentversorgt

Abnehmer Ware MengeDatum

VBrancheVerband

PName PStrasse PStadt PPlzProduzent

PLand betreutVon

KName KStrasse KStadt KPlzKunden

Blau AG Domstr. 3 Köln 50033... ... ... ...

Blau AG Zement 10020.05.01... ... ......

BLAU... ... ... ... ...

Neuestr. 8, Heidelberg, 69115, Deutschland

System 1 System 2

11Business Integration Forum 2007

Aufbau einer zentralen Datenbasis, in die die Inhalte der angeschlossenen Quellen in einem Vorverarbeitungsschritt importiert werden. Diese Datenbasis stellt die integrierte Sicht dar

materialisierter Ansatza priori Integration (eager)

Nutzung der Systeme der Quellen für die Anfrageauswertung (Durchreichen von Anfragen). Die integrierte Sicht ist physisch nicht vorhanden; sie wird von Mediatoren dynamisch bereitgestellt:

virtueller AnsatzIntegration bei Bedarf (lazy)

Architektur : Virtuell vs. materialisiert

12Business Integration Forum 2007

Materialisierter Ansatz

Zentrale Datenbasis

(periodischer) Import in diezentrale Datenbasis

Quellen

Anwendung

für Anfragen wird nur die zentrale Datenbasis genutzt

13Business Integration Forum 2007

Virtuelle Integration

WrapperWrapper Wrapper

Mediator

Facilitator

Mediator

Quellenauswahl

Schema- undInstanzintegrati

on

Datenmodell-integration

14Business Integration Forum 2007

Materialisierter Ansatz – Vorteile

Einfach zu realisieren• Anwendungsentwicklung unterscheidet sich durch

zentrale Datenbasis kaum vom Ein-Quellen-Fall• Mehr Informationen über vorhandene Daten

Performant • Direkte Datenbankzugriffe für Anfrageauswertung• Entkopplung von (evtl. langsamen, nur teilweise

verfügbaren) externen Systemen• gezielte Optimierungen möglich

Nachbearbeitungsoperationen möglich• Von den Fremdanbietern gelieferte Daten können

(auch aufwendig) geprüft und bereinigt werden• Aggregation von Daten ebenfalls leicht möglich

15Business Integration Forum 2007

Materialisierter Ansatz: Nachteile

(redundante) Speicherung evtl. großer Datenmengen• leistungsfähige Infrastruktur erforderlich

Aktualität der Daten ist nicht gewährleistet• klassisches Caching-Problem

Aktualisierung • auf Initiative der Datenquellen

o organisatorische Maßnahmen erforderlicho Insbesondere: wir brauchen ein Austauschformat!

• Aktualisierung auf Initiative des Portalso bei großen Datenmengen häufig unpraktikabelo keine Information, was geändert wurde

Keine Kontrolle des Urhebers mehr über die Daten!

16Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

17Business Integration Forum 2007

Dienstperspektive

Einzubindende Systeme sind Dienste• klar definierte Schnittstelle und zu erbringende

Funktionalität• deutlich spezifischer als Anfrageschnittstellen

Autonomen Dienste soll durch eine Infrastruktur die gegenseitige Nutzung ermöglicht werden=> Dienstorientierte Architekturen

Hauptprobleme• Wie mache ich Dienste interoperabel?• Wie finde ich benötigte Dienste?• Wie beschreibe ich Dienste?

18Business Integration Forum 2007

Kernprobleme für dienstorientierte Architekturen

Kommunikationsprotokoll (technische Ebene)• Kodierung von Methodenaufruf und Parameterübergabe• Authentifizierung, Sicherheit etc.

Dienstbeschreibung• Konkrete Adresse (wie erreiche ich den Dienst)• Dienstschnittstelle (wie rufe ich ihn auf)• Semantik des Dienstes (was tut der Dienst)• Organisatorisches (was kostet der Dienst o.ä.)

Verzeichnisdienste

Möglichkeiten zur Aggregierung von Diensten

19Business Integration Forum 2007

Dienstorientierte Architekturen – Lose Kopplung

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Dienst-nehmer

(service requestor)

Dienst-nehmer

(service requestor)

nutzen

Implementie-rungen werden

austauschbar

Mehrere Dienstehinter derselben

Fassade

mehrschrittigeVerarbeitung

20Business Integration Forum 2007

Prozessperspektive

Auf der Abstraktionsebene von Diensten spielt nicht nur die isolierte Dienstfunktionalität eine Rolle, sondern auch deren Abfolge.• hier ist auch die wichtige Brücke zwischen der IT-Sicht

und der Geschäfts-Sicht

Dementsprechend spielt auch die Prozessintegration eine große Rolle.• viele Versuche, Prozess- und Dienstebene voneinander

zu trennen• allerdings: klare und eindeutige Trennung ist nicht so

einfach möglich

21Business Integration Forum 2007

Die Web-Service-Welt

NachrichtenMetadaten

RessourcenTransaktionenZuverlässigkeitSicherheit

Geschäftsprozesse Management

WSDLWS-Discovery

UDDI

WS-PolicyWS-Metadata-Exchange

SOAP WS-Notification WS-Adressing

Web ServicesResources Framework

WS-Business ActivityWS-Atomic Transact.WS-Coordination

WS-ReliabilityWS-Reliable Messag.

WS-SecurityWS-TrustWS-Security PolicyWS-FederationWS-Secure Conversat.

BPELWS-ChoreographyWS-Choreography Description Language

BPMLWSMFWS-ManagementMUWS

WS-EventsMOWSWSMF-WSM

22Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

InformationsquellenDatenmodell, Schema, semantische Heterogenität

Präsentationsfragmenteclient-seitige Integration

Netzwerkprotokolle, RPCDarstellungssyntax

DiensteDienstschnittstelle, -semantikDienstfindung, -orchestrierung

23Business Integration Forum 2007

Präsentationsebene

Grundidee ist hier: einheitliche Darstellung von unterschiedlichen Inhalten

Ansätze• Einbindung gerenderter Inhalte, also HTML-Fragmente

(=> Portlets)• reine Overlay-Techniken• Einbindung von GUI-Steuerelementen

24Business Integration Forum 2007

Google Maps Mashups

25 FZI Research Center for Information Technologies Karlsruhe, Germany | Information Process Engineering | www.fzi.de/ipe

Potentiale semantischer Technologien

26Business Integration Forum 2007

Motivation

Hauptherausforderung bei der Informationsintegration ist die Überwindung der semantischen Heterogenität

Dabei steht die prinzipielle Machbarkeit außer Frage.

Aber wie bekommt semantische Integration auch effizient (i.S.d. menschlichen Aufwandes), wartbar und skalierbar in den Griff?• kann nur durch einen höheren Grad der Automatisierung

erreicht werden• und durch Spezifikationen auf höherer Abstraktionsebene

27Business Integration Forum 2007

Semantische Technologien...

... sind ein Sammelbegriff für aktuelle technische Ansätze, um dies zu realisieren.

Überwiegend bedienen sie sich Ontologien als Instrument zur expliziten und maschinenverarbeitbaren Repräsentation von Semantik.

Prominenteste Vision dieser Technologieansätze ist das Semantic Web.

28Business Integration Forum 2007

Arten von Semantik

[Uschold (2002), “Where are the Semantics in the Semantic Web?”]

29Business Integration Forum 2007

Ontologien in der Informatik

Eine Ontologie [in der Informatik] ist eine

• explizite Spezifikation einer Konzeptualisierung [explicit specification of a conceptualization] (Gruber 1993)

• ein gemeinsames Verständnis einer bestimmten Domäne [shared understanding of a domain of interest] (Uschold & Grüninger 1996)

Formalitätsgrad kann variieren:• von kontrollierten Vokabularen bis hin zu

schwergewichtigen Ontologien mit logischer Axiomatisierung

30Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

DiensteDienstsemantikDienstfindung, -orchestrierung

31Business Integration Forum 2007

Grundidee

Modellierung von Konzepten und Relationen der Anwendungswelt als Ontologie (= konzeptuelle Modellierung)

Deklarative Spezifikation von Abbildungsregeln zwischen der Ontologie und den beteiligten Quellen

Zur Laufzeit: Ausführung dieser Abbildungsregeln

Fortgeschritten:• semiautomatische Entdeckung diese Abbildungsregeln

32Business Integration Forum 2007

Anwendungen: Datenaustausch

RDBMS 1RDBMS 1 RDBMS 2RDBMS 2XMLXML XMLXML

OntologieOntologie

XSL-TXSL-T

Export-Werkzeugedes RDBMS

Import-Werkzeugedes RDBMS

BezugXML-Struktur Ontologie

BezugXML-Struktur Ontologie

XSL-TWerkzeug

automatisierter Vorgangmanueller Vorgang

33Business Integration Forum 2007

Bewertung

Ontologien sind wohl dosiert eingesetzt elegante (da auf deskriptiven Spezifikationen aufbauend) Bausteine für typische Integrationsprobleme, vor allem wenn• viel Domänenwissen benötigt wird• mit unvollständigen Informationen umgegangen wird

Schritt auf dem Weg zu mehr modellgetriebenen Integrationsansätzen

34Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

DiensteDienstsemantikDienstfindung, -orchestrierung

35Business Integration Forum 2007

Motivation

Bislang hat sich die Beschreibung von Web Services auf syntaktische Aspekte beschränkt• Überprüfung, ob syntaktisch korrekter Aufruf• Generierung von sprachspezifischen Bindings

Aber:• keine Suche nach Diensten, die etwas Bestimmtes tun• keine automatisierte Kopplung• keine Prüfung von Qualitätsbeschreibungen

Idee: Erweiterung der Beschreibungskonzepte für Web Services durch ontologiebasierte Verfahren, so dass eine maschinenverarbeitbare semantische Beschreibung entsteht.

36Business Integration Forum 2007

Dienste: Was wollen wir semantisch beschreiben?

Semantik der übertragenen Parameter • Mittel: semantische Annotation der Nachrichtenschemata• Zweck: Interoperabilität/Mediation

Semantik der Dienstfunktionalität• Mittel: Annotation, ggf. mit Vor-/Nachbedingungen• Zweck: Dienstfindung und -komposition

Semantik der Dienstgüte • Mittel: formale Beschreibung der Dienstgüte / SLAs• Zweck: Dienstfindung und Überprüfbarkeit

Ausführungssemantik • Mittel: formale Modellierung der Abläufe• Zweck: Validierung, Verifikation

37Business Integration Forum 2007

Beispiel: SemanticUDDI

Grundidee:• UDDI-Dienstverzeichnisse sind derzeit für Fachexperten

nur schwer zu benutzen• deshalb: Annotation um Fachsemantik• dies kann allerdings nur durch die Fachexperten selbst

erfolgen

Lösung• Kopplung eines UDDI-Verzeichnisses an ein

SemanticWiki-System

Projekt im Auftrag der LUBW – Landesanstalt für Umweltschutz Baden-Württemberg

38Business Integration Forum 2007

Ontologiezentrierter Architekturstil

39Business Integration Forum 2007

Ontologie für die Lernunterstützungh

ttp://p

rofe

ssion

al-

learn

ing

.eu

40Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

ProzesseTraceability, Compliance

41Business Integration Forum 2007

Semantik für die Geschäftsprozessmodellierung

Traceability• Explizite semantische Zusammenhänge zwischen

Prozessmodellen und technischen Diensten• dadurch leichteres Change Management• erste Anwendungen im eGovernment

Überprüfung der Compliance• Beschreibung von Ausführungsbedingungen• damit z.B. Risikomanagement automatisierbar

42Business Integration Forum 2007

Integrationsebenen

Technische Ebene

Informationsebene

Anwendungslogikebene

Prozeßebene

Präsentationsebene

gemeinsame SemantikAbbildungen auf konzeptueller Ebene spezifizieren

PräsentationsfragmenteMicroformats

ProzesseTraceability, Compliance

43Business Integration Forum 2007

Fazit: Semantische Technologien

Ontologiegestützte semantische Technologien sind mächtige Werkzeuge• standardisierte Technologien (Sprachen, Werkzeuge) für die

breite Anwendung vorhanden• erste Implementierungserfahrungen• bieten Vorteile in Richtung modellgetriebener Entwicklung• bessere Beherrschbarkeit komplexer Systeme durch höhere

Abstraktionsebene

Allerdings sollte ihr Einsatz wohldosiert erfolgen• Berücksichtigung von Skalierbarkeit• Aufwendige Entwicklung von Ontologien• Nutzen von Ontologien liegt vor allem im Umgang mit

o unvollständigen Informationeno hohem Maß an Hintergrundwissen

44Business Integration Forum 2007

Kontakt

Andreas SchmidtAbleitungsleiter Forschungsbereich Information Process EngineeringFZI Forschungszentrum Informatik, Karlsruheandreas.schmidt@fzi.dehttp://www.fzi.de/ipe

Recommended