NEW VERSION: Data Quality und SOA

  • View
    1.656

  • Download
    0

Embed Size (px)

DESCRIPTION

Data Quality meets SOA –Datenqualität für alle Geschäftsprozesseverfügbar machen!

Text of NEW VERSION: Data Quality und SOA

  • 1. WHITE PAPER: SOA WHITE PAPER / Data Quality meets SOA Datenqualitt fr alle Geschftsprozesse verfgbar machen Datenqualittsfunktionen wurden im Be- reich Unix, Windows und Linux schon als Services bereitgestellt, als die Analysten von Gartner den Begriff SOA noch nicht erfunden hatten. Fr diese Architektur waren berwiegend technische Grnde ausschlaggebend. Darber hinaus stel- len sich mit der Implementierung von ser- vice-orientierten Architekturen neue und andere Anforderungen an Datenquali- ttsservices, gleichzeitig wachsen auch die Mglichkeiten und der Nutzen, den sie bewirken knnen. __________________________ Alle in diesem Dokument verwendeten Firmen-, Produktnamen und Logos sind Han- delsnamen und/oder eingetragene Warenzeichen der jeweiligen Unternehmen. Seite 1
  • 2. WHITE PAPER: SOA Ausgangspunkt Datenqualitts-Services Um die Bedeutung von service-orientierten Architekturen fr die Bereitstellung und Nutzung von Datenqualittsfunktionen zu betrachten, ist es zunchst ntz- lich, einen Blick auf die typischen Datenqualitts-Funktionen selbst zu werfen. ANWENDUNG A: Eine klassische Anwendung ist die Adressprfung aufgrund von Referenzdaten, in denen Straen- und Ortsnamen sowie die Abhngigkeiten der Postleitzahlen von Orten, Straen und Hausnummer hinterlegt sind. Im Gegensatz zu einem einfachen Datenbankzugriff soll hier die rich- tige Adresse auch dann gefunden werden, wenn die Eingabe unvollstndig ist, Schreibfehler oder Hrfehler enthlt. Ziel ist eine groe Treffergenauigkeit, um einen mglichst hohen Anteil fehlerhafter Adressen automatisch korrigieren zu knnen. ANWENDUNG B: Eine weitere Anwendung ist die Dublettensuche im eigenen Bestand. Auch hier ist das Ziel trotz unvollstndiger, abweichender oder fehlerhafter Eingabe - sei es ein Geschftsobjekt, ein Geschftspartner, ein Produkt oder auch eine Sales Opportunity - schnell und sicher zu identifizieren. Einerseits um die Suche zu vereinfachen und damit die Produktivitt der Anwender zu erhhen, ande- rerseits um die Anlage von Dubletten, das bedeutet doppelt vorhandene Eintrge, die sich auf dasselbe Objekt in der realen Welt beziehen, zu vermeiden. Damit soll eine konsistente, vollstndige und eindeu- tige Abbildung der real existierenden Objekte in der Datenbank erreicht werden. Ein wichtiges Ziel im Rahmen der Verbesserung von Neben der Antwortzeit spielte bereits bei Datenqualitt besteht darin, unvollstndige oder Datenqualitts-Services die Integration in unter- fehlerhafte Daten gar nicht erst in der Datenbank schiedlichste Umgebungen eine wichtige Rolle. Fr zu speichern. Mgliche Probleme sollen bereits das Erreichen dieses Ziels ist eine Entkopplung bei der Erfassung erkannt und daraufhin entwe- des Datenqualittsservices vom Servicekonsumenten der automatisch oder mittels eines entsprechenden sowie die Nutzung ber ein Client/Server-Protokoll Feedbacks an den Anwender durch diesen berei- wichtig. Daher wurde diese Funktionalitt im nigt werden. Spezialisierte Suchindizes sorgen Bereich Datenqualitt, zumindest fr anspruchsvolle- dafr, dass eine Suche in Datenbestnden mit re Anwendungen, schon vor der Erfindung service- 1.000.000 bis hin zu 100.000.000 Datenstzen orientierter Architekturen als Service bereitgestellt auch bei abweichender Schreibweise im Regelfall und genutzt. So war es mglich, sowohl die hohen nur den Bruchteil einer Sekunde bentigt. Doch Anforderungen an die Antwortzeiten zu erfllen als diese Antwortzeiten erfordern ein intelligentes auch die Bereitstellung von Funktionalitten fr unter- Caching der Indizes. Das wiederum kann sehr effi- schiedlichste Umgebungen zu gewhrleisten. zient durch die Implementierung der Software als zentralen Service gewhrleistet werden, der von einem eigenen Server zur Verfgung gestellt wird. UNISERV GmbH / +49 7231 936-1000 / All rights reserved. Seite 2
  • 3. WHITE PAPER: SOA Vom fat client zur 3-Schichten-Architektur Layered Architecture LAYERED ARCHITECTURE Die typische Architektur aus den Anfangszeiten der FAT CLIENT Client/Server-Welt bestand aus einer Datenbank, die neben der Speicherung von Transaktions- und ROLE Stammdaten auch eine asynchrone Kommunikation Name Customer zwischen unterschiedlichen Systemkomponenten Street Supplier und damit eine Entkopplung dieser Komponenten Postcode Reseller ermglichte. Botschaften (Messages) wurden vom Sender in die Datenbank geschrieben und vom Empfnger dort ausgelesen. Dazu war allerdings ein regelmiges Pollen der entsprechenden Tabelle erforderlich, um festzustellen, ob neue, noch unbearbeitete Messages zur Verfgung standen. Die Geschftslogik war berwiegend in sogenann- ten fetten Clients implementiert. Aufgaben, fr die Batch-Verfahren Anwendung fanden, wurden durch Hintergrundprozesse, die auf die Datenbank zugriffen, implementiert. Interaktive Funktionen zur Prfung von Adressen oder zur Erkennung von Dubletten direkt bei der Erfassung waren in aller Regel in die graphische Oberflche integriert. Der Aufruf erfolgte blicherweise ber proprietre Schnittstellen. Spezifikationen wie DCE1 oder CORBA2, deren Ziel die Standardisierung von Schnittstellen fr die Kommunikation verteilter Komponenten war, kamen ber ein Nischen-Dasein nicht hinaus. UNISERV GmbH / +49 7231 936-1000 / All rights reserved. Seite 3
  • 4. LAYERED ARCHITECTURE WHITE PAPER: SOA FATDiese Situation hat sich in den vergangenen Jahren CLIENT CLIENT grundlegend verndert. Ausgangspunkt dafr war vor allem die Etablierung von Standards im Rahmen ROLE ROLE Name Customer Name Customer der JEE3 (Java Enterprise Edition) und in der Folge die Bereitstellung leistungsfhiger Implementierungen Street Supplier Street Supplier dieser Standards sowohl als kommerzielle Produkte Postcode Reseller Postcode Reseller als auch als Open-Source-Lsungen. DIE EINFACHE INTEGRATION IN DEN APPLICATION SERVER APPLIKATIONSSERVER SEI ES AUF BASIS EINER JEE- ODER EINER .NET-ARCHITEKTUR TRAT DAMIT JETZT IN DEN VORDERGRUND. Fr die Windows-Welt zog Microsoft mit der Entwicklung von .NET4 als sprachunabhngi- ge Plattform und den .NET Enterprise-Services nach. Damit stand unabhngig von der gewhl- ten Plattform (JEE, .NET) eine leistungsfhige Infrastruktursoftware bereit, um die Geschftslogik weitgehend aus der Prsentationsschicht zu lsen und auf dem Server in einer eigenen Schicht zu implementieren. Damit vernderten sich auch die Anforderungen an Datenqualitts-Services, die jetzt berwiegend aus dem Bereich der Geschftslogik auf der Serverseite angesprochen wurden. 1 http://en.wikipedia.org/wiki/Distributed_Computing_Environment 2 http://en.wikipedia.org/wiki/CORBA 3 http://en.wikipedia.org/wiki/Java_Platform,_Enterprise_Edition 4 http://en.wikipedia.org/wiki/.NET_Framework UNISERV GmbH / +49 7231 936-1000 / All rights reserved. Seite 4
  • 5. WHITE PAPER: SOA SOAP als Enabler fr SOA Richtig effektiv wird SOA erst durch die Etablierung Proprietary Protocol eines Standardprotokolls fr die Bereitstellung und Nutzung von Services. Mit dem Web Service Protokoll SOAP5 wurde diese Lcke geschlossen. Es wird von praktisch allen Middleware- und Infrastrukturkomponenten untersttzt und ermglicht damit erst die Interoperabilitt zwischen Service- Providern, Middleware und Service-Consumern. Damit entfllt die Bereitstellung von Konnektoren fr die Nutzung proprietrer Protokolle in pro- pietrer Middleware. Damit ist die Grundlage fr die Etablierung mchtiger Middleware- Komponenten gelegt. Dazu gehrt das Konzept des Enterprise Service Bus (ESB)6, der die lose Kopplung unterschiedlicher Komponenten mit einem besonderen Gewicht auf dem Routen von Messages ermglicht, genauso wie Engines, die in einer Geschftsprozesssprache definier- te Workflows (BPEL)7 direkt ausfhren knnen. 5 http://en.wikipedia.org/wiki/SOAP 6 http://en.wikipedia.org/wiki/Enterprise_service_bus 7 http://en.wikipedia.org/wiki/BPEL UNISERV GmbH / +49 7231 936-1000 / All rights reserved. Seite 5
  • 6. WHITE PAPER: SOA Damit haben sich SOAP-basierte Web Services SOAP Protocol auch zum zentralen Instrument entwickelt, um interaktive Datenqualittsservices in modernen Enterprise Architekturen bereitzustellen. Es handelt sich dabei berwiegend um Services, die nach dem Request/Response Pattern ablaufen, in dem der Service-Consumer einen Request initiiert, zum Beispiel validiere d