Upload
kerstin-edel
View
106
Download
0
Embed Size (px)
Citation preview
Im WWW nichts Neues?
Teil II – Das Semantic Web
Roland MückeIMISE Leipzig
11. September 2006
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 2
Inhalt
Die Vision des Semantic Web
Grundlegende Technologien
Praktische Anwendungen
Einsatzszenarien in der Medizin
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 3
Inhalt
Die Vision des Semantic Web
Grundlegende Technologien
Praktische Anwendungen
Einsatzszenarien in der Medizin
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 4
Das World Wide Web bisher
Was wir haben
Eine Vielzahl von Dokumenten, Inhalten und Daten Sprachen zur Darstellung von Inhalten (HTML, CSS...) Werkzeuge für die Nutzung (Webbrowser,
Suchmaschinen...) Anwendungsfälle (Information, Bildung, Unterhaltung, E-
Commerce, Organisation, Kommunikation...) Was wir nicht haben
Ein echtes Zusammenspiel der informationsverarbeitenden Systeme
Was wir brauchen
Semantik
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 5
Semantik?
Bezeichnet die exakte Bedeutung von Sprachen unter Zuhilfenahme formaler, logisch-mathematischer Methoden.
In Abgrenzung zur Semantik in Philosophie und Linguistik als formale Semantik bezeichnet.
Ziel ist es, dass Computersysteme Inhalte nicht nur bereitstellen (Webserver), transportieren (Internet) und präsentieren (Webbrowser), sondern auch „verstehen“.
Zumindest soweit verstehen, dass die bereitgestellten Daten in nutzbringender Weise miteinander in Verbindung gebracht werden können.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 6
Ein visionäres Beispiel
„At the doctor's office, Lucy instructed her Semantic Web agent through her handheld Web browser. The agent promptly retrieved information about Mom's prescribed treatment from the doctor's agent, looked up several lists of providers, and checked for the ones in-plan for Mom's insurance within a 20-mile radius of her home and with a rating of excellent or very good on trusted rating services. It then began trying to find a match between available appointment times and Pete's and Lucy's busy schedules.
In a few minutes the agent presented them with a plan. Pete didn't like it—University Hospital was all the way across town from Mom's place, and he'd be driving back in the middle of rush hour. He set his own agent to redo the search with stricter preferences about location and time. Lucy's agent, having complete trust in Pete's agent in the context of the present task, automatically assisted by supplying access certificates and shortcuts to the data it had already sorted through.“
Quelle: Tim Berners-Lee, James Hendler und Ora Lassila: The Semantic Web - A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities, Scientific American, May 17, 2001
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 7
Ein paar praktische Beispiele
Zusammenstellen von Nachrichten-Schlagzeilen aus verschiedenen Quellen und Filterung nach vorgegebenen Kategorien
Präsentation persönlicher Kontaktinformationen auf verschiedenen Websites und zugleich im Adressbuch des E-Mail-Clients, der Terminverwaltung und im PDA
Import von Terminen aus verschiedenen Quellen per Drag&Drop aus dem Webbrowser in die persönliche Terminverwaltung
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 8
Beispiel: Termine aus mehreren Quellen
Website
Informationsfluss
SW-Baustein
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 9
Das „Web“ in Semantic Web
Anbieter von semantisch ausgezeichneten Daten und die Nutzer dieser Daten sind nur lose miteinander gekoppelt. Genauso wie Webserver und Webbrowser nur lose über HTTP und HTML miteinander in Verbindung stehen. Es gibt keine zentrale Instanz, die die Kommunikation steuert.
Website Client Zugriff
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 10
It's all about the Data
Das Semantic Web wird kein Nachfolger des World Wide Web sein. Es ist vielmehr eine Ergänzung desselben.
Da die Hauptnutzer Softwaresysteme sind, wird das Semantic Web für uns Menschen weitgehend im Verborgenen bleiben.
Der Fokus liegt auf den Daten, die ausgetauscht und miteinander kombiniert werden. Die (visuelle) Darstellung spielt hierbei eine nachgeordnete Rolle.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 11
Zwei grundlegende Philosophien
Zugang zu strukturierten Informationen in Datenbanken
Diese Daten sind sonst gar nicht oder nur indirekt über Webanwendungen erreichbar.
Semantisches Markup von Webdokumenten
Dokumente, die für den Menschen als Nutzer gedachtsind, werden zusätzlich mit Markup versehen, der die Inhalte für Computersysteme verständlich macht.
Beide Philosophien stehen nicht im Widerspruch zueinander und so werden für beide eine Vielzahl von Technologien entwickelt
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 12
Inhalt
Die Vision des Semantic Web
Grundlegende Technologien
Praktische Anwendungen
Einsatzszenarien in der Medizin
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 13
Ein Stapel von Spezifikationen
Das Semantic Web wird vom W3C auf dem Fundament des WWW entwickelt
URIs für Identifikation Unicode für universelle
Zeichencodierung XML als universelle
Repräsentationsform Sprachen des Semantic Web: RDF, OWL (Ontology),
SPARQL (Query), SWRL (Rules) Logic, Proof und Trusted SW folgen später
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 14
Resource Description Framework
Mit RDF werden Aussagen über Dinge (Statements) ausgedrückt.
Dinge (Ressourcen) können Dokumente im Web sein oder Personen oder Termine oder oder oder ...
Also alles, worüber man etwas ausdrücken möchte. Die Aussagen haben die Form von Tripeln
(Subjekt, Prädikat, Objekt) oder (Subject, Property, Value)
Subject Property Value
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 15
RDF-Beispiele
Aus RDF-Statements werden Graphen gebildet.
Die Statements können aus beliebigen Quellen stammen. Die Verbindung erfolgt über die URIs.
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <rdf:Description rdf:about="http://www.gmds2006.de/Tutorien/WWW-Teil2.pdf"> <dc:title>Im WWW nichts Neues?</dc:title> <dc:author>http://www.imise.de/Mitarbeiter/RolandMuecke</dc:author> </rdf:Description> <rdf:Description rdf:about="http://www.imise.de/Mitarbeiter/RolandMuecke"> <foaf:firstname>Roland</foaf:firstname> <foaf:surename>Mücke</foaf:surename> </rdf:Description></rdf:RDF>
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 16
Web Ontology Language (OWL)
Die explizite Festlegung von Struktur erfolgt durch Vokabulare (einfach), Schemata oder Ontologien (komplex).
OWL definiert Konzepte und Beziehungen.
Klassen und ihre Eigenschaften Hierarchien von Klassen und Eigenschaften
Vergleichbar mit Datenbank-Schemata.
Kann aber komplexere Beziehungen ausdrücken Wird in RDF ausgedrückt. Unterscheidung in z. B. OWL Lite, OWL DL und OWL Full. Grundlage für die Ableitung impliziter Statements.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 17
OWL-Beispiel
Definition der Klasse „Person“ und einer ihrer Eigenschaften „firstName“ aus dem FOAF-Schema
<rdfs:Class rdf:about="http://xmlns.com/foaf/0.1/Person" rdfs:label="Person" rdfs:comment="A person."> <rdfs:subClassOf rdf:resource="http://xmlns.com/wordnet/1.6/Person"/> <rdfs:subClassOf rdf:resource="http://xmlns.com/foaf/0.1/Agent"/> <rdfs:subClassOf rdf:resource="http://www.w3.org/2000/10/swap/pim/contact#Person"/> <rdfs:subClassOf rdf:resource="http://www.w3.org/2003/01/geo/wgs84_pos#SpatialThing"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/> <owl:disjointWith rdf:resource="http://xmlns.com/foaf/0.1/Document"/> <owl:disjointWith rdf:resource="http://xmlns.com/foaf/0.1/Organization"/> <owl:disjointWith rdf:resource="http://xmlns.com/foaf/0.1/Project"/></rdfs:Class>
<rdf:Property rdf:about="http://xmlns.com/foaf/0.1/firstName" rdfs:label="firstName" rdfs:comment="The first name of a person."> <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#DatatypeProperty"/> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf-schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/></rdf:Property>
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 18
Implizites Wissen
Mit den in OWL ausgedrückten Beziehungen von Konzepten und ihren Eigenschaften kann aus vorhandenem Wissen neues Wissen abgeleitet werden.
Beispiel
„Im WWW nichts Neues?“ ist ein GMDS-Tutorium. Ein GMDS-Tutorium ist eine GMDS-Veranstaltung. „Im WWW nichts Neues?“ ist eine GMDS-Veranstaltung
und gehört deswegen in jeden Tagungs-Kalender. Die Ableitung dieses impliziten Wissens (Inferenz,
Entailment) wird von einem Reasoner durchgeführt, der meist direkt an einem RDF-Store angeschlossen sind.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 19
SPARQL Protocol and RDF Query Language
Abfragesprache für RDF-Graphen
Grundlage jeder anspruchsvollen SW-Anwendung Liefert einzelne Werte, Datensätze oder Teilgraphen
Vergleichbar mit SQL für Datenbanken
Allerdings nur mit lesendem Zugriff Die Spezifikation definiert zusätzlich ein Protokoll für die
Kommunikation zwischen SPARQL-Clients und -Servern.
Implementationen können auf HTTP oder SOAP aufsetzen
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 20
SPARQL-Beispiele
SELECT ?titleWHERE { <http://example.org/book/book1> dc:title ?title }
SELECT ?title ?priceWHERE { ?x ns:price ?price . FILTER (?price < 30) . ?x dc:title ?title . }
SELECT ?name ?mbox ?hpageWHERE { ?x foaf:name ?name . OPTIONAL { ?x foaf:mbox ?mbox } . OPTIONAL { ?x foaf:homepage ?hpage } }
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 21
Inhalt
Die Vision des Semantic Web
Grundlegende Technologien
Praktische Anwendungen
Einsatzszenarien in der Medizin
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 22
Das Semantic Web in der freien Wildbahn
Seit der „Einführung“ des Semantic Web im Scientific American im Jahre 2001 hat es nicht nur Entwicklungen im wissenschaftlichen Umfeld gegeben.
Einige Anwendungen sind dabei, die Labore zu verlassen und sich im praktischen Alltag zu bewähren.
Besonders empfänglich: die Blogger-Szene Der Geek-Faktor ist jedoch noch immer sehr hoch. Die einzige Ausnahme ist RSS – und das ist nicht mal
echtes Semantic Web.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 23
Nachrichten-Aggregation: RSS
Bereitstellung von Nachrichten-Schlagzeilenmittels „Rich Site Summary“
Clientseitige Nutzung in Newsreadern oder Live-Bookmarks
Serverseitige Nutzung auf Nachrichten-Portalen, die Schlagzeilen aus vielen Quellen zusammenführen (Syndizierung)
Kategorien von News (Channels)
Kein allgemeiner Standard zur Kategorisierung Es existieren mehrere Versionen von RSS und nur eine
(die 1.0) verwendet RDF
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 24
Netzwerk von Bekanntschaften: FOAF
FOAF steht für „Friend of a Friend“ Persönliche Beschreibung von sich und seinen Freunden
Name, Mailbox, Homepages, Bild Diverse Instant-Messenger-IDs und Online-Accounts Bekanntschaften, Interessen, Publikationen, Projekte
Derzeit die Visitenkarte im Semantic Web und bei Bloggern.
<foaf:Person> <foaf:name>Dan Brickley</foaf:name> <foaf:mbox_sha1sum>241021fb0e6289f92815fc210f9e9137262c252e</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="http://rdfweb.org/people/danbri/" /> <foaf:img rdf:resource="http://rdfweb.org/people/danbri/mugshot/danbri-small.jpeg" /></foaf:Person>
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 25
Semantisches Markup in XHTML
Die Grundidee ist, dass vorhandene Web-Dokumente mit Auszeichnungen versehen werden, die ihren Inhalt semantisch „greifbar“ machen.
Die Ansätze reichen bezüglich der Auswirkungenauf den XHTML-Code von „unauffällig“ (GRDDL) bis „brachial“ (RDF/A).
Das Ziel ist, eine Dopplung von Informationen in XHTML- und RDF-Dateien zu vermeiden.
Minimiert Arbeit und Fehler Ideal, wenn die Inhalte nicht anderweitig strukturiert sind,
z.B. in Datenbanken
<HTML>
<RDF>
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 26
GRDDL, Microformats, RDF/A
GRDDL: Gleaning Resource Descriptions from Dialects of Languages extrahiert Daten mittels XSL-Transformation aus XML-Dokumenten.
XSL muss die Struktur der XML-Dialekte (z. B. XHTML) kennen, in denen die gewünschten Inhalte stecken.
Microformats: Vorgegebene Konstrukte aus <div>- und <span>-Tags zusammen mit CSS-Klassen
Vordefinierte Formate, die die Verarbeitung stark vereinfachen. Beispiele sind hCard oder hCalendar
RDF/A: Einbettung von RDF direkt in XHTML-Code<p>Dieser Teil des Tutoriums ist von
<span class="author" about="WWW-Teil2.pdf" property="dc:creator">Roland Mücke</span>.</p>
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 27
SPARQL-Endpunkt für SQL-Datenbanken
Zugriff auf SQL-Datenbanken über einen Wrapper, der SPARQL-Querys in SQL-Querys umwandelt.
Beispiel: D2RQ
Anbindung an lokale SQL-Datenbanken Zugriff auf Datenbankinhalt als RDF-Graph möglich Beziehung zwischen Datenbankschema und RDF-Graph
über Mapping, das semi-automatisch hergestellt wird.
DB Endpunkt Semantic WebSPARQLSQL
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 28
Zum Rumprogrammieren: APIs
Für die Entwicklung von „Semantic-Web-Anwendungen“ stehen einige APIs als OpenSource zur Verfügung.
Teilweise Referenzimplementationen, also kein Bastelkram! Jena, Sesame
Java-APIs für RDF und SPARQL, RDF-Store Redland
Gleicher Leistungsumfang, in C geschrieben Bindings u. a. für Perl, Python, Ruby und PHP
Keine APIs, aber sehr leistungsfähige Browser/Editoren: Protege und Swoop
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 29
Wann kommt die Killer-App?
Vermutlich wird es nie eine Killer-Applikation geben, die dem Semantic Web zum Durchbruch verhelfen wird.
Gab es eine Killer-Website, die dem WWW zum Durchbruch verhalf?
Stattdessen wird es viele kleine Semantic Webs geben, die sich in bestimmten Nutzerkreisen oder bei bestimmten Anwendungsfällen durchsetzen, z. B. RSS oder FOAF.
Der Wandel hin zum Semantic Web wird sich hinter den Kulissen vollziehen, so dass Otto-Normalsurfer nichts davon mitbekommt.
Große E-Commerce-Websites könnten die Entwicklung drastisch beschleunigen.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 30
Inhalt
Die Vision des Semantic Web
Grundlegende Technologien
Praktische Anwendungen
Einsatzszenarien in der Medizin
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 31
Medizinische Informationsportale
RSS für Neuigkeiten und Termine FOAF als Visitenkarte
Entweder aus Verzeichnisdienst generieren oder FOAF-a-Matic
Microformats für Termine und Kontaktinformationen
Spätestens bei der nächsten Überarbeitung mit einplanen, wenn man sich sowieso stärker mit CSS beschäftigen will
Generell gilt: Catch the low hanging fruit!
Mit geringem Aufwand den Nutzern einen zusätzlichen Service bieten.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 32
Verteilte Studienregister
Anstelle eines zentralen Dienstes wird die bestehende Web-Infrastruktur von Studien-gruppen und Forschungsprojekten genutzt.
Beschreibung von Studien mit RDF
Entweder aus der lokalen Studiendatenbank Oder mittels GRDDL oder RDF/A
Ein zentrales Schema für die Beschreibung ist nicht zwingend notwendig
Mapping individueller Schemata aufeinander Vereinfacht die Organisation
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 33
Planung und Durchführung von Studien
Beschreibung von Studien-Items mit RDF Nutzung dieser Beschreibungen zur
Erzeugung der Studiendatenbanken Generierung von Studiendokumenten (CRFs) Annotation der Studienprotokolle Kommunikation mit Studienregistern
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 34
Semantisch annotierte SOPs
SOPs besitzen meist eine Grundstruktur, klar definierte Zielgruppen und Anwendungsfälle.
Über Annotationen kann die Erreichbarkeit und Bekanntmachung von SOPs verbessert werden.
Zielgruppengerichtete Information über Neuerungen Anwendungsfallbezogene Suche in SOP-Systemen Integration direkt in die Arbeitsumgebung
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 35
Semantische Wörterbücher
Wörterbücher dienen dazu, die vielschichtigen Begrifflichkeiten in der Medizin klarer zu fassen und Missverständnisse zu vermeiden.
Eine semantische Beschreibung von Wörterbucheinträgen hilft, Begriffe und ihre Bedeutungen im richtigen Kontext zu gebrauchen.
In Verbindung mit annotierten SOPs liefern sie die korrekten Begriffe beim Nachschlagen.
Bei Studienregistern sorgen sie für eine präzise Interpretation von Studieneigenschaften (z. B. beim Begriff der „Remission“)
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 36
Medizinische Ontologien
Eine Grundlage für die Beschreibung medizinischer Sachverhalte sind Vokabulare, Terminologien und Klassifikationen.
ICD-10, SNOMED, MeSH, UMLS, GALEN Das National Cancer Institute (NCI) stellt mit ihren
Enterprise Vocabulary Services ein umfangreiches Vokabular für die Onkologie bereit.
Wem das alles zu schwergewichtig ist, der kann sich natürlich auch seine eigene Ontologie erstellen.
Die Interoperabilität wird durch Mappings gewährleistet.
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 37
Ausblick
Das Semantic Web steckt noch in seinen Kinderschuhen
Noch stehen nicht alle benötigten Bausteine zur Verfügung Die Praxistauglichkeit mancher Ideen muss sich erst zeigen
Medizinische Anwendungsgebiete stehen explizit im Fokus der Forschung rund um das Semantic Web
Eine ergiebige Domäne mit breitem Anwendungsspektrum und einer Vielzahl von Profiteuren (Ärzte, Patienten, Wissenschaftler, Controller)
Das Semantic Web wird allmählich seinen Nutzen zeigen
Mitmachen ist gefragt, sonst droht das Henne-Ei-Problem
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 38
Zusammenfassung
Das Semantic Web macht Wissen im World Wide Web für Maschinen verständlich und nutzbar.
Es ist eine Ergänzung des bestehenden Web, die weitgehend unsichtbar für den Menschen mit Daten operiert.
Die Daten stammen entweder aus Datenbanken oder aus semantisch ausgezeichneten Webdokumenten.
Die Infrastruktur und Grundbausteine des WWW werden genutzt: URI, Unicode, XML
Auf ihnen setzen die Sprachen des Semantic Web auf
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 39
Zusammenfassung
RDF zur Beschreibung von Dingen im Semantic Web
Statements (Subject, Property, Value) bilden RDF-Graphen OWL zur Beschreibung von Vokabularen oder Ontologien
Definition von Klassen, ihren Eigenschaften und Beziehungen
Unerlässlich für das Schlussfolgern impliziten Wissens SPARQL zur Abfrage von RDF-Stores
Das „SQL für das Semantic Web“ Regeln, Logik, Beweisen, Signatur und Verschlüsselung
werden in der Zukunft ein vertrauensürdiges SW erlauben
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 40
Zusammenfassung
Aktuelle Anwendungsgebiete des Semantic Web
RSS für Nachrichten-Schlagzeilen FOAF als Visitenkarte GRDDL, Microformats und RDF/A für semantisches
Markup von Webdokumenten Im medizinischen Umfeld ist die Nutzung des Semantic
Webs für Studienregister, SOPs oder Wörterbücher vorstellbar
Neue Anwendungsfälle benötigen nur ein wenig Phantasie – und der sind keine Grenzen gesetzt!
Montag, 11. September 2006 GMDS-Tutorium: Im WWW nichts Neues? 41
Kontakt
Roland Mücke Institut für Medizinische Informatik, Statistik und
Epidemiologie (IMISE)Universität LeipzigHärtelstraße 16-1804107 Leipzig
Tel.: +49 341 97 16165 E-Mail: [email protected]