Click here to load reader

Linked Open Data (Entwurfsprinzipien und Muster für vernetzte Daten)

  • View
    475

  • Download
    0

Embed Size (px)

DESCRIPTION

Released my (German language) habilitation talk slides on Linked Open Data under CC-BY license. Download the slides to enjoy full animations.

Text of Linked Open Data (Entwurfsprinzipien und Muster für vernetzte Daten)

  • 1. Entwurfsprinzipienund Muster frvernetzte DatenAnsgar ScherpHabilitationskolloquiumUniversitt Koblenz-Landau9. November 2011 CC-BY

2. Motivation Dave plant eine Reise von London zum Kunden in Kln Wie geht er vor? Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 2 of 42 3. Webseite der Deutschen BahnFunktioniert, aber Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 3 of 42 4. Versuchen wir andere Anfragen Engpsse im ffentlichen Personenverkehr Visualisierung der Route auf einer Karte Vergleich mit Flugverbindungen Verknpfung mit anderen Daten Anfragen knnen nicht beantwortet werden Denn im Internet von heute sind die Daten Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 4 of 42 5. eingeschlossen in Silos! Hoher Integrationsaufwand Nicht wiederverwendbar Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten5 of 42 B. Jagendorf, http://www.flickr.com/photos/bobjagendorf/, CC-BY 6. Lsung: vernetzte Daten Vernetzte Daten (engl. Linked Data) Verffentlichung und Verknpfung von Daten unterschiedlicher Qualitt und Zweck aus verschiedenen Quellen im Internet WebLinked Data Entitten DokumenteDaten RelationenHyperlinks Typisierte Links FormatHTML RDF Identitt / Protokoll URI / HTTP URI / HTTPAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 6 of 42 7. Linked Data: Mai 07 Sept. 11 Web 2.0Medien Publikationen GovernmentCross-Domain Lebenswissen-Geographischschaften< 31 Milliarde Entwurfsprinzipien und Muster fr vernetzte Daten Ansgar Scherp Triple Quelle: http://lod-cloud.net 7 of 42 8. Facettierte, interaktive Exploration Daten verschiedener Qualitt und Herkunft:DBpedia, GeoNames, WordNet, FOAF und Flickr Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 8 of 42 9. bersicht Motivation Prinzipien1. Identifikation2. Verknpfung3. Dereferenzierung4. Beschreibung Muster Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 9 of 42 10. Beispiel: Big LynxMatt Briggs Scott Miller ?Big Lynx Firma< 31 Milliarde Entwurfsprinzipien und Muster fr vernetzte Daten Ansgar Scherp TripleQuelle: http://lod-cloud.net 10 of 42 11. 1. Verwende URIs fr DingeMatt BriggsScott Millerhttp://biglynx.co.uk/people/matt-briggs http://biglynx.co.uk/ people/scott-miller B. Gazen,http://www.flickr.com/photos/bayat/, CC-BY Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 11 of 42 12. Beispiel: Big Lynx Matt BriggsScott Miller Big LynxFirma Was ist mit Relationen wie z.B. kennt ? Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten12 of 42 13. Resource Description Framework (RDF) Beschreibung von Ressourcen mit RDF-Triple Spiegelt die Struktur einfacher Stze wider, z. B. Matt Briggsist eine Person SubjektPrdikatObjektAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten13 of 42 14. Beispiel in Turtle Syntax . Namensrume zum Abkrzen von URIs Etablierte Namensrume: rdf, foaf, @prefix rdf:[email protected] foaf: . rdf:type foaf:Person . Prfix ist im aktuellen Dokument gltigAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 14 of 42 15. 1. Verwende URIs fr Relationen http://biglynx.co.uk/ people/matt-briggs http://biglynx.co.uk/ people/scott-miller Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten B. Gazen,http://www.flickr.com/photos/bayat/, CC-BY 15 of 42 16. Beispiel: Big LynxDave SmithLondon lebt hierMatt Briggs dieselbeScott MillerPersonBig LynxFirma DBpediaMatt BriggsMatts privateWebseite Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten16 of 42 17. 2. Verknpfungen herstellen Verknpfen von Ressourcen mit RDF-Links Beziehungslinks Identittslinks Vokabularlinks Ermglichen es weitere Ressourcen zu findenAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 17 of 42 18. Beziehungslinks in RDF Definieren Beziehungen zwischen Ressourcen Beispielfoaf:based_near . Externe Beziehungslinks: Subjekt und Objektkommen aus verschiedenen Namensrumen Interne Beziehungslinks: gleicher Namensraumbiglynx:matt-briggs foaf:knows biglynx:dave-smith .Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 18 of 42 19. Identittslinks URI-Aliase zur Verknpfung von Datenquellen,die dieselben Dinge der realen Welt beschreiben Beispiel . Dienst fr Identittslinks: .org Wann sind zwei Ressourcen identisch?Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten19 of 42 20. Gleichheit von Entitten Problem bekannt aus Datenbanken undDatamining K. Mayer und K. M. Mayer dieselbe Person? Auflsen von Name, Koautoren, Titel undVeranstaltungsort oftmals nicht ausreichend 413.000 DBpedia Orte mit GeoNames abgleichen Werkzeuge zur Formulierung von HeuristikenAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 20 of 42 21. Vokabularlinks Verweise auf Definitionen in eigenen undexistierenden Vokabularen Ziel: Daten werden selbstbeschreibend Spezifikation eigener Vokabulare mit RDF Vocabulary Description Language (RDFS) Simple Knowledge Organization System (SKOS) Web Ontology Language (OWL):typischerweise nur owl:sameAsAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 21 of 42 22. Existierende Vokabulare Friend-of-a-Friend (foaf): Personenund Beziehungen Dublin Core (dc): Metadaten wie Titel,Ersteller, Datum und Thema Programmontologie der BBC Schema.org Web-Seiten-Markupvon Google, Bing und Yahoo! Facebook Graph APIAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 22 of 42 23. Abgleich von Vokabularen Integration von Vokabularen hnlich zum Problem der Identitt Beispiel: foaf:name vs. vcard:family-name Nicht trivial, selbst fr hnliche Vokabulare Domnenontologien knnen sehr gro sein Methoden zum Abgleich von Vokabularen undRe-EngineeringAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 23 of 42 24. Beispiel: Big LynxDave SmithLondon foaf:based_near lebt hierMatt Briggsdieselbe owl:sameAsPersonBig LynxFirma DBpediaMatt BriggsMatts privateWebseite Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten24 of 42 25. 3. Dereferenzierung von URIs Nachschlagen von URIs mittels HTTP GET Anwendbar fr Dokumente und digitale Inhalte Nachschlagen von Dingen der realen Welt ?http://biglynx.co.uk/people/matt-briggs Verschiedene URIs fr Dinge und BeschreibungAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 25 of 42 26. Variante 1: 303 See OtherLinkedHTTP GET (Accept: appl./rdf+xml) Big Data http://biglynx.co.uk/people/matt-briggs LynxClient Server303 See Otherhttp://biglynx.co.uk/people/matt-briggs.rdfHTTP GEThttp://biglynx.co.uk/people/matt-briggs.rdf200 OK (Dokument in RDF)- Hhere Netzwerklatenz+ Geeignet fr groe Datenstze, z. B. DBpedia Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 26 of 42 27. Variante 2: Hash URIs URI enthlt einen mit # getrennten Teil, z. B.http://biglynx.co.uk/vocab/sme#Team Abschneiden des #-Fragmentes Verbleibende URI dereferenzieren Beschreibung mehrerer Ressourcen, u. A. Team - Hhere Datenbertragung + Geeignet zum Empfang ganzer VokabulareAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 27 of 42 28. Beispiel: Big Lynx Dave SmithLondon foaf:based_nearMatt Briggs owl:sameAsBig Lynx Firma DBpedia Matt BriggsMatts privateBeschreibungWebseite von Matt? Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 28 of 42 29. 4. Beschreibung von URIs Dereferenzierung einer Ressource Liefert eine Beschreibung in RDF zurck Was ist eine sinnvolle Beschreibung?Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 29 of 42 30. Beispiel: Beschreibung von Mattfoaf:Person dp:Birminghamrdf:type foaf:based_nearbiglynx:matt-briggs ex:loc_:pointfoaf:knows wgs84: wgs84:long biglynx:dave-smith lat-0.118foaf:based_near 51.509 dp:London Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten30 of 42 31. Concise Bounded Description Gegeben ein RDF-Graph G = (V, P, E) mit V = R B L endliche Knotenmenge aus Ressourcen R, Blank-Nodes B und Literale L P endliche Menge an Prdikaten E R B x P x V Menge typisierter Kanten Startknoten nR Blank-Node: eindeutige Ressource, ohne URI Literal: XSD-typisiertes Objekt (z. B. string, int)Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 31 of 42 32. Concise Bounded Description Einfache Concise Bounded Description (CBD)SimpleCBD(n) = I j mitj=0 I 0 = { (s, p, o) | (s, p, o)E s=n} I j+1 = { (o, p, o) E| (s, p, o)Ij : o Bj(o, p, o)Ik}k=0 Weitere CBDs bercksichtigen bspw. nochRDF-Reifikation, Symmetrie und RDF-LabelAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten32 of 42 33. Beispiel: Beschreibung von Mattfoaf:Person dp:Birminghamrdf:type foaf:based_nearbiglynx:matt-briggs ex:loc_:pointfoaf:knows wgs84: wgs84:long biglynx:dave-smith lat-0.118foaf:based_near 51.509 dp:London Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten33 of 42 34. Datenstze beschreiben mit voiD Profile der Mitarbeiter sind gebndelt zu einemgroen Datensatz rdf:type void:Dataset;dc:hasPart ;dc:isPartOf . voiD hat keine explizite SchemainformationAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 34 of 42 35. Schemaextraktion Finde Quellen mit bestimmten Datentypen Erkenne die Verknpfung von Datenquellen Przise Indexstrukturen bentigt Beispielsweise fr RDF-Typen, Typ-Cluster undprdikatsbasierte quivalenzklassen Ermglicht verteilte Anfragenauf der Linked-Data-WolkeAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 35 of 42 36. bersicht Motivation Prinzipien1. Identifikation2. Verknpfung3. Dereferenzierung4. Beschreibung Muster Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 36 of 42 37. Muster in vernetzten Daten Generische Lsung fr ein wiederkehrendesModellierungsproblem Klare Kommunikation durch festgelegte Begriffe (Oft) eher Best Practices als Muster [Dodds und Davis, 2011]Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 37 of 42 38. Muster: Topic Autodiscovery Problem Web-Seiten handeln oft von einem bestimmten Thema Lsung Einbetten eines -ElementsAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 38 of 42 39. Muster: Reified Statement Problem Modellierung von Aussagen ber Aussagen Triple annotieren mit Autor, Datum der Erstellung usw. Lsung Beschreibung von Graphnderungen mit herkmmlicher RDF-Reifikation Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 39 of 42 40. Beispiel: Reified Statementrdf:Statement rdf:typedc:created_:ex1"2011-10-28"rdf:subject rdf:object rdf:predicateex:/book/1biglynx: matt-briggs foaf:maker Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten40 of 42 41. Muster: Qualified Relation Relation mit zwei gleichberechtigen Ressourcen Spezieller Fall des Musters N-ary Relation Beispiel _:mattMaryMarriage rdf:type ex:Marriage;ex:partner biglynx:matt-briggs;ex:partner ex:mary;ex:date "2010-08-06"^^xsd:date . Warum nicht als Reified Statement?Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 41 of 42 42. Zusammenfassung Verffentlichung und Verknpfung von Daten Einheitliches Datenmodell RDF Beschreiben und Auffinden von Daten Web-Standards wie URI und HTTP Herausforderungen Identitt und Verknpfung von Ressourcen Abgleich von Vokabularen Extrahieren von Schemata Intuitiv benutzbare AnwendungenAnsgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 42 of 42 43. Literaturhttp://linkeddatabook.com/http://patterns.dataincubator.org/Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten43 of 42 44. Weitere Literatur T. Berners-Lee: Linked Data, June, 2009.URL: http://www.w3.org/DesignIssues/LinkedData.html T. Berners-Lee: Cool URIs dont change, 1998.URL: http://www.w3.org/Provider/Style/URI M. Janik, A. Scherp, and S. Staab. The Semantic Web: CollectiveIntelligence on the Web. In: Informatik Spektrum, Springer, 2011. F. Manola, E. Miller, B. McBride (eds.): RDF Primer, 2004. URL:http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#reification L. Sauermann, R. Cyganiak, D. Ayers, M. Vlkel: Cool URIs for theSemantic Web, 2008. URL: http://www.w3.org/TR/cooluris/ P. Stickler: CBD - Concise Bounded Description, 2005.URL: http://www.w3.org/Submission/CBD/ Talis Systems Ltd.: Bounded Descriptions In RDF, 2011. URL:http://docs.api.talis.com/getting-started/bounded-descriptions-in-rdf J. Volz, C. Bizer, M. Gaedke, G. Kobilarov: Discovering andMaintaining Links on the Web of Data. ISWC, Westfields, USA, 2009. Ansgar Scherp Entwurfsprinzipien und Muster fr vernetzte Daten 44 of 42