Upload
magnus-pfeffer
View
1.106
Download
0
Embed Size (px)
DESCRIPTION
Vortrag bei der Jahresversammlung des Regionalverbands Südwest des Vereins Deutscher Bibliothekare (VdB) am 27. April 2012 in Mainz
Prof. Magnus PfefferHochschule der Medien, Stuttgart
Bibliotheken und Linked Open Data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 2
Übersicht Teil 1: Theorie
Das Resource Description Framework (RDF) Linked Data Open Data
Teil 2: Praxis Projekte im Bibliotheksumfeld Umsetzung mit eigenen Daten Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 3
Teil 1
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 4
Einleitung Was Linked Open Data nicht ist:
Kompliziert Ganz anders Etwas komplett Neues Eine Revolution!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 5
Einleitung Was Linked Open Data ist:
Sammlung von Standards und Best-Practice-Handlungsempfehlungen
Gemeinsame Infrastruktur Ziel: Einfach zugreifbare und interoperable Daten
Interoperabilität ist fürBibliotheken nichts Neues!
Einfacher Zugriffschon eher....
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 6
Das Resource Description Framework (RDF)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 7
Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 8
Datensilos Abgeschottete Daten
Proprietäre Formate Proprietäre Zugangsmechanismen
Bild
: W
ikik
emed
ia C
omm
ons
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 9
Bibliotheksdaten: MARCInteroperabel
Nahezu alle Bibliotheksinformations-systeme können MARC lesen
Verständlich?
CAPTCHA - Completely Automated Public Turing test to tell Cataloguers and Humans Apart
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 10
Bibliotheksdaten: MARC Und was ist mit XML?
Nicht wirklich besser!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 11
Bibliotheksdaten Spezifische Datenformate
MARC / MAB
Spezifische Zugriffsprotokolle z39.50 / SRU OAI-PMH
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 12
Daten neu denken Struktur
Felder Tabellen Datensätze
→ Syntax: Zulässige Zeichen(folgen)
Bedeutung Feldbeschreibung Tabellenkopf Datenformat
→ Semantik: Zulässige Inhalte
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 13
Daten: Traditionell
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 14
Daten zu Aussagen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 15
Daten zu Aussagen
Ich bin ein Leopard-Drückerfisch.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 16
Daten zu Aussagen
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 17
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
Ich bin 50 cm lang.
Daten zu Aussagen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 18
Spezies 90020 ist ein Leopard-Drückerfisch.
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
Bezug der Aussage eindeutig
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 19
Identifikatoren Nummern oder Zeichenfolgen identifizieren Konzepte
oder zusammengehörige Datensätze
Identifikatoren sind innerhalb der Datenbank eindeutig Im Beispiel: numerische SpeciesID
→ Lokale semantische Eindeutigkeit herstellbar
Problem: Erweiterung der lokalen zu globalen Identifikatoren
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 20
Identifikatoren Problem:
Erweiterung der lokalen zu globalen Identifikatoren
Lösungsansatz:Ein globaler Namensraum, der für alle am Datenaustausch Interessierten zugänglich ist
Vorhandene Namensräume URIs mit qualifizierten Domainnamen URNs
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 21
Spezies 90020 ist ein Leopard-Drückerfisch.
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
Und jetzt mit URIs
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 22
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 23
Spezies 90020 gehört zu den Drückerfischen.
Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
http://example.org/species/90020 http://example.org/length_cm 50.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 24
Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
http://example.org/species/90020 http://example.org/length_cm 50.
http://example.org/species/90020 http://example.org/category http://example.org/triggerfish.http://example.org/triggerfish http://example.org/name „Drückerfisch“.
http://example.org/triggerfish http://example.org/name „Triggerfish“.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 25
Daten als Aussagen Eigenschaften
Einfache Darstellung Explizite Semantik Beliebige Aggregation von Aussagen möglich
Unabhängig von den beschriebenen Entitäten Unabhängig von den Prädikaten Annahme: Die Aussagen sind alle „wahr“
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 26
RDF Abstraktes Modell
Aussagen der Form Subjekt-Verb-Objekt
→ „Tripel“
URIs zur Bennennung der Entitäten Globaler Namensraum Als URLs über Standardprotokolle erreichbar
→ „dereferenzierbar“
Dateiformate zur Serialisierung RDF/XML Notation 3
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 27
Dereferenzierung von http-URIs
http://example.org/common_name „Clown Triggerfish“.
http://example.org/category http://example.org/triggerfish.
http://example.org/length_cm 50.
http://example.org/notes „Also known as the Big-spotted Triggerfish.“
Bei Aufruf:
Ausliefern von RDF-Daten für Programme und Anwendungen
Über Http-Protokoll erreichbar
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 28
Aussagen über Aussagen RDF-Schema
Klassen von Entitäten rdfs:Property Prädikate rdf:Resource Resourcen rdfs:Class Klassen rdfs:Literal Literale ...
Eigenschaften rdf:type Zuordnung zu einer Klasse rdfs:domain zulässige Subjekte für ein Prädikat rdfs:range zulässige Objekte für ein Prädikat rdfs:label für Menschen verstehbare Bezeichnung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 29
Aussagen über Prädikate
http://example.org/length_cm „Länge in cm“@de
http://www.w3.org/2000/01/ rdf-schema#label
Unter dieser http-URI können Browser und Programme diese (und weitere) Angaben finden.
http://www.w3.org/2000/01/ rdf-schema#label
„length in cm“@en
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 30
Auswertung der Vokabulare
Name: „Clown Triggerfish“.
Kategorie http://example.org/triggerfish.
Länge in cm: 50.
Anmerkungen: „Also known as the Big-spotted Triggerfish.“
Bei Aufruf:
HTML-Seiten für Webbrowser (Menschen)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 31
Vokabulare Sammlung von Prädikaten und Klassen
Für einen bestimmten Anwendungszweck Nachnutzbar für alle im Linked Data Web
Beschreibung wieder in RDF und RDF-Schema Aussagen über Aussagen Einschränkung auf sinnvolle Domains und Ranges
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 32
Beispiel: Dublin Core
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://example.org/book/4387-1"> <dc:creator>Karl Mustermann</dc:creator> <dc:title>Algebra</dc:title> <dc:subject>mathematics</dc:subject> <dc:date>2000-01-23</dc:date> <dc:language>EN</dc:language> <dc:description>An introduction to algebra</dc:description> </rdf:Description></rdf:RDF>
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://example.org/book/4387-1"> <dc:creator>Karl Mustermann</dc:creator> <dc:title>Algebra</dc:title> <dc:subject>mathematics</dc:subject> <dc:date>2000-01-23</dc:date> <dc:language>EN</dc:language> <dc:description>An introduction to algebra</dc:description> </rdf:Description></rdf:RDF>
Prefixe für eine einfachere Notation
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 33
Zwischenfazit Daten zu Aussagen
RDF
Vokabularien für Anwendungsbereiche RDF und RDF-Schema
Dereferenzierbare URLs Daten für Maschinen Webseiten für Menschen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 34
Linked data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 35
Logik Web Ontology Language (OWL)
Erweiterung von RDF/RDF-Schema Steigerung der Ausdrucksmächtigkeit Teilweise Einschränkung der Ausdrucksmächtigkeit
Definition von Axiomen über Entitäten Erlaubt Inferenz (= Ableitung von logischen Schlüssen)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 36
Logik Web Ontology Language (OWL)
Beispiele owl:sameAs
Identität in jeder Hinsicht
owl:inverseOf Angabe von inversen Beziehungen Aus „A fatherOf B“ und „fatherOf owl:inverseOf sonOf“
folgt „B sonOf A“
owl:transitiveProperty Angabe von transitiven Beziehungen aus „A olderThan B“ und „B olderThan C
und „olderThan owl:transitiveProperty“ folgt „A olderThan C“
Damit können Daten und Vokabulare zusammengeführt werden
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 37
http://example.org/species/90020 http://example.org/triggerfish.http://example.org/category
Linking data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 38
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://example.org/category
http://example.org/name
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 39
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
Drückerfisch
http://example.org/category
http://example.org/name
http://example.org/name
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 40
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfisch
http://example.org/category
http://example.org/name
http://example.org/name
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 41
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfisch
http://example.org/category
http://d-nb.info/gnd/4145258-6dc:subject
http://example.org/name
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 42
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfischskos:prefLabel
http://example.org/category
http://d-nb.info/gnd/4145258-6dc:subject
owl:sameAs
http://example.org/name
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 43
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfischskos:prefLabel
http://example.org/category
http://d-nb.info/gnd/4145258-6dc:subject
owl:sameAs
http://example.org/name
http://lobid.org/14233owl:sameAs
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 44
http://example.org/species/90020 http://example.org/triggerfish
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfischskos:prefLabel
http://example.org/category
http://d-nb.info/gnd/4145258-6dc:subject
owl:sameAs
http://example.org/name
http://lobid.org/14233owl:sameAs
http://dbpedia.org/resource/Triggerfishowl:sameAs
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 45
http://example.org/species/90020 http://example.org/triggerfish.
Triggerfish
http://example.org/name
http://data.bib.uni-mannheim.de/12344 Peter Tierliebdc:creator
Drückerfischskos:prefLabel
http://example.org/category
http://d-nb.info/gnd/4145258-6dc:subject
owl:sameAs
http://example.org/name
http://lobid.org/14233owl:sameAs
http://dbpedia.org/resource/Triggerfishowl:sameAs
DBPediaDBPedia
Example.orgExample.org
UBMannheim
UBMannheim
Lobid.orgLobid.org
GNDGND
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 46
Bild: linkeddata.org
08.10.2007
2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 47
Bild: linkeddata.org
07.11.2007
2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 48
Bild: linkeddata.org
10.11.2007
2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 49
Bild: linkeddata.org
28.02.2008
2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 50
Bild: linkeddata.org
31.03.2008
2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 51
Bild: linkeddata.org
18.09.2008
2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 52
Bild: linkeddata.org
05.03.2009
2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 53
Bild: linkeddata.org
27.03.2009
2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 54
Bild: linkeddata.org
14.07.2009
2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 55
Bild: linkeddata.org
22.09.2010
2010
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 56
2011
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 57
2011
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 58
Zusammenfassung Daten als Aussagen der Form Subjekt-Prädikat-Objekt
Aussagen können beliebig aggregriert werden
URLs als Identifikatoren Dereferenzierung: Aufruf der URL gemäß Protokoll Je nach Anfrage entweder RDF-Daten oder HTML
Vokabulare Beschreibung von Eigenschaften und Beziehungen Beschreibung als RDF und RDF-Schema
OWL als höhere Ebene „sameAs“ zur Beschreibung semantischer Equivalenz
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 59
Weiterführende Informationen Tutorials und Anleitungen
http://linkeddata.org/guides-and-tutorials
Tom Heath and Christian Bizer. Linked Data: Evolving the Web into a Global Data Space. Morgan & Claypool. 2011 http://linkeddatabook.com (Volltext)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 60
Open Data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 61
Technische Interoperabilität Resource Description Framework (RDF)
„Cool URIs“ URIs sind im Web erreichbar
RDF-Daten oder HTML je nach Anfrage
URIs sind stabil Keine Neubelegung einmal vergebener URIs
Einfache Schemata für den Aufbau der URIs z.B. http://<Domainname>/data/species/<Identnummer>
Gemeinsame Vokabulare
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 62
Rechtliche Interoperabilität Datensammlungen unterliegen dem Urheberrecht
Veröffentlichung Kopie Weiterverwendung mit anderen Daten
→ Lizenzierung durch den Urheber erforderlich
Lizenzmodelle „Nur anschauen“ Eingeschränkte Nutzung
nichtkommerziell, Nennung der Quelle, keine Veränderungen
Uneingeschränkte Nutzung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 63
Rechtliche Interoperabilität Lizenzmodelle
„Nur anschauen“ = Keine Nutzung Eingeschränkte Nutzung Uneingeschränkte Nutzung
Standardlizenzen Abbildung von sinnvollen Einschränkungen Juristisch einwandfreie Formulierungen Anpassungen an unterschiedliche Rechtssysteme
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 64
Die „Creative Commons“ Gründung
2001 in den USA von einer Gruppe um Lawrence Lessig
Anlass Befürchtung, dass das US Copyright (und andere
Urheberrechtsgesetze) die Kreativität im Internet behindern.
Ziele Mehr „kreatives“ Material unter offenen, standardisierten
Lizenzen verfügbar machen Die Lizenzen sollen flexibel, leicht verständlich, leicht zu
nutzen und weltweit gültig sein
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 65
Die Creative Commons Lizenzen BY: Attribution
Namensnennung
SA: Sharealike Weitergabe unter
gleichen Bedingungen
ND: No derivatives Keine Veränderungen
NC: Non-commercial Kein kommerzieller Einsatz
Mehr Rechte vorbehalten
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 66
No rights reserved: CC-0 und PDDL Keine Lizenz, sondern „Waiver“
Der Urheber erklärt öffentlich, von seinen Urheberrechten keinen Gebrauch zu machen
Ziel Werk wird faktisch „Public Domain“, also Allgemeingut Abhängig vom Rechtsraum
In Deutschland kann das Urheberrecht weder aufgegeben noch veräußert werden
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 67
Open Data Commons Creative Commons
Primär ausgelegt auf „kreative“ Werke Für Daten nicht optimal 1:1 Übertragung der Lizenzen auf Daten problematisch
Open Data Commons Orientiert sich an Creative Commons Für Daten besser geeignet:
ODC-BY: Attribution ODC-ODbL: Attribution-Share-Alike
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 68
Eignung für Linked Open Data Jede Einschränkung erschwert Interoperabilität
Non-commercial Rechtliche Grauzone Fehlende Definition: Was ist kommerzielles Handeln?
No-derivatives Erlaubt keine Kombination mit anderen Daten Daten könnten faktisch nur noch angezeigt werden
Share-Alike „Infiziert“ die andere Daten mit seiner Lizenz Nicht kombinierbar mit uneingeschränkten Daten!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 69
Lizenzen für Open Data? BY: Attribution
Namensnennung
SA: Sharealike Weitergabe unter
gleichen Bedingungen
ND: No derivatives Keine Veränderungen
NC: Non-commercial Kein kommerzieller Einsatz
Mehr Rechte vorbehalten
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 70
Warum nicht CC-BY? Namensnennung „gut gemeint“
Aber: Praktisch schwer bis unmöglich umsetzbar Beispiel:
Daten aus 17 Quellen in einer gemeinsamen Datenbank Abfrage über ein Webinterface, Ausgabe von jeweils 10
Treffern Anzeige erfordert Kombination und Anreicherung der Daten
Und nun: Anzeige der Namen „pauschal“ am Ende? Oder Anzeige an jedem einzelnen Datenelement? Wie? Was tun bei abgeleiteten Daten (z.B. Berechnungen)? Und die Anreicherungen?
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 71
Lizenzen für Open Data? BY: Attribution
Namensnennung
SA: Sharealike Weitergabe unter
gleichen Bedingungen
ND: No derivatives Keine Veränderungen
NC: Non-commercial Kein kommerzieller Einsatz
Mehr Rechte vorbehalten
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 72
Für Bibliotheksdaten...
Denn jede Einschränkung verhindert die rechtliche Interoperabilität der Daten.
Public Domain!(CC-0 oder PDDL)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 73
Zusammenfassung Interoperabilität durch Linked Open Data
Standards RDF, RDF-Schema, OWL RDF/XML, Notation 3
Best Practice „Cool URLs“ Verwendung bestehender Vokabulare Freie Lizenzierung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 74
Zeit für Fragen
??
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 75
Teil 2
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 76
Übersicht Teil 1: Theorie
Das Resource Description Framework (RDF) Linked Data Open Data
Teil 2: Praxis Projekte im Bibliotheksumfeld Umsetzung mit eigenen Daten Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 77
Projekte im Bibliotheksumfeld
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 78
10 Jahre Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 79
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
6 Jahre Linked Data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 80
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
4 Jahre Linked Data in Bibliotheken
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 81
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Linked Data Tutorial (Bizer et al.)
Tim Berners-Lee publiziert Prinzipien für Linked Data
Tim Berners-Lee’s Artikel in Scientific American zum Semantic Web
LOD Cloud, Linking Open Data Projekt
LIBRIS, LCSH.info
HBZ, DNB, UB Mannheim, …
LoC LCSH (Offiziell)
W3C LLD XG
DINI AG KIM
2 Jahre Linked Data in Deutschland
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 82
Projekte: Kerninhalte Vokabulare
Normdaten
Titeldaten
Anreicherungen und Verknüpfungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 83
Vokabulare Dublin Core Metadata Elements (DC)
Komplettumfang „qualified Dublin Core“
Semantic Publishing and Referencing (SPAR) „Strauß“ von Vokabularen
CiTO, the Citation Typing Ontology FaBiO, the FRBR-aligned Bibliographic Ontology BiRO, the Bibliographic Reference Ontology C4O, the Citation Counting and Context Characterization
Ontology DoCO, the Document Components Ontology PRO, the Publishing Roles Ontology PSO, the Publishing Status Ontology PSO, the Publishing Status Ontology
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 84
Vokabulare RDA in RDF
Element Sets Elemente der FRBR-Gruppen
Value Vocabularies Zulässige Werte für einzelne Elemente Explizite Aufzählungen
Beispiel: http://rdvocab.info/termList/encFormat/1031 Vocabulary: RDA Encoding Format Concepts: ASCII
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 85
Normdaten „Das Rückgrat des Semantic Web“
Stabile Systeme zur Beschreibung und Vernetzung der Daten insbesondere auf inhaltlicher Ebene
Simple Knowledge Organization System (SKOS) Einfaches aber mächtiges Vokabular Beschreibung von Konzepthierarchien Beschreibung von Thesauri
Friend-of-a-Friend (FOAF) Beschreibung von Beziehungen zwischen Personen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 86
Library of Congress Subject Headings
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 87
GND der Deutschen Nationalbibliothek
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 88
Standard Thesaurus Wirtschaft
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 89
Thesaurus Sozialwissenschaften
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 90
Titeldaten LIBRIS der schwedischen Nationalbibliothek (2008)
HBZ, BSZ: Open Data für Katalogdaten. (März 2010)
UB Mannheim: Verknüpfungen zwischen HeBIS und SWB, Linked Data Aufbereitung. (Juli 2010)
HBZ: lobid.org (September 2010): Titeldaten als Linked Open Data Identifikatoren für Organisationen
B3KAT (Winter 2011) Erste vollständige Freigabe eines Verbundkatalogs plus
Linked Data-Umsetzung!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 91
B3KAT – Verbundkatalog von BVB und KOBV
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 92
Andere Projekte im Bibliotheksumfeld CultureGraph
Sammlung gemeinsamer Identifier und Verknüpfung von Datensätzen zwischen Katalogen
Europeana Open Data als Voraussetzung der Teilnahme RDF-basiertes Datenmodell
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 93
Umsetzung mit eigenen Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 94
Überblick Daten publizieren
Szenario Daten Varianten der Umsetzung
Angebote anreichern
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 95
Überblick Daten publizieren
Szenario Daten Varianten der Umsetzung
Angebote anreichern
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 96
Szenario Ziel: Erweiterung der bestehenden Webdienste
Bereits vorhandene bibliografische Daten im WWW Online-Katalog (OPAC) Dokumentenserver Bibliografische Datensammlungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 97
Voraussetzungen Möglichkeit der Anpassung der serverseitigen Skripte
Lizenzen beachten
Stabile URLs für die Ressourcen Dokumentenserver: Teil der Funktion OPAC:
Verbund-Identnummer als eindeutiger Identifikator nutzbar Zugriff auf einen einzelnen Eintrag über Suche nach PPN
Stabile und kurze URLs durch URL-Rewriting realisierbar http://mein.opac/data/12345667 nach
http://mein.opac/query.php?ppn=12345667
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 98
Aufbereitung der Daten Schritte
Auswahl der Vokabularien Konvertierung der Daten Bereitstellen der Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 99
Vokabularien Linked Data schreibt kein Vokabular vor
Aber: Orientierung an bestehenden Vokabularien Mischen von Attributen aus verschiedenen Quellen
Katalogdaten Dublin Core Bibliographic Ontology (BibO)
Thesauri und Klassifikationen Simple Knowledge Organization System (SKOS) URLs für SWD Schlagwörter bei der DNB URLs für die DDC bei OCLC
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 100
Konvertierung der Daten Analyse des internen Datenformat
Dokumentenserver: Relationale Datenbank OPAC: MAB / Marc21
Nachnutzung vorhandener Routinen Abbildung auf Dublin Core dokumentiert Ähnliche Zielformate wie Endnote, BibTeX Fertige Lösungen z.B. von OAI-PMH/DC nach RDF
→ Konvertierung erfolgt serverseitig bei Darstellung einer Ergebnisseite
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 101
Technisch Umsetzung – Variante 1 Einbetten der semantischen Informationen
Nutzung der vorhandenen Dienste-Infrastruktur Erweiterung des bestehenden XHTML-Codes Menschen- und maschinenlesbare Daten unter einer
URL
Datenformate RDFa Mikroformate Microdata
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 102
Einbetten semantischer Informationen RDFa
Allgemeines Datenformat Annotation von sichtbaren Elementen der Webseite
Beispiel
http://swb.bsz-bw.de/DB=2.1/PPNSET?PPN=309704839
Stuckenschmidt, Heiner 2009
http://purl.org/dc/elements/1.1/author http://purl.org/dc/elements/1.1/date
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 103
RDFa in XHTML
<p xmlns:dc="http://purl.org/dc/elements/1.1/" about="http://www.exmpl.com/books/wikinomics">
In his latest book <cite property="dc:title">Wikinomics</cite>,<span property="dc:creator">Don Tapscott</span>explains deep changes in technology,demographics and business.
The book is due to be published in<span property="dc:date" content="2006-10-01">October 2006</span>.</p>
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 104
Einbetten „light“ Mikroformate
Einbetten semantischer Annotationen in Webseiten Anwendungsspezifisch Einfach aufgebaut Auch für Menschen les- und verstehbar
Beispiel: COinS Mikroformat für bibliografische Angaben Weite Verbreitung in OPACs, Verlagsseiten Mit RDFa kombinierbar
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 105
Beispiel: COins
<span class="Z3988" title="ctx_ver=Z39.88-2004&rfr_id=info:sid/SWB:2.1&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=book&rft_id=http%3A%2F%2Fdx.doi.org%2F10.1007%2F978-3-540-79333-5&rft.btitle=Ontologien : Konzepte,+Technologien+und+Anwendungen&rft.aulast=Stuckenschmidt&rft.aufirst=Heiner&rft.date=2009&rft.isbn=978-3-540-79333-5&rft.pages=Online-Ressource&rft.pub=Springer-Verlag+Berlin+Heidelberg&rft.place=Berlin,+Heidelberg"></span>
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 106
Variante 1: Nutzen und Vorteile Bibliotheken
Geringer Aufwand Keine eigene Infrastruktur Semantische Annotation auch für nicht-bibliografische
Daten möglich Termine von Veranstaltungen Koordinaten der Gebäude Kontaktdaten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 107
Technische Umsetzung – Variante 2 Separate Datenhaltung
Content-Negotiation mit Redirect für RDF/XML MIME-Type vom Webserver auf Datenserver
Hinweis auf RDF-Daten im HTML<link rel="alternate" type="application/rdf+xml" href="link_to_RDF" />
Datenserver Hochwertige Open-Source Softwarepakete verfügbar Datenbank und Webserver integriert Rückverknüpfung mit den bestehenden Webdiensten über
Redirects für HTML-Content
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 108
Variante 2: Nutzen und Vorteile Bibliothek
Serverseitige Konvertierung entfällt Suche und Abfragen in den RDF-Daten möglich Abbildung der Daten in unterschiedlichen Vokabularen Lokale Speicherung beliebiger weiterer RDF-Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 109
Nutzen und Vorteile allgemein Endnutzer
„Herauskratzen“ mit Copy-und-Paste von Informationen aus Webseiten entfällt
Browser-Plugins für Datenweitergabe an externe Programme
CoinS/RDFa an Literaturverwaltungsprogramme Koordinaten an Routenplaner Öffnungszeiten an Terminplaner Personendaten an Kontaktmanager
Erstellen eigener Anwendungen möglich
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 110
Nutzen und Vorteile allgemein Bibliothek
Sofortige Serviceverbesserung Stabile URLs für Bookmarks Übernahme von Daten in Literaturverwaltung
Sichtbarkeit in Suchmaschinen Einfacher Zugang zu den eigenen Daten
Erweiterungen können einheitlich auf LOD aufsetzen Abstraktionsebene zwischen Katalog und Erweiterungen
→ Übernahme von Entwicklungen für andere Kataloge problemlos möglich!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 111
Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 112
LODUM, Universität Münster
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 113
LODUM, Bibliotheksdaten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 114
LODUM, Gebäudeinformationen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 115
LODUM, Vorlesungsverzeichnis
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 116
LODUM, Personen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 117
University of Southampton
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 118
Southampton, Gebäude
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 119
Southampton, Räume
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 120
Southampton, Einrichtungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 121
Southampton, Vorlesungen plus Statistiken
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 122
Southampton, Campus-Gastronomie
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 123
Southampton, Anwendungen Open Data und Linked Open Data
Einfacher Zugang und rechtlich problemlose Nutzung
Etliche Anwendungen bereits vorhanden Viele von externen Anbietern Mobile Anwendungen für mobile Geräte Diverse Aufbereitungen, wie Busverbindungen Telefonbuchanwendungen Catering
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 124
Southampton, Catering-Anwendung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 125
Southampton, Catering-Anwendung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 126
Außerhalb von Bibliotheken Open Data Initiativen von Staaten
www.data.gov (USA) www.data.gov.uk (UK)
Medienunternehmen http://www.guardian.co.uk/data (The Guardian, UK) http://backstage.bbc.co.uk/ (BBC UK)
Live Sciences http://www.brain-map.org/ (Allen Institute, US) http://cu.bio2rdf.org/ (Carleton University, Canada)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 127
Links Library of Congress
http://lcsubjects.org/
ZBW Kiel http://zbw.eu/stw/versions/latest/about
Deutsche Nationalbibliothek http://www.d-nb.de/hilfe/service/linked_data_service.htm
Hochschul-Bibliothekszentrum NRW http://lobid.org/de/
Bayrischer Bibliotheksverbund http://www.bib-bvb.de/open-data.html http://lod.b3kat.de/doc/
University of Southhampton http://data.southampton.ac.uk/
Universität Münster http://lodum.de/
UB Mannheim http://data.bib.uni-mannheim.de/
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 128
Executive Summary
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 129
Worum geht es? Linked Open Data stellt Interoperabiltät von Daten her
Technisch durch das Resource Description Framework Rechtlich durch die freie Lizenzierung der Inhalte
Linked Open Data „brummt“ Es existieren mehrere RDF-Vokabularien zur
Beschreibung bibliografischer Einheiten und der Bezüge zwischen diesen
Wichtige Normdaten sind als Linked Open Data veröffentlicht
Titeldaten mehrerer Nationalbibliotheken sind ebenfalls verfügbar
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 130
Was bringt es? Daten werden sichtbar
Für Suchmaschinen Für Browser-Plugins (z.B. Literaturverwaltung) Für alle Interessierten
Daten werden integrierbar Verlinkung zu externen Angeboten Verlinkung von externen Angeboten Standardprotokoll anstelle obskurer Web APIs
Daten werden „neu gedacht“ Modellierung der Daten je nach Verwendungszweck Ausprobieren neuer Strukturierungselemente
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 131
Und jetzt? Mitmachen! Daten freigeben
Fremde Inhalte filtern, Freie Lizenz wählen Bestehende Datendienste nutzen (Verbünde)
Selber basteln Rewrite-Rules im OPAC-Webserver für stabile, kurze
URLs für alle Einträge Einbetten der bibliografischen Daten als RDF oder
Mikroformat in die bestehenden HTML-Seiten
Am Ball bleiben Jährlicher Workshop der DINI-AG „Kompetenzzentrum
Interoperable Metadaten (KIM)“ Jährliche Konferenz „Semantic Web in Bibliotheken“
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 132
Fragen und Diskussion
??
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 133
Aufbau und Beispiele nach einer Vorlage von Kai Eckert http://www.slideshare.net/kaiec Lizenz: http://creativecommons.org/licenses/by-sa/3.0/
MARC Beispiele Jindřich Mynarz http://www.slideshare.net/jindrichmynarz Lizenz: http://creativecommons.org/licenses/by/2.5/
Verwendete Materialien
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 134
Tagcloud erstellt mit wordle.net auf Basis des final reports der W3C Library Linked Data Incubator Group
Silos Wikimedia Commons, User leaflet http://en.wikipedia.org/wiki/File:Ralls_Texas_Grain_Silos_2010.jpg Lizenz: Public Domain
Closed Sign: http://openclipart.org Lizenz: Public Domain
Linking Open Data Cloud Diagramme Von Richard Cyganiak und Anja Jentzsch http://lod-cloud.net/ Lizenz: http://creativecommons.org/licenses/by-sa/3.0/
Verwendete Materialien
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 135
Lizenz Diese Präsentation steht unter der Creative Commons
Attribution-ShareAlike Lizenz http://creativecommons.org/licenses/by-sa/3.0