of 61 /61
Bibliotheksdatenpublikation und Linked Data Lars G. Svensson | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 1

Bibliotheksdatenpublikation und linked data

Embed Size (px)

DESCRIPTION

Folien für das Seminar "Bibliotheksdatenpublikation und Linked Data" in der Österreichischen Nationalbibliothek am 11. September 2014 (Brainpool K 04/2014). Der erste Teil behandelt die Repräsentation von Bibliotheksdaten als RDF (Grundlagen, Modelle), der zweite Teil ist eine Einführung in das Framework Metafacture; hier schulde ich Christoph Böhme von der DNB großen Dank, da ich auf seine Folien zurückgreifen konnte.

Text of Bibliotheksdatenpublikation und linked data

  • 1. Lars G. Svensson Bibliotheksdatenpublikation und Linked Data | 61 | Bibliotheksdatenpublikation und 1 Linked Data | 11. September 2014
  • 2. Wenn jemand nach Information sucht, geht er heute nicht in die Bibliothek | 61 | Bibliotheksdatenpublikation und 2 Linked Data | 11. September 2014
  • 3. Die Daten, die Bibliotheken erstellen, knnen aber helfen, die Suche effizienter zu machen Da ist es. WOW! | 61 | Bibliotheksdatenpublikation und 3 Linked Data | 11. September 2014 Photo by Wendt Commons (CC BY): http://www.flickr.com/photos/wendt-library/5190902316/
  • 4. Auerhalb von Bibliotheken versteht man unsere Datenformate nicht MARC 21 MAB 2 UNIMARC Z39.50 ISBD | 61 | Bibliotheksdatenpublikation und 4 Linked Data | 11. September 2014 FRBR http://farm1.static.flickr.com/159/342220423_558ea703f6_b.jpg
  • 5. Dabei sollte es einfach sein, Bibliotheksdaten zu benutzen Some data | 61 | Bibliotheksdatenpublikation und 5 Linked Data | 11. September 2014 Photo by KIUI Staff (CC BY): http://www.flickr.com/photos/ kiui/3693823005/ Library data Other data
  • 6. Linked Library Data ist ein guter Anfang | 61 | Bibliotheksdatenpublikation und 6 Linked Data | 11. September 2014 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 7. Das Semantic Web hat ein einfaches Datenmodell: RDF (Resource Description Framework) http://d-nb.info/ 990075621 hatTitel Stolz und Vorurteil : Roman Subjekt Prdikat Objekt | 61 | Bibliotheksdatenpublikation und 7 Linked Data | 11. September 2014
  • 8. Das Semantic Web hat ein einfaches Datenmodell: RDF http://d-nb.info/gnd/118505173 Objekt Prdikat Subjekt hatAutor http://d-nb.info/ 990075621 hatTitel Stolz und Vorurteil : Roman Subjekt Prdikat Objekt | 61 | Bibliotheksdatenpublikation und 8 Linked Data | 11. September 2014
  • 9. Das Semantic Web hat ein einfaches Datenmodell: RDF http://d-nb.info/gnd/118505173 Prdikat http://d-nb.info/ 990075621 Stolz und Vorurteil : Roman | 61 | Bibliotheksdatenpublikation und 9 Linked Data | 11. September 2014 Austen, Jane Subjekt Prdikat Objekt Subjekt Objekt Subjekt Prdikat Objekt hatAutor hatTitel hatName
  • 10. Vokabulare definieren Klassen von Ressourcen und Relationen zwischen ihnen http://d-nb.info/gnd/118505173 dc:creator http://d-nb.info/ 990075621 Stolz und Vorurteil : Roman | 61 | Bibliotheksdatenpublikation und 10 Linked Data | 11. September 2014 Austen, Jane hatAutor hatTitel hatName bibo:Book dc:title foaf:name foaf:Person rdf:type rdf:type
  • 11. In RDF mssen alle Ressourcen in Subjekt- und Prdikatposition eindeutige Identifiers haben http://d-nb.info/gnd/118505173 dc:creator http://d-nb.info/ 990075621 Stolz und Vorurteil : | 61 | Bibliotheksdatenpublikation und 11 Linked Data | 11. September 2014 Roman Austen, Jane hatAutor hatTitel hatName bibo:Book dc:title foaf:name foaf:Person rdf:type rdf:type
  • 12. Eindeutige Identifiers sorgen dafr, dass wir wissen, worber wir reden Wir wollen alles identifizieren knnen Objekte/Ressourcen mssen global identifizierbar sein Identifiers mssen zur generischen URI-Syntax kompatibel sein - http-URIs (http://d-nb.info/gnd/118915185) - URNs (urn:nbn:de:bvb:20-opus-23317) - Mailto (mailto:[email protected]) An verschiedenen Typen von Identifiers hngen unterschiedliche Erwartungen - Persistenz der Ressource - Auflsbarkeit | 61 | Bibliotheksdatenpublikation und 12 Linked Data | 11. September 2014
  • 13. Wenn zwei Sachen den gleichen Namen haben, aber unterschiedliche URIs, knnen wir sie unterscheiden Titel - Dokumenttitel (dc:title) - Persnlicher Titel (foaf:title) - Akademischer Titel (gndo:academicDegree) - Kurstitel (crsw:has-title) - | 61 | Bibliotheksdatenpublikation und 13 Linked Data | 11. September 2014
  • 14. URIs knnen unterschiedlich aussehen dc:title vs. http://purl.org/dc/elements/1.1/title foaf:title vs. http://xmlns.com/foaf/0.1/title gndo:academicDegree vs. http://d-nb. info/standards/elementset/gnd#academicDegree crsw:has-title vs. http://courseware.rkbexplorer.com/ontologies/courseware#h as-title dc, foaf, gndo und crsw sind Prfixe (prefixes), nachzuschlagen bei z. B. http://prefix.cc something:like-this nennt man CURIE (compact URI) | 61 | Bibliotheksdatenpublikation und 14 Linked Data | 11. September 2014
  • 15. RDFS und OWL erlauben es, Typen und Beziehungen nher zu spezifizieren und somit die Sachen, fr die wir uns interessieren, zu beschreiben Bcher Autoren (Verlags-)Orte Verlage Herausgeber Themen | 61 | Bibliotheksdatenpublikation und 15 Linked Data | 11. September 2014
  • 16. 16 hnlich wie bei der Katalogisierung betrachten wir zunchst sog. Individuen Frankfurt am Main Jane Austen Stolz und Vorurteil Hermann Hesse Glasperlen-spiel Berlin Das Suhrkamp schrieb verffentlichte hat Sitz in Fischer hat Sitz in schrieb | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 17. Als nchstes finden wir Gemeinsamkeiten Frankfurt am Main Jane Austen Stolz und Vorurteil Hermann Hesse Glasperlen-spiel Berlin Das Suhrkamp schrieb verffentlichte hat Sitz in Fischer hat Sitz in schrieb
  • 18. Individuen, die Gemeinsamkeiten haben, gehren zu derselben Klasse Frankfurt am Main Jane Austen Stolz und Vorurteil Hermann Hesse Glasperlen-spiel Berlin Das Suhrkamp schrieb verffentlichte hat Sitz in Fischer hat Sitz in schrieb Verffent-licher Ort Schreiber
  • 19. 19 Es gibt aber verschiedene Arten von Publikationen Stolz und Vorurteil Das Glasperlen-spiel Roman owl:Class rdf:type Kurzge-schichte Die Stadt Erzhlung owl:subclassOf owl:subclassOf rdf:type rdf:type rdf:type dct:creator Hermann Hesse
  • 20. Und verschiedene Arten von z. B. Namen rdfs:label | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 20 Das Glasperlen-spiel Die Stadt foaf:name Hermann Hesse Das Glasperlenspiel Hermann Hesse dc:title gndo:preferredNameForThePerson
  • 21. Damit auch Computer RDF verstehen knnen, gibt es sog. Serialisierungen RDF/XML Turtle N-Triples | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 21
  • 22. Zurck zu Jane Austen http://d-nb.info/gnd/118505173 dct:creator http://d-nb.info/ 990075621 Stolz und Vorurteil : | 61 | Bibliotheksdatenpublikation und 22 Linked Data | 11. September 2014 Roman Austen, Jane hatAutor hatTitel hatName bibo:Book dc:title foaf:name foaf:Person rdf:type rdf:type
  • 23. Jane Austen in RDF/XML Stoltz und Vorurteil : RomanJane Austen | 61 | Bibliotheksdatenpublikation und 23 Linked Data | 11. September 2014
  • 24. Jane Austen in Turtle @prefix foaf: . @prefix dc: . @prefix dct: . @prefix bibo: . @prefix gnd: . a bibo:Book dc:title Stoltz und Vorurteil : Roman ; dct:creator gnd:118505173 . gnd:118505173 a foaf:Person ; foaf:name Jane Austen . | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 24
  • 25. Jane Austen in N-Triples Stoltz und Vorurteil : Roman Jane Austen | 61 | Bibliotheksdatenpublikation und 25 Linked Data | 11. September 2014
  • 26. Zur Abfrage von RDF-Daten gibt es SPARQL (SPARQL Protocol and RDF Query Language) PREFIX dc: PREFIX foaf: PREFIX dct: SELECT ?title WHERE { ?book dc:title ?title ; dct:creator ?author . ?author foaf:name "Jane Austen } | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 26
  • 27. Linked Data baut auf all diesen Sachen auf | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 27 1.Use URIs as names for things 2.Use HTTP URIs so that people can look up those names. 3.When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) 4. Include links to other URIs so that they can discover more things. http://www.w3.org/DesignIssues/LinkedData.html
  • 28. Das sog. Five Star-Schema behandelt aber nicht nur die Verlinkung Available on the web (whatever format) but with an open licence, to be Open Data Available as machine-readable structured data (e.g. excel instead of image scan of a table) as (2) plus non-proprietary format (e.g. CSV instead of excel) All the above plus, Use open standards from W3C (RDF and SPARQL) to identify things, so that people can point at your stuff All the above, plus: Link your data to other peoples data to provide context http://www.w3.org/DesignIssues/LinkedData.html | 61 | Bibliotheksdatenpublikation und 28 Linked Data | 11. September 2014
  • 29. bung: Klassen, Beziehungen, Instanzen Auf den Gruppentischen finden Sie Krtchen mit verschiedenen Worten. Ordnen Sie jedes der Karten einer der folgenden Gruppen zu: - Klasse - Beziehung - Instanz Zeit: 15 Minuten | 61 | Bibliotheksdatenpublikation und 29 Linked Data | 11. September 2014
  • 30. 30 | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 Um Daten auszutauschen, mssen wir eine gemeinsame Sprache sprechen Pieter Brghel d. J.: Turmbau zu Babel (Public Domain): https://commons.wikimedia.org/wiki/File:The_Tower_of_Babel,_oil_on_panel_painting_by_Pieter_Bruegh el_the_Younger.jpg
  • 31. RDF ist eine abstrakte Syntax, die keine Semantik vorgibt http://d-nb.info/gnd/118505173 http://d-nb.info/ 990075621 Stolz und Vorurteil : | 61 | Bibliotheksdatenpublikation und 31 Linked Data | 11. September 2014 Roman Austen, Jane
  • 32. Die Semantik ergibt sich durch die Wahl der Vokabulare Dublin Core Elements (dc) Dublin Core Terms (dct bzw. dcterms) Bibliographic Ontology (bibo) Simple Knowledge Organisation System (SKOS) GND-Ontologie (gndo) Friend of a Friend (foaf) RDF Schema (rdfs) Web Ontology Language (owl) | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 32
  • 33. Bei der Wahl der Vokabulare ist auch die Frage, was die eigenen Daten hergeben | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 33 A manual for writers of research papers, theses, and dissertations : Chicago style for students and researchers / Kate L. Turabian ; revised by Wayne C. Booth, Gregory G. Colomb, Joseph M. Williams, and University of Chicago Press editorial staff. 7th ed. Chicago : University of Chicago Press, 2007. xviii, 466 p. : ill. ; 23 cm. (Chicago guides to writing, editing, and publishing). Includes bibliographical references (p. 409-435) and index. ISBN 978-0-226-82336-2 (cloth : alk. paper) : USD35.00. ISBN 978-0-226-82337-9 (pbk. : alk. paper) : USD17.00
  • 34. Deutschsprachige Systeme trennen meist zwischen Norm- und Titeldaten | 61 | Bibliotheksdatenpublikation und 34 Linked Data | 11. September 2014
  • 35. Neu ist auch eine Tendenz, die bibliografische Beschreibung aufzuteilen | 61 | Bibliotheksdatenpublikation und 35 Linked Data | 11. September 2014
  • 36. Es gibt auch mehr Modelle, als einem lieb ist Hierarchische Modelle FRBR/RDA BIBFRAME schema.org Einstufige Modelle DINI-KIM ISBD | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 36
  • 37. 37 Hundra-ringen (Work) Hundra-ringen (Expr, sv) Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Jonas Jonasson Der hundert-jhrige (2011) Le vieux (Expr, fr) Wibke Kuhn Caroline Berg Le viex (2011) Le viex (2012)
  • 38. 38 Hundra-ringen (Work) Hundra-ringen (Expr, sv) Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Der hundert-jhrige (2011) Le vieux (Expr, fr) Le viex (2011) Hc.01 / DDC22: 839.73 803 Le viex (2012) DDC23: 839.738 DDC23: 839.738 Hjec.01 / DDC22:840 Schweden, Mann, Greisenalter, Altenheim, Flucht, Abenteuer, Belletr. Darstellung DDC-SG:839, B
  • 39. Hundra-ringen (Work) Altenheim Mann Hommes Hundra-ringen (Expr, sv) Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Der hundert-jhrige (2011) Le vieux (Expr, fr) Le viex (2011) Hc.01 / DDC22: 839.73 803 Le viex (2012) DDC23: 839.738 DDC23: 839.738 Hjec.01 / DDC22:840 Schweden, Mann, Greisenalter, Altenheim, Flucht, Abenteuer, Belletr. Darstellung DDC-SG:839, B Old age Men homes Maisons de Retraite
  • 40. Die Frage ist, inwiefern die Modelle interoperabel sind | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 40 http://www.loc.gov/bibframe/docs/images/wemi-bibframe-profile-small.png
  • 41. Wie viel Interoperabilitt notwendig ist, hngt vom Austauschpartner ab Such-maschi-ne Biblio-thek | 61 | Bibliotheksdatenpublikation und 41 Linked Data | 11. September 2014 Archiv, Museum Biblio-thek Foto von Doc Searls (CC BY): http://www.flickr.com/photos/docsearls/5500714140/
  • 42. Pause bis 15.15 Uhr | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 42 Foto von Angelo Laub (CC BY-NC-SA): https://flic.kr/p/4QHh
  • 43. Eine kurze Einfhrung in Metafacture | 61 | Bibliotheksdatenpublikation und 43 Linked Data | 11. September 2014
  • 44. Metafacture ist ein Framework fr Datenverarbeitung 44 Metamorph Stream modules Flux Bausteine fr Prozesse Stream module mit eigener DSL* fr Metadatentrans-formationen DSL* fr Prozessdefinition *DSL: Domain specific Language | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 45. Die Stream modules sind die Kernbausteine von Metafacture 45 Stream module Empfngt typisierten Input: strings triples objects metadata events Sendet typisierten Output: strings triples objects metadata events Verarbeitet Input um einen bestimmten Output zu erstellen. Um die Wiederver-wendbarkeit zu erhhen, sind die Aufgaben meist klein. | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 46. Eine einfache Prozesskette kann so aussehen: 46 file name file handle string metadata events open-file as-lines decode-String pica encode-formeta write("stdout") file handle a string for each line metadata events string a string nothing Lese und schreibe eine Datei mit PICA-records: | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 47. Die Module werden mit einfachen Parametern konfiguriert Modulekonfiguration Entweder ein einzelner, obligatorischer Wert Oder optionale key-value Paare 47 Stream module | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 48. Die Prozessketten beschreibt man mit Flux 48 Metamorph Stream modules Flux | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 49. Ein einfaches Flux-Skript kann wie folgt aussehen: "file.name" |open-file |as-lines |decode-pica |encode-formeta(style="multiline") |write("stdout"); 49 Ein String als Eingangsinput Module sind mit dem Pipe- Character verbunden Key-value-basierte konfiguration Obligatorischer Parameter Der Flow endet mit einem Semikolon | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 50. Flux erlaubt auch Variablen und Kommentare 50 default in = "file.name"; default out = "stdout"; in |open-file // ... |write(out); Definiert Defaultwerte fr die Variablen in und out Kommentare starten mit zwei Slashes Werwendet Variablen statt Direkteingabe eines Strings | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 51. Es gibt auch nette Features fr Strings in Flux 51 FLUX_DIR beinhaltet immer den Pfad des bergeordneten Ordners default in = FLUX_DIR + "file.name"; default haiku = "A dropped ice cream cone One red ant, then two, then four Suddenly hundreds!"; | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 Strings knnen zusammenfefgt werden Strings knnen multi-line sein
  • 52. Metamorph schlielich beschreibt Datentransformationen 52 Metamorph Stream modules Flux | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 53. In Metafacture sind Metadaten eine Sequenz von Ereignissen Pica record [email protected] $0 2809 033A $n Publisher $p Location Sequenz von Metadaten-ereignissen Start record 2809 Start entity [email protected] Literal 0: 2809 End entity Start entity 033A Literal n: Publisher Literal p: Location End entity End record decode-pica | 61 | Bibliotheksdatenpublikation und 53 Linked Data | 11. September 2014
  • 54. Metamorph hrt auf Metadatenevents 54 Start record id Start entity 021A Literal a: The Trial End entity End record Start record id Literal Title: The Trial End record morph Listen for 021A.a Output as Title | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 55. Die Transformationsregeln sind meist data-Ereignissen 55 Separator zwischen Entitten und Namen der Literale Name des Literals, nach dem gehorcht wird Name des Output- Literalsof the literal that is output | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 56. Man kann auch einen Prfix hinzufgen 56 ... ... Erst kommt http://d-nb. info/gnd/, dann der Inhalt von 028A $9 | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 57. Metamorph kann auch die Daten modifizieren 57 ... ... Diese data-Statements erzeugen keinen Output, sondern Variablen Name des generierten Literals; kann auch Variablen beinhalten Literal, der aus zwei Variablen konstruiert wird (unten definiert) | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 58. In Eclipse knnen Flux-Skripte mit Run as ausgefhrt werden Whle Run with Flux, um den gewhlten Skript auszufhren Whle Flux Help um 58 | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 eine Liste der Module zu bekommen
  • 59. bung: Erstellung von LinkedData aus PICA+ mit Hilfe von Metafacture 1. ffnen Sie eclipse in der virtuellen Umgebung 2. Navigieren Sie zu Workshop Materials / Exercises / data-transformation 3. Verndern Sie den Skript simple-transformation.xml, um aus den PICA+-Daten JSON zu erstellen (der flux-Skript ist schon vorkonfiguriert) 4. Fhren Sie nach jeder neuen Transformationsregel den Skript mit Run-as aus | 61 | Bibliotheksdatenpublikation und 59 Linked Data | 11. September 2014
  • 60. Sind Ihre Erwartungen erfllt? Foto von (CC BY-NC): https://flic.kr/p/9QEig7 60 | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014
  • 61. 61 Vielen Dank frs Mitmachen! http://d-nb.info/gnd/ 124903959 | 61 | Bibliotheksdatenpublikation und Linked Data | 11. September 2014 Lars G. Svensson [email protected] nb:Brain- Pool_K_04/2014 Bibliotheksdatenpublikation und RDF / Linked Data foaf:name foaf:mbox teach:courseTitle teach:teacherOf