Folien für das Seminar "Bibliotheksdatenpublikation und Linked Data" in der Österreichischen Nationalbibliothek am 11. September 2014 (Brainpool K 04/2014). Der erste Teil behandelt die Repräsentation von Bibliotheksdaten als RDF (Grundlagen, Modelle), der zweite Teil ist eine Einführung in das Framework Metafacture; hier schulde ich Christoph Böhme von der DNB großen Dank, da ich auf seine Folien zurückgreifen konnte.
Text of Bibliotheksdatenpublikation und linked data
1. Lars G. Svensson Bibliotheksdatenpublikation und Linked Data
| 61 | Bibliotheksdatenpublikation und 1 Linked Data | 11.
September 2014
2. Wenn jemand nach Information sucht, geht er heute nicht in
die Bibliothek | 61 | Bibliotheksdatenpublikation und 2 Linked Data
| 11. September 2014
3. Die Daten, die Bibliotheken erstellen, knnen aber helfen,
die Suche effizienter zu machen Da ist es. WOW! | 61 |
Bibliotheksdatenpublikation und 3 Linked Data | 11. September 2014
Photo by Wendt Commons (CC BY):
http://www.flickr.com/photos/wendt-library/5190902316/
4. Auerhalb von Bibliotheken versteht man unsere Datenformate
nicht MARC 21 MAB 2 UNIMARC Z39.50 ISBD | 61 |
Bibliotheksdatenpublikation und 4 Linked Data | 11. September 2014
FRBR
http://farm1.static.flickr.com/159/342220423_558ea703f6_b.jpg
5. Dabei sollte es einfach sein, Bibliotheksdaten zu benutzen
Some data | 61 | Bibliotheksdatenpublikation und 5 Linked Data |
11. September 2014 Photo by KIUI Staff (CC BY):
http://www.flickr.com/photos/ kiui/3693823005/ Library data Other
data
6. Linked Library Data ist ein guter Anfang | 61 |
Bibliotheksdatenpublikation und 6 Linked Data | 11. September 2014
Linking Open Data cloud diagram, by Richard Cyganiak and Anja
Jentzsch. http://lod-cloud.net/
7. Das Semantic Web hat ein einfaches Datenmodell: RDF
(Resource Description Framework) http://d-nb.info/ 990075621
hatTitel Stolz und Vorurteil : Roman Subjekt Prdikat Objekt | 61 |
Bibliotheksdatenpublikation und 7 Linked Data | 11. September
2014
8. Das Semantic Web hat ein einfaches Datenmodell: RDF
http://d-nb.info/gnd/118505173 Objekt Prdikat Subjekt hatAutor
http://d-nb.info/ 990075621 hatTitel Stolz und Vorurteil : Roman
Subjekt Prdikat Objekt | 61 | Bibliotheksdatenpublikation und 8
Linked Data | 11. September 2014
9. Das Semantic Web hat ein einfaches Datenmodell: RDF
http://d-nb.info/gnd/118505173 Prdikat http://d-nb.info/ 990075621
Stolz und Vorurteil : Roman | 61 | Bibliotheksdatenpublikation und
9 Linked Data | 11. September 2014 Austen, Jane Subjekt Prdikat
Objekt Subjekt Objekt Subjekt Prdikat Objekt hatAutor hatTitel
hatName
10. Vokabulare definieren Klassen von Ressourcen und Relationen
zwischen ihnen http://d-nb.info/gnd/118505173 dc:creator
http://d-nb.info/ 990075621 Stolz und Vorurteil : Roman | 61 |
Bibliotheksdatenpublikation und 10 Linked Data | 11. September 2014
Austen, Jane hatAutor hatTitel hatName bibo:Book dc:title foaf:name
foaf:Person rdf:type rdf:type
11. In RDF mssen alle Ressourcen in Subjekt- und
Prdikatposition eindeutige Identifiers haben
http://d-nb.info/gnd/118505173 dc:creator http://d-nb.info/
990075621 Stolz und Vorurteil : | 61 | Bibliotheksdatenpublikation
und 11 Linked Data | 11. September 2014 Roman Austen, Jane hatAutor
hatTitel hatName bibo:Book dc:title foaf:name foaf:Person rdf:type
rdf:type
12. Eindeutige Identifiers sorgen dafr, dass wir wissen, worber
wir reden Wir wollen alles identifizieren knnen Objekte/Ressourcen
mssen global identifizierbar sein Identifiers mssen zur generischen
URI-Syntax kompatibel sein - http-URIs
(http://d-nb.info/gnd/118915185) - URNs
(urn:nbn:de:bvb:20-opus-23317) - Mailto (mailto:[email protected])
An verschiedenen Typen von Identifiers hngen unterschiedliche
Erwartungen - Persistenz der Ressource - Auflsbarkeit | 61 |
Bibliotheksdatenpublikation und 12 Linked Data | 11. September
2014
13. Wenn zwei Sachen den gleichen Namen haben, aber
unterschiedliche URIs, knnen wir sie unterscheiden Titel -
Dokumenttitel (dc:title) - Persnlicher Titel (foaf:title) -
Akademischer Titel (gndo:academicDegree) - Kurstitel
(crsw:has-title) - | 61 | Bibliotheksdatenpublikation und 13 Linked
Data | 11. September 2014
14. URIs knnen unterschiedlich aussehen dc:title vs.
http://purl.org/dc/elements/1.1/title foaf:title vs.
http://xmlns.com/foaf/0.1/title gndo:academicDegree vs.
http://d-nb. info/standards/elementset/gnd#academicDegree
crsw:has-title vs.
http://courseware.rkbexplorer.com/ontologies/courseware#h as-title
dc, foaf, gndo und crsw sind Prfixe (prefixes), nachzuschlagen bei
z. B. http://prefix.cc something:like-this nennt man CURIE (compact
URI) | 61 | Bibliotheksdatenpublikation und 14 Linked Data | 11.
September 2014
15. RDFS und OWL erlauben es, Typen und Beziehungen nher zu
spezifizieren und somit die Sachen, fr die wir uns interessieren,
zu beschreiben Bcher Autoren (Verlags-)Orte Verlage Herausgeber
Themen | 61 | Bibliotheksdatenpublikation und 15 Linked Data | 11.
September 2014
16. 16 hnlich wie bei der Katalogisierung betrachten wir
zunchst sog. Individuen Frankfurt am Main Jane Austen Stolz und
Vorurteil Hermann Hesse Glasperlen-spiel Berlin Das Suhrkamp
schrieb verffentlichte hat Sitz in Fischer hat Sitz in schrieb | 61
| Bibliotheksdatenpublikation und Linked Data | 11. September
2014
17. Als nchstes finden wir Gemeinsamkeiten Frankfurt am Main
Jane Austen Stolz und Vorurteil Hermann Hesse Glasperlen-spiel
Berlin Das Suhrkamp schrieb verffentlichte hat Sitz in Fischer hat
Sitz in schrieb
18. Individuen, die Gemeinsamkeiten haben, gehren zu derselben
Klasse Frankfurt am Main Jane Austen Stolz und Vorurteil Hermann
Hesse Glasperlen-spiel Berlin Das Suhrkamp schrieb verffentlichte
hat Sitz in Fischer hat Sitz in schrieb Verffent-licher Ort
Schreiber
19. 19 Es gibt aber verschiedene Arten von Publikationen Stolz
und Vorurteil Das Glasperlen-spiel Roman owl:Class rdf:type
Kurzge-schichte Die Stadt Erzhlung owl:subclassOf owl:subclassOf
rdf:type rdf:type rdf:type dct:creator Hermann Hesse
20. Und verschiedene Arten von z. B. Namen rdfs:label | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014 20
Das Glasperlen-spiel Die Stadt foaf:name Hermann Hesse Das
Glasperlenspiel Hermann Hesse dc:title
gndo:preferredNameForThePerson
21. Damit auch Computer RDF verstehen knnen, gibt es sog.
Serialisierungen RDF/XML Turtle N-Triples | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014
21
22. Zurck zu Jane Austen http://d-nb.info/gnd/118505173
dct:creator http://d-nb.info/ 990075621 Stolz und Vorurteil : | 61
| Bibliotheksdatenpublikation und 22 Linked Data | 11. September
2014 Roman Austen, Jane hatAutor hatTitel hatName bibo:Book
dc:title foaf:name foaf:Person rdf:type rdf:type
23. Jane Austen in RDF/XML Stoltz und Vorurteil : RomanJane
Austen | 61 | Bibliotheksdatenpublikation und 23 Linked Data | 11.
September 2014
24. Jane Austen in Turtle @prefix foaf: . @prefix dc: . @prefix
dct: . @prefix bibo: . @prefix gnd: . a bibo:Book dc:title Stoltz
und Vorurteil : Roman ; dct:creator gnd:118505173 . gnd:118505173 a
foaf:Person ; foaf:name Jane Austen . | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014
24
25. Jane Austen in N-Triples Stoltz und Vorurteil : Roman Jane
Austen | 61 | Bibliotheksdatenpublikation und 25 Linked Data | 11.
September 2014
26. Zur Abfrage von RDF-Daten gibt es SPARQL (SPARQL Protocol
and RDF Query Language) PREFIX dc: PREFIX foaf: PREFIX dct: SELECT
?title WHERE { ?book dc:title ?title ; dct:creator ?author .
?author foaf:name "Jane Austen } | 61 | Bibliotheksdatenpublikation
und Linked Data | 11. September 2014 26
27. Linked Data baut auf all diesen Sachen auf | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014 27
1.Use URIs as names for things 2.Use HTTP URIs so that people can
look up those names. 3.When someone looks up a URI, provide useful
information, using the standards (RDF*, SPARQL) 4. Include links to
other URIs so that they can discover more things.
http://www.w3.org/DesignIssues/LinkedData.html
28. Das sog. Five Star-Schema behandelt aber nicht nur die
Verlinkung Available on the web (whatever format) but with an open
licence, to be Open Data Available as machine-readable structured
data (e.g. excel instead of image scan of a table) as (2) plus
non-proprietary format (e.g. CSV instead of excel) All the above
plus, Use open standards from W3C (RDF and SPARQL) to identify
things, so that people can point at your stuff All the above, plus:
Link your data to other peoples data to provide context
http://www.w3.org/DesignIssues/LinkedData.html | 61 |
Bibliotheksdatenpublikation und 28 Linked Data | 11. September
2014
29. bung: Klassen, Beziehungen, Instanzen Auf den
Gruppentischen finden Sie Krtchen mit verschiedenen Worten. Ordnen
Sie jedes der Karten einer der folgenden Gruppen zu: - Klasse -
Beziehung - Instanz Zeit: 15 Minuten | 61 |
Bibliotheksdatenpublikation und 29 Linked Data | 11. September
2014
30. 30 | 61 | Bibliotheksdatenpublikation und Linked Data | 11.
September 2014 Um Daten auszutauschen, mssen wir eine gemeinsame
Sprache sprechen Pieter Brghel d. J.: Turmbau zu Babel (Public
Domain):
https://commons.wikimedia.org/wiki/File:The_Tower_of_Babel,_oil_on_panel_painting_by_Pieter_Bruegh
el_the_Younger.jpg
31. RDF ist eine abstrakte Syntax, die keine Semantik vorgibt
http://d-nb.info/gnd/118505173 http://d-nb.info/ 990075621 Stolz
und Vorurteil : | 61 | Bibliotheksdatenpublikation und 31 Linked
Data | 11. September 2014 Roman Austen, Jane
32. Die Semantik ergibt sich durch die Wahl der Vokabulare
Dublin Core Elements (dc) Dublin Core Terms (dct bzw. dcterms)
Bibliographic Ontology (bibo) Simple Knowledge Organisation System
(SKOS) GND-Ontologie (gndo) Friend of a Friend (foaf) RDF Schema
(rdfs) Web Ontology Language (owl) | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014
32
33. Bei der Wahl der Vokabulare ist auch die Frage, was die
eigenen Daten hergeben | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014 33 A manual for writers of
research papers, theses, and dissertations : Chicago style for
students and researchers / Kate L. Turabian ; revised by Wayne C.
Booth, Gregory G. Colomb, Joseph M. Williams, and University of
Chicago Press editorial staff. 7th ed. Chicago : University of
Chicago Press, 2007. xviii, 466 p. : ill. ; 23 cm. (Chicago guides
to writing, editing, and publishing). Includes bibliographical
references (p. 409-435) and index. ISBN 978-0-226-82336-2 (cloth :
alk. paper) : USD35.00. ISBN 978-0-226-82337-9 (pbk. : alk. paper)
: USD17.00
34. Deutschsprachige Systeme trennen meist zwischen Norm- und
Titeldaten | 61 | Bibliotheksdatenpublikation und 34 Linked Data |
11. September 2014
35. Neu ist auch eine Tendenz, die bibliografische Beschreibung
aufzuteilen | 61 | Bibliotheksdatenpublikation und 35 Linked Data |
11. September 2014
36. Es gibt auch mehr Modelle, als einem lieb ist Hierarchische
Modelle FRBR/RDA BIBFRAME schema.org Einstufige Modelle DINI-KIM
ISBD | 61 | Bibliotheksdatenpublikation und Linked Data | 11.
September 2014 36
37. 37 Hundra-ringen (Work) Hundra-ringen (Expr, sv)
Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Jonas Jonasson
Der hundert-jhrige (2011) Le vieux (Expr, fr) Wibke Kuhn Caroline
Berg Le viex (2011) Le viex (2012)
38. 38 Hundra-ringen (Work) Hundra-ringen (Expr, sv)
Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Der
hundert-jhrige (2011) Le vieux (Expr, fr) Le viex (2011) Hc.01 /
DDC22: 839.73 803 Le viex (2012) DDC23: 839.738 DDC23: 839.738
Hjec.01 / DDC22:840 Schweden, Mann, Greisenalter, Altenheim,
Flucht, Abenteuer, Belletr. Darstellung DDC-SG:839, B
39. Hundra-ringen (Work) Altenheim Mann Hommes Hundra-ringen
(Expr, sv) Hundra-ringen (2009) Der hundert-jhrige (Expr, de) Der
hundert-jhrige (2011) Le vieux (Expr, fr) Le viex (2011) Hc.01 /
DDC22: 839.73 803 Le viex (2012) DDC23: 839.738 DDC23: 839.738
Hjec.01 / DDC22:840 Schweden, Mann, Greisenalter, Altenheim,
Flucht, Abenteuer, Belletr. Darstellung DDC-SG:839, B Old age Men
homes Maisons de Retraite
40. Die Frage ist, inwiefern die Modelle interoperabel sind |
61 | Bibliotheksdatenpublikation und Linked Data | 11. September
2014 40
http://www.loc.gov/bibframe/docs/images/wemi-bibframe-profile-small.png
41. Wie viel Interoperabilitt notwendig ist, hngt vom
Austauschpartner ab Such-maschi-ne Biblio-thek | 61 |
Bibliotheksdatenpublikation und 41 Linked Data | 11. September 2014
Archiv, Museum Biblio-thek Foto von Doc Searls (CC BY):
http://www.flickr.com/photos/docsearls/5500714140/
42. Pause bis 15.15 Uhr | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014 42 Foto von Angelo Laub (CC
BY-NC-SA): https://flic.kr/p/4QHh
43. Eine kurze Einfhrung in Metafacture | 61 |
Bibliotheksdatenpublikation und 43 Linked Data | 11. September
2014
44. Metafacture ist ein Framework fr Datenverarbeitung 44
Metamorph Stream modules Flux Bausteine fr Prozesse Stream module
mit eigener DSL* fr Metadatentrans-formationen DSL* fr
Prozessdefinition *DSL: Domain specific Language | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September
2014
45. Die Stream modules sind die Kernbausteine von Metafacture
45 Stream module Empfngt typisierten Input: strings triples objects
metadata events Sendet typisierten Output: strings triples objects
metadata events Verarbeitet Input um einen bestimmten Output zu
erstellen. Um die Wiederver-wendbarkeit zu erhhen, sind die
Aufgaben meist klein. | 61 | Bibliotheksdatenpublikation und Linked
Data | 11. September 2014
46. Eine einfache Prozesskette kann so aussehen: 46 file name
file handle string metadata events open-file as-lines decode-String
pica encode-formeta write("stdout") file handle a string for each
line metadata events string a string nothing Lese und schreibe eine
Datei mit PICA-records: | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014
47. Die Module werden mit einfachen Parametern konfiguriert
Modulekonfiguration Entweder ein einzelner, obligatorischer Wert
Oder optionale key-value Paare 47 Stream module | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September
2014
48. Die Prozessketten beschreibt man mit Flux 48 Metamorph
Stream modules Flux | 61 | Bibliotheksdatenpublikation und Linked
Data | 11. September 2014
49. Ein einfaches Flux-Skript kann wie folgt aussehen:
"file.name" |open-file |as-lines |decode-pica
|encode-formeta(style="multiline") |write("stdout"); 49 Ein String
als Eingangsinput Module sind mit dem Pipe- Character verbunden
Key-value-basierte konfiguration Obligatorischer Parameter Der Flow
endet mit einem Semikolon | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014
50. Flux erlaubt auch Variablen und Kommentare 50 default in =
"file.name"; default out = "stdout"; in |open-file // ...
|write(out); Definiert Defaultwerte fr die Variablen in und out
Kommentare starten mit zwei Slashes Werwendet Variablen statt
Direkteingabe eines Strings | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014
51. Es gibt auch nette Features fr Strings in Flux 51 FLUX_DIR
beinhaltet immer den Pfad des bergeordneten Ordners default in =
FLUX_DIR + "file.name"; default haiku = "A dropped ice cream cone
One red ant, then two, then four Suddenly hundreds!"; | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September 2014
Strings knnen zusammenfefgt werden Strings knnen multi-line
sein
52. Metamorph schlielich beschreibt Datentransformationen 52
Metamorph Stream modules Flux | 61 | Bibliotheksdatenpublikation
und Linked Data | 11. September 2014
53. In Metafacture sind Metadaten eine Sequenz von Ereignissen
Pica record [email protected] $0 2809 033A $n Publisher $p Location Sequenz von
Metadaten-ereignissen Start record 2809 Start entity [email protected] Literal
0: 2809 End entity Start entity 033A Literal n: Publisher Literal
p: Location End entity End record decode-pica | 61 |
Bibliotheksdatenpublikation und 53 Linked Data | 11. September
2014
54. Metamorph hrt auf Metadatenevents 54 Start record id Start
entity 021A Literal a: The Trial End entity End record Start record
id Literal Title: The Trial End record morph Listen for 021A.a
Output as Title | 61 | Bibliotheksdatenpublikation und Linked Data
| 11. September 2014
55. Die Transformationsregeln sind meist data-Ereignissen 55
Separator zwischen Entitten und Namen der Literale Name des
Literals, nach dem gehorcht wird Name des Output- Literalsof the
literal that is output | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014
56. Man kann auch einen Prfix hinzufgen 56 ... ... Erst kommt
http://d-nb. info/gnd/, dann der Inhalt von 028A $9 | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September
2014
57. Metamorph kann auch die Daten modifizieren 57 ... ... Diese
data-Statements erzeugen keinen Output, sondern Variablen Name des
generierten Literals; kann auch Variablen beinhalten Literal, der
aus zwei Variablen konstruiert wird (unten definiert) | 61 |
Bibliotheksdatenpublikation und Linked Data | 11. September
2014
58. In Eclipse knnen Flux-Skripte mit Run as ausgefhrt werden
Whle Run with Flux, um den gewhlten Skript auszufhren Whle Flux
Help um 58 | 61 | Bibliotheksdatenpublikation und Linked Data | 11.
September 2014 eine Liste der Module zu bekommen
59. bung: Erstellung von LinkedData aus PICA+ mit Hilfe von
Metafacture 1. ffnen Sie eclipse in der virtuellen Umgebung 2.
Navigieren Sie zu Workshop Materials / Exercises /
data-transformation 3. Verndern Sie den Skript
simple-transformation.xml, um aus den PICA+-Daten JSON zu erstellen
(der flux-Skript ist schon vorkonfiguriert) 4. Fhren Sie nach jeder
neuen Transformationsregel den Skript mit Run-as aus | 61 |
Bibliotheksdatenpublikation und 59 Linked Data | 11. September
2014
60. Sind Ihre Erwartungen erfllt? Foto von (CC BY-NC):
https://flic.kr/p/9QEig7 60 | 61 | Bibliotheksdatenpublikation und
Linked Data | 11. September 2014
61. 61 Vielen Dank frs Mitmachen! http://d-nb.info/gnd/
124903959 | 61 | Bibliotheksdatenpublikation und Linked Data | 11.
September 2014 Lars G. Svensson [email protected] nb:Brain-
Pool_K_04/2014 Bibliotheksdatenpublikation und RDF / Linked Data
foaf:name foaf:mbox teach:courseTitle teach:teacherOf