Upload
jasmin-huegi
View
116
Download
2
Embed Size (px)
DESCRIPTION
Dies ist eine Präsentation, welche für den Unterricht von Bachelor-Studenten (2. Sem.) in Informationswissenschaften gegeben wurde.
Citation preview
Linked Open Data in Bibliotheken
Jasmin Hügi
Haute école de gestion, Genève, Suisse Information documentaire Semestre 2 – Cours «Thesauri, Taxonomien, Ontologien» 21.05.2013
Problem
• Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?
• Mühsam:
– Roman + Rom,
– Roman + Bern,
– Roman + Paris, etc.
Cours 722-11n : Analyse documentaire – Juin 2012 - C. Bezençon
2
Nutzen für Bibliotheken
• Idealerweise: Computer weiss, was eine europäische Hauptstadt ist.
Ontologien geben dem Computer dieses Wissen.
Was sind Ontologien?
Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?
Roman
Bern
Lissabon
London
Hogwarts Film
Spielt in
Spielt in
Ist
Ist
Nachtzug nach Lissabon / Pascal Mercier
Harry Potter / J. K. Rowling
Shadows on the Hudson / I. Bashevis Singer
5
New York
Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?
Hauptstadt
Fiktiver Ort
Ist
6
Stadt
Ist
Roman
Bern
Lissabon
London
Hogwarts Film
Spielt in
Spielt in
Ist
Ist
Nachtzug nach Lissabon / Pascal Mercier
Harry Potter / J. K. Rowling
Shadows on the Hudson / I. Bashevis Singer
New York
Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?
Schweiz
Portugal
7
USA
Eng-land
Europa
Ist eine Stadt in
Ist eine Stadt in
Befindet sich in
Roman
Bern
Lissabon
London
Hogwarts Film
Spielt in
Spielt in
Ist
Ist
Nachtzug nach Lissabon / Pascal Mercier
Harry Potter / J. K. Rowling
Shadows on the Hudson / I. Bashevis Singer
New York
Wie finde ich Romane, deren Handlung in einer europäischen Hauptstadt spielt?
Roman
Bern
Lissabon
London
Hogwarts
Hauptstadt
Fiktiver Ort Film
Ist
Nachtzug nach Lissabon / Pascal Mercier
Harry Potter / J. K. Rowling
Shadows on the Hudson / I. Bashevis Singer
8
New York
Stadt
Ist
Europa
Spielt in
Spielt in
Ist
Ist
Die Sprache der Tripel
Beispiel
Subjekt – Prädikat – Objekt
= Tripel
Tripel - Beispiel
Linked Open Data in Bibliotheken
Jasmin Hügi
lehrt
Hat Lehrperson
Graph
Spezifisch
Folksonomies Eliane Blumer
lehrt
hat Lehrperson
Linked Open Data in Bibliotheken
Jasmin Hügi
lehrt
hat Lehrperson
Graph
Allgemein
Unterrichtseinheit Lehrperson
lehrt
hat Lehrperson
Graph
Allgemein
Unterrichtseinheit Lehrperson
wird besucht von
besucht
Student
behandelt das Thema
wird unterrichtet
im Kurs
Kurs
lehrt
hat Lehrperson
Aufgabe
Erstellt einen RDF-Graph für Bücher in einem Bibliothekskatalog.
• Buchtitel
• Buchautor
• ISBN
• Thema
• Sprache
• Publikationsjahr
• Herausgeber
• Publikationsort
• Etc.
Beispiel eines RDF-Graphen
Beispiellösung
Linked Data
Linked Data
• Informationen werden als Paare mit einer Beziehung dargestellt.
• Alles hat eine URI (http://...).
• Informationen werden in einem Standardformat kodiert.
Ein Paar mit Beziehung
Linked Open Data in Bibliotheken
Jasmin Hügi
lehrt
Hat Lehrperson
URI
URI (http://...) URI (http://...) URI (http://...)
Linked Open Data in Bibliotheken
Jasmin Hügi
lehrt
Hat Lehrperson
Standardformat
RDF <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:bil="http://www. bilingue.fake/unterricht#"> <rdf:Description rdf:about="http://www.bilingue.fake/ unterricht/einheit/lod_biblio"> <bil:lehrperson>Jasmin Hügi</bil:lehrperson> <bil:kurs>Thesauri, Taxonomien, und Ontologien </bil:kurs> </rdf:Description> </rdf:RDF>
Beispiel
<http://www.bilingue.fake/unterricht/lod_biblio>
<http://www.bilingue.fake/unterricht/hat_Lehrperson>
<http://www.linkedin.fake/Jasmin_Hügi>
Subjekt Prädikat
Objekt
Linked Open Data in Bibliotheken
Jasmin Hügi
lehrt
hat Lehrperson
Beispiel
<http://www.bilingue.fake/unterricht/lod_biblio> <http://www.biling ue.fake/unterricht/hat_Lehrperson> <http://www.linkedin.fake/Jasmin_Hügi>
= Tripel
Alternative
<http://www.bilingue.fake/unterricht/lod_biblio> <http://www.biling ue.fake/unterricht/hat_Lehrperson> «Jasmin Hügi»
= Tripel
Wieso URI?
Eindeutige Identifikation
<http://www.bilingue.fake/unterricht/lod_biblio>
<http://www.htwchur.fake/unterricht/lod_biblio>
Wieso URI?
Zusätzliche Informationen
http://www.linkedin.fake/Jasmin_Hügi
Dublin Core
• Metadaten-Schema für die Beschreibung von digitalen Resourcen
• Websites, Online-Dokumente, etc.
• Einfachere Auffindbarkeit mit Suchmaschinen
• 15 Kernelemente
Dublin Core
Dublin Core
15 Kernelemente • Title • Creator • Subject • Description • Publisher • Contributor • Date • Type
• Format • Identifier • Source • Language • Relation • Coverage • Rights
Übung Dublin Core
Versucht für die Elemente eures Graphen das passende Element des Dublin Cores auf dieser Website (http://dublincore.org/documents/dcmi-terms/) zu finden.
Beispiel: Autor Buch
dcterms:creator
Beispiel-Lösung
dcterms:title
dcterms:creator
dcterms:date
dcterms:publisher
dcterms:identifier dcterms:subject
dcterms:type
dcterms:description
dcterms:description
Linked Open Data
5 Star deployment scheme by Tim Berners-Lee
http://5stardata.info/
5 Star LOD von Tim Berners-Lee
★ make your stuff available on the Web (whatever format) under an open license
= Bild
5 Star LOD von Tim Berners-Lee
★★ make it available as structured data (e.g., Excel instead of image scan of a table)
gtd-2.xls
5 Star LOD von Tim Berners-Lee
★★★ use non-proprietary formats (e.g., CSV instead of Excel)
gtd-3.csv
5 Star LOD von Tim Berners-Lee
★★★★ use URIs to denote things, so that people can point at your stuff
http://5stardata.info/gtd-4.html
5 Star LOD von Tim Berners-Lee
★★★★★ link your data to other data to provide context
http://5stardata.info/gtd-5.html
Ontologien
• Ontologien (Vokabulare) werden benötigt, um ein Subjekt mit einem Objekt zu verbinden.
• Eine einzige Ontologie genügt selten, um alle Beziehungen darzustellen.
Buch Autor
dcterms:creator
Übung Vokabular auswählen und recherchieren. • BIO Vocabulary • Event Ontology • FOAF • Core FRBR Ontology • Musical Ontology • PRISM (Namespae)
Vokabular präsentieren und am Beispiel des Buchgraphs seine Nützlichkeit erklären. Zusatzaufgabe: Herausfinden, was eine Klasse ist.
Turtle (Terse RDF Triple Language)
Turtle : Regel 1
Jedes Tripel beginnt auf einer neuen Linie
Jedes Tripel endet mit einem Punkt (.)
Turtle : Regel 1 Beispiel
Der Verdacht wurde geschrieben von Friedrich Dürrenmatt .
Matto regiert wurde geschrieben von Friedrich Glauser .
Turtle : Regel 1 Beispiel
<http://www.rero.fake/000005214_Verdacht> <http://purl.org/dc/elements/1.1/creator>
«Friedrich Dürrenmatt».
<http://www.rero.fake/00004314_Matto> <http://purl.org/dc/elements/1.1/creator>
«Friedrich Glauser».
Turtle : Regel 2
Subjekt, Prädikat und Objekt werden mit einem Leerschlag (Whitespace) voneinander getrennt.
Turtle : Regel 2 Beispiel
<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».
<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».
Turtle : Regel 3
Wörter ohne URI werden in Anführungszeichen gesetzt.
Bsp: «Friedrich Dürrenmatt»
Turtle : Regel 3 Beispiel
<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».
<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».
Turtle : Regel 4
URIs werden in spitze Klammern gesetzt.
Bsp:
<http://www.bilingue.fake/unterricht/lod_biblio>
Turtle : Regel 4 Beispiel
<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».
<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».
Turtle : Regel 5
URIs können mit Präfixen (Namespace) abgekürzt werden.
Turtle : Regel 5 Beispiel
<http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt».
<http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».
Wiederholung: <http://purl.org/dc/elements/1.1/>
<http://www.rero.fake/>
Turtle : Regel 5 Beispiel
@prefix dc: <http://purl.org/dc/elements/1.1/> @prefix rero: <http://www.rero.fake/> rero:000005214_Verdacht dc:creator «Friedrich Dürrenmatt». rero:000004314_Matto dc:creator «Friedrich Glauser». = <http://www.rero.fake/000005214_Verdacht> <http:/ /purl.org/dc/elements/1.1/creator> «Friedrich Dürrenmatt». <http://www.rero.fake/000004314_Matto> <http://p url.org/dc/elements/1.1/creator> «Friedrich Glauser».
Turtle : Regel 6
Es dürfen Kommentare in den Code geschrieben werden. Dafür muss das Zeichen # an den Anfang einer Linie geschrieben werden.
Turtle: Regel 6 Beispiel
@prefix dc: <http://purl.org/dc/elements/1.1/>
@prefix rero: <http://www.rero.fake/>
# Es geht um Schweizer Autoren.
rero:000005214_Verdacht dc:creator «Friedrich Dürrenmatt».
rero:000004314_Matto dc:creator «Friedrich Glauser».
Turtle : Regel 7
Wenn mehrere Objekte immer dasselbe Subjekt betreffen, können diese Beziehungen durch ein Strichpunkt (;) miteinander verbunden werden.
Turtle : Regel 7 Beispiel
@prefix dc: <http://purl.org/dc/elements/1.1/>
@prefix rero: <http://www.rero.fake/>
# Es geht um Schweizer Autoren.
rero:000005214_Verdacht
dc:creator «Friedrich Dürrenmatt» ;
dc:title «Der Verdacht» ;
dc:language «Deutsch» .
Turtle : Regel 8
Wenn ein Objekt mehrere Eigenschaften hat, dann kann das Objekt in eckigen Klammern [] beschrieben werden.
@prefix dc: <http://purl.org/dc/elements/1.1/>
@prefix rero: <http://www.rero.fake/>
@prefix bio: <http://purl.org/vocab/bio/0.1/>
rero:000005214_Verdacht
dc:creator [rdf:type foaf:person ;
foaf:name «Friedrich Dürrenmatt» ;
bio:event bio:birth [bio:date «05.01.1921»] ] ;
dc:title «Der Verdacht».
Übung
Findet Fehler im Code, den Ihr erhalten habt.
Datei mit Fehlern: http://campus.hesge.ch/id_bilingue/doc/turtle_beispielmitfehler.pdf
Lösung http://campus.hesge.ch/id_bilingue/doc/turtle_beispiel.pdf