Kataloganreicherung a la lod

Preview:

DESCRIPTION

Präsentation "Kataloganreicherung à la Linked Open Data" auf der Veranstaltung vom VdB, Landesverband Bayern, München am 2012-09-27 "Jenseits der Verbundkataloge. Die Zukunft der Recherche".

Citation preview

Kataloganreicherung à la Linked Open Data

VdB, Landesverband Bayern, München, 2012-09-27

Jenseits der Verbundkataloge. Die Zukunft der Recherche

Pascal Christoph

Christoph - Kataloganreicherung à la Linked Open Data

Lizenz2

2012-09-27

Dieser Vortrag – inklusive der durch den Autor erstellten Grafiken auf den Folien 7, 8, 11, 13, 15, 16, 17, 18, 20, 21, 33, 62, 63 und 67 – steht unter der CC0 Lizenz : https://creativecommons.org/about/cc0

Davon ausgenommen sind die übrigen verwendeten Grafiken, Bilder und Screenshots, deren individuelle Rechte und Lizenzbedingungen fortgelten.

Insbesondere stehen die http://www.istockphoto.com/ Grafiken auf den Folien 47, 49, 50 und 83 unter einer CC-BY-ND Lizenz : http://creativecommons.org/licenses/by-nd/3.0/de/

Die Graphiken auf den Folien 22-26 entstammen dem “Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

3

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

4

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT5

2012-09-27

Werden Sie in 15 Minuten ein LOD Experte

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT6

2012-09-27

Besser: z.B. einen Workshop besuchen !z.B. auf der SWIB12

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: HTTP-URI7

2012-09-27

Jede Ressource erhält einen HTTP-URI

http://example.de/12345

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: HTTP-URI8

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: HTTP-URI9

2012-09-27

HTTP-URIs sind z. B. einer URN-URI überlegen: sie können z. B. einfach im Browser nachgeschlagen werden.

Christoph - Kataloganreicherung à la Linked Open Data

LOD–Basics: HTTP-URI derefenzieren10

2012-09-27

Wird die Ressource nachgeschlagen, so wird die Ressource geliefert. Geht dies nicht, z.B. weil es sich um einen physischen Gegenstand handelt, werden Daten über die Ressource geliefert (aka Metadaten).

Christoph - Kataloganreicherung à la Linked Open Data

HTTP-URI derefenzieren11

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: RDF Triple12

2012-09-27

Datenbeschreibung mittels RDF => Triple:Subjekt Prädikat Objekt .

(Ein Triple ist die kleinste Informationseinheit.)

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: RDF Triple13

2012-09-27

Der obige Graph als NTriples in RDF ausgedrückt:

<http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/title> "With reference to reference" .<http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/issued> "1983" .<http://lobid.org/resource/HT002948556> <http://purl.org/ontology/bibo/isbn13> "9780915145539" .<http://lobid.org/resource/HT002948556> <http://purl.org/dc/elements/1.1/creator> "Elgin, Catherine" .

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: RDF Triple14

2012-09-27

Ein Objekt kann Text sein:

„Elgin, Catherine“

Ein Objekt kann ein URI sein:

<http://d-nb.info/gnd/135539897>=> Ressourcen in Ressourcen (aka „linked“)

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: linked15

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: linked16

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: linked17

2012-09-27

...

<http://lobid.org/resource/HT002948556><http://purl.org/dc/elements/1.1/creator>

<http://d-nb.info/gnd/135539897> ....

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: linked18

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD - Definition „linked“21

2012-09-27

2007

2008

2009

2010

2011

Christoph - Kataloganreicherung à la Linked Open Data

LOD - Definition „linked“27

2012-09-27

Ad astra ?Ad astra ?Ad data !Ad data !

To boldly go where no data has gone before.

Ad astra ?Ad astra ?Ad data !Ad data !

To boldly go where no data has gone beforeTo boldly go where no data has gone before..

Bildquelle:http://hubblesite.org/gallery/album/star/pr2006050d

Christoph - Kataloganreicherung à la Linked Open Data

LOD – Basics: Resümee „linked“28

2012-09-27

● Ein RDF Triple besteht aus Subjekt, Prädikat und Objekt● Ein RDF Triple ist die kleinstmögliche Aussage über etwas● RDF Triple können URIs enthalten, und somit wiederum Triple● Mehrere RDF Triple ergeben RDF Graphen● HTTP-URIs, und damit Daten, sind institutsübergreifend● Maschinen „verstehen“ Daten● Einfache Schnittstelle: z.B. Webseiten (RDFa in HTML)

=> globales Datennetz („Web of Data“)

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

29

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“30

2012-09-27

http://opendefinition.org/

Wissen ist offen, wenn dessen

VerwendungWiederverwendungWiederverwertung

erlaubt ist.

(„A piece of knowledge is open if you are free to use, reuse and redistribute it.“)

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?31

2012-09-27

Wozu Open Data ?

Um die Daten nutzbar zu machen !

Jeder kann, ohne zu fragen, die Daten

nutzen, nach eigenem Gutdünken

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?32

2012-09-27Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?33

2012-09-27Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?34

2012-09-27Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?35

2012-09-27

Das Ganze ist mehr als die Summe seiner Teile .

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?36

2012-09-27

Bildquelle: https://github.com/jakobib/ticer2012 to be copied and modified under CC-BY-SA license.

Data vs. Application

„Data matures like Wine, Applications like Fish“ (James Governor)

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“-wozu ?37

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: „open“38

2012-09-27

Open Data - eine Frage von:

●Lizenzen●Zugänglichkeit●Formate

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: Lizenzen39

2012-09-27

●Attribution (ODC-BY)●Attribution-Share-Alike (OdbL)●Public Domain (CC0, PDDL)

Keine Non-Commercial Lizenz

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: Datenpotential40

2012-09-27

Open Data =>

Daten Mehrnutzung

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: Daten öffnen41

2012-09-27

Interessierte Akteure zusammenbringen

Bildquelle: http://www.flickr.com/photos/johnspooner/2199685678/

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: Daten öffnen42

2012-09-27

Mögliche rechtliche Probleme klären

● Fremddaten im Katalog● Nutzungsbedingungen in den Verträgen prüfen

- KiM: Empfehlungen zur Öffnung bibliothekarischer Daten- Till Kreutzer: Open Data – Freigabe von Daten aus Bibliothekskatalogen- Adrian Pohl: Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. 2010

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: Daten öffnen43

2012-09-27

● Daten exportieren● Daten veröffentlichen ● Daten lizensieren● Daten verzeichnen (http://thedatahub.org/)● Bekanntgeben

Christoph - Kataloganreicherung à la Linked Open Data

LOD-Basics: five stars44

2012-09-27

Sir Tim Berners Lee:

Bildquelle: http://www.w3.org/DesignIssues/LinkedData.html

Kataloganreicherung45

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

46

2012-09-27

KATALOGANREICHERUNG?

Christoph - Kataloganreicherung à la Linked Open Data

Kataloganreicherung: Definition

Jegliche Ergänzung vorhandener Datensätze um zusätzliche InformationenLinks zum Volltext im WWWSchlagwörterUmschlagbilder ...

Herkunft egal (Benutzer, Bibliotheken, Firmen...)

Neue Funktionen: nur mittelbar

48

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

„INSTANT GRATIFICATION“

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

51

2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

Kataloganreicherung: Methoden

24.05.2012

Datenbank vs. MashupChristoph - Kataloganreicherung à la Linked Open Data 2012-09-27

52

Bildquelle: http://findicons.com/about

Christoph - Kataloganreicherung à la Linked Open Data

53

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Lokale DB:

+ Aufwendigere Zusammenführungen möglich

+ Daten nutzbar für Recherche und weitere Funktionen

- Hoher kontinuierlicher Aufwand für jede Quelle

Kataloganreicherung: Methoden

Dynamisches Mashup:

+ Aktuell

+ Relativ geringer Aufwand je Quelle

- Benötigt (performante) API

- Keine Recherche über die Daten

Christoph - Kataloganreicherung à la Linked Open Data

Kataloganreicherung: Infrastruktur

RDF-basierte Speicherung mit SPARQL Endpoint: Einfaches Hinzufügen neuer Daten Nachnutzbar „Selbst-beschreibender“ Dump „API“ inbegriffen

54

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

55

Bildquelle: http://www.flickr.com/photos/jhsum-commons/4419490136/

Christoph - Kataloganreicherung à la Linked Open Data

Ausgangslage in lobid.org

RDF Store mit SPARQL Endpoint: 4store Open Data aus dem Verbundkatalog „hbz01“ 16 M Titeldatensätze <=> 700 M Triple Verknüpfungen:

56

24.05.2012

• 5.500 Projekt Gutenberg• 12.000 DBpedia• 70.000 b3kat• 200.000 Dewey Decimal Class.• 270.000 DNB Nationalbiografie• 420.000 OCLC

• 1.250.000 Open Library• 700.000 ZDB• 800.000 LOC Iso-639-2• 22.000.000 gnd Normdatei• 32.000.000 lobid-organisations

Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

Praxisbeispiel: LODUM57

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Christoph - Kataloganreicherung à la Linked Open Data

ÜBERSICHT

Linked Open Data (LOD):Basics

linked open

KataloganreicherungDefinitionTechnikMatchingVerlinkung

Fazit & Anwendungsbeispiel

58

2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Verlinkungssoftware

Silk Culturegraph Google-refine ...

59

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Matchingalgorithmen

Abhängig von DatenSpannende Daten liegen „woanders“=> andere Regelwerke

Beispiel DBpedia:Autor, ISBN usw. fehlt meistens => bleibt TitelEingrenzungen:

deutsche DBpedia category:Literarisches_Werk ,

category:Lexikon,_Enzyklopädie

60

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Problem: Disambiguierung

Matching zu ungenau Postprozessierung:

nur Bündel mit gleichem Autor zulassen

61

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Bündel mit gleichem Autor62

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Bündel mit verschiedenen Autoren63

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

LOW-HANGING FRUIT

Kai Schreiber, „Reiche Ernte” 7. August 2005 via Flickr CC BY-SA 2.0

Jansen / Christoph - Kataloganreicherung mit LOD

Triplifizierung

Prädikate finden oder selber prägen rdrel:workManifested=> Triple:

<lobid-resource> <rdrel:workManifested> <dbpedia-resource>

65

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Indexierung

Lizenzfragen klären Triples importieren in SPARQL-Endpoint

Eigener „named Graph“ bietet Vorteile:Leicht löschbar/veränderbarProvenienz verfolgbarEingrenzung von Abfragen auf Named Graphs

66

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Named Graphs67

24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Was wurde erreicht?

12.000 „sichere“ Links zu 4.000 DBpedia Ressourcen => 4.000 neue „Work“-Ebenen (21.000 verworfene Links)

Durchschnittliche Bündelgröße: 3 Links nach freebase: 3.000 0.1 % Anreicherung

68

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

5.500 Links zu 400 Project Gutenberg Ressourcen (Volltexte in mehreren Formaten)=> 0.05% Anreicherung

1.200.000 Links zur Work-Ebene der Open Library=> 12.5% Anreicherung

69

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Was wurde erreicht?

LOW-HANGING FRUIT

Kai Schreiber, „Reiche Ernte” 7. August 2005 via Flickr CC BY-SA 2.0

Jansen / Christoph - Kataloganreicherung mit LOD

DBpedia Beispiel:

„Die Heilige Johanna der Schlachthöfe“

71

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Was wurde erreicht?

Jansen / Christoph - Kataloganreicherung mit LOD

Open Library Beispiel:

„With reference to reference“

75

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Was wurde erreicht?

Jansen / Christoph - Kataloganreicherung mit LOD

Integration in Kataloge

Was darf übernommen werden, was nicht? Was sollte übernommen werden, was nicht? Menschen-lesbare Anzeige der Links/URIs (Manche) Daten sollten lokal indexiert werden

(zur Recherche) ...

77

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Warum Linked Open Data?

Richtig ist: „Warum nicht LOD?“ Linked Data impliziert kontrolliertes

Vokabular, Identifier, weitere Links … <= ideal!

Linked Open Data: Daten lassen sich nachnutzen/zwischenspeichern/verändern <= ideal!

78

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Fazit79

80

Bildquelle: http://www.flickr.com/photos/library_of_congress/4037490394/

Jansen / Christoph - Kataloganreicherung mit LOD

Anwendungsbeispiel81

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

Anwendungsbeispiel82

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Jansen / Christoph - Kataloganreicherung mit LOD

FAZIT84

24.05.2012Jansen / Christoph - Kataloganreicherung mit LOD 24.05.2012Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27

Alles, was mit LOD erreicht werden kann, kann auch anders erreicht werden.

Mit LOD ist es nur viel einfacher.

Vielen Dank!85

Rückfragen jederzeit:

christoph@hbz-nrw.de+49 221 400 75 – 139

Quellenverzeichnis86

- KiM: Empfehlungen zur Öffnung bibliothekarischer Datenhttps://wiki.d-nb.de/pages/viewpage.action?pageId=45419980

- Till Kreutzer (2010): Open Data – Freigabe von Daten aus Bibliothekskatalogen http://www.hbz-nrw.de/dokumentencenter/veroeffentlichungen/open-data-leitfaden.pdf

- Adrian Pohl (2010): Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. Preprint: http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2010_open-data.pdf

- Tim Berners Lee zu Open Data (2010): http://www.youtube.com/watch?v=3YcZ3Zqk0a8

- Jansen / Christoph: Dynamische Kataloganreicherung auf Basis von Linked Open Datahttp://de.slideshare.net/h_jansen/dynamische-kataloganreicherung-auf-basis-von-linked-open-data

- Blog post: First results using SILK to link to DBpediahttps://wiki1.hbz-nrw.de/display/SEM/2012/05/03/First+results+using+SILK+to+link+to+DBpedia

- Blog post: 1.2 M links to Open Libraryhttps://wiki1.hbz-nrw.de/display/SEM/2012/05/23/1.2+M+links+to+Open+Library

- Oliver Flimm (2010): LOD und die Open Library http://de.slideshare.net/flimm/lod-openlibrary20100512

- Datenverzeichnis „thedatahub“ aka CKAN: http://www.thedatahub.org/

- 49 bibliographische Datenquellen als LODhttp://thedatahub.org/group/bibliographic?tags=lod

- Workshop SWIB12: http://swib.org/swib12/programme.php

Recommended