Upload
jkett
View
414
Download
1
Embed Size (px)
Citation preview
1
Linked-Data-Aktivitäten der Deutschen NationalbibliothekNationale und internationale Vernetzungsstrategien
Jürgen Kett
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Die Nationalbibliografie ist ein Graph im Graph des Graphen der Graphen
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20112
3 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Linked Data
NPs, Wikipedia,Homepages,Dienste
Wissenschaftl. DatenSocial Data
News, EreignisseNormen, Standards
Internat. BibliografienGebäude
KunstwerkeArchivalien
…
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20114
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20115
Planung: • DNB-Titel in einfacher Form noch in diesem Jahr.• Für die DDB ist ebenfalls ein Dataset geplant.
Herausforderungen
– Interoperabilität steigern
– Für leichte Nutzbarkeit / einfachen Zugang sorgen
– Vernetzungsgrad erhöhen
– Mehr Arbeitsteilung / übergreifende Prozesse
– Persistenz/Transparenz
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20116
Herausforderungen
– Interoperabilität steigern
– Für leichte Nutzbarkeit / einfachen Zugang sorgen
– Vernetzungsgrad erhöhen
– Mehr Arbeitsteilung / übergreifende Prozesse
– Persistenz/Transparenz
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Publizieren vonLinked (Open) Data
7
Linked-Data-Mythen
– Alles ist dezentral: keine zentralen Datenquellen / Prozessknoten mehr
– Triple Stores sind ideale DBMS für Bibliotheken
– SPARQL = ideale Suche, nur die GUI fehlt
– Linked Data = Semantische Suche
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20118
Beobachtungen
– Nicht alle interessanten Daten werden als RDF/über SPARQL angeboten.
– Verknüpfungen zwischen Datensets müssen gepflegt werden. Häufig ist dies ein kooperativer Prozess.
– Komplexe Matching-/Clustering-Verfahren brauchen effizienten und direkten Zugriff auf große Wissensbasen.
– Am Besten: Vernetzung/Dublettenvermeidung bei der Datenerstellung, nicht danach.
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20119
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.
10
???
FacebookAmazon VIAFGNDKatalog1 Katalog2
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.
11<
FacebookAmazon VIAFGNDKatalog1 Katalog2
???
definitiv nicht vorhanden
vielleicht nicht vorhandenunpräzise
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Suchmaschine oder andere Recherchedienstleistung
12
Dataset6Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6
Unverknüpfte Entitäten / Dubetten
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201113
Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6
Culturegraph.org
Suchmaschine oder andere Recherchedienstleistung
Offene Plattform zur Datenvernetzung
Culturegraph.orgOffene Plattform zur Datenvernetzung
persistente Identifizierung von Entitäten
Verwaltung und Veröffentlichung von Mappings
Berechnung von Ähnlichkeiten und Verknüpfungen
Offene Daten / Freie Software
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201114
Initiales Projekt: „Resolving und Lookup-Dienst für bibliografische IDs“
– Kooperation hbz/DNB im Auftrag der AG Verbund.
– Aufbau einer Plattform zur Sammlung relevanter Identifier für Titel.
– Bündelung und Identifizierung ähnlicher Ressourcen über eine gemeinsame URI (CG-URI).
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201115
16 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
TripleStore
NoSQLDB
RESTSRU-Update OAI SPARQLOAIREST SRU
Map/Reduce
Verteilte Berechnung Von Ähnlichkeitsclustern
SPARQLRESTProvinienz/Historie
17
Fazit
– Vernetzte Daten im WWW sind die Zukunft.
– Veröffentlichung der Daten im Web als Linked Data ist ein idealer Startpunkt.
– Um den Vernetzungsgrad zu erhöhen und Stabilität zu erreichen, werden zusätzliche Infrastruktur, Werkzeuge und passgenaue Erschließungsprozesse benötigt.
– Offene Schnittstellen und Datenformate sind Voraussetzungen.
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
18
Quellen
– Plattform / Projektseitewww.culturegraph.org
– Hbz-Wikihttps://wiki1.hbz-nrw.de (Bereich Semantic Web)
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011
Fragen?
| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201119