19
1 Linked-Data-Aktivitäten der Deutschen Nationalbibliothek Nationale und internationale Vernetzungsstrategien Jürgen Kett | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

  • Upload
    jkett

  • View
    414

  • Download
    1

Embed Size (px)

Citation preview

Page 1: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

1

Linked-Data-Aktivitäten der Deutschen NationalbibliothekNationale und internationale Vernetzungsstrategien

Jürgen Kett

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Page 2: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Die Nationalbibliografie ist ein Graph im Graph des Graphen der Graphen

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20112

Page 3: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

3 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Linked Data

NPs, Wikipedia,Homepages,Dienste

Wissenschaftl. DatenSocial Data

News, EreignisseNormen, Standards

Internat. BibliografienGebäude

KunstwerkeArchivalien

Page 4: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20114

Page 5: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20115

Planung: • DNB-Titel in einfacher Form noch in diesem Jahr.• Für die DDB ist ebenfalls ein Dataset geplant.

Page 6: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Herausforderungen

– Interoperabilität steigern

– Für leichte Nutzbarkeit / einfachen Zugang sorgen

– Vernetzungsgrad erhöhen

– Mehr Arbeitsteilung / übergreifende Prozesse

– Persistenz/Transparenz

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20116

Page 7: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Herausforderungen

– Interoperabilität steigern

– Für leichte Nutzbarkeit / einfachen Zugang sorgen

– Vernetzungsgrad erhöhen

– Mehr Arbeitsteilung / übergreifende Prozesse

– Persistenz/Transparenz

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Publizieren vonLinked (Open) Data

7

Page 8: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Linked-Data-Mythen

– Alles ist dezentral: keine zentralen Datenquellen / Prozessknoten mehr

– Triple Stores sind ideale DBMS für Bibliotheken

– SPARQL = ideale Suche, nur die GUI fehlt

– Linked Data = Semantische Suche

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20118

Page 9: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Beobachtungen

– Nicht alle interessanten Daten werden als RDF/über SPARQL angeboten.

– Verknüpfungen zwischen Datensets müssen gepflegt werden. Häufig ist dies ein kooperativer Prozess.

– Komplexe Matching-/Clustering-Verfahren brauchen effizienten und direkten Zugriff auf große Wissensbasen.

– Am Besten: Vernetzung/Dublettenvermeidung bei der Datenerstellung, nicht danach.

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20119

Page 10: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.

10

???

FacebookAmazon VIAFGNDKatalog1 Katalog2

Page 11: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.

11<

FacebookAmazon VIAFGNDKatalog1 Katalog2

???

definitiv nicht vorhanden

vielleicht nicht vorhandenunpräzise

Page 12: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Suchmaschine oder andere Recherchedienstleistung

12

Dataset6Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6

Unverknüpfte Entitäten / Dubetten

Page 13: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201113

Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6

Culturegraph.org

Suchmaschine oder andere Recherchedienstleistung

Offene Plattform zur Datenvernetzung

Page 14: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Culturegraph.orgOffene Plattform zur Datenvernetzung

persistente Identifizierung von Entitäten

Verwaltung und Veröffentlichung von Mappings

Berechnung von Ähnlichkeiten und Verknüpfungen

Offene Daten / Freie Software

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201114

Page 15: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Initiales Projekt: „Resolving und Lookup-Dienst für bibliografische IDs“

– Kooperation hbz/DNB im Auftrag der AG Verbund.

– Aufbau einer Plattform zur Sammlung relevanter Identifier für Titel.

– Bündelung und Identifizierung ähnlicher Ressourcen über eine gemeinsame URI (CG-URI).

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201115

Page 16: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

16 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

TripleStore

NoSQLDB

RESTSRU-Update OAI SPARQLOAIREST SRU

Map/Reduce

Verteilte Berechnung Von Ähnlichkeitsclustern

SPARQLRESTProvinienz/Historie

Page 17: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

17

Fazit

– Vernetzte Daten im WWW sind die Zukunft.

– Veröffentlichung der Daten im Web als Linked Data ist ein idealer Startpunkt.

– Um den Vernetzungsgrad zu erhöhen und Stabilität zu erreichen, werden zusätzliche Infrastruktur, Werkzeuge und passgenaue Erschließungsprozesse benötigt.

– Offene Schnittstellen und Datenformate sind Voraussetzungen.

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Page 18: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

18

Quellen

– Plattform / Projektseitewww.culturegraph.org

[email protected]

– Hbz-Wikihttps://wiki1.hbz-nrw.de (Bereich Semantic Web)

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Page 19: 2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Fragen?

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201119