1
Alexander Haffner
Normdaten - die Aggregatoren im Web
…and nobody else
Was können Sie für Ihren
Kunden tun?
– Sichtbarkeit und Verkaufszahlen der Publikation im Internet erhöhen
- Vertrieb in einer großen Zahl von Online-Shops
- PR über Social-Media-Kanäle
– Nachweis der eindeutigen Verfasserschaft- den Autor als „Web-Ressource“ etablieren
- Einbinden der Veröffentlichungen in zur Web-Ressource
gehörenden Publikationsliste
5
7
Online-Shops
The Power of Social Networks
– Dan Brown hat über 2 Mio. „likes“
Wikipedia
– Benutzer pflegen Informationen über Persönlichkeiten und Institutionen des öffentlichen Lebens
– Lebensdaten strukturiert abgelegt und in Infoboxen dargestellt
– Vollständiger Bibliographie-nachweis
– Artikel sind mit Informations-nachweisen auf anderen Plattformen verlinkt
9
Wikipedia
10
163 Nach-
weise
Verknüpfung
mit Wikipedia
11
12
MusicBrainz
MusicBrainz
13
14
MusicBrainz
- bietet die Infrastruktur für eine neue Qualität des Umgangs mit Information hinsichtlich Beschaffung wie auch Bereitstellung
- hohe Verfügbarkeit- hohe Aktualität- geringe Kosten
- Probleme des Web- Fülle an Informationen- ausgerichtet auf Menschen als Endnutzer- Lokalisierung von Information problematisch- heutige Suchmaschinen gut, aber stichwortbasiert
- wünschenswert:- inhaltliche, semantische Suche
Das Web
15
Semantic WebDas Web für die Maschine
- Ziele:
- Strukturierung der Web-Informationen zur Erleichterung der
automatisierten Auswertung durch die Maschine
- offene und weitverbreitete Standards zur Beschreibung von
Informationen / Wissen
- Anbieterübergreifende Vernetzung von Wissen
- Methoden zur Gewinnung von weiteren Informationen aus
existierenden Beschreibungen
16
- Grundprinzipien - Linked Data:
1. Benutzung von URIs, um Objekte zu identifizieren
2. Vergabe von HTTP-URIs, so dass Objekte nachgeschlagen werden
können
3. Wenn eine URI nachgeschlagen wird, müssen zweckdienliche
Informationen gemäß Semantic-Web-Standards bezogen werden
können
4. Verknüpfung von Objektbeschreibungen mit anderen Objekten (Link
zu deren URI)
18
Semantic WebDas Web für die Maschine
– Linked Data:- Kodierung und Verlinkung der Daten durch Resource Description
Framework (RDF)
- Subjekt-Prädikat-Objekt-Ausdrücke
Resource
Resource
Resource
Literal
Property
Property
Subjekt ObjektPrädikat
Linked Data und Semantic Web
19
Ein einfaches Beispiel
20
http://d-nb.info/971564396
Illuminati
http://purl.org/dc/elements/1.1/creator
Dan Brown
http://purl.org/dc/elements/1.1/title
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://d-nb.info/971564396">
<dc:title>Illuminati</dc:title>
<dc:creator>Dan Brown</dc:creator>
</rdf:Description>
</rdf:RDF>
Ein einfaches Beispiel
21
http://d-nb.info/971564396
Illuminati
http://purl.org/dc/elements/1.1/creator
http://d-nb.info/gnd/124429548
http://purl.org/dc/elements/1.1/title
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://d-nb.info/971564396">
<dc:title>Illuminati</dc:title>
<dc:creator rdf:resource="http://d-nb.info/gnd/124429548 " />
</rdf:Description>
</rdf:RDF>
22
DBpedia
Warum Normdaten?
– normierte Sucheinstiege zu bibliografischen Einheiten- erhöhte Benutzerfreundlichkeit bei der Recherche in
Bibliothekskatalogen
– alles an einer Stelle- zentrale Datenverwaltung- einmalige Charakterisierung von
Normdatenentitäten (Vorzugsbenennung, Verweisungsformen etc.)
– kooperative Erstellung und Nutzung- Daten sind allen Bibliotheken zugänglich
23
– PND: PersonennamendateiPersonen der Formal- und Sacherschließung
– GKD: Gemeinsame KörperschaftsdateiKörperschaften der Formalerschließung einschl. Gebietskörperschaften und Kongresse
– SWD: SchlagwortnormdateiSchlagwörter - alle sekundär behandelten Entitäten einschl. Körperschaften, Geografika, Veranstaltungen, Werke, Schriftdenkmäler etc.
– DMA-EST: Einheitssachtitel musikalischer Werke einschl. Expressionen
24
Ausgangssituation - Getrennte Normdateien
Datensätze in Zahlen
25
•PND7 mio
•SWD600.000
•GKD1.6 mio
•DMA-EST
100.000
9.3 mio
Gemeinsame Normdatei (GND)
– Beschreibung von Personen, Körperschaften, Kongressen, Geografika, Schlagwörtern und Werken
– Integration der Normdateien (PND, GKD, SWD, DMA-EST) in objektorientierter Struktur
- Entitätenbasierte Repräsentation- Aufhebung von Redundanzen- einheitliches Datenformat und Regelwerk- Bereinigung ungeeigneter Datenstrukturen- Möglichkeit der Eingabe von Originalschrift
– Angleichung an internationale Standards- Austauschformat MARC 21 Authority- Berücksichtigung von RDA, FRBR und FRAD
– Zukunftsfähig- Linked-Data-Repräsentation im Semantic Web- für automatische Verfahren geeignet
26
– Projektziel
– Kostensenkung bibliothekarischer Normdaten bei gleichzeitiger Steigerung ihres Nutzens
– verlinkte Daten im Web zugänglich machen
– Abgleich und Verlinkung nationaler Normdateien
– 22 Normdateien von 19 Einrichtungen
– derzeit noch auf Personendaten beschränkt
– Gemeinschaftsprojekt von Nationalbibliotheken, das von OCLC implementiert und gehosted wird
Virtual International Authority File
27
Virtual International Authority File
28
Portalansicht der DNB
29
Mission
ORCID aims to solve the author/contributor name ambiguity problem in scholarly communications by creating a central registry of unique identifiers for individual researchers and an open and transparent linking mechanism between ORCID and other current author ID schemes. These identifiers and the relationships among them can be linked to the researcher’s output to enhance the scientific discovery process and to improve the efficiency of research funding and collaboration within the research community.
Participant Organizations
Was können Sie tun um Teil der Cloud
zu werden?
Was können Sie tun um Teil der Cloud
zu werden?
…und noch wichtiger,
was haben Sie davon?
Benefits der Cloud
34
– Daten stehen weiteren Akteuren zur Nachnutzung bzw. gemeinsamen Pflege zur Verfügung
– Lizenzfestlegung notwendig
– Online-Shops können bibliografische Daten ohne Zutun des Verlages in ihr Angebot aufnehmen
– Web 2.0 Plattformen können Inhalte in ihr Angebot aufnehmen
– Sicherung der Korrektheit der Angaben seitens des Verlages
– Sie nutzen Daten nach, die von Dritten bereits in der Cloud bereitgestellt wurden
Was bedeutet das für Sie?
– Erschließung bibliografischer Ressourcen mit Verknüpfung zu Normdaten
– eindeutige Identifier für Verlag und Autoren/Mitwirkende
– Aufbau eines semantischen Netzes
– Anlegen bzw. Nachnutzen von Normdateneintragungen
– Pool von Akteuren kollaborativ pflegen
– Einbeziehung bereits existierender Normdatennachweise
– Rollenangabe für Mitwirkende spezifizieren
35
…Gegenwart und nahe Zukunft in der Deutschen Nationalbibliothek
36
– kollaborative GND-Erschließung mit Bibliotheken und bibliotheksfremden Organisationen weiter verstärken
– Workflows für regelmäßige maschinelle Abgleichverfahren zu Fremddaten etablieren
– gezielte Einbeziehung von ausgewählten Fremddaten bei der Erschließung
– semi-automatisch vs. voll-automatisch
– Ausbau von Qualität und Quantität der GND-Datenbasis
– freie Bereitstellung der Daten sowie der Verknüpfungen zu Fremdbeständen im Semantic Web
Vielen Dank!
discussion is welcome…
Alexander Haffner Deutsche Nationalbibliothek
Adickesallee 1, 60322 Frankfurt am Main Telefon: +49-69-1525-1766 Telefax: +49-69-1525-1799
[email protected] http://www.dnb.de
37