29
1 Alexander Haffner Die GND und ihr Weg in das Semantic Web

Die GND und ihr Weg in das Semantic Web

Embed Size (px)

DESCRIPTION

Die konsistente Ansetzung und Verwendung von Normdaten im deutschsprachigen Raum soll ab Frühjahr 2012 durch die Gemeinsame Normdatei (GND) gewährleistet sein. In der GND werden die bislang im Bibliotheks- und Archivwesen sowie die in Museen eingesetzten Normdateien - Gemeinsame Körperschaftsdatei (GKD), Schlagwortnormdatei (SWD) und die Personennamendatei (PND) - sowie die Einheitssachtitel-Datei des Deutschen Musikarchivs (EST-Datei) zusammengeführt. Die GND wird somit normierte Beschreibungen für Personen, Körperschaften, Kongresse, Geografika, Schlagwörter und Einheitssachtitel der Musik enthalten. Der Vortrag wird neben einer Vorstellung der GND den klassischen Ansatz der kooperativen Erschließung im Bibliothekswesen diskutieren. Darüberhinaus sollen die aufkommenden Potentiale durch die semantische Vernetzung von Normdaten hervorgehoben werden. In diesem Kontext sollen Aspekte der Verlinkung mit bibliotheks- und nicht-bibliotheksspezifischen Daten und Möglichkeiten zur Effizienzsteigerung bei der Erschließung und Nachnutzung betrachtet werden. Interessante Beispiele für die Verknüpfung von GND-Daten mit nicht-bibliothekarischen Wissensorganisationssystemen sind die Web 2.0 Plattformen Wikipedia, GeoNames oder auch MusicBrainz. Darüberhinaus soll der Vortrag auch die Verknüpfungsstrategien mit dem VIAF, der DDC, den LCSH sowie dem STW näher beleuchten. Außerdem soll diskutiert werden, wie die GND perspektivisch auch im Semantic Web eine zentrale Rolle im und außerhalb des Bibliothekswesen einnehmen kann. Anhand von Erfahrungen aus dem Linked-Data-Service-Projekt der Deutschen Nationalbibliothek werden Ansätze für die Modellierung und Bereitstellung von Normdaten als Linked-Data-Repräsentationen vorgestellt.

Citation preview

Page 1: Die GND und ihr Weg in das Semantic Web

1

Alexander Haffner

Die GND und ihr Weg in das Semantic Web

Page 2: Die GND und ihr Weg in das Semantic Web

Warum Normdaten?

– normierte Sucheinstiege zu bibliografischen Einheiten- erhöhte Benutzerfreundlichkeit bei der Recherche

– alles an einer Stelle- zentrale Datenverwaltung- einmalige Charakterisierung von

Normdatenentitäten (Vorzugsbenennung, Verweisungsformen etc.)

– kooperative Erstellung und Nutzung- Daten sind allen Bibliotheken zugänglich

2 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 3: Die GND und ihr Weg in das Semantic Web

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 20113

Die Gemeinsame Normdatei (GND)

Page 4: Die GND und ihr Weg in das Semantic Web

– PND: PersonennamendateiPersonen der Formal- und Sacherschließung

– GKD: Gemeinsame KörperschaftsdateiKörperschaften der Formalerschließung (einschl. Gebietskörperschaften und Kongresse)

– SWD: SchlagwortnormdateiSchlagwörter (alle sekundär behandelten Entitäten) (einschl. Körperschaften, Geografika, Veranstaltungen, Werke, Schriftdenkmäler ….)

– DMA-EST: Einheitssachtitel musikalischer Werke (einschl. Expressionen)

4

Ausgangssituation - Getrennte Normdateien

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 5: Die GND und ihr Weg in das Semantic Web

Datensätze in Zahlen

5

•PND7 mio

•SWD600.000

•GKD1.6 mio

•DMA-EST

100.000

9.3 mio

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 6: Die GND und ihr Weg in das Semantic Web

– unterschiedliche Regelwerke (RAK, RAK-Musik, RSWK)

– unterschiedliche Datenmodelle

– unterschiedliche Datenformate

– redundante Datenhaltung

– Anwender halten die Normdateien als Spiegel in der eigenen Arbeitsumgebung

6

Ausgangssituation: Getrennte Normdateien

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 7: Die GND und ihr Weg in das Semantic Web

Gemeinsame Normdatei (GND)

– Integration der Normdateien in objektorientierter Struktur

- Entitätenbasierte Repräsentation- Aufhebung von Redundanzen- einheitliches Datenformat und Regelwerk- Bereinigung ungeeigneter Datenstrukturen- Möglichkeit der Eingabe von Originalschrift

– Angleichung an internationale Standards- Austauschformat MARC 21 – Authority- GND-Erfassungsformat nahe an MARC 21- Berücksichtigung von RDA, FRBR und FRAD

– Zukunftsfähig- Semantic Web-fähig- rür automatische Verfahren geeignet

7 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 8: Die GND und ihr Weg in das Semantic Web

Kooperative Erschließung im Bibliothekswesen

8 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 9: Die GND und ihr Weg in das Semantic Web

Online-Normschnittstelle (ONS)

9 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 10: Die GND und ihr Weg in das Semantic Web

– Eingabe von Datensätzen in die GND durch alle Teilnehmer im Bibliotheksverbund

– Erfassung und Änderung über den eigenen Client- „gleichzeitig“ in der überregionalen Normdatei und in der

Verbunddatei

– alle Normdatensätze gelangen von Verbundebene in die überregionalen Normdateien

– neue Datensätze für alle Normdatenanwender über OAI verfügbar

10 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Online-Kommunikationsverfahren

Page 11: Die GND und ihr Weg in das Semantic Web

Potentiale der semantischen Vernetzung

11 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 12: Die GND und ihr Weg in das Semantic Web

Ziele der semantischen Vernetzung

– Nachweis zusätzlicher Informationsquellen

– Vermeidung von Doppelarbeit bei der Erschließung- stärkere Nachnutzung externer Daten- Redundanzvermeidung, wenn möglich

– Aufmerksamkeit für bibliothekarische Normdaten steigern

– bessere Vernetzung der bibliografischen Daten

– Öffnung zu Nicht-Bibliothekscommunities

12 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 13: Die GND und ihr Weg in das Semantic Web

Semantische Vernetzung innerhalb des Bibliothekswesens

13

– Aufbau eines semantischen Netzes innerhalb der internationalen Bibliothekscommunity

– Voraussetzung:

– Durchsuchbarkeit von Fremddaten möglichst ohne vorherigem Datenimport

– sofortige Einbeziehung in den Erschließungsprozess

– aktuelle Praxis: nachgestellte Suche nach Konkordanzen/Redundanzen

– potentielle Datenquellen für die GND

– VIAF, DDC, LCSH, STW etc.

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 14: Die GND und ihr Weg in das Semantic Web

– Engagement der Web 2.0 Community

– Überschneidungen bibliothekarischer Normdaten und Web 2.0 Plattformen identifizieren

– Ausweisung der Konkordanzen für den Katalogbenutzer

– Einbeziehung in die Erschließung (?)

Wo liegt die Kernkompetenz einer Bibliothek?

Gibt es Dinge, die andere besser machen?

Was ist heutzutage noch durch Bibliotheken zu leisten?

14

Semantische Vernetzung mit externen Datenanbietern

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 15: Die GND und ihr Weg in das Semantic Web

15

– Wikipedia

– Nachweis von Personen, Körperschaften, Geografika, Schlagwörtern, Werken

– Konkordanz zu 162.492 Personen der PND

– GeoNames

– Aggregator von Ämtern für Statistik und Vermessung

– Nachweis von Geografika (sehr saubere Entitätentrennung)

– Konkordanz zu 41.904 Orten und Ländern der SWD

– MusicBrainz

– Nachweis von Personen und Körperschaften der Musik, Labels, Musiktonträgern

– Konkordanz zu 31.322 Künstlern der PND und 14.663 der GKD

Konkordanzen zu Social Web Plattformen

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011Stand November 2011

Page 16: Die GND und ihr Weg in das Semantic Web

GND-Linked-Data-Service

16 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 17: Die GND und ihr Weg in das Semantic Web

17

– Vereinfachung des Datenzugriffes für bibliotheksfremde Anwender

– Zugriff über HTTP

– kein vorheriger Datenimport notwendig

– Schaffung einer international nachnutzbaren GND-Datenrepräsentation im Web

– dokumentierte Ontologie nutzbar durch Mensch und Maschine

– Vollständige Abbildung der Normdatenentitäten im Semantic Web

– aktuell im Linked-Data-Service der DNB nur individualisierte Personen, Körperschaften und Sachschlagwörter

– verbesserte Vernetzung und Ausweisung von Konkordanzen

Ziele

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 18: Die GND und ihr Weg in das Semantic Web

Der Weg zur GND im Semantic Web

18

– entitätenbasierte Repräsentation der GND-Daten- Personen, Familien, Körperschaften, Kongresse und

Veranstaltungen, Geografika, Schlagwörter, Werke

– eine Ontologie zur Beschreibung der GND entwickeln

- Voraussetzung:

1. entitätenbasierter GND-Erfassungsleitfaden

2. Beschreibung der verwendeten Felder und Codes

– Bereitstellung kontrollierter Vokabulare in RDF/SKOS

- Sprachencodes, Ländercodes, DNB-Sachgruppen,

Geschlechtsangaben, Funktionscodes etc.

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 19: Die GND und ihr Weg in das Semantic Web

Was machen andere?http://id.loc.gov/

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 201119

Page 20: Die GND und ihr Weg in das Semantic Web

Was machen andere?http://id.loc.gov/

Available Authorities & Vocabularies

• LC Subject Headings• LC Name Authority File• LC Children's Subject Headings• LC Genre/Form Terms• Thesaurus of Graphic Materials

Preservation Vocabularies• Preservation Events• Preservation Level Role• Cryptographic Hash Functions

• MARC Relators• MARC Countries• MARC Geographic Areas• MARC Languages• ISO639-1 Languages• ISO639-2 Languages• ISO639-5 Languages

MADS/RDF Namespace Document• http://www.loc.gov/standards/mads/rdf/v1.html

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 201120

Page 21: Die GND und ihr Weg in das Semantic Web

Die GND-Ontologie

21

– Verwendung von OWL

– Definition der Entitätentypen als Klassen

– Differenzierung nach Datatype- und Object-Properties- Festlegung für Object-Properties ob asymetric, transitive etc.

– Zuweisung von Domain und Range- vorerst nur Zuweisung der obersten Entitätenebene

– Definition von Value Vocabularies

– Zuordnung von Classes, Properties und Values anderer Ontologien (Vocabulary-Alignment)

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 22: Die GND und ihr Weg in das Semantic Web

22

Beispiel Datatype-Property

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 23: Die GND und ihr Weg in das Semantic Web

23

Beispiel Object-Property

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 24: Die GND und ihr Weg in das Semantic Web

24

Beispiel Object-Property

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 25: Die GND und ihr Weg in das Semantic Web

GND Gender

25 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 26: Die GND und ihr Weg in das Semantic Web

GND Country Code

26 | Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 27: Die GND und ihr Weg in das Semantic Web

Weitere GND Value VocabulariesCode Listen

27

– Language Code

– Content Type

– Carrier Type

– Media Type

– Form Of Work

– Function

– Instrument

– …

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 28: Die GND und ihr Weg in das Semantic Web

Einführen einer Metametadaten-Entität?

– Nutzungskennzeichen

– Quellenangaben

– Negativ eingesehene Quellen

– Definition

– Benutzungshinweise

– Nummer und Ansetzungsform des

Zielsatzes bei Umlenkung

– Katalogisierende Institution

28

– Quelle und Datum der

Ersterfassung

– Quelle und Datum der letzten

Änderung

– Quelle und Datum der letzten

Statusvergabe

– Katalogisierungslevel

– Kennzeichen für Hinweissatz

– Änderungscodierung

– Teilbestandskennzeichen

| Alexander Haffner | Digitale Bibliothek – Metadaten und Vokabularien | 25. November 2011

Page 29: Die GND und ihr Weg in das Semantic Web

Vielen Dank!

discussion is welcome…

29