Transcript
Page 1: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig103. Bibliothekartag, Bremen, 5.6.2014

Martin Czygan, Universitätsbibliothek LeipzigAnke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig

Page 2: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdatenimplementierung als finc Milestone

Page 3: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeGroßer Bestandteil klassischer Katalogisierungsarbeit

Page 4: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeEnorme Datensammlungen

http://d-nb.info/gnd/118576291

Page 5: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeGND als übergreifendes Normierungssystem

https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu

Page 6: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte

http://de.wikipedia.org/wiki/Gustav_Mahler

Page 7: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = Potentiale

Steigerung des Suchkomforts für unsere Nutzer/innen!

Page 8: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Bisherige Anwendungsfelder„klassische“ Datenauswertung: Verweissysteme•Personennamen und Körperschaften•Schlagworte•(musikalische) Werktitel

Weitere Datenauswertung•Länderbezug für Autor/innen und Komponist/innen•Geofacette

Page 9: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Personennamen und KörperschaftenAnreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen

https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900

Page 10: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

SchlagworteAnreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte

https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950

Page 11: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807

Page 12: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

EST: Konzerte, Vc Orch, G 479Violoncellokonzert, Nr. 2Cellokonzert, D-Dur

EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36Streichquartette, op. 20

(musikalische) WerktitelAnreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)

Page 13: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

LänderbezugAuswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung

„Haben Sie Noten von Komponisten Rumänischer Herkunft?“

“Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer:

http://www.ub.uni-heidelberg.de/archiv/12555

Auswertung und Indexierung der geografischen Codes an

Schlagwort-Normsätzen

Page 14: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Grenzen?!• Bislang nur für lokale Bibliotheksdaten (SWB) –

externe Quellen im Discovery System werden bislang nicht berücksichtigt

• Relativ simples Verwendungsmuster: Synonymverweisungen

• Keine visuelle Umsetzung der Inhalte eines Normsatzes

• GND als einziger Datenpool

Page 15: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Vier Beispiele

• Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT.• 05.06.2014 1000

Page 16: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Überblick

• Intro – 1

• Namensvarianten via GND – 7

• Alternative Sucheinstiege – 1

• Knowledge Graph – 2

• Querschnittssuche – 5

• Ausblick – 3

Page 17: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Intro

• Ein rotes Band – die GND

• Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken

Page 18: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

GND-Anreicherung externer Quellen

Datensatz der externen Quelle „Naxos Music Library“

http://d-nb.info/gnd/118638157

Page 19: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 1

• GND basierte Erweiterung von MARC-Records um Namensvarianten

• gnd.es:variantNameForThePerson

• Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP

Page 20: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 2

• Nutzung eines Normdatenindex für Kandidatensuche

• Nutzung einer minimalen HTTP–API für Taxonomieabfragen

Page 21: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 3

• Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex

• Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt

• Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind

Page 22: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 4

• Naxos - 71815

• RISM - 11241

• IMSLP - 51722

• Gallica - 23754

Page 23: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 5

• 54339 Name insgesamt

• 5051 Namen in Naxos und GND

• 719 Namen konnten zugeordnet werden

Page 24: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 6

• Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt

• RISM – 415

• IMSLP – variabel

• Gallica – 268

• generelle Frage der Qualitätsprüfung

Page 25: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Namensvarianten 7

• Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche

Page 26: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Sucheinstiege 1

• API um die GND–Daten

• narrower terms, broader terms, [synonyms]

• siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?)

• Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)

Page 27: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Optimierte Datennutzung für Suchanfragenoptimierte Nutzung der Taxonomie der SchlagwörterDarstellung der semantischer Beziehungen von GND-Einträgen untereinander

http://melvil.d-nb.de/swd-search?term=oboenrohr

Page 28: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Knowledge Graph 1

• Inspiration – Google Knowledge Graph

• Indexierung von GND, VIAF und DBPedia

• technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)

Page 29: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Knowledge Graph 2

• Beispiel Goethe

• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...

• {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}

Page 30: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuchen 1

• Menschen gruppieren Dinge auch außerhalb von Facetten

• Wikipedia–Kategorien

Page 31: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Weitere Datenpools und Services:„Wikipedia-Querschnittssuche“

http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)

Page 32: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig
Page 33: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 2

• Zutaten: GND–Index, Wikipedia–Normdaten–Index, Wikipedia–Category–Index

Page 34: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 3

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Page 35: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 4

• {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"}

• {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"}

• {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}

Page 36: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Querschnittssuche 5

• Beispiel – Kategorie:Romantik_(Musik)

• 1225 Seiten unter der Kategorie

• 1082 GNDs

• Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen

Page 37: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 1

• verwendete Daten – GND, VIAF, DBPedia

• noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ...

• Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)

Page 38: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 2

• Index – Elasticsearch*

• Workflowmanagement – luigi*, gluish*

• Konverter – gomarckit*, nttoldj*, wptoldj*

• SQL für TSV: textql*

• Unix – awk*, cat*, cut*, grep*, sed*

Page 39: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Ausblick 3

• * Open source

• Linked Data schafft neue Verbindungen

Page 40: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Normdaten = Potentiale!Voraussetzungen und Perspektiven• Übernahme der VIAF-IDs in die Datensätze der GND• Bereitstellung von IDs in Initiativen zur

Datenfreigabe• Konsistentere Nutzung der GND in Bibliotheken• Projekte zur rückwirkenden Anreicherung in

Bibliotheken• Nachnutzung der GND / VIAF auch in

nichtbibliothekarischen Projekten

Page 41: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Übernahme der VIAF-IDs in die Datensätze der GND

http://viaf.org/viaf/99258155

Page 42: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Bereitstellung von IDs in Initiativen zur Datenfreigabe

https://opac.rism.info/search?id=653004096&db=251&View=rism

https://opac.rism.info/id/rismid/653004096?format=marc

Page 43: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Konsistentere Nutzung der GND in BibliothekenSacherschließungsquote im Buchbestand der HMT: 42,4%

Page 44: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Nachnutzung der GND in nicht-bibliothekarischen Projekten

http://pdr.bbaw.de/projekt

http://in2n.de/

Page 45: Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Danke für Ihre Aufmerksamkeit!

http://blog.finc.info

Martin [email protected]

Anke [email protected]


Recommended