9
27.06.2011 - Plenum UB Bo chum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Embed Size (px)

Citation preview

Page 1: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

27.06.2011 - Plenum UB Bochum

Integration von Literaturdaten aus Open Data

Universitätsbibliothek Bochum

Page 2: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Ausgangssituation:

• Geringe Anzahl von Daten aus den Projektdatenbanken

Ziel

• Anreicherung der vorhandenen Daten durch Integration offener bibliographischer Daten

Derzeit

• Bearbeitung der Open Data aus der British National Library, British National Bibliography (Aufnahme aller in Großbritannien veröffentlichten Titel seit 1950)

Page 3: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Offene bibliographische Daten der British National Library

• Metadaten verfügbar in RDF/ XML

• Problem:

Verwendung verschiedenster Vokabulare:

RDF, rdfs, DublinCore, skos, isbd, OWLT

keine direkte Konvertierung der Daten nach FRBR

Page 4: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum
Page 5: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Vorgehen:Schritt 1 - Erstellen einer Konkordanz des vorliegenden Datenformates zu MODS

Page 6: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Schritt 2 - Transformation der vorhandenen Datenformate in das MODS-Format

Weg:Erstellen eines XSLT-Stylesheets

Page 7: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Schritt 3 - Auswahl archäologisch relevanter Titel

• Insgesamt verfügbar: ca. 3 Millionen Titel (British National Bibliography)

• Notwendig: Filtern der archäologisch relevanten Titelüber Schlagwörter und Klassifizierungen

• Verschlagwortung der BNB: Library of Congress Subject Headings, freie Schlagworte

• Klassifizierung der BNB:

Dewey Decimal Classification System

Filtern über DDC-Klasse 930 und ihre Unterklassen

Page 8: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Relevante DDC-Klassen

930 History of ancient world to ca. 499 (umfasst auch alles Archäologische)931 China to 420932 Egypt to 640933 Palestine to 70934 India to 647935 Mesopotamia & Iranian Plateau to 637936 Europe north & west of Italy to ca. 499937 Italy & adjacent territories to 476938 Greece to 323939 Other parts of ancient world to ca. 640

Erfassung von rund 4000 Titeln

Page 9: 27.06.2011 - Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum

Ausblick

• Ähnliches Vorgehen bei weiteren offenen Daten:

– Library of Congress (Stand 2007, heute > 14 Millionen Titel)

– Universitätsbibliothek Tübingen (> 2,6 Mio. Titeldatensätze plus verknüpfte Lokal- und Normdaten, Stand 19.05.2010)

– Universitäts- und Stadtbibliothek Köln (ca. 3,1 Millionen Titelaufnahmen, allnächtliche Aktualisierung )

– Open Library

– Eventuell Europeana (aktuelle Freigabe der Daten, 3,5 Millionen Texte, Bilder)

• Arbeitsaufwand: variiert je nach Metadatenformat der jeweils verfügbaren Daten und nach der Art der Verschlagwortung/Klassifizierung