19
Stefanie Rühle, Fachstelle Bibliothek, SUB Göttingen; CC0 Public Domain Dedication 1.0 METS/MODS für Monografien Ein Best Practice Guide Version 1.0

METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

Stefanie Rühle, Fachstelle Bibliothek, SUB Göttingen; CC0 Public Domain Dedication 1.0

METS/MODS für Monografien Ein Best Practice Guide Version 1.0

Page 2: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

2 www.deutsche-digitale-bibliothek.de

Inhalt Einleitung ...........................................................................................................................................2

a) Ausgangslage ..........................................................................................................................2

b) Die zugrunde liegenden Standards ..........................................................................................3

METS/MODS für einzelne Bücher ........................................................................................................5

a) Problemstellung ......................................................................................................................5

b) METS-Elemente .......................................................................................................................6

<mets:mets> ...............................................................................................................................6

<mets:metsHdr> .........................................................................................................................7

<mets:fileSec> .............................................................................................................................7

<mets:structMap TYPE="PHYSICAL"> ........................................................................................ 10

<mets:dmdSec> ........................................................................................................................ 12

<mets:structMap TYPE="LOGICAL"> .......................................................................................... 14

<mets:structLink>...................................................................................................................... 17

<mets:amdSec> ......................................................................................................................... 17

c) Zusammenfassung................................................................................................................. 19

Einleitung a) Ausgangslage

Seit Ende der 90er Jahre wird in deutschen Bibliotheken digitalisiert. Zu Beginn waren dies nur vereinzelte Projekte, die das Ziel hatten, ausgesuchte Bestände digital zur Verfügung zu stellen. Aber spätestens seit Mitte der 2000er Jahre kann man von einer „Massendigitalisierung“ sprechen, die zunächst vor allem im Bereich der gemeinfreien Bücher und Zeitschriften stattfand. Diese Entwicklung hatte zur Folge, dass die Zahl der digitalen Objekte von Jahr zu Jahr rasch anstieg. Da die Digitalisierung jedoch in den unterschiedlichsten Projekten stattfand, wichen die technischen Umsetzungen, d.h. die verwendeten Systeme, Datenformate und Präsentationsoberflächen, häufig stark voneinander ab, und es wurde zunehmend schwierig, sich einen Überblick über die bereits digital vorliegenden Dokumente zu verschaffen. In der 2. Hälfte der 2000er Jahre entstanden deshalb zwei Anwendungen, die hier Abhilfe schaffen sollten: das Zentrale Verzeichnis digitalisierter Drucke (zvdd)1 und der DFG-Viewer2, die einander in ihren Funktionalitäten ergänzten. So war und ist das

zvdd-Portal bis heute ein reines Nachweissystem, das einen zentralen Zugang zu digitalisiertem Bibliotheksmaterial und hier vor allem den Zugang zu digitalisierten Druckwerken wie Monographien, Zeitschriften,

1 http://www.zvdd.de 2 http://dfg-viewer.de/

Page 3: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

3 www.deutsche-digitale-bibliothek.de

Musikdrucken, Einblattdrucken usw. ermöglicht. Grundlage für die Suche in diesem System sind Metadaten, die über OAI inkrementell geharvestet und in die zvdd-Datenbank ingestiert werden. Die digitalen Objekte selbst verbleiben bei den Datengebern. Die Anzeige der Objekte erfolgt nicht in zvdd, vielmehr verlinkt das Portal aus den Daten heraus direkt auf die Präsentationsseite der datengebenden Institution und auf den DFG-Viewer.3 Als Komplementär zum zvdd ist der DFG-Viewer ein browserbasierter Webdienst, dessen Aufgabe die einheitliche Anzeige von digitalen Objekten aus unterschiedlichsten Projekten ist. Daten und digitale Objekte werden vom DFG-Viewer nicht gespeichert, sondern über einen URL on-the-fly abgerufen und angezeigt. Die Funktionalitäten des Viewers arbeiten also mit verteilten Datenbeständen, die jedoch, damit der Viewer die Daten verarbeiten kann, von den Datengebern in einem einheitlichen Format bereitgestellt werden müssen, dem METS/MODS-Format.4

Die Abhängigkeit zwischen METS/MODS und der Anzeige der Daten im DFG-Viewer hat zur Folge, dass dieses Format seitdem auch für die Lieferung von Daten an zvdd verpflichtend ist.5 Und schließlich unterstützen die DFG-Praxisrichtlinien „Digitalisierung“ dieses Format, indem sie die

Verwendung von METS/MODS für die Beschreibung von digitalisierten gedruckten Textwerken und digitalisiertem Archivgut verpflichtend vorschreiben.6 Damit hat sich das Format vor allem im Bereich der digitalisierten Drucke, aber auch für andere Materialarten, als Standard durchgesetzt. Die Deutsche Digitale Bibliothek (DDB) hat diesen Standard schon sehr früh als

Lieferformat akzeptiert, er steht hier gleichberechtigt neben dem traditionellen bibliothekarischen Austauschformat MARC 21 und Dublin Core.7 Die Nutzung der Daten in der DDB führte aber auch dazu, dass der für den DFG-Viewer bisher weniger beachtete Informationsgehalt des MODS-Teils des Formats größere Bedeutung erhielt. Es sind vor allem die MODS-Daten, die in das DDB-Format transformiert werden und sowohl die Anzeige in der DDB als auch die semantische Verknüpfung der Objekte untereinander bestimmen.

In den folgenden Abschnitten beschreiben wir METS/MODS daher sowohl in seiner Funktion als Anzeigeformat für den DFG-Viewer als auch in seiner Funktion als Lieferformat für die DDB und zeigen, wie die Daten aufgebaut sein müssen, um beiden Anwendungen zu genügen.

b) Die zugrunde liegenden Standards Wenn wir von METS/MODS sprechen, so sind damit eigentlich drei verschiedene Standards gemeint:

der Metadata Encoding and Transmission Standard (METS)8 das DFG-Viewer Strukturdatenset9

3 http://www.zvdd.de/ueber-das-projekt/ 4 http://dfg-viewer.de/ueber-das-projekt/was-ist-der-dfg-viewer/ 5 http://www.zvdd.de/dokumentation/technische-architektur/ 6 http://www.dfg.de/formulare/12_151/12_151_de.pdf Seite 6 f. 7 https://pro.deutsche-digitale-bibliothek.de/node/368 8 http://www.loc.gov/standards/mets/ 9 http://dfg-viewer.de/strukturdatenset/

Page 4: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

4 www.deutsche-digitale-bibliothek.de

das Metadata Object Description Schema (MODS)10

Der Metadata Encoding and Transmission Standard – kurz METS – wurde 2001 unter Förderung der Digital Library Federation entwickelt und wird seitdem von der Library of Congress und dem

METS Editorial Board gepflegt. METS ist ein XML-Format, das einerseits die Verwaltung der digitalen Objekte innerhalb einer Datenbank unterstützt und andererseits auch als Austauschformat genutzt werden soll.11 Dabei dient METS als Container, in dem neben den administrativen Eigenschaften der Objekte vor allem auch die strukturellen Eigenschaften beschrieben und die verschiedenen Teile eines digitalen Objekts zusammengeführt werden. Für eine detailliertere Beschreibung dieser Teile wird nicht der METS-Standard verwendet, vielmehr verweist METS in diesem Zusammenhang auf andere Metadatenstandards wie z. B. MODS, Dublin Core und PREMIS. Metadaten unter Verwendung dieser Standards können in den METS-Container eingebettet werden oder es wird vom METS-Datensatz aus auf Datensätze in dem jeweiligen Format verlinkt.12

10 http://www.loc.gov/standards/mods/ 11 http://www.loc.gov/standards/mets/METSPrimer.doc Seite 15 12 http://www.loc.gov/standards/mets/METSPrimer.doc Seite 34 ff.

Page 5: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

5 www.deutsche-digitale-bibliothek.de

Für den DFG-Viewer wurde auf der Grundlage dieses Standards das METS-Anwendungsprofil für digitalisierte Medien entwickelt, das beschreibt, welche METS-Elemente in welcher Form verwendet werden müssen, damit die Anzeige im DFG-Viewer funktioniert. D.h., dass das Anwendungsprofil eine eingeschränkte Version des METS-Standards ist und Vorgaben macht, welche METS-Elemente und Attribute in welchem Zusammenhang zu verwenden bzw. welche Werte erlaubt sind.13 Eine dieser Wertelisten, die für das METS-Anwendungsprofil verpflichtend sind, ist das DFG-Viewer-Strukturdatenset. Das Strukturdatenset nennt die Strukturtypen, die für die Beschreibung der logischen Struktur eines digitalen Objekts verwendet werden müssen.14

Das Metadata Object Description Schema – MODS – ist ein XML-Standard für die bibliographische Beschreibung von Dokumenten, der 2002 von der Library of Congress und dem MARC Standards Office entwickelt wurde. Die Idee war, für kleinere Bibliotheksanwendungen einen Standard zur Verfügung zu haben, der reichhaltiger ist als Dublin Core, aber einfacher als MARC. Dementsprechend enthält der Standard einige Entsprechungen zu MARC-Feldern, vereinfacht diese jedoch bzw. gruppiert sie um.15 Außerdem haben zahlreiche Elemente Attribute, die die Verwendung eines URI fordern (z. B. das Attribut valueURI in dem Element mods:name).16 Damit unterstützt der Standard die Transformation der MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden können (z. B. für Personen und Schlagwörter).

Für den DFG-Viewer und zvdd wurde auf der Grundlage dieses Standards das MODS-Anwendungsprofil für digitalisierte Medien erarbeitet. Ebenso wie das METS-Anwendungsprofil ist auch dieses Profil eine eingeschränkte Version – in diesem Fall des MODS-Standards. Es enthält die MODS-Elemente, die für die Anzeige von Daten im DFG-Viewer relevant sind, sowie die Elemente, die bei der Verarbeitung der Daten in zvdd und in der DDB berücksichtigt werden bzw. verpflichtend sind. Zudem nennt das Profil die Bedingungen und Regeln, die für den Gebrauch der Elemente in diesen Anwendungen gelten (z. B. Wiederholbarkeit und erlaubte Werte).17 Das Profil dient vor allem dazu, die bibliographischen Beschreibungen innerhalb eines METS-Datensatzes zu vereinheitlichen, um die Nachnutzung der Daten in übergreifenden Anwendungen wie der DDB zu ermöglichen.

METS/MODS für einzelne Bücher a) Problemstellung

Das traditionelle Beschreibungsobjekt in Bibliotheken ist das Buch, ein Dokument, das aus ein bis endlich vielen Seiten besteht, die zwischen zwei Buchdeckeln zusammengehalten werden. Die Navigation innerhalb eines Buches erfolgt über die Seitenzählung und das Inhaltsverzeichnis. Das Inhaltsverzeichnis beschreibt, aus welchen inhaltlichen Teilen (Titelseite, Einleitung, Kapitel, Index usw.) das Dokument innerhalb der Buchdeckel besteht und auf welchen Seiten diese Teile zu finden sind. Wird das Buch nun auf den Scanner gelegt, so geht der Zusammenhang, der sich aus der Anordnung von Buchdeckeln, Seitenzählung und Inhaltsverzeichnis ergibt, verloren. Was bleibt, ist eine Vielzahl von Image-Dateien, die zwar dateibezogene Metadaten (wie das Dateiformat, die Dateigröße, das Entstehungsdatum usw.) enthalten, aber keine Informationen darüber, welche 13 s. METS-Dokumentation unter http://dfg-viewer.de/profil-der-metadaten/ 14 http://dfg-viewer.de/strukturdatenset/ 15 http://www.loc.gov/standards/mods/mods-overview.html 16 s. z. B. http://www.loc.gov/standards/mods/mods-outline-3-6.html#name 17s. MODS-Dokumentation unter http://dfg-viewer.de/profil-der-metadaten/

Page 6: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

6 www.deutsche-digitale-bibliothek.de

Beziehungen die einzelnen Dateien zueinander haben, geschweige denn, in welcher Beziehung sie zu den verschiedenen Inhalten des Dokuments stehen. Aufgabe der METS-Daten ist es, diese Beziehungen wiederherzustellen. Ein METS-Datensatz muss darum Antworten auf diese Fragen geben:

Welche Dateien gehören zu welchem Dokument? Wie kann man auf diese Dateien zugreifen? Welche Dateien repräsentieren welche Seite? Welche Dateien repräsentieren dieselben Seiten? In welcher Reihenfolge müssen die Dateien angezeigt werden? Aus welchen Teilen besteht das Dokument? In welcher Beziehung stehen diese Teile zueinander? Welche Seiten gehören zu welchen Dokumentteilen?

b) METS-Elemente <mets:mets> Das Wurzelelement mets:mets ist der oberste Knoten in einem METS-Datensatz. Im METS-Anwendungsprofil werden keine Vorgaben zur Verwendung des Wurzelelements gemacht, jedoch empfiehlt es sich, spätestens hier die verwendeten Metadatenformate zu benennen und auf die gültigen Schemata zu verweisen.

Um die Anzeige im DFG-Viewer zu unterstützen, sollten alle Teile eines Buches in einem METS-Datensatz beschrieben werden, d.h., alles was sich zwischen den beiden Buchdeckeln befindet, findet man in ein und demselben METS-Datensatz. Eine Ausnahme kann man bei Konvoluten machen. Hier

Page 7: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

7 www.deutsche-digitale-bibliothek.de

findet man zwischen den Buchdeckeln verschiedene selbständige Werke, die bei Bedarf auch unabhängig voneinander beschrieben werden können.

<mets:metsHdr> Der Header (mets:metsHdr) enthält Informationen über den METS-Datensatz – sogenannte Meta-Meta-Daten. Dies sind Informationen darüber, wer den Datensatz erstellt hat und wer ihn verwaltet, ggf. mit welchem System er erstellt, wann er erstellt und wann er zuletzt geändert wurde. Ebenso wie beim Wurzelknoten gibt es im METS-Anwendungsprofil keine Vorgaben darüber, welche Elemente und Attribute genutzt werden sollten. Die erlaubten Elemente und Werte findet man in der METS-Spezifikation.18

<mets:fileSec> Die mets:fileSec beantwortet die Fragen:

Welche Dateien gehören zu welchem Dokument? Wie kann man auf diese Dateien zugreifen?

In mets:fileSec werden die Dateien aufgelistet, die zu dem Dokument, das mit dem METS-Datensatz beschreiben wird, gehören. Es kann sich dabei um Bilddateien, aber auch um Volltextdateien handeln. Für jede dieser Dateien gibt es ein Element mets:file, das in dem Attribut ID einen eindeutigen Identifier für die Datei enthält. Gleichzeitig muss in dem Element mets:fileSec das Unterelement mets:FLocat vorhanden sein. Dieses Element enthält die Attribute LOCTYPE="URL" und xlink:href. Das Attribut xlink:href erhält als Wert den URL zur Datei. Es empfiehlt sich, an dieser Stelle persistente URLs zu verwenden.

18 http://www.loc.gov/standards/mets/docs/mets.v1-9.html#metsHdr

Page 8: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

8 www.deutsche-digitale-bibliothek.de

Da ein- und dieselbe Seite im Dokument von Dateien in unterschiedlichen Auflösungen repräsentiert werden kann, wird jedes mets:file einer mets:fileGrp zugeordnet. In mets:fileGrp wird mit Hilfe des Attributs USE beschrieben, um was für eine Art von Datei es sich handelt. Das METS-Anwendungsprofil erlaubt im Attribut USE die folgenden Werte:

DEFAULT für normale Präsentationsderivate MAX für hochauflösende Präsentationsderivate DOWNLOAD für herunterladbare (PDF-)Derivate THUMBS für Vorschaubilder (max. 150x150 Pixel) TEASER für eine Voransicht des Dokuments (max.

150x150 Pixel) AUDIO für digitale Tonaufnahmen SPECIAL für spezielle Aufnahmetechniken FULLTEXT für Volltext- und Layoutinformationen

Page 9: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

9 www.deutsche-digitale-bibliothek.de

Für die Anzeige der Daten in der DDB ist mets:fileGrp mit dem Attribut USE="DEFAULT" verpflichtend, da die DDB aus dieser mets:fileGrp die Vorschaubilder generiert.

Wird auf Volltextdateien verlinkt, so muss auf diese in mets:fileGroup mit dem Attribut USE="FULLTEXT" referenziert werden.

Eine detaillierte Beschreibung, welche Elemente und Attribute für den DFG-Viewer in mets:fileSec verwendet werden sollen sowie Beispiele finden sich im METS-Anwendungsprofil in Abschnitt 2.4 “Digitale Repräsentationen”.

Page 10: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

10 www.deutsche-digitale-bibliothek.de

<mets:structMap TYPE="PHYSICAL"> Die mets:structMap dient dazu, die hierarchische Struktur von Dokumenten abzubilden. Das METS-Anwendungsprofil unterscheidet dabei zwei verschiedene Strukturen: die physische und die logische.

Die physische Struktur wird in mets:structMap TYPE="PHYSICAL" abgebildet. Sie beantwortet diese Fragen:

Welche Dateien repräsentieren welche Seiten?

Welche Dateien repräsentieren dieselben Seiten?

In welcher Reihenfolge müssen die Dateien angezeigt werden?

Die structMap TYPE="PHYSICAL" beschreibt die Beziehungen zwischen dem Buch und den Seiten, aus denen es sich zusammensetzt. Unter Seiten verstehen wir dabei nicht nur das, was sich zwischen den Buchdeckeln befindet, sondern auch die Buchdeckel selbst.

Diese Informationen ermöglichen dem Viewer, die Seiten unabhängig vom Dateinamen und der Auflösung immer in der richtigen Reihenfolge anzuzeigen, so dass der Nutzer im Viewer im Buch blättern oder die gesuchte Seite aufrufen kann.

Die oberste Ebene in dieser Hierarchie wird durch eine mets:div wiedergegeben, die das Attribut TYPE=“physSequence“ enthält sowie einen eindeutigen Identifier in dem Attribut ID. Diese mets:div steht für das gesamte Buch.

Innerhalb dieser mets:div wird für jede Seite eine eigene mets:div angelegt, die das Attribut TYPE=“page“ enthalten muss.

Neben dem Attribut TYPE müssen die mets:div, die die Seiten beschreiben, das Attribut ID und das Attribut ORDER enthalten. Das Attribut ID enthält den eindeutigen Identifier der mets:div, das Attribut ORDER eine Zahl (Integer), die die Position der Seite als Teil des Buches beschreibt. Der Wert in diesem Attribut bestimmt, in welcher Reihenfolge die Dateien, die die Seiten repräsentieren, angezeigt werden.

Page 11: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

11 www.deutsche-digitale-bibliothek.de

Weicht die Zählung im Attribut ORDER von der im Dokument angegebenen Paginierung ab (z. B. weil Seiten wie Buchdeckel, Titelblatt u. a. nicht gezählt werden oder innerhalb des Dokuments eine lateinische Zählung der arabischen vorangeht), so kann die Zählung aus dem Dokument in das Attribut ORDERLABEL übernommen werden.

Werden die einzelnen Seiten durch einen URN identifiziert, so steht dieser in dem Attribut CONTENTIDS.

In der mets:div der Seite werden außerdem alle Dateien, die ein und dieselbe Seite abbilden, zusammengeführt. Dies geschieht durch das Unterelement mets:fptr. Das Element mets:fptr enthält im Attribut FILEID die Identifier, die den einzelnen Dateien in der mets:fileSec zugewiesen wurden.

Eine detaillierte Beschreibung, welche Elemente und Attribute hier verwendet werden müssen sowie Beispiele findet man im METS-Anwendungsprofil in Abschnitt 2.2 „Angaben zur physischen Dokumentenstruktur“.

Page 12: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

12 www.deutsche-digitale-bibliothek.de

<mets:dmdSec> Während die physischen Teile des Buches die Dateien sind, die in der mets:fileSec beschrieben werden, werden die inhaltlichen Teile des Buches in der mets:dmdSec beschrieben. Die mets:dmdSec enthält die sogenannten Titeldaten, wobei neben den selbständigen Werken (i.d.R. Monographien) auch die einzelnen Teile innerhalb derselben (also Beiträge, Kapitel, Illustrationen usw.) mit Titeldaten versehen werden können. Dabei ist zu beachten, dass für jeden Teil, zu dem es Titeldaten gibt, eine eigene mets:dmdSec angelegt werden muss. Ebenso wie die mets:fileSec muss auch die mets:dmdSec einen eindeutigen Identifier haben. Auch hier wird dafür das Attribut ID verwendet. Allerdings werden die Titeldaten nicht in METS abgebildet. Wie weiter oben bereits gesagt, geht METS davon aus, dass für die detaillierte Beschreibung der inhaltlichen Teile ein anderer Standard verwendet wird. In METS/MODS ist dies das Metadata Object Description Schema (MODS). In den METS-Daten wird dieses Schema innerhalb der dmdSec definiert und zwar in dem Unterelement mets:mdWrap mit dem Attribut MDTYPE=“MODS“. Für digitalisierte Drucke gilt, dass die im MODS-Anwendungsprofil19 genannten Elemente verwendet werden sollten. Weitere Elemente aus dem MODS-Schema20 sind erlaubt, werden aber i.d.R. weder für die Anzeige im DFG-Viewer noch beim Mapping der Daten auf das DDB-Format berücksichtigt. Zudem ist darauf zu achten, dass die verwendeten Elemente grundsätzlich valide zu dem im Wurzelknoten genannten MODS-Schema sind.

Die folgenden MODS-Elemente sind für die Anzeige von digitalisierten Drucken selbständiger Werke im DFG-Viewer bzw. in der DDB verpflichtend:

mods:titleInfo für den Titel des selbständigen Werks bzw. Teile innerhalb des Werks. Enthält die dmdSec keinen Titel, wird sie für die Anzeige in der DDB nicht berücksichtigt.

mods:originInfo für den Erscheinungsvermerk (Verlag, Erscheinungsort, -datum) des selbständigen Werks.

19 http://dfg-viewer.de/profil-der-metadaten/ 20 http://www.loc.gov/standards/mods/mods-schemas.html

Page 13: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

13 www.deutsche-digitale-bibliothek.de

mods:language für die im selbständigen Werk verwendete Sprache. Fehlt bei Textdokumenten die Sprache, so lehnt Europeana das Einspielen der Daten ab.

mods:recordIdentifier als Unterelement zu mods:recordInfo in der dmdSec, die das selbständige Werk beschreibt. Das Element enthält den Identifier des Datensatzes. Damit dieser Identifier eindeutig ist, muss in dem Attribut source angegeben werden, aus welchem System er übernommen wurde. Aus diesem Identifier wird der DDB-URI generiert, der in der DDB sowohl das Überschreiben von bereits vorhandenen Datensätzen steuert als auch die Verlinkung zwischen den verschiedenen Teilen eines Dokuments.

Die Verwendung der folgenden MODS-Elemente wird empfohlen:

mods:name für die Angabe von Personen und Organisationen, die an der Entstehung des selbständigen Werkes beteiligt waren bzw. an einem seiner Teile. Wenn GND-Datensätze vorhanden sind, so sollte der GND-URI in dem Attribut valueURI mitgeliefert werden.

Page 14: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

14 www.deutsche-digitale-bibliothek.de

mods:genre für Schlagwörter, die die Art des Dokuments beschreiben. Empfohlen wird die Verwendung von GND-Schlagwörtern, deren URI in dem Attribut valueURI mitgeliefert wird.

mods:extent als Unterelement zu mods:physicalDescription für die Umfangsangabe. mods:physicalLocation als Unterelement zu mods:location, um den Standort des Buches

anzugeben, das für die Digitalisierung als Vorlage gedient hat. mods:accessCondition mit dem Attribut type=“use and reproduction“ sollte für die

Lizenzangabe verwendet werden, wenn diese nicht in der amdSec mitgeliefert werden kann.

Eine detaillierte Beschreibung, welche Elemente und Attribute in der mets:dmdSec verwendet werden sollten sowie Beispiele findet man im METS-Anwendungsprofil in Abschnitt 2.5 Deskriptive Metadaten sowie im MODS-Anwendungsprofil.

<mets:structMap TYPE="LOGICAL"> Die <mets:structMap TYPE=“LOGICAL“> beantwortet die Fragen:

Aus welchen Teilen besteht das Dokument?

Page 15: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

15 www.deutsche-digitale-bibliothek.de

In welcher Beziehung stehen diese Teile zueinander?

Die structMap TYPE="LOGICAL" beschreibt die inhaltliche Struktur eines Dokuments, d.h. das Inhaltsverzeichnis. Dabei werden die hierarchischen Beziehungen zwischen den verschiedenen Teilen (Band, Kapitel, Illustration usw.), aus denen das Dokument besteht, in den Daten abgebildet. Auch hier erfolgt die hierarchische Gliederung über mets:div-Elemente, die ineinander geschachtelt werden. Im Gegensatz zu der mets:structMap TYPE=“PHYSICAL“, die nur zwei Ebenen enthält, kann die mets:structMap TYPE=“LOGICAL“ jedoch über (un)endlich viele Ebenen hinabsteigen.

Bei selbständigen Werken ist die oberste mets:div der Container, der für das selbständige Werk steht. Dies kann eine Monographie sein oder eine Handschrift, eine Karte oder ein Faksimile. Die mets:div innerhalb dieser Container stehen für die unselbständigen Teile innerhalb des selbständigen Werks (die Kapitel, Unterkapitel, Illustrationen usw.). Auch diese mets:div müssen mit dem Attribut ID eindeutig identifiziert werden. Außerdem ist das Attribut TYPE innerhalb der mets:div verpflichtend. In diesem Attribut dürfen nur Werte aus dem DFG-Viewer-Strukturdatenset verwendet werden.21 In der Tabelle auf den Seiten des DFG-Viewers findet man die für das TYPE-Attribut geltenden Werte in der Spalte xml. Auf der obersten Ebene einer Monographie wäre dies z. B. der Wert „monograph“, für die Titelseite „title_page“ und für ein Kapitel der Wert „chapter“. Soll der Titel des Werkes bzw. des jeweiligen Teils im Inhaltsverzeichnis im DFG-Viewer angezeigt werden, so muss derselbe in dem Attribut LABEL angegeben werden. Ist kein LABEL vorhanden, übernimmt der DFG-Viewer für die Anzeige den Wert aus dem Attribut TYPE. Für alle Teile, die in einer mets:dmdSec mit MODS-Daten beschrieben werden, muss eine Verlinkung zwischen der mets:div dieses Teils und der mets:dmdSec hergestellt

21 http://dfg-viewer.de/strukturdatenset/

Page 16: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

16 www.deutsche-digitale-bibliothek.de

werden. Dies geschieht in der mets:div über das Attribut DMDID. In diesem Attribut muss der Wert aus der ID der mets:dmdSec stehen, damit die Beziehung sowohl im Viewer als auch in der DDB angezeigt werden kann. Grundsätzlich sollte eine mets:dmdSec nur für solche Teile in einem Dokument erstellt werden, die einen aussagekräftigen Titel haben. Aus diesem Grund hat eine mets:structMap TYPE="LOGICAL" i.d.R. mehr mets:div als mets:dmdSec in dem METS-Datensatz vorhanden sind.

Eine detaillierte Beschreibung, welche Elemente und Attribute in der mets:structMap TYPE="LOGICAL" verwendet werden sollten sowie Beispiele findet man im METS-Anwendungsprofil in Abschnitt 2.1 „Angaben zur logischen Dokumentenstruktur“.

Page 17: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

17 www.deutsche-digitale-bibliothek.de

<mets:structLink> Beantwortet die Frage:

Welche Seiten gehören zu welchen Dokumentteilen?

Der mets:structLink verknüpft die mets:div, die die verschiedenen Teile des Dokuments beschreiben mit den mets:div, die die Seiten innerhalb des Buchs repräsentieren. Verlinkt wird in dem Element mets:smLink von der structMap TYPE="LOGICAL" zur structMap TYPE="PHYSICAL" unter Verwendung der Identifier der mets:div. Die Identifier aus der structMap TYPE="LOGICAL" müssen in dem Attribut xlink:from angegeben werden, die Identifier aus der structMap TYPE="PHYSICAL" in dem Attribut xlink:to. Dabei sollten immer alle Seiten den jeweiligen Dokumentteilen zugewiesen werden. D.h., dass die mets:div, die für das selbständige Werk steht, mit allen Seiten des Buches verlinkt wird; die mets:div, die für ein Kapitel innerhalb des Dokuments steht, nur mit den Seiten, die zu dem Kapitel gehören und die mets:div, die für eine Illustration innerhalb des Kapitels steht, nur mit der Seite, auf der diese Illustration ist.

Die detaillierte Beschreibung, welche Elemente und Attribute im mets:structLink verwendet werden müssen sowie Beispiele findet man im METS-Anwendungsprofil in Abschnitt 2.3 „Verknüpfung von logischer und physischer Struktur“.

<mets:amdSec> Die mets:amdSec enthält administrative Informationen zum Digitalisat. Wie schon im Falle der mets:dmdSec dient auch die mets:amdSec als Container, innerhalb dessen ein anderes Format verwendet wird. In der amdSec ist dies ein für den DFG-Viewer entwickelter Standard für administrative Daten, dessen Namensraum http://dfg-viewer.de lautet und für den im METS-Anwendungsprofil das Präfix dv verwendet wird. Innerhalb der mets:amdSec unterscheidet das METS-Anwendungsprofil zwischen Rechteinformationen zum Digitalisat in dem Unterelement

Page 18: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

18 www.deutsche-digitale-bibliothek.de

mets:rightsMD und Links zu weiteren Repräsentationen des Dokuments in dem Unterelement mets:digiprovMD.

Für die Angabe der Rechteinformationen wird innerhalb von mets:rightsMD das Unterelement mets:mdWrap geöffnet, in dem das verwendete Datenformat in dem Attribut OTHERMDTYPE="DVRIGHTS" angegeben wird. Aus dem dv-Namensraum sind in diesem Container die folgenden Elemente verpflichtend:

dv:rights als der Container für alle Elemente aus dem dv-Namensraum, die hier zugelassen sind

dv:owner für den Namen der Institution, der das Digitalisat gehört dv:ownerLogo für den URL zu dem Logo dieser Institution dv:ownerSiteURL für den URL zu der Hompage dieser Institution dv:ownerContact für einen Link, der zu den Kontaktdaten der Institution führt dv:license für die Lizenz, die für das Digitalisat gilt.

Kann für die Lizenzangabe aus technischen Gründen nicht dv:license verwendet werden, so muss die Rechteinformation in der dmdSec, die das Dokument beschreibt, in dem Element mods:accessCondition vorhanden sein (s. dazu Abschnitt <mets:dmdSec>)

Neben den Rechteinformationen kann der Container auch Angaben zum Geldgeber der Digitalisierung enthalten. Hier sind die folgenden Elemente möglich:

dv:sponsor für den Namen der geldgebenden Institution bzw. Person dv:sponsorLogo für den URL zu dem Logo dieser Institution oder Person dv:sponsorSiteURL für den URL zu der Homepage dieser Institution oder Person

Kann der Geldgeber aus technischen Gründen nicht in der amdSec angegeben werden, so sollte er in der dmdSec, die das Dokument beschreibt, in dem Element mods:name vorhanden sein. Hier wird er als Sponsor kenntlich gemacht durch die Verwendung des MARC-Relator-Code im Unterelement mods:roleTerm. Eine detaillierte Beschreibung zur Verwendung von mods:name kann man im MODS- Anwendungsprofil finden.

Für die Angabe der Links wird innerhalb von mets:digiprovMD ebenfalls das Unterelement mets:mdWrap geöffnet. Das Datenformat, das in dem Attribut OTHERMDTYPE angegeben wird, ist aber DVLINKS. Aus dem dv-Namensraum sind in diesem Container die folgenden Elemente verpflichtend:

dv:links als der Container für alle Elemente aus dem dv-Namensraum, die hier zugelassen sind

dv:reference für den Link zum Katalogisat bei der Institution, die die METS/MODS-Daten bereitgestellt hat

dv:presentation für den Link zur Anzeige des Digitalisats bei dieser Institution

Page 19: METS/MODS für Monografien - Das Portal für Datenpartner ......MODS-Daten in RDF und Linked Data, da mit Hilfe der URIs aus den Werten in den MODS-Daten RDF-Instanzen generiert werden

19 www.deutsche-digitale-bibliothek.de

Die detaillierte Beschreibung der erlaubten Elemente sowie Beispiele findet man im METS-Anwendungsprofil in den Abschnitten 2.6 „Administrative Metaten“ und 2.7 „DFG-Viewer-spezifische Angaben“.

c) Zusammenfassung METS/MODS dient der standardisierten Beschreibung von digitalisierten Dokumenten und ermöglicht die Nutzung von Daten aus verteilten Datenquellen in Anwendungen wie dem DFG-Viewer oder der DDB. Dabei versucht der Standard, die Strukturen des Originaldokuments so weit als möglich zu erhalten. Aus diesem Grund werden die verschiedenen Dateien, die die einzelnen Seiten des Dokuments in Form von Bildern oder Volltext wiedergeben, nicht einfach beschrieben, sondern in der mets:structMap TYPE="PHYSICAL" miteinander verknüpft. Erst die Verknüpfung der Dateien mit den Seiten ermöglicht es, dass der DFG-Viewer die Seiten als Teil des Dokuments in der richtigen Reihenfolge anzeigt. Dasselbe geschieht auf der Ebene des Inhaltsverzeichnisses mit den einzelnen Bestandteilen eines Dokuments, wie Titelblatt, Kapitel, Illustrationen usw. Während sich die bibliographische Beschreibung in der dmdSec entweder auf das gesamte Dokument oder auf einzelne Teile des Dokuments bezieht, wird die Beziehung der einzelnen Teile zueinander und zum gesamten Dokument erst durch die Verknüpfung mit den Strukturen in der mets:structMap TYPE="LOGICAL" nachvollziehbar. Schließlich bedient sich METS/MODS mit dem mets:structLink eines weiteren METS-Containers, um die Beziehung herzustellen zwischen den verschiedenen Bestandteilen des Dokuments und den Seiten, die zu diesen Bestandteilen gehören. Auf diesem Wege wird es möglich, im DFG-Viewer von der Beschreibung eines Dokumententeils direkt auf die erste Seite dieses Dokumententeils geleitet zu werden.