EAD(DDB) in der Praxis
Die Verwendung in derDDB und im Archivportal-D
Umsetzung
1. Objektseiten2. Suchfilter3. Normdaten4. Verlinkung und
Binärcontent5. Identifier6. Ingestprozess7. Ausblick
Unterschiedliche Anzeige je Verzeichnungsstufe Archivportal-D Objektseiten analog zur DDB
Objektseiten
Hierarchien Nicht alle Stufen haben eine Objektansicht
Strukturierung der Beschreibungen durch Absätze wichtig: Absätze im Freitext in </lb>
umwandeln
Suchfilter
Zeit: ISO-8601 („YYYY-TT-MM“)– Bereinigungsprozess in der DDB
Sprache: ISO 639-2 („ger“) Medientyp: fixes Vokabular Sparte / Datenlieferant: aus der
Registrierung befüllt Person / Ort / Stichwort:
– Indexbegriffe– + Urheber/Provenienz und
Archivalientyp– Archivalientyp-Vokabular
sollte normalisiert angegeben werden
– sinnvoll Einträge doppelt anzugeben
Links - zurück ins Findmittelsystem - zu einem Viewer- zum Findbuch
Binärcontent - Link zum „freistehenden“ Digitalisat- Direkte Mitlieferung der Digitalisate -
Angabe der relativen Pfade
Verlinkung und Binärcontent
Personen-Seite
GND
GND
DDB
Wikipedia
Normdaten
GND: Zentrales Element zur Vernetzung der Inhalte
Entitätenseiten als zusätzlicher Einstieg
Anreicherung mit externen Inhalten
Möglich Normdaten anzugeben für Indexbegriffe, Provenienz und Urheber
Stabile Identifier
DDB interner Identifier baut auf IDs aus EAD(DDB) auf Zum Überschreiben alter Datensätze bei Neulieferungen Um Verlinkung zwischen Tektonik und Findbuch zu
gewährleisten Zum Abgleich der Datenlieferung bei verschiedenen
Lieferwegen Stabile Objektreferenz in myDDB Grundlage für Persistent Identifier Systeme
Anforderungen
Nicht sprechende technische Identifikatoren Eindeutigkeit (Findbuch und Tektonik) innerhalb der
Institution zentral (nicht nur innerhalb der Datei) Auch für Gliederungsstufen und Binärcontent Wird nicht erst beim Export erzeugt Stabilität bei Neulieferungen muss gewährleistet sein Muss auch bei einem Software-Umstieg stabil bleiben Im besten Falle beruhen auch die Links auf den
Identifiern (Permalink-System)
Umsetzungsbeispiele
LABW: aid: zusammengesetzt aus einem Archividentifier und der scope-id (eindeutige ID in scope für jeden Datensatz)– Beispiel: 1-2951896
LAV: weltweit eindeutige Identifier (UUIDs/GUIDs) werden pro Verzeichnisebene vergeben– Beispiel: 936DA01F-9ABD-4D9D-80C7-02AF85C822A8
Ingestprozess
Datenlieferanten schicken Testdaten Kontrolle anhand des Schemas Laden in ein Testsystem (inhaltliche Kontrolle) Im Moment: Anpassungen vor dem Ingest von der
Fachstelle Archiv zukünftig standardisiertes EAD(DDB) von zentraler
Bedeutung Plan 2014: Fachstelle Archiv: Standardisierung der
Export-Schnittstellen
Ausblick
METS: Nutzen eines gemeinsamen Viewers Spezifischere Rechteauszeichnung je Digitalisat Persistent Identifier-Systeme: stabile Links in der
DDB Rollen: spezifischere Auszeichnung der Personen Geo-Koordinaten: Kartenanwendungen OAI-PMH: Protocol for Metadata Harvesting
Valides EAD(DDB)
Die Schemata
Valides EAD(DDB)
1. Änderungen in EAD 1.12. Dokumentation3. Zweck der Schemata4. Schemata5. Normiertes Vokabular6. Mögliche Probleme bei der Validierung7. Anforderungen an die Exportschnittstellen
EAD(DDB) 1.1
Geringe Erweiterungen– Einfachere Unterscheidung zwischen Findbuch und
Tektonik Datei– Angaben zum Archiv und zur Überorganisation
besser getrennt– Mehr Möglichkeiten zur Einbindung von Normdaten– In der Format-Definition in Excel ausgezeichnet
• rot: Änderungen• grün: Ergänzungen
Dokumentation
Jeweils pro Tektonik und Findbuch-Datei– Beschreibende Informationen in Word: erläuternde
Informationen– Dokumentation in Excel-Form
• Überblick über Struktur von EAD(DDB) und den Verpflichtungsgrad der Elemente
– Testdateien in einer minimalen und maximalen Ausprägung– Schemata
Verfügbar unter http://www.landesarchiv-bw.de/ead (Version 1.1)
Zweck der Schemata
EAD 2002 ermöglicht eine sehr breite Verwendung aller Elemente Reduktion der Möglichkeiten
Hilfestellung bei der Erstellung von Schnittstellen Kontrollfunktion beim Import Weiterlieferung an das Archivportal Europa mit
einem Mapping ermöglichen
Schemata
Unterscheidung zwischen Tektonik- und Findbuch-Schema Zwei Versionen:
– XSD 1.1 (Referenzversion)– XSD 1.0 (für ältere XML-Software ungenauer)
• kein Zusammenhang mit EAD(DDB) 1.0!
– Kein dtd vorgesehen! Sehr eng gehalten, um Abweichungen möglichst schnell zu
entdecken Basiert auf großem EAD: EAD(DDB) ist valide zu EAD EAD(DDB) 1.1 Validierung möglich mit dem DPT von APEx
Kontrollierte Vokabulare
Bundesland (offizielle Bezeichnungen) Archivtyp (VDA-Fachgruppen) Medientyp (TEXT, BILD, AUDIO, VIDEO) Archivalientyp: normiertes Vokabular Datum: ISO-8601 ISIL: z.B.: DE-1951 @xlink:role: für Linktyp/Digitalisatstyp
21
Mögliche Validierungsprobleme 1
Richtigen Namespace verwenden– ead-namespace muss ausgezeichnet sein!
Die Reihenfolge der Elemente ist in vielen Abschnitten von EAD zentral– bedingt durch das große EAD Schema
Manche Elemente dürfen nicht ohne Unterelemente erzeugt werden
Elemente und Attribute sollen nur dort erlaubt sein, wo dies vorgesehen ist– Einfache Kontrolle, ob das Mapping richtig ist
Elemente sollen je nach Definition im oder nicht im Gruppierungselement (<did>) verwendet werden
Mögliche Validierungsprobleme 2
Header / Angaben zum Archiv Keine c01-c12 Elemente sonder nur c-Elemente Es sollen keine Überschriften (<head>) ohne Inhalt
(<p>) erzeugt werden Die IDs sollten der Ansetzung von XML-IDs entsprechen
– z.B.: dürfen nicht mit Namen anfangen, dürfen nicht leer sein
Das normalisierte Datumsfeld sollte ISO-8601 konform sei, soweit dies gewährleistet werden kann
Anforderungen an die Schnittstellen
Nichtvalides EAD sollte vom Nutzer nicht erzeugt werden können
Basis EAD(DDB)-Export sollte ohne Konfiguration möglich sein
Notwendigkeiten
1. Stabile Identifier sind zentral!2. Verknüpfung zwischen Findbuch und Tektonik
muss gewährleistet sein!3. Links zurück ins Findbuchsystem und auf
„freistehende“ Digitalisate sollen, so fern vorhanden, mitgeliefert werden
Vielen Dank für Ihre Aufmerksamkeit
Fragen? Hinweise? Anregungen?
Martin ReisacherTel.: 0711/212-4298Email: [email protected]