1© ETH-Bibliothek 2008
Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek
ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008
Pilotprojekt Digitale Langzeitarchivierung
2© ETH-Bibliothek 2008
ProjektorganisationProjektorganisation
Kooperation zwischen drei Partnern
Informatikdienste der ETH Zürich
ETH-Bibliothek
Konsortium der Schweizer Hochschulbibliotheken
Phase 1: 01.09.2006 – 31.05.2007
Phase 2: 01.06.2007 – ca. Ende 2008
3© ETH-Bibliothek 2008
Ausgangslage (1)Ausgangslage (1)
Digitale Informationen an der ETH Zürich
Aus der Forschung
Primärdaten: digitale Messdaten
Sekundärdaten: elektronische Auswertungen / Ergebnisse
Aus der Verwaltung
digitale Dokumente: Geschäftsdaten
4© ETH-Bibliothek 2008
Ausgangslage (2)Ausgangslage (2)
ETH-Bibliothek
verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc.
traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form)
An der ETH Zürich fehlt:
ein umfassender Ansatz für die langfristige ein umfassender Ansatz für die langfristige Archivierung und Verfügbarkeit von Archivierung und Verfügbarkeit von digitalen Primär- und Sekundärdatendigitalen Primär- und Sekundärdaten
5© ETH-Bibliothek 2008
OAIS-Referenzmodell als BasisOAIS-Referenzmodell als Basis
ISO-Standard 14721 seit 2001 Consultative Committee for Space Data Systems (CCSD) –
NASA, ESA, DLR
Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig
Übernahme von Modulen in Projektorganisation und Strukturplan
6© ETH-Bibliothek 2008
Nutzung von Erfahrungen und Kompetenzen Nutzung von Erfahrungen und Kompetenzen
Austausch international E-Helvetica kopal KB – Koninklijke
Bibliotheek der Niederlande
Kooperation mit nestor Gemeinsame Umfrage
2007 Nachnutzung:
„Kriterienkatalog vertrauenswürdige digitale
Langzeitarchive“
7© ETH-Bibliothek 2008
Testdaten (1)Testdaten (1)
Primärdaten
Departement Erdwissenschaften der ETH Zürich
Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes
Projekt Replay – Multimedia-Portal System der ETH Zürich
Video-Dateien (Vorlesungen)
8© ETH-Bibliothek 2008
Testdaten (2)Testdaten (2)
Sekundärdaten
ETH-Bibliothek und Konsortium
E-Journals Elsevier
E-Books (Springer)
E-Pics (Bildarchiv)
E-Collection (Dissertationen und elektronische Publikationen der ETH-Angehörigen
9© ETH-Bibliothek 2008
Metadatenanalyse (1)Metadatenanalyse (1)
Standards
Möglichst bestehende Standards und offene Formate verwenden
Für möglichst viele Objekttypen ohne Anpassungen
Metadatengewinnung
Möglichst automatisierter Ablauf
10© ETH-Bibliothek 2008
MetadatentypMetadatentyp KategorieKategorie
Dublin Core reine Beschreibung der Metadaten
LMER / PREMIS administrative u. technische Metadaten
METS Packaging
XML Codierung
Metadatenanalyse (2)Metadatenanalyse (2)
MetadatenstandardsGeeignet für die Langzeitarchivierung
11© ETH-Bibliothek 2008
PreservationLevel A
PreservationLevel B
PreservationLevel C
Se
rvic
ele
vel
Aufbewahrungsdauer
Kurzeitige Datenhaltung
mit minimaler Serviceleistung
Mittelfristige Datenhaltung
mit geringer Serviceleistung
Dauerhafte Datenhaltung
mit umfassender Serviceleistung
Definition von Preservation Levels (1)Definition von Preservation Levels (1)
Definition für die ETH ZürichDrei Stufen und
Kriterien für die Langzeitarchivierung
12© ETH-Bibliothek 2008
Kriterien – Preservation Levels (2)Kriterien – Preservation Levels (2)
Kriterien für die Archivierung nach den Preservation Levels
Kriterien für die Speicherung gemäss Preservation Level A
A.1 Ein Objekt stellt kein Sicherheitsrisiko für das Archiv oder für archivierte Objekte dar.
A.2 Es ist eine Übergabevereinbarung mit der Archiveinrichtung zu schliessen.
A.3 Es ist erkennbar, wer das Objekt abliefert.
Kriterien für die Speicherung gemäss Preservation Level B
B.1 Metadaten müssen so aufbereitet werden können, dass die Objekte für 5 bis 10 Jahre nutzbar bleiben.
B.2 Das Dateiformat entspricht einer Positivliste von Formaten.
Kriterien für die Langzeitarchivierung gemäss Preservation Level C
C.1Umfassende inhaltliche, technische und administrative Metadaten sind vorhanden.Ein Mindeststandard der Metadaten muss definiert werden.
C.2 Der Objekttyp entspricht einer Positivliste von Typen.
C.3 Das Dateiformat entspricht einer Positivliste von Formaten (z.B. PDF/A, XML, etc.).
13© ETH-Bibliothek 2008
14© ETH-Bibliothek 2008
ÜbergabevereinbarungÜbergabevereinbarung
Datenlieferant
Art und Umfang der Lieferung Inhaltliche Umschreibung Umfang, Dateiformate, Übergabeverfahren IT-Umgebung, Metadaten etc.
Verpflichtung des digitalen LZA Preservation Levels Dauer der Archivierung u. Dienstleistungsumfang
Nutzungsbedingungen Zielgruppen, Nutzungsrechte
Schutzfristen, Kosten
etc.
15© ETH-Bibliothek 2008
Online-Umfrage (1)Online-Umfrage (1)
Bedarfsanalyse April 2007Klärung des Bedarfs an LZA digitaler Objekte
an der ETH Zürich
Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen)
AdressatenAlle 15 Departemente der ETH Zürich
Zentrale Dienste
Rücklauf: 20%
16© ETH-Bibliothek 2008
Online-Umfrage (2)Online-Umfrage (2)
Allgemeine Aussagen Über 80 % haben Interesse an einer zentralen Dienstleistung
„digitale Langzeitarchivierung“
17© ETH-Bibliothek 2008
Online-Umfrage (3)Online-Umfrage (3)
Vereinbarungen und Vorschriften ca. 80 % geben an, dass es in ihrer Organisationseinheit
keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.
18© ETH-Bibliothek 2008
Online-Umfrage (4)Online-Umfrage (4)
Formate der zu archivierenden Daten und Objekte ASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB,
NETCDF, PDF, TIF, TXT, WORD, XML
Teilweise proprietäre Formate
17 (18%)keine Antwort
29 (31%)Nein
48 (51%)Ja
Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist?
19© ETH-Bibliothek 2008
Online-Umfrage (5)Online-Umfrage (5)
Gibt es in Ihrem Bereich Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?
<5 Jahre: 5-10 Jahre: dauerhaft:
Einzeldateien (Textdateien, Bilder,
PDFs etc.)
Komplexe Objekte (z.B. Multimedia)
Datenbanken Fachspezifische Formate (GIS, CAD etc.)
Websites Ausführbare Objekte (Programme)
Aufbewahrungsdauer
20© ETH-Bibliothek 2008
Enthalten die betreffenden Daten eine standardisierte Beschreibung ihrer technischen Eigenschaften?
Ja 27 (29%)
Nein 48 (51%)
keine Antwort 19 (20%)
Online-Umfrage (6)Online-Umfrage (6)
Technische Metadaten Daten und Objekte verfügen überwiegend über keine
standardisierten Metadaten
21© ETH-Bibliothek 2008
Enthalten die betreffenden Daten aussagekräftige deskriptive und administrative Beschreibungen, die es erlauben, diese zu einem anderen Zeitpunkt sachlich korrekt zu interpretieren?
Ja 50 (53%)
Nein 24 (26%)
keine Antwort 20 (21%)
Inhaltliche Metadaten Rund die Hälfte der Antworten bejaht das Vorhandensein von
inhaltlichen (deskriptiven und administrativen) Metadaten.
Online-Umfrage (7)Online-Umfrage (7)
22© ETH-Bibliothek 2008
Entsprechen die technischen und inhaltlichen Beschreibungen einem Standard, der in Ihrem Fach oder allgemein anerkannt und dokumentiert ist?
Ja 39 (41%)
Nein 31 (33%)
keine Antwort 23 (26%)
Online-Umfrage (8)Online-Umfrage (8)
Format der technischen u. inhaltlichen Metadaten 41 % antworten mit ja, aber nennen kein konkretes Format.
23© ETH-Bibliothek 2008
Online-Umfrage (9)Online-Umfrage (9)Aktuelle Massnahmen
eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum.
Durch welche Massnahme stellen Sie bzw. Ihre Mitarbeiter die Verfügbarkeit Ihrer Daten heute sicher? (Mehrfachnennungen erlaubt)
Die Mitarbeiter sind dafür selber verantwortlich:
56(60%)
Beim Weggang von Mitarbeitenden müssen diese angeben, an welchem Ort und in welcher Form ihre Daten abgelegt sind:
49(52%)
Es gibt klare Richtlinien zur Aufbewahrung der Daten:
19(20%)
Wir haben dafür eine verantwortliche Person benannt, die sich um die Aufbewahrung langfristig relevanter Daten kümmert:
24 (26%)
Ergänzungen und sonstige Vorgehensweisen:
18(19%)
24© ETH-Bibliothek 2008
Auswahl der Software und PilotAuswahl der Software und Pilot
Schritt 1
Anforderungs-katalog
Schritt 2
Präsentationen
Lieferanten
Schritt 3
WorkshopsLieferanten
Schritt 4
Test-Installationen
Ziel: Vergleichende Pilotinstallation Vergleich zweier unterschiedlicher Ansätze
25© ETH-Bibliothek 2008
Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung:
E-Mail: [email protected] / Telefon: +41 44 632 84 26