9

Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten
Page 2: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

Sichern – Speichern – Archivieren – Publizieren

Das Projekt IANUS und der Umgang mit Forschungsdaten Durch den zunehmenden Einsatz digitaler Methoden in der Archäologie treten neben die Publikation von abgeschlossenen Ergebnissen in Zeitschriften, Sammelbänden und Monographien – sowohl gedruckt als auch online – neue Formen der Veröffentlichung. Die Bereitstellung und Weitergabe von teilweise unpublizierten, dynamischen digitalen Forschungsdaten im Internet ermöglichen dabei ganz neue Formen der wissenschaftlichen Nachnutzung, stellen aber auch neue Herausforderungen an die Wissenschaft und die Technik. Dabei erfordert besonders die Frage zur Nachhaltigkeit solcher Angebote und zur langfristigen Nutzbarkeit der Daten besondere Lösungen und Anstrengungen. Forschungsdaten entstehen in der Archäologie hauptsächlich durch digitale Fotografien, Tabellen, Datenbanken, Textdokumente, Zeichnungen, Pläne, Messdaten, Filme, u.v.m., die meist produziert werden, um bestimmte Fragestellungen in Forschungsprojekten zu beantworten und diese Ergebnisse im Idealfall zu publizieren. Sie sind damit Teil eines vielstufigen Arbeitsprozesses (Abb. 1).

In vielen Projekten bleiben einige dieser Daten je nach Fragestellungen und Interessensschwerpunkten im Forschungsvorhaben unbearbeitet; manche werden zwar prozessiert, bleiben aber trotzdem unberücksichtigt, weil sie sich für die jeweilige Fragestellung doch nicht als zielführend erweisen oder sich Schwerpunkte verlagert haben. Aus unterschiedlichen Gründen gelangt letztendlich nur ein kleiner Teil in eine Publikation und wird damit der Allgemeinheit zugänglich gemacht. Die Zahl der Forschungsdaten, welche für die abschließende Publikation ausgewählt werden, ist folglich im Verhältnis zu der Menge an erhobenen Forschungsdaten häufig sehr gering und die Daten werden in den meisten Projekten nur unter bestimmten Aspekten ausgewertet. Durch diese Auswahlprozesse, die auch z. B. rechtliche und/oder finanzielle Gründe haben können, werden die meisten Informationen, die digital vorliegen, dem Datenlebenszyklus (siehe Abb. 2) entzogen, obwohl sie eine hohe wissenschaftliche Bedeutung besitzen und für potentielle Nachforschungen interessant sein können.

Page 3: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

72 Ortwin Dally – Felix F. Schäfer et al.

Abb.

1: I

deal

isie

rte G

egen

über

stel

lung

ana

loge

r und

dig

itale

r Arb

eits

schr

itte

in d

er A

rchä

olog

ie

Page 4: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

73 Sichern – Speichern – Archivieren – Publizieren

Abb. 2: Vereinfachtes Modell des Data-Life-Cycle1

.

Nach Abschluss des Projekts und der erfolgten Publikation verharren die erhobenen Daten auf privaten Rechnern, Festplatten oder institutionellen Servern, wo sie nicht mehr erreichbar sind und ihre Existenz unbekannt bleibt, obwohl sie für eine Nachnutzung durch die Wissenschaft potentiell geeignet wären. Die Verwendung dieser primären wie sekundären, publizierten und unpublizierten Daten für neue Fragen und Aspekte oder für den Vergleich mit weiteren Projekten ist folglich erschwert bis unmöglich. Im ungünstigsten Fall müssen die relevanten Informationen in der Zukunft mit erhöhtem Zeit- und Finanzaufwand – sofern überhaupt möglich – erneut erhoben werden.

1 Die Abbildung beruht auf dem Model der UK Data Archive: http://www.data-archive.ac.uk/create-

manage/life-cycle [Zugriff am 04.11.2013]. Ein komplexeres Model, das stärker noch den Aspekt der Datenkuratierung berücksichtigt, wurde vom Digital Curation Centre erstellt: http://www. dcc.ac.uk/resources/curation-lifecycle-model [Zugriff am 04.11.2013]. Ausführlich siehe S. Rümpel, Der Lebenszyklus von Forschungsdaten, in: S. Büttner – H.-C. Hobohm – L. Müller (Hrsg.), Handbuch Forschungsdatenmanagement (2011) 25-34.

Page 5: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

74 Ortwin Dally – Felix F. Schäfer et al.

In der archäologischen Forschung sind jedoch die meisten Forschungsdaten in hohem Maße einzigartig, weil sie nicht reproduziert werden können. Ausgrabungs-befunde gehen durch den Prozess der Freilegung unwiederbringlich verloren, Feldforschungsgenehmigungen werden nicht nochmals erteilt, Museen und Magazine werden geschlossen, aber auch politische Unruhen und kriegerische Zerstörungen können die erneute Untersuchung von Regionen verhindern. Daten, die prinzipiell für längere Zeiträume forschungsrelevant sind und auch nach dem Projektabschluß nachgenutzt werden könnten, sind oft schwer zugänglich, weil sie institutionell verteilt und disparat sind. Häufig sind sie für außenstehende Personen zudem schwer verständlich, da ihre Inhalte heterogen und schlecht dokumentiert sind. Darüber hinaus sind digitale Daten für die Zukunft stark gefährdet, weil sie durch den Ausfall von Datenspeichern (PCs, Festplatten, Servern, etc.) verloren gehen können und weil sie in den allermeisten Fällen nicht in langzeitarchivierungsfähigen Dateiformaten vorliegen. So reicht es nicht aus, die Daten von einem Träger auf den nächsten Träger zu sichern und durch automatisierte Backups eine vermeintliche Zukunftssicherheit zu erstellen. Für die wenigsten der heute gebräuchlichen, zumeist proprietären Dateiformate wird es in wenigen Jahren noch Anwendungen geben, die diese ohne Verlust öffnen können. Der fachliche Inhalt bleibt also in den Bits- und Bytes einer Datei verborgen und ist weder für Mensch noch Maschine verständlich. Vor allem digitale Daten benötigen daher eine kontinuierliche und nachhaltige Pflege, wofür meistens das nötige Know-how, sowie Hard- und Software und zeitliche und finanzielle Möglichkeiten nicht vorhanden sind. Kurzum, es fehlt eine professionelle Kuratierung und Archivierung wie sie in dem Bereich analoger Dokumente und Objekte etabliert ist. Diese Herausforderung vergrößert sich sukzessive durch die Erzeugung immer neuer digitaler Forschungsdaten und die Erschließung von Untersuchungsmethoden mit neuen Techniken. Insofern besteht die Notwendigkeit eines fachspezifischen Datenzentrums, das sich um die nicht-publizierten digitalen Forschungsdaten in der Archäologie und Altertumskunde kümmert und heute erzeugte Daten für die Nachwelt aufbereitet. Bereits existierende, vergleichbare Einrichtungen in Großbritannien („Archaeology Data Service“2) und in den Niederlanden („e-depot for nederlandse archaeologie“3

Die Anforderungen für ein fachspezifisches nationales Datenzentrum, das sich um Forschungsdaten kümmert, sind also vielfältig. Auf den ersten Blick geht es um die individuelle und fachlich fundierte Aufbereitung von Daten, z. B. hinsichtlich ihrer Dokumentation, Verständlichkeit und technischen Formate sowie einer zuverlässigen professionellen Langzeitarchivierung für die Nachwelt. Da die Archivierung von Daten immer auch deren Bereitstellung impliziert, trägt deren höhere Verfügbarkeit auch zur Überwindung bestehender Grenzen zwischen unterschiedlichen Disziplinen, Methoden, Akteuren und Institutionen bei und verbessert so den Austausch von forschungsrelevanten Informationen.

) zeigen, wie solche Datenzentren funktionieren. Dort werden erfolgreich die bestehenden Grenzen zwischen unterschiedlichen Disziplinen, Methoden, Akteuren und Institutionen überwunden sowie die Forschung durch Vernetzung vorhandener Daten verbessert und effizienter gestaltet.

Auf diese Möglichkeiten und Herausforderungen versucht das im Aufbau befindliche Projekt „IANUS - Forschungsdatenzentrum Archäologie & Altertumswissenschaften“ zu reagieren,

2 http://www.archaeologydataservice.ac.uk [Zugriff am 04.11.2013]. 3 http://www.edna.nl [Zugriff am 04.11.2013].

Page 6: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

75 Sichern – Speichern – Archivieren – Publizieren

das seit Herbst 2011 durch die DFG gefördert und durch das Deutsche Archäologische Institut in Berlin koordiniert wird4. Unterstützt wird es durch verschiedene Repräsentanten und Mitglieder ganz unterschiedlicher Einrichtungen, die sich in Deutschland mit der archäologischen und altertumswissenschaftlichen Erforschung befassen. Eingebunden in ein Steuergremium sowie verschiedene Arbeitsgruppen und Expertisen stellen die über 100 Mitglieder die Rückkopplung an die Wünsche und Bedingungen der Fachwelt her5

.

Abb. 3: Übersicht über die unterschiedlichen Akteure beim Aufbau von IANUS.

4 Unter der Projektleitung von Prof. Friederike Fless und Prof. Ortwin Dally. 5 Ausführlich http://www.ianus-fdz.de/projects/zentr-dig-arch/wiki/Beteiligte_Institutionen [Zugriff am

04.11.2013].

Page 7: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

76 Ortwin Dally – Felix F. Schäfer et al.

Als zentrale, fachspezifische Adresse sollen in IANUS alle Fragen und Antworten zu Datenmanagement, Lebenszyklus und Langzeitarchivierung von Forschungsdaten gebündelt und so weit wie möglich Lösungen angeboten werden. Dafür wird eine Daten- und Serviceinfrastruktur aufgebaut, die über Grenzen von Bundesländern, Institutionen und Projektlaufzeiten hinweg IT-Dienstleistungen dauerhaft im Regelbetrieb anbietet. Zentrales Anliegen ist es, langfristig digitale Daten zu sammeln, zu beschreiben, zu katalogisieren, zu migrieren, zu archivieren und bereitzustellen, also unter Berücksichtigung der jeweiligen rechtlichen und finanziellen Rahmenbedingungen der Datengeber Dateien und Informationen zu publizieren. Die Vorteile, die sich durch die von IANUS angestrebte kontinuierliche und nachhaltige Pflege und Archivierung von digitalen (Roh-)Daten für Datenproduzenten wie für Datennutzer ergeben, lassen sich – auch in Analogie zu anderen Disziplinen6

Durch die langfristige Les- und Nutzbarkeit von Inhalten und die Gewährleistung eines dauerhaften Zugriffs besteht die Chance, dem unwiederbringlichen Verlust von Fachwissen vorzubeugen.

– leicht aufzählen:

Ergebnisse können durch den Blick auf die ihnen zugrunde liegenden (Roh-) Daten im Sinne der guten wissenschaftlichen Praxis7

Durch die Vergabe von sog. Persistenten Identifikatoren besser nachvollzogen und überprüft werden.

8

Bereits erhobene Daten können kostengünstig für eigene neue Forschungsvorhaben wiederverwendet und neu analysiert werden.

wird die Zitierbarkeit von elektronischen Ressourcen (z. B. eines Textes, eines Fotos, einer Datensammlung, etc.) erleichtert und damit eine größere Verbreitung bzw. höhere Sichtbarkeit von Forschungsleistungen unterstützt.

Dank einer adäquaten und standardkonformen Aufbereitung von Daten, die im Rahmen der Archivvorbereitung erfolgt, wird ein elektronischer Austausch von Fachinhalten (z. B. zur Zusammenführung von Einzelinformationen, Vergleichen von Funden, etc.) ermöglicht bzw. optimiert.

Um diese Aufgaben erfüllen zu können, wird IANUS verschiedene und spezifische Dienstleistungen anbieten. Diese umfassen die professionelle Kuratierung von Forschungsdaten, also deren vollständige Dokumentation, Beschreibung, Migration und Katalogisierung, um sie einerseits einer Langzeitarchivierung zuführen zu können und um sie andererseits auch online (z. B. als Download) zu veröffentlichen. Auf diese Weise kann der Lebenszyklus von Daten weitergeführt und ausgebaut werden (Abb. 2). Sofern Datenproduzenten Dienstleistungen von IANUS für ihre digitalen Forschungsdaten in Anspruch nehmen möchten, regeln Übergabeverträge verbindlich die jeweiligen Rechte und

6 Vgl. z.B. aus dem Bereich der Psychologie: http://psychdata.zpid.de/index.php?main=

give&sub=vorteile [Zugriff am 04.11.2013]. 7 Siehe die Denkschrift der DFG „Sicherung guter wissenschaftlicher Praxis“:

http://www.dfg.de/download/pdf/dfg_im_profil/reden_stellungnahmen/download/empfehlung_wiss_praxis_1310.pdf [Zugriff am 04.11.2013].

8 K. Schroeder, Persistent Identifier (PI) – ein Überblick, in: H. Neuroth u.a. (Hrsg.), Nestor Handbuch. Eine kleine Enzyklopädie der digitalen Langzeitarchivierung. Version 2.3 (2010) Kap.9: 22-45 (http://nestor.sub.uni-goettingen.de/handbuch/artikel/nestor_handbuch_artikel_406.pdf [Zugriff am 04.11.2013]).

Page 8: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

77 Sichern – Speichern – Archivieren – Publizieren

Pflichten auf beiden Seiten. Ebenso wird es für Endnutzer, die Daten über das geplante Web-Portal von IANUS beziehen, juristisch bindende Lizenz- und Nutzungsbedingungen geben, um die erforderliche Rechtssicherheit zu schaffen. Der Schutz von sensiblen Daten wird durch ein Rechte-Rollen-Konzept gewährleistet, in dem unterschiedliche Stufen des Zugriffs für unterschiedliche Sichtbarkeiten von Daten abgebildet werden können. Auf diese Weise kann gewährleistet werden, dass zwar alle Daten archiviert, aber nur spezifische Teile entsprechend den Vorgaben des Dateneigentümers oder Projekt-verantwortlichen veröffentlicht werden. Eng verbunden mit der Archivierung und Bereitstellung ist die Entwicklung eines eigenen Nachweiskatalogs, der über die Datenbestände des IANUS-Archivs Auskunft gibt und dieses effizient durchsuchbar macht. Die Archivierbarkeit und Nachnutzbarkeit von Daten hängt wesentlich von ihrer fachlichen wie technischen Nachvollziehbarkeit ab. Um diese Aspekte zu fördern und um eine aktive Unterstützung beim Forschungsdatenmanagement anzubieten, formuliert IANUS zusammen mit Fachspezialisten und unter Berücksichtigung existierender Leitfäden9 neue Mindeststandards und IT-Empfehlungen zum nachhaltigen Umgang mit Forschungsdaten. In diesen werden unter dem Blickwinkel der Nachhaltigkeit möglichst viele Aspekte der Datenerhebung, -verarbeitung und -archivierung thematisiert. Die Inhalte werden dabei nach den verschiedenen Phasen eines Projektes, den unterschiedlichen technischen Dateiformaten und den vielfältigen Forschungsmethoden strukturiert und mit Best-Practice-Beispielen angereichert. Eine erste Version dieser IT-Empfehlungen soll Ende 2013 online gehen10

Darüber hinaus will IANUS auch Unterstützung für laufende Projekte anbieten, z. B. mittels sog. Sync-&-Share-Services zur gemeinsamen sicheren Ablage von dynamischen Projektdaten und zur Beratung beim Forschungsdatenmanagement

.

11

In einem Zeitalter, in dem auch die archäologische Forschung zunehmend durch elektronische Geräte und Verfahren geprägt ist, kommt den digitalen Daten eine besondere Bedeutung zu und diese Daten schaffen neue Möglichkeiten. Zukünftig wird es nicht mehr ausreichen, die Projektergebnisse, Kataloge von Objekten oder neue Interpretationen wie bisher in gedruckter Form oder als online verfügbare PDFs zu publizieren, sondern die Nachfrage nach den zugrunde liegenden Daten wird dazu führen, auch diese dem wissenschaftlichen Diskurs zur Verfügung zu stellen. Beispiele in anderen Ländern

. Ergänzt werden soll dies durch Veranstaltungen und Online-Angebote zur Vermittlung von fachspezifisch notwendigen IT-Kenntnissen, sowohl für Studierende und Dozenten als auch für Projektmitarbeiter und Projektleiter.

12

9 Z. B. der IT-Leitfaden des DAI (http://www.dainst.org/de/project/it-leitfaden?ft=all [Zugriff am

04.11.2013]) und der „Guides to Good Practice“, die gemeinsam vom Archaeology Data Service (York, UK) und Digital Antiquity (Tempe, AZ, USA) herausgegeben werden (http://guides.archaeologydataservice.ac.uk/ [Zugriff am 04.11.2013]).

und in

10 Vgl. im englischsprachigen Raum die gemeinsam vom Archaeology Data Service (UK) und the Digital Archaeological Record (USA) formulierten „Guides to good practice“: http://guides.archaeologydataservice.ac.uk/g2gp/Main [Zugriff am 04.11.2013].

11 S. Büttner – H.-C.Hobohm – L. Müller (Hrsg.), Handbuch Forschungsdatenmanagement (2011). 12 Vgl. das „Journal of open archaeology data“: http://openarchaeologydata.metajnl.com/ [Zugriff am

04.11.2013].

Page 9: Sichern – Speichern – Archivieren – Publizieren - IANUS › attachments › download › 571 › ... · Als zentrale, fachspezifische Adresse sollen alle Fragen und Antworten

78 Ortwin Dally – Felix F. Schäfer et al.

anderen Disziplinen wie den Erd- und Umweltwissenschaften13

zeigen die aktuellen Tendenzen auf. Mit dem Aufbau des Forschungsdatenzentrums IANUS mit seinen primären Zielsetzungen der Langzeitarchivierung und der Datenbereitstellung sollen diese Chancen auch für die archäologische und altertumswissenschaftliche Forschung nutzbar gemacht werden.

Ortwin Dally – Friederike Fless – Maurice Heinrich – Felix Schäfer – Anne Sieverling Für die Autoren Prof. Dr. Ortwin Dally Generalsekretär Deutsches Archäologisches Institut Podbielskiallee 69-71 D-14195 Berlin [email protected] Dr. Felix F. Schäfer Deutsches Archäologisches Institut Zentrale, IT-Referat "IANUS. Forschungsdatenzentrum Archäologie & Altertumswissenschaften" Podbielskiallee 69-71 D-14195 Berlin [email protected]

13 „PANGAEA. Data Publisher for Earth & Environmental Science“: www.pangaea.de [Zugriff am

04.11.2013].