View
350
Download
6
Category
Preview:
Citation preview
http://www.ianus-fdz.de Maurice Heinrich
Forschungsdaten – Nach der Publikation
ist vor der Archivierung!
Übernahme und Bewertung von Forschungsdaten, Viertes Treffen des Arbeitskreises Wissenschaftliche Archive in Berlin,
TU-Berlin, 09. März 2016
2
GLIEDERUNG
1. Altertumswissenschaften – Heute
2. Sichern – Backup – Archivieren
3. Vorberreitende Arbeitsschritte
4. Forschungsdatenkuratierung
5. Angebote & Empfehlungen
3
Wie sieht der klassische Forschungsprozess heutzutage in den Altertumswissenschaften aus Sicht der Forschungsdaten aus?
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
4
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
Wie sieht der klassische Forschungsprozess heutzutage in den Altertumswissenschaften aus Sicht der Forschungsdaten aus?
» Einbahnstraße – mit Publikation sind Forschungsrohdaten der Forschung dritter weitestgehend entzogen
» Forschungsrohdaten werden selten mit Forschern geteilt
» Forschungsrohdaten werden noch seltener veröffentlicht
5
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
1
DIGITALE FORSCHUNGSDATEN IN DEN ALTERTUMSWISSENSCHAFTENSTAKEHOLDERANALYSE 2013 ZU FORSCHUNGSDATEN IN DEN ALTERTUMSWISSENSCHAFTEN.
TEIL 2: KOMBINIERTE AUSWERTUNG & INTERPRETATION
6
Erhebung
Wie stellt sich ein durchschnittliches archäologisches Forschungsprojekt aus datentechnischer Sicht dar?
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
7
Testdaten aus altertumswissenschaftlichen Forschungsprojekten
» 20 altertumswissenschaftliche Institutionen
» aus verschieden Disziplinen*
» aus laufenden & abgeschlossenen Projekten
» nicht explizit für die Archivierung aufbereitet
› keine Auswahl, Formatvalidierung, Qualitsätsicherung etc.
› unvollständige Dokumentation, Metadaten, Lizenzen etc.
› oft nur Teile aus größeren Datenbeständen
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
8
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
9
Quantitäten Insgesamt
» 684,9 GB Speicher
» 237.403 Dateien in 7.537 Ordnern
» max. Ordnertiefe: 12 Ebenen
» 462 Dateiformate
Durchschnittliches archäologisches Projekt (Mittelwert)
» 38 GB Speicher
» 12.425 Dateien in 380 Ordner
» max. Ordnertiefe: 4 Ebenen
» 40 Dateiformate
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
10
Digitale Forschungsdaten in den Altertumswissenschaften sind
» inhaltlich und technisch heterogen
» einmalig, weil oft nicht reproduzierbar
» für lange Zeiträume forschungsrelevant
» institutionell verteilt und disparat
» zum größten Teil unpubliziert
» oftmals dem wissenschaftlichen Diskurs entzogen
» für Dritte nur selten nachnutzbar
» für die Zukunft gefährdet, da ein Daten- und Wissensverlust droht
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
11
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
12
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
Auch unpublizierte (Roh-)Daten besitzen hohe wissen- schaftliche Bedeutung und benötigen kontinuierliche Pflege!
13
FAZIT
» Im Sinne der guten wissenschaftlichen Praxis sollten digitale Forschungsdaten
› ausreichend dokumentiert sein
› von Datenkuratoren gepflegt werden
› nachhaltig und langfristig archiviert werden
› niedrigschwellig und online zur Verfügung gestellt werden
› in der Nachnutzung immer kostenfrei sein
› über eine möglichst offene Lizenz verfügen
ALTERTUMSWISSENSCHAFTEN – MORGEN
14
ALTERTUMSWISSENSCHAFTEN – MORGEN
15
2. SICHERN – BACKUP – ARCHIVIEREN
Sicherst du noch oder archivierst du schon?
16
Differenzierung – Begriffsbedeutung
» Sichern / Speichern – Daten speichern; Daten aus dem Arbeitsspeicher eines Programms auf einen Datenspeicher übertragen
» Backup – Abbild eines (Daten-)Speichers mit dem Zweck, den Inhalt dessen, falls er beschädigt oder zerstört worden ist, wiederherzustellen
» digitale (Langzeit-)Archivierung – Erfassung, (langfristige) Aufbewahrung sowie die Erhaltung von dauerhafter Verfügbarkeit von digitalen Informationen
2. SICHERN – BACKUP – ARCHIVIEREN
17
2. SICHERN – BACKUP – ARCHIVIEREN
VORBEREITUNG NACHBEREITUNGPROJEKT-PHASEN
DYNAMISCHE FORSCHUNGSDATEN STATISCHE FORSCHUNGSDATENAKTIVITÄTS-VERLAUF
SPEICHER-MEDIEN-VERLAUF
SPEICHERN SPEICHERN SPEICHERN SPEICHERNBACKUP BACKUP BACKUP
SICHERUNGS-VERLAUF
ARCHIVIEREN
BEGINN ENDEMEILENSTEIN MEILENSTEIN MEILENSTEIN
PROJEKT-VERLAUF
DURCHFÜHRUNG
Differenzierung – zeitliche Relevanz
18
3. VORBERREITENDE ARBEITSSCHRITTE
19
» Auswahl – signifikante Eigenschaften
» Vorbereitung von Forschungsdaten
› Datenformatsanpassungen
› Metadatenanreicherung
› Dokumenation
» Kontaktaufnahme Archiv – Datenübergabe
» Erste initiale Überprüfung durch Datenkuratoren
› Preservation Planing
» Finale Absprache Datengeber – Datenkurator
» Beginn Datenkuratierung
3. VORBERREITENDE ARBEITSSCHRITTE
20
3. VORBERREITENDE ARBEITSSCHRITTE
» Auswahl – signifikante Eigenschaften
» Vorbereitung von Forschungsdaten
› Datenformatsanpassungen
› Metadatenanreicherung
› Dokumenation
» Kontaktaufnahme Archiv – Datenübergabe
» Erste initiale Überprüfung durch Datenkuratoren
› Preservation Planing
» Finale Absprache Datengeber – Datenkurator
» Beginn Datenkuratierung
21
3. VORBERREITENDE ARBEITSSCHRITTE
AIP - Archivierungsformate
DIP - Präsentationsformate
PDF/A-1 pdf präferiert pdf/A-2 pdf/A
PDF/A-2 pdf präferiert pdf/A-2 pdf/A
PDF/A-3 pdf akzeptiert pdf/A-2 + weitere Dateien pdf/A
andere PDF-Varianten pdf akzeptiert pdf/A-2 pdf/A
Portable Document Format (PDF/A) pdf präferiert pdf/A pdf/A
andere PDF-Varianten pdf akzeptiert pdf/A-2 pdf/A
OpenDocument Format odt präferiert odt + pdf/A odt, pdf/A
Microsoft Office XML docx präferiert docx + pdf/A docx, pdf/A
Microsoft Word doc akzeptiert docx + pdf/A docx, pdf/A
Rich Text Format rtf akzeptiert docx + pdf/A docx, pdf/A
Open Office XML sxw akzeptiert odt + pdf/A odt, pdf/A
Reiner Text, plain text txt präferiert txt txt
Strukturierter Text, Markupxml, sgml, html etc. + dtd, xsd etc.
präferiert xml, sgml, html etc. + dtd, xsd etc. xml, sgml, html etc. + dtd, xsd etc.
Baseline TIFF v. 6, unkomprimiert tiff, tif präferiert tiff (unkomprimiert v.6) jpeg
Adobe Digital Negative dng präferiert dng dng, jpeg
Portable Network Graphics png akzeptiert tiff (unkomprimiert v.6) png
Joint Photographic Expert Group jpeg, jpg akzeptiert tiff (unkomprimiert v.6) jpeg
Graphics Interchange Format gif akzeptiert tiff (unkomprimiert v.6) png
Windows Bitmap bmp akzeptiert tiff (unkomprimiert v.6) png
Photoshop (Adobe) psd akzeptiert tiff (unkomprimiert v.6) png, jpeg
CorelPaint cpt akzeptiert tiff (unkomprimiert v.6) png, jpeg
JPEG2000 jp2, jpx akzeptiert tiff (unkomprimiert v.6) jp2, jpx, jpeg
RAW image format nef, crw etc. akzeptiert dng jpeg
Comma Separated Values csv präferiert csv csv
Tab Separated Values tsv präferiert csv csv
OpenDocument Format ods präferiert ods ods
Microsoft Office XML xlsx präferiert xlsx xlsx
Strukturierter Text, Markupxml, html etc. + dtd, xsd etc.
präferiert xml, html etc. + dtd, xsd etc. xml, html etc. + dtd, xsd etc.
Portable Document Format (PDF/A) pdf akzeptiert pdf/A pdf/A
Open Office XML sxc akzeptiert ods ods
Microsoft Excel xls akzeptiert xlsx xlsx
X3D x3d + avi, mpg, jpeg präferiert x3d + avi, mpg, tiff etc. x3d + avi, mpg, jpeg
COLLADA dae + avi, mpg, jpeg präferiert dae + avi, mpg, tiff etc. dae + avi, mpg, jpeg
OBJ obj + jpeg präferiert obj + tiff obj + jpeg
Polygon File Format (PLY) ply + jpeg präferiert ply + tiff ply + jpeg
Virtual Reality Modeling Language (VRML)
vrml + avi, mpg, jpeg akzeptiert vrml + avi, mpg, tiff etc. vrml + avi, mpg, jpeg etc.
Universal 3D Format u3d + avi, mpg jpeg akzeptiert x3d + avi, mpg, tiff etc. x3d + avi, mpg, jpeg
STL stl + jpeg akzeptiert ply + tiff ply + jpeg
DXF dxf + jpeg akzeptiert dxf + tiff dxf + tiff
X
RAST
ERG
RAFI
KEN
3D-D
ATE
N /
VIR
TUA
L RE
ALI
TY
DATEIFORMATE UND DATENMIGRATION– Januar 2016 –
SIP - Abgabeformate
PDF-
DO
KUM
ENTE
TEXT
E / D
OKU
MEN
TETA
BELL
EN
22
3. VORBERREITENDE ARBEITSSCHRITTE
» Auswahl – signifikante Eigenschaften
» Vorbereitung von Forschungsdaten
› Datenformatsanpassungen
› Metadatenanreicherung
› Dokumenation
» Kontaktaufnahme Archiv – Datenübergabe
» Erste initiale Überprüfung durch Datenkuratoren
› Preservation Planing
» Finale Absprache Datengeber – Datenkurator
» Beginn Datenkuratierung
23
3. VORBERREITENDE ARBEITSSCHRITTE
Bezeichnung KurzdefinitionIdentifizierung - Projekttitel
Verbindliche Kurzbezeichnung des Projektes.
Identifizierung - Alternativtitel
Ggf. alternative Titel für ein Projekt.
Identifizierung - Projektnummer(n)
Nummern oder Kennungen, die z.B. innerhalb der durchführenden Organisation oder von Mittelgebern verwendet wird, um das Projekt eindeutig identifizieren zu können.
KurzbeschreibungKnappe Angaben zur Fragestellung, zum Verlauf und Ergebnis des Projektes sowie Skizzierung der Datensammlung (insgesamt ca. 100-300 Worte).
Schlagworte - Fachdisziplinen
Stichworte, die die beteiligten Disziplinen und Fächer benennen. Sofern die Stichworte auf publizierten Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Schlagworte - Inhalt
Stichworte, die den Inhalt der Datensammlung benennen., z. B. zu Materialgruppen, Fundstellen-Klassifizierung, Quellenarten, Kulturgruppen etc. Sofern die Stichworte auf publizierten Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Schlagworte - Methoden
Stichworte, die die eingesetzten Forschungsmethoden beschreiben. Sofern die Stichworte auf publizierten Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Ausdehnung – Geografisch-1
Detaillierte Angaben zur räumlichen Ausdehnung oder zum Fundort des untersuchten Gegenstandes mittels geografischer Koordinaten. Die maximale Ausdehnung kann als Bounding Box angegeben werden.
Ausdehnung – Geografisch-2
Sprachliche Beschreibung des untersuchten Gegenstandes mittels Ortsangaben mit Land, Stadt, Kreis, Straße, Gemarkung etc. Sofern Namen sich im Lauf der Zeit geändert haben, dies gesondert vermerken. Sofern eine Referenz zu einer Geo-Ressource oder einem Gazetteer existiert, sollte diese ebenfalls angegeben werden.
Ausdehnung – zeitlich
Chronologische Angaben zum untersuchten Gegenstand, entweder als Periodenbezeichnung und/oder mit groben/genauen Jahresangaben. Sofern die Stichworte auf publizierten Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Primärforscher - Person
Personen, die entweder für das Projekt als Ganzes, für das Datenmanagement oder für die Erzeugung bestimmter Datenarten zentral bzw. verantwortlich sind. Hier ist eine Kontaktadressen erforderlich und die aktuelle/letzte institutionelle Zugehörigkeit, damit die Personen bei Rückfragen erreicht werden kann.
Eigentümer - Organisation
Organisation, der die unter "Primärforscher" genannten Personen angehören, oder die nach Ausscheiden derselben für die Daten verantwortlich ist, im weitesten Sinne also Eigentümer der Daten ist. Hier ist eine Kontaktadresse erforderlich, damit die Organisation bei Rückfragen erreicht werden kann.
FinanzierungNennung der Organisation(en) / (Dritt-)Mittelgeber, durch die das Projekt finanziert wurde. Es sollte jeweils der Zeitraum der Finanzierung angegeben werden.
Veröffentlichung - Projektdaten
Wenn die hier beschriebene Datensammlung des Projektes bereits an anderer Stelle veröffentlicht / online gestellt wurde, bitte entsprechende Angaben machen, z. B. durch Nennung der Organisationen, Datenarchive, Online-Ressourcen etc.
Veröffentlichung – Ergebnisse
Analoge oder digitale Publikationen zu Ergebnissen des Projektes oder zur Datensammlung des Projektes, ausführliche bibliographische Angaben (ohne fachspezifische Abkürzungen) unter Nennung des Verlages erforderlich.
Dauer - Projekt Anfangs- und Enddatum des Projektes.Dauer – Datenbestand
Anfangs- und Enddatum der Erzeugung oder Verarbeitung digitaler Daten im Rahmen des Projektes.
Rechtliches – Urheberrechte
Name des Inhabers der Urheber-, Nutzungs- und Verwertungsrechte; i. d. R. die Organisation, an der der Primärforscher, beschäftigt war.
Rechtliches - Lizenzgeber
Angabe der Person, die i. d. R. als Vertretung für eine Organisation für die Lizenzierung von Daten zur Nachnutzung verantwortlich und berechtigt ist, einen Datenübergabevertrag abzuschließen.
Rechtliches - Datenschutz
Angaben, ob in der Datensammlung datenschutzrelevante Informationen enthalten sind. Wenn ja, in welchem Umfang.
Quellen - Ältere Ältere Quellen oder existierende Ressourcen, auf denen die Daten aufbauen.
Quellen - Zugehörige
Sofern während des Projektes Informationen, Datensammlungen, (un-)publizierte Dokumente, Online-Ressourcen etc. verwendet oder erzeugt wurden, die nicht Teil der hier beschriebenen Datensammlung sind, aber für deren Verständnis wichtig sind, bitte entsprechende Angaben zu Art und Umfang dieser Quellen machen.
Sprache Die in den Dokumenten und Dateien verwendete(n) Sprache(n). Sprachkennungen nach ISO 639 angeben.
Art der DatenKurzcharakterisierung der Daten, z. B. ob es sich um Rohdaten, verarbeitete Daten, Interpretationen, Ergebnisse, Abschlussberichte etc. handelt.
Vollständigkeit Aussagen zur Vollständigkeit der Projektdaten, z. B. ob bestimmte Datenarten noch fehlen und warum.
DateiformateAuflistung der Dateiformate, die in der Datensammlung vorkommen, ggf. unter Nennung der verwendeten Programme und Zeichencodierungen.
ZugriffsrechteFestlegung der gewünschten Zugriffsrechte für die Daten, sofern diese für den gesamten Projekt-Datenbestand gelten sollen; differenzierte Regelungen müssen auf Dateiebene vorgenommen werden.
Signatur Metadaten
Angabe darüber, wer die o. g. Metadaten wann ausgefüllt hat.
PROJEKTBEZOGENE METADATEN– vorläufiger Stand –
X
24
3. VORBERREITENDE ARBEITSSCHRITTE
» Auswahl – signifikante Eigenschaften
» Vorbereitung von Forschungsdaten
› Datenformatsanpassungen
› Metadatenanreicherung
› Dokumenation
» Kontaktaufnahme Archiv – Datenübergabe
» Erste initiale Überprüfung durch Datenkuratoren
› Preservation Planing
» Finale Absprache Datengeber – Datenkurator
» Beginn Datenkuratierung
25
4. FORSCHUNGSDATENKURATIERUNG
26
Rechte-Rollen-Konzept
4. FORSCHUNGSDATENKURATIERUNG
27
4. FORSCHUNGSDATENKURATIERUNG
28
4. FORSCHUNGSDATENKURATIERUNG
29
» Beratung zu Metadaten, Dateiformaten, Methoden notwendig
› „IT-Empfehlungen für den nachhaltigen Umgang mit digitalen Daten in den Altertumswissenschaften“
» Bei Abgabe von Daten – klare Dateiformatvorgaben notwendig
› Metadatenformular, Übersicht akzeptierte Datenformate
» Vertrauen schaffen – Nachhaltigkeit fördern
› transparente Veröffentlichung aller Projektergebnisse
FAZIT
30
5. ANGEBOTE & EMPFEHLUNGEN
IT-Empfeh
lung
en
31
IT-Empfehlungen für den nachhaltigen Umgang mit digitalen Daten in den Altertumswissenschaften
» Inhaltliche Zielsetzung
› Langfristige Lesbarkeit und Nutzbarkeit von Daten
› Hinweise zu Formaten und Metadaten
› Unterscheidung von Dateiformaten und Forschungsmethoden
» konkrete Praxistipps und empfohlene Mindeststandards
› zu technischen Aspekten – Dateiformaten
› zur Dokumentation von Inhalten – Metadaten
5. ANGEBOTE & EMPFEHLUNGEN
32
Vorbilder
» Guides to Good Practice, ADS (UK) und tDAR (USA)
» Ratgeber zur Archivierung, Verband der Landesarchäologen
» IT-Leitfaden, DAI
AG Archivierung der Kommission �Archäologie und Informationssysteme“ im Verband der Landesarchäologen der Bundesrepublik Deutschland
Ratgeber zurrchivierung digitaler Daten
T r i t t s t e i n e a u f d e m W e g z u m D i g i t a l a r c h i v
Vorabversion 0.07
Die AG Archivierung der Kommission �Archäologie und Informationssysteme“ im Verband der Lan-desarchäologen Deutschlands verfolgt das Ziel, allgemein verfügbare methodische und technische Ansätze zur Archivierung digitaler archäologischer Daten zu begutachten sowie praxisorientierte Emp-fehlungen, Vorschläge und Tipps zu geben. Die Ergebnisse dieser Arbeit münden in diesen Ratgeber. Sind auch noch einige Themenbereiche in Arbeit, so sind doch wesentliche Teile schon verfügbar und werden in dieser Vorabversion vorgestellt
5. ANGEBOTE & EMPFEHLUNGEN
33
5. ANGEBOTE & EMPFEHLUNGEN
34
5. ANGEBOTE & EMPFEHLUNGEN
ÜbersichtVertiefung
PraxisQuellen
Diskussion
35
ÜbersichtVertiefung
PraxisQuellen
Diskussion
dynamische Online-Version statische PDF-Version
5. ANGEBOTE & EMPFEHLUNGEN
36
weiterführende Verweise
5. ANGEBOTE & EMPFEHLUNGEN
37
Erklärungen Fachbegriffe
5. ANGEBOTE & EMPFEHLUNGEN
38
WO FINDEN SIE WELCHE INHALTE?
Ergebnisse
» http://www.ianus-fdz.de/projects/ergebnisse/wiki
IT-Empfehlungen
» http://www.ianus-fdz.de/it-empfehlungen
Stakeholderanalyse
» doi:10.13149/000.jah37w-q
39
VIELEN DANK
Forschungsdatenzentrum
Archäologie &
Altertumswissenschaften
Austausch
Digitale DatenForsch
ung
Nachnutzung
Archivierun
g
Plan
ung
Datenerhaltung
Metad
aten
Dokumentation
IT-Empfehlungen
IANUSc/o Deutsches Archäologisches Institut Podbielskiallee 69-71 D-14195 BerlinTel.: +49-(0)30-187711-359
ProjektleitungProf. Dr. Friederike FlessProf. Dr. Ortwin Dally
ProjektmanagementMaurice Heinrich Dr. Felix F. Schäfer
Weitere Infoshomepage: http://www.ianus-fdz.detwitter: @Ianus_fdzfacebook: IANUS-Forschungsdatenzentrumyoutube: IANUS-Forschungsdatenzentrum
Recommended