23
RADAR DINI Jahrestagung 2017 Göttingen, 05. Oktober 2017 Archivierung und Publikation von Forschungsdaten Matthias Razum

RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

RADAR

DINI Jahrestagung 2017 Göttingen, 05. Oktober 2017

Archivierung und Publikation von Forschungsdaten Matthias Razum

Page 2: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

RADAR IN A NUTSHELL

VOM PROJEKT ZUM PRODUKT

AUSBLICK

Page 3: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

RADAR – RESEARCH DATA REPOSITORY

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 3

RADAR (Research Data Repository) ist ein

• disziplinübergreifendes Forschungsdatenrepositorium

• für die Archivierung und Publikation von Forschungsdaten

• abgeschlossener wissenschaftlicher Studien und Projekte.

Gefördert durch die DFG von September 2013 – August 2016

Keine Konkurrenz zu etablierten disziplinären Datenzentren

• Schwerpunkt „Long tail“

Page 4: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

DER ‚LONG TAIL‘ IST WICHTIG

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 4

“The majority of datasets produced through research are part of the

‘Long Tail of Research Data’”

Source: Humphrey C (2014): OpenAIRE-COAR Conference, Athens

Source: Ferguson et al. (2014): Big

data from small data: data-sharing in

the 'long tail' of neuroscience.

DOI: 10.1038/nn.3838

Page 5: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

FORSCHUNGSDATEN SIND NICHT IMMER „BIG DATA“

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 5

Science Survey 2011:

• 48 % of respondents were working with datasets that were <1GB in size

• 50 % stored data exclusively! in labs

Source: Science (2011): 331(6018), p. 692-693. DOI: 10.1126/science.331.6018.692

Page 6: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

LEBENSZYKLUS UND FOKUS

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 6

Page 7: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

SERVICE LEVEL VON RADAR

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 7

Datenarchivierung mit Publikation

• Unbegrenzte Haltefrist (mindestens 25 Jahre)

• Optionale Embargos

• Vergabe eines DOI (DataCite)

• Schnittstelle für Peer Review

• Auswahl von Lizenzen, kein CC0 erforderlich

• Metadaten indexiert (RADAR, DataCite, Google)

Quelle: Wikipedia Commons, Simon A. Eugster. CC 3.0 BY SA

Datenarchivierung

• „dark archive“

• Flexible Haltefrist (5, 10, 15 Jahre)

• Datengeber bestimmen Zugriffsrechte

(privat/geteilt/öffentlich)

Page 8: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

ROLLEN UND HIERARCHISCHE ORGANISATION DER INHALTE

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 8

Administrator

(Sub-)Kurator

Administrator

Kurator

Administrator Contract

Workspace

Dataset

Folder

File File

File

Dataset

File

Workspace

Page 9: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

DATENSICHERHEIT

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 9

• Für archivierte/publizierte Daten:

• Datenpakete werden mit einer Checksum versehen

• Nach dem Schreiben wird Checksum direkt geprüft

• Drei Kopien an drei Standorten (2x Karlsruhe, 1x Dresden)

• Unterschiedliche Hard- und Software sowie Administration

• Regelmäßige Migration auf neue Speichermedien, dabei Prüfung der

Datenintegrität

• Für temporäre Daten

• Redundantes Plattensystem (RAID-6) mit täglicher Sicherung

Quelle: SCC, Karlsruher Institute for Technology (KIT)

Page 10: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

SCHEMATISCHE ARCHITEKTUR

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 10

KIT/SCC

Management Layer / Repository

RZ API RZ API

API API

TU Dresden/ZIH

RZ API RZ API

Rechenzentrum X

RZ API RZ API

User Interface A User Interface B

HPSS / dCache iRODS ???

GUI

Page 11: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

RADAR IN A NUTSHELL

VOM PROJEKT ZUM PRODUKT

AUSBLICK

Page 12: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

KOOPERATIONSPARTNER

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 12

Beratung, Marketing und Öffentlichkeitsarbeit

Datenarchivierung und IT-Infrastruktur

Datenarchivierung

Vergabe von DOI

Page 13: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

AUS DER COMMUNITY – FÜR DIE COMMUNITY

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 13

Fach-öffentlich-

keit

Fach-öffentlich-

keit

• Workshops

• Präsentationen

• Publikationen

Wissen-schaftlicher

Beirat

Wissen-schaftlicher

Beirat

• Beratung

• Evaluierung

Nutzer Nutzer • Testsystem

• Feedback „Aufbau muss bedarfsgetrieben erfolgen“

Page 14: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

ZIELGRUPPEN

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 14

• Hochschulen und außerhochschulische Forschungseinrichtungen

• Institutionelles Angebot zum Forschungsdatenmanagement

• Integration mit existierenden institutionellen Portalen

• Forscher

• Publikation und Archivierung von Forschungsdaten aus Projekten

• Kultureinrichtungen

• Langzeitarchivierung von Digitalisaten (Master)

• Access-Kopien für Online-Zugriff

Quelle: Wikipedia Commons, Arthurrh. CC 3.0 BY SA

Page 15: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

MARKT

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 15

427 Hochschulen in Deutschland, davon geschätzt ca. 250 forschende

Hochschulen (2015/16)

• 955 außeruniversitäre Forschungseinrichtungen (2014)

Ziel für die ersten 5 Jahre:

• 30 Verträge

• Gesamtvolumen der archivierten/publizierten Daten: 1 PB (= 1 Mio. GB)

Quelle: destatis

Quelle: Wikimedia Commons/Ildar Sagdejev, CC-BY-SA 3.0

Page 16: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

PREIS FÜR „ARCHIVIERUNG“

Hinzu kommt jährliche Grundgebühr von 500,00 € (netto) pro Vertrag

• temporärer Speicher (200 GB)

• Vertragsmanagement

Anteil Fixkosten 0,17 € Variable Kosten 0,18 € Risikozuschlag 0,04 € Mehrwertsteuer 0,07 €

pro Jahr/GB (netto) 0,46 €

Anteil Fixkosten 0,17 € Variable Kosten 0,18 € Risikozuschlag 0,04 € Mehrwertsteuer 0,07 €

pro Jahr/GB (netto) 0,46 €

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 16

Page 17: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

PREIS FÜR „ARCHIVIERUNG MIT PUBLIKATION“ (EINMALZAHLUNG)

• Berücksichtigung der Personalkosten nur in den ersten 5 Jahren

• Risikozuschlag bei 200%

• 34,7 % Rabatt bei Speicherung von 1 GB über 25 Jahre: 7,58 € statt 25*0,46 €

= 11,50 €

Anteil Fixkosten (5 Jahre) 1,13 € Variable Kosten 2,97 € Risikozuschlag (200%) 2,27 € Mehrwertsteuer 1,21 €

25+ Jahre/GB 7,58 €

Anteil Fixkosten (5 Jahre) 1,13 € Variable Kosten 2,97 € Risikozuschlag (200%) 2,27 € Mehrwertsteuer 1,21 €

25+ Jahre/GB 7,58 €

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 17

Page 18: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

UND DIE ANDEREN?

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 18

• Freie Lizenzwahl (CC0 nur für Metadaten gefordert)

• Daten unterliegen deutscher Jurisdiktion

• Neben Datenpublikation auch reine Archivierung

• 25 Jahre garantierte Haltefrist für publizierte Daten

• Schnittstellen zur Einbindung in eigene Infrastruktur

• Rollenkonzept mit delegierter Administration

• Datensparsamkeit

Page 19: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

RADAR IN A NUTSHELL

VOM PROJEKT ZUM PRODUKT

AUSBLICK

Page 20: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

WAS KOMMT ALS NÄCHSTES?

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 20

• Weitere Nutzer gewinnen

• Geschäftsplan sieht 3 Nutzer im ersten Jahr vor (bisher vier Verträge)

• Hochschulen als erste Nutzergruppe

• Leibniz-Institute folgen als zweite Kundengruppe

• Weiterentwicklung des Geschäftsmodells

• Konsortien

• Inhouse-/Hybrid-Nutzung

• Zertifizierung (Core Trust Seal)

Quelle: Wikimedia Commons/User:Tasma3197, CC-BY-SA 3.0

Page 21: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

REPRISE: LONG TAIL

„The amount of data needed for research has grown tenfold

within the last four years”

Mikko Hakala, Aalto University

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 21

Page 22: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

FUNKTIONALE ERWEITERUNGEN DER SOFTWARE

RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 22

• Effiziente Unterstützung großer Datenvolumina

• Alternative Datenübertragungsmethoden (GridFTP)

• Projektion

• „Streaming“

• Versionierung

• Verbesserte Unterstützung fachspezifischer Metadaten

• EduGAIN (bisher DFN-AAI)

• Lösung für besonders schutzbedürftige Daten (personenbezogen,

Auftragsforschung)

• Erweiterte Administrationsmöglichkeiten

Page 23: RADAR Archivierung und Publikation von ForschungsdatenDER ‚LONG TAIL‘ IST WIHTIG 4 RADAR - Archivierung und Publikation von Forschungsdaten - Göttingen, 05.10.2017 “The majority

Except where otherwise noted, content on this site is licensed under a Creative Commons Attribution 4.0

International License.

FRAGEN?

[email protected] Twitter: @RADAR_Service