30
RADAR Matthias Razum 30. April 2014 dbv – Sektion 4: Frühjahrssitzung 2014

Matthias Razum 30. April 2014 dbv – Sektion 4 ......Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 Several researchers describe particular research support services

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • RADAR Matthias Razum 30. April 2014 dbv – Sektion 4: Frühjahrssitzung 2014

    http://creativecommons.org/licenses/by-sa/3.0/

  • Seite

    Agenda

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 2

    Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service

  • Seite

    Motivation /1

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 3

    Several researchers describe particular research support services they lack. Data management and storage topped the list of gaps in research tools and services. A Slice of Research Life: Information Support for Research in the US S. Kroll and R. Forsman: “A Slice of Research Life: Information Support for Research in the United States”, Report commissioned by OCLC Research in support of the RLG partnership, published online at http://www.oclc.org/research/publications/library/2010/2010-15.pdf, June 2010

  • Seite

    Motivation /2

    Empfehlung 7 Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern […] für zehn Jahre aufbewahrt werden. DFG-Regeln zur guten wissenschaftlichen Praxis Deutsche Forschungsgemeinschaft. (1998). Vorschläge zur Sicherung guter wissenschaftlicher Praxis: Empfehlungen der Kommission „Selbstkontrolle in der Wissenschaft“ (Denkschrift). Weinheim: Wiley-VCH.

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 4

  • Seite

    Motivation /3

    Library

    Publication

    Manuscript

    Private Files

    Data Metadata

    J. Helly, H. Staudigel, and A. Koppers, Scalable models of data sharing in Earth sciences, Geochem. Geophys. Geosyst., 4(1),1010, doi:10.1029/2002GC000318, 2003

    Research

    5 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014

  • Seite

    RADAR – Research Data Repositorium

    „Neuausrichtung überregionaler Informationsservices“ Themenfeld 4: Forschungsnahe Informationsinfrastruktur

    Laufzeit: 01.09.2013 bis 30.08.2015; gefördert durch

    Option auf 3. Jahr Förderung nach Evaluierung

    www.radar-projekt.de

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 6

    http://www.radar-projekt.de/

  • Seite

    RADAR – Ziele

    Forschungsdatenarchivierung als generische Dienstleistung

    Zweistufiger Ansatz zur Archivierung von Forschungsdaten: disziplinübergreifendes Einstiegsangebot höherwertiges Angebot mit integrierter Datenpublikation

    Keine Konkurrenz zu etablierten disziplinären Datenzentren

    Tragfähiges Geschäftsmodell

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 7

  • Seite

    Projektpartner

    Technische Informationsbibliothek (TIB) Hannover

    Ludwig-Maximilians-Universität München (LMU) Fakultät für Chemie und Pharmazie

    Leibniz-Institut für Pflanzenbiochemie (IPB)

    Karlsruher Institut für Technologie (KIT) Steinbuch Centre for Computing (SCC)

    FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur (FIZ)

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 8

  • Seite

    Die Partner und ihre Kompetenzen

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 9

    Geschäftsmodell

    SW-Entwicklung

    Primärdaten- publikation

    RZ-Betrieb

    Langzeitarchivierung

    Wissenschaftliche Anforderungen

    IPB LMU

    TIB SCC

    FIZ

    RADAR Kontakt zu Verlagen und Fachgesellschaften

  • Seite

    Arbeitspakete

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 10

    AP 1: Projektmanagement (TIB/FIZ)

    AP 2: Anforderungs-

    analyse

    (IPB/LMU)

    AP 3: Metadaten-

    profile

    (IPB/LMU, TIB)

    AP 4: Daten-

    management

    (FIZ/SCC)

    AP 5: Daten-

    publikation

    (TIB)

    AP 6: Geschäfts-modell und

    Rahmen-bedingungen

    (FIZ, SCC)

    AP 7: Evaluierung (IPB/LMU)

  • Seite

    Domänenmodell nach Treloar et al.

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 11

  • Seite

    Domänenmodell für Forschungsdaten

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 12

    1. Domäne „privat“

    (Arbeitsplatz des Wissenschaftlers)

    2. Domäne „kollaborativ“ (Infrastruktur des

    Instituts)

    3. Domäne „öffentlich“

    (Archiv)

    4. Domäne „Dissemination“

    (Fachportale)

    GetInfo (Disziplinspezifische Portale)

    Bitstream Preservation Persistent Identifier Datenpublikation Geschäftsmodell Infrastruktur Software SLA/Verträge (Funktionale LZA)

    Workflows / Auswahl der Daten

    Datenformate

    Datentypen

    Formatkonvertierung

    Metadatenprofile für Archivierung

    MD-Profile

    DataCite Verlage

  • Seite

    Agenda

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 13

    Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service

  • Seite 14 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014

    Das Paradigma

    Bitstream Preservation

    Ingest

    Content Preservation

    Bereitstellung/Access

    Pre-Ingest/Datenauswahl

    Die meisten Kostenmodelle versuchen alle Aufgaben der LZA adäquat in einem Modell abzubilden, z. B. nach OAIS-Funktionalität (s. CMPD-Modell, Royal Library of Denmark)

  • Seite

    Bitstream Preservation

    15 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014

    Kostenmodelle für LZA

    Relativ einfach zu kalkulieren Relativ schwer zu kalkulieren

    Kosten abhängig von Datenmenge (inkl. Anzahl Kopien)

    Kosten abhängig von Datenkomplexität

    Langfristige/Dauerhafte Kosten Einmalig/temporäre Kosten

    Content Preservation (z. B. Migration und Emulation)

    Im Rahmen institutioneller Förderung finanzierbar

    Im Rahmen projektbezogener Förderung finanzierbar

  • Seite

    Bitstream Preservation

    16 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014

    Kostenmodelle für LZA

    Relativ einfach zu kalkulieren Relativ schwer zu kalkulieren

    Kosten abhängig von Datenmenge (inkl. Anzahl Kopien)

    Kosten abhängig von Datenkomplexität

    Langfristige/Dauerhafte Kosten Einmalig/temporäre Kosten

    Content Preservation (z. B. Migration und Emulation)

    Im Rahmen institutioneller Förderung finanzierbar

    Im Rahmen projektbezogener Förderung finanzierbar

  • Seite

    Betrachtung von Kostenfaktoren

    Hardware-Kosten sinken kontinuierlich Administrationskosten blieben weitgehend stabil Wartung und Softwarekosten steigen moderat Management/Reporting kann weitgehend

    automatisiert werden

    Relatives Risiko: Energiekosten

    Teuerster Schritt ist die Überwindung der „Curation Boundary“ einmalige Kosten!

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 17

    Quelle: Wikipedia Commons, Ildar Sagdejev. CC 3.0 BY SA

  • Seite

    Prognostizierte Kosten für Bitstream Preservation

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 18

    1. Jahr

    Speicherung

    10. Jahr 30. Jahr

    Aufbereitung der Daten für

    Archivierung und Access

    Speicherung (HW, Bänder,

    Energie)

    QA / Reporting

    SW-Erstellung QA / Reporting

    SW-Erstellung Management Management

    Projizierte Entwicklung der Kostenanteile pro Speichereinheit (Symbolische Darstellung!)

  • Seite 19 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014

    Kostenentwicklung für Bitstream Preservation über die Zeit

    Vgl.: Beagrie: 2011: Keeping Research Data Safe Factsheet

  • Seite

    Speicherkostenentwicklung (Disk)

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 20

    Prognose Unvollständige Daten

    0,00

    1,00

    2,00

    3,00

    4,00

    5,00

    6,00

    7,00

    8,00

    9,00

    10,00

    11,00

    12,00

    13,00

    14,00

    15,00

    16,00

    17,00

    18,00

    2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014

    Kosten pro TB Hardware (in T€)

    Kosten pro TB Software (in T€)

    Kosten pro TB Wartung (in T€)

    Kosten pro TB Gesamt (in T€)

  • Seite

    Agenda

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 21

    Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service

  • Seite

    Zielgruppen für RADAR

    Forscher Forschungsdaten aus Projekten

    Bibliotheken Institutionelles Angebot zum

    Forschungsdatenmanagement

    Kultureinrichtungen Digitalisate (Access-/Masterkopien)

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 22

    Quelle: Wikipedia Commons, Arthurrh. CC 3.0 BY SA

  • Seite

    Bezahlmodelle

    Einmalzahlung Kompatibel mit Finanzstrukturen von Forschungsprojekten Für Dauer einer Haltefrist (z.B. 10 Jahre) oder „ewig“

    Jährliche Zahlung (Wahrscheinlich) sinkende Kosten pro Jahr Für institutionelle Nutzer

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 23

  • Seite

    Nachhaltiges Geschäftsmodell: Erste Überlegungen

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 24

    Kunden

    Stiftung

    Dienstleister

    Bezahlung

    Daten

    Beauftragung

    Quelle: Wikipedia Commons, ChrisO. CC 3.0 BY SA

  • Seite

    Agenda

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 25

    Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service

  • Seite

    LZA als Service

    Verlässlicher Speicherplatz für Digitalisate/Forschungsdaten Datenaufbereitung (Pre-Ingest) Erzeugung technischer Metadaten Übernahme beschreibender Metadaten Erfassung von Lizenz-Metadaten Vergabe persistenter Identifier Verwaltung von Zugriffsrechten Bereitstellung von Zugriffskopien Datenpublikation

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 26

    Quelle: Wikipedia Commons, Simon A. Eugster. CC 3.0 BY SA

  • Seite

    Beispiel: Verlässlicher Speicherplatz

    Mehrfach redundante Speicherung an geografisch verteilten Orten langsamer Zugriff (im Stundenbereich) lange Wiederherstellungszeiten im Katastrophenfall (im

    Wochenbereich) Regelmäßige Überprüfung der Datenkonsistenz inkl. Reporting Zugriff nur für datengebende Einrichtung bzw. autorisierte Partei und

    Betreiber möglich Vergabe persistenter Identifier Verwaltung von Speicherplatz-Quotas Versionierung

    Bitstream Preservation, keine funktionale Langzeiterhaltung!

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 27

  • Seite

    Offenes System mit APIs

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 28

    1. Domäne „privat“

    (Arbeitsplatz des Wissenschaftlers)

    2. Domäne „kollaborativ“ (Infrastruktur des

    Instituts)

    3. Domäne „öffentlich“

    (Archiv)

    4. Domäne „Dissemination“

    (Fachportale)

    Ingest API

    Access API

    Enrichment API

    z.B. DataCite, Verlage, bw-FLA

  • Seite

    Schematische Architektur

    Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 29

    Benutzungsoberfläche

    Repository

    Hardware

    Rechenzentrum

    RZ Services

    API

    Management

    Compute Storage

    LL Cache

    HL Cache

    Ingest

  • Fragen?

    [email protected]

    http://creativecommons.org/licenses/by-sa/3.0/

    RADARFoliennummer 2Motivation /1Motivation /2Motivation /3RADAR – Research Data RepositoriumRADAR – ZieleProjektpartnerDie Partner und ihre KompetenzenArbeitspaketeDomänenmodell nach Treloar et al.Domänenmodell für Forschungsdaten Foliennummer 13Das ParadigmaKostenmodelle für LZAKostenmodelle für LZABetrachtung von KostenfaktorenPrognostizierte Kosten �für Bitstream PreservationKostenentwicklung für Bitstream Preservation über die Zeit Speicherkostenentwicklung (Disk)Foliennummer 21Zielgruppen für RADARBezahlmodelleNachhaltiges Geschäftsmodell:�Erste ÜberlegungenFoliennummer 25LZA als ServiceBeispiel: Verlässlicher SpeicherplatzOffenes System mit APIs Schematische ArchitekturFoliennummer 30