Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
RADAR Matthias Razum 30. April 2014 dbv – Sektion 4: Frühjahrssitzung 2014
http://creativecommons.org/licenses/by-sa/3.0/
Seite
Agenda
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 2
Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service
Seite
Motivation /1
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 3
Several researchers describe particular research support services they lack. Data management and storage topped the list of gaps in research tools and services. A Slice of Research Life: Information Support for Research in the US S. Kroll and R. Forsman: “A Slice of Research Life: Information Support for Research in the United States”, Report commissioned by OCLC Research in support of the RLG partnership, published online at http://www.oclc.org/research/publications/library/2010/2010-15.pdf, June 2010
Seite
Motivation /2
Empfehlung 7 Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern […] für zehn Jahre aufbewahrt werden. DFG-Regeln zur guten wissenschaftlichen Praxis Deutsche Forschungsgemeinschaft. (1998). Vorschläge zur Sicherung guter wissenschaftlicher Praxis: Empfehlungen der Kommission „Selbstkontrolle in der Wissenschaft“ (Denkschrift). Weinheim: Wiley-VCH.
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 4
Seite
Motivation /3
Library
Publication
Manuscript
Private Files
Data Metadata
J. Helly, H. Staudigel, and A. Koppers, Scalable models of data sharing in Earth sciences, Geochem. Geophys. Geosyst., 4(1),1010, doi:10.1029/2002GC000318, 2003
Research
5 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014
Seite
RADAR – Research Data Repositorium
„Neuausrichtung überregionaler Informationsservices“ Themenfeld 4: Forschungsnahe Informationsinfrastruktur
Laufzeit: 01.09.2013 bis 30.08.2015; gefördert durch
Option auf 3. Jahr Förderung nach Evaluierung
www.radar-projekt.de
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 6
http://www.radar-projekt.de/
Seite
RADAR – Ziele
Forschungsdatenarchivierung als generische Dienstleistung
Zweistufiger Ansatz zur Archivierung von Forschungsdaten: disziplinübergreifendes Einstiegsangebot höherwertiges Angebot mit integrierter Datenpublikation
Keine Konkurrenz zu etablierten disziplinären Datenzentren
Tragfähiges Geschäftsmodell
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 7
Seite
Projektpartner
Technische Informationsbibliothek (TIB) Hannover
Ludwig-Maximilians-Universität München (LMU) Fakultät für Chemie und Pharmazie
Leibniz-Institut für Pflanzenbiochemie (IPB)
Karlsruher Institut für Technologie (KIT) Steinbuch Centre for Computing (SCC)
FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur (FIZ)
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 8
Seite
Die Partner und ihre Kompetenzen
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 9
Geschäftsmodell
SW-Entwicklung
Primärdaten- publikation
RZ-Betrieb
Langzeitarchivierung
Wissenschaftliche Anforderungen
IPB LMU
TIB SCC
FIZ
RADAR Kontakt zu Verlagen und Fachgesellschaften
Seite
Arbeitspakete
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 10
AP 1: Projektmanagement (TIB/FIZ)
AP 2: Anforderungs-
analyse
(IPB/LMU)
AP 3: Metadaten-
profile
(IPB/LMU, TIB)
AP 4: Daten-
management
(FIZ/SCC)
AP 5: Daten-
publikation
(TIB)
AP 6: Geschäfts-modell und
Rahmen-bedingungen
(FIZ, SCC)
AP 7: Evaluierung (IPB/LMU)
Seite
Domänenmodell nach Treloar et al.
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 11
Seite
Domänenmodell für Forschungsdaten
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 12
1. Domäne „privat“
(Arbeitsplatz des Wissenschaftlers)
2. Domäne „kollaborativ“ (Infrastruktur des
Instituts)
3. Domäne „öffentlich“
(Archiv)
4. Domäne „Dissemination“
(Fachportale)
GetInfo (Disziplinspezifische Portale)
Bitstream Preservation Persistent Identifier Datenpublikation Geschäftsmodell Infrastruktur Software SLA/Verträge (Funktionale LZA)
Workflows / Auswahl der Daten
Datenformate
Datentypen
Formatkonvertierung
Metadatenprofile für Archivierung
MD-Profile
DataCite Verlage
Seite
Agenda
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 13
Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service
Seite 14 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014
Das Paradigma
Bitstream Preservation
Ingest
Content Preservation
Bereitstellung/Access
Pre-Ingest/Datenauswahl
Die meisten Kostenmodelle versuchen alle Aufgaben der LZA adäquat in einem Modell abzubilden, z. B. nach OAIS-Funktionalität (s. CMPD-Modell, Royal Library of Denmark)
Seite
Bitstream Preservation
15 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014
Kostenmodelle für LZA
Relativ einfach zu kalkulieren Relativ schwer zu kalkulieren
Kosten abhängig von Datenmenge (inkl. Anzahl Kopien)
Kosten abhängig von Datenkomplexität
Langfristige/Dauerhafte Kosten Einmalig/temporäre Kosten
Content Preservation (z. B. Migration und Emulation)
Im Rahmen institutioneller Förderung finanzierbar
Im Rahmen projektbezogener Förderung finanzierbar
Seite
Bitstream Preservation
16 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014
Kostenmodelle für LZA
Relativ einfach zu kalkulieren Relativ schwer zu kalkulieren
Kosten abhängig von Datenmenge (inkl. Anzahl Kopien)
Kosten abhängig von Datenkomplexität
Langfristige/Dauerhafte Kosten Einmalig/temporäre Kosten
Content Preservation (z. B. Migration und Emulation)
Im Rahmen institutioneller Förderung finanzierbar
Im Rahmen projektbezogener Förderung finanzierbar
Seite
Betrachtung von Kostenfaktoren
Hardware-Kosten sinken kontinuierlich Administrationskosten blieben weitgehend stabil Wartung und Softwarekosten steigen moderat Management/Reporting kann weitgehend
automatisiert werden
Relatives Risiko: Energiekosten
Teuerster Schritt ist die Überwindung der „Curation Boundary“ einmalige Kosten!
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 17
Quelle: Wikipedia Commons, Ildar Sagdejev. CC 3.0 BY SA
Seite
Prognostizierte Kosten für Bitstream Preservation
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 18
1. Jahr
Speicherung
10. Jahr 30. Jahr
Aufbereitung der Daten für
Archivierung und Access
Speicherung (HW, Bänder,
Energie)
QA / Reporting
SW-Erstellung QA / Reporting
SW-Erstellung Management Management
Projizierte Entwicklung der Kostenanteile pro Speichereinheit (Symbolische Darstellung!)
Seite 19 Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014
Kostenentwicklung für Bitstream Preservation über die Zeit
Vgl.: Beagrie: 2011: Keeping Research Data Safe Factsheet
Seite
Speicherkostenentwicklung (Disk)
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 20
Prognose Unvollständige Daten
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
11,00
12,00
13,00
14,00
15,00
16,00
17,00
18,00
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
Kosten pro TB Hardware (in T€)
Kosten pro TB Software (in T€)
Kosten pro TB Wartung (in T€)
Kosten pro TB Gesamt (in T€)
Seite
Agenda
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 21
Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service
Seite
Zielgruppen für RADAR
Forscher Forschungsdaten aus Projekten
Bibliotheken Institutionelles Angebot zum
Forschungsdatenmanagement
Kultureinrichtungen Digitalisate (Access-/Masterkopien)
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 22
Quelle: Wikipedia Commons, Arthurrh. CC 3.0 BY SA
Seite
Bezahlmodelle
Einmalzahlung Kompatibel mit Finanzstrukturen von Forschungsprojekten Für Dauer einer Haltefrist (z.B. 10 Jahre) oder „ewig“
Jährliche Zahlung (Wahrscheinlich) sinkende Kosten pro Jahr Für institutionelle Nutzer
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 23
Seite
Nachhaltiges Geschäftsmodell: Erste Überlegungen
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 24
Kunden
Stiftung
Dienstleister
Bezahlung
Daten
Beauftragung
Quelle: Wikipedia Commons, ChrisO. CC 3.0 BY SA
Seite
Agenda
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 25
Das DFG-Projekt RADAR Kostenmodelle der LZA Geschäftsmodell für RADAR LZA als Service
Seite
LZA als Service
Verlässlicher Speicherplatz für Digitalisate/Forschungsdaten Datenaufbereitung (Pre-Ingest) Erzeugung technischer Metadaten Übernahme beschreibender Metadaten Erfassung von Lizenz-Metadaten Vergabe persistenter Identifier Verwaltung von Zugriffsrechten Bereitstellung von Zugriffskopien Datenpublikation
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 26
Quelle: Wikipedia Commons, Simon A. Eugster. CC 3.0 BY SA
Seite
Beispiel: Verlässlicher Speicherplatz
Mehrfach redundante Speicherung an geografisch verteilten Orten langsamer Zugriff (im Stundenbereich) lange Wiederherstellungszeiten im Katastrophenfall (im
Wochenbereich) Regelmäßige Überprüfung der Datenkonsistenz inkl. Reporting Zugriff nur für datengebende Einrichtung bzw. autorisierte Partei und
Betreiber möglich Vergabe persistenter Identifier Verwaltung von Speicherplatz-Quotas Versionierung
Bitstream Preservation, keine funktionale Langzeiterhaltung!
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 27
Seite
Offenes System mit APIs
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 28
1. Domäne „privat“
(Arbeitsplatz des Wissenschaftlers)
2. Domäne „kollaborativ“ (Infrastruktur des
Instituts)
3. Domäne „öffentlich“
(Archiv)
4. Domäne „Dissemination“
(Fachportale)
Ingest API
Access API
Enrichment API
z.B. DataCite, Verlage, bw-FLA
Seite
Schematische Architektur
Matthias Razum: RADAR | dbv Sektion 4: Frühjahrssitzung 2014 29
Benutzungsoberfläche
Repository
Hardware
Rechenzentrum
RZ Services
API
Management
Compute Storage
LL Cache
HL Cache
Ingest
Fragen?
http://creativecommons.org/licenses/by-sa/3.0/
RADARFoliennummer 2Motivation /1Motivation /2Motivation /3RADAR – Research Data RepositoriumRADAR – ZieleProjektpartnerDie Partner und ihre KompetenzenArbeitspaketeDomänenmodell nach Treloar et al.Domänenmodell für Forschungsdaten Foliennummer 13Das ParadigmaKostenmodelle für LZAKostenmodelle für LZABetrachtung von KostenfaktorenPrognostizierte Kosten �für Bitstream PreservationKostenentwicklung für Bitstream Preservation über die Zeit Speicherkostenentwicklung (Disk)Foliennummer 21Zielgruppen für RADARBezahlmodelleNachhaltiges Geschäftsmodell:�Erste ÜberlegungenFoliennummer 25LZA als ServiceBeispiel: Verlässlicher SpeicherplatzOffenes System mit APIs Schematische ArchitekturFoliennummer 30