26
Frauke Ziedorn Meeting TIB/DataCite - DLR - EUMETSAT 22./23.05.2014 TIB DOI-Service und DataCite PIDs, Best Practices

TIB DOI-Service und DataCite - PIDs, Best Practices

Embed Size (px)

Citation preview

Page 1: TIB DOI-Service und DataCite - PIDs, Best Practices

Frauke Ziedorn

Meeting TIB/DataCite - DLR - EUMETSAT22./23.05.2014

TIB DOI-Service und DataCitePIDs, Best Practices

Page 2: TIB DOI-Service und DataCite - PIDs, Best Practices

2

• Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik

• Bund-Länder-finanziert, Mitglied der Leibniz-Gemeinschaft (WGL)

• Alle 7 Jahre Evaluierung durch externe international besetzte Gutachtergruppe (zuletzt 02.2011)

• Ergebnis (u.a.): Besonders hervorzuheben ist dabei der Betrieb der nationalen DOI-Registrierungsagentur zur Referenzierung von Forschungsdaten. Mit ihr bietet die TIB einen innovativen und bedeutenden Dienst an, der auch international wahrgenommen wird.

Die Technische Informationsbibliothek

Page 3: TIB DOI-Service und DataCite - PIDs, Best Practices

3

Historie der DOI-Registrierung

• 2003:DFG Projekt der TIB mit World DataCenters bzgl. Publikation von Forschungsdaten

• 2005:TIB wird erste DOI-Registrierungsagentur für Forschungsdaten. Von Anfang an wird auch graue Literatur registriert.

• 03.2009:Paris Memorandum bzgl. der Zusammenarbeit von 6 europäischen Informationseinrichtungen

• 12.2009:Gründung von DataCite mit 7 Mitgliedern

• 03.2014:22 Mitglieder, 9 assoziierte Mitglieder aus 18 Ländern der Kontinente Amerika, Europa, Afrika, Asien und Australien.

Page 4: TIB DOI-Service und DataCite - PIDs, Best Practices

4

PIDs

• DOI

• Zitierung von wissenschaftlichen Publikationen

• In der wissenschaftlichen Gemeinschaft anerkannt

• Auflösen möglich über jeden Handle Server oder http://dx.doi.org/{doi}

• Verantwortung und Garantien für Persistenz und Datenqualität

• Handle

• Globales Referenzieren von Daten vor der Publikation

• Auflösen möglich über jeden Handle Server

• Keine Persistenz, keine gesicherten Verantwortlichkeiten

Page 5: TIB DOI-Service und DataCite - PIDs, Best Practices

5

PIDs

• URN• Referenzieren lokaler Dokumente innerhalb eines geschlossenen

Systems (z.B. Hochschulschriften)• Auflösung nur auf Server des Herausgebers• Persistenz und Datenqualität werden gewährleistet

• ARK• Dokumente aller Arbeitsprozesse• Möglichkeit “persistence declaration” abzugeben• ARKs können auch gelöscht werden• Auflösen nur kostenfrei auf dem eigenen Server möglich, Kosten

entstehen bei Nutzung des globalen n2t.net Resolvers• Qualitätsmanagement, keine Persistenzgarantie

Page 6: TIB DOI-Service und DataCite - PIDs, Best Practices

6

ARK

• origins in the library, archive, and museum (LAM) community (e.g., the Internet Archive has 4 million ARKs, the National Library of France has 20 million ARKs, natural history museums are using ARKs for specimens)

• applicable to any resource, whether digital, physical, or abstract, e.g., to vocabulary terms or people

• flexible metadata guidelines, depending on discipline and application • ability to declare different kinds of persistence, e.g., long-term retention

with absolute bit-level fixity, or long-term retention subject to update, or something in between

• ARKs are URLs, with the ability to retrieve metadata by appending '?' to the URL

• persistence declaration and organizational commitment retrievable by appending '??'

• a time-limited persistence declaration permits some ARKs to be deleted, as appropriate

• support for mixed case, allowing shorter identifiers in unique combinations

Eigenschaften

Informationen von Joan Starr (CDL / EZID)

Page 7: TIB DOI-Service und DataCite - PIDs, Best Practices

7

ARK

• no fees to assign or resolve ARKs via a local resolver; to use ARKs with the global n2t.net resolver you must be an EZID customer

• resolution based on simple web redirection, with open source tools available

• you can host ARKs on your own branded web server/resolver (e.g., the British Library uses ARKs this way)

• at low cost via EZID, you can host ARKs at a global resolver http://n2t.net/ ; this resolver is in the process of being replicated for high availability

• with respect to publication content, ARKs can be used for pre-prints, post-prints, and supporting artifacts

Anwendungsfälle

Informationen von Joan Starr (CDL / EZID)

Page 8: TIB DOI-Service und DataCite - PIDs, Best Practices

8

ARK

• support for the '?' and '??' inflections is inconsistent at the moment

• no standardization yet for persistence declarations

• currently there is no replication for the global n2t.net resolver

• In terms of the research data life cycle, we recommend the use of ARKs as a best practice for good data management by assigning unique identifiers (ARKs) to the data as part of the data documentation. Researchers benefit by keeping track of (and remembering) aspects of their data throughout the research project.

Schwächen

Informationen von Joan Starr (CDL / EZID)

Page 9: TIB DOI-Service und DataCite - PIDs, Best Practices

9

Das DOI® System

• 1998 Gründung der International DOI Foundation (IDF) als übergeordnete Organisation

• DOI ist eine geschützte Marke; seit Mai 2012 ISO Standard 26324

• DOI ist eine Vermarktung des technisch geprägten Handle Systems

• Teil der Qualitätskontrolle ist die verpflichtende Abgabe von Metadaten bei jeder DOI-Registrierung.

DOI®, DOI.ORG® and shortDOI® are trademarks of the International DOI Foundation

Page 10: TIB DOI-Service und DataCite - PIDs, Best Practices

10

DOI-Registrierungsagenturen

• CrossRef – Zeitschriftenartikel, Bücher, Konferenzberichte• DataCite – Forschungsdaten, Graue Literatur, nicht-textuelle Materialien• EIDR – Filme, TV Serien und andere kommerzielle Filmmaterialien

• Airiti, Inc. – Traditionale Chinesische Materialien• CNKI (China National Knowledge Infrastructure) - Chinesische e-Journals,

Zeitungen, Dissertationen, Konferenzbände u.m.• ISTIC (The Institute of Scientific and Technical Information of China) –

Zeitschriften des chinesischen Marktes• JaLC (Japan Link Center) – wissenschaftliche und akademische

Publikationen in Japan• mEDRA – Internet Dokumente

• OPOCE (Office des publications EU) – Dokumente der Europäischen Union

Page 11: TIB DOI-Service und DataCite - PIDs, Best Practices

11

DataCite

• Globales Konsortium getragen von lokalen Einrichtungen• Fokussiert auf die Verbesserung des Zugangs zu und der

Zitierung von Daten und anderen nicht-textuellen Inhalten• Gegründet am 1. Dezember 2009 in London• Working Groups / Staff:

• Metadata:Entwicklung des Metadaten Schemas in Zusammenarbeit mit der Community

• Business Practices:Entwicklung von Standards, Workflows und Best Practices

• Tech Team:Weiterentwicklung der technischen Infrastruktur

Page 12: TIB DOI-Service und DataCite - PIDs, Best Practices

12

Technische Informationsbibliothek (TIB)Canada Institute for Scientific and Technical Information (CISTI), California Digital Library, USAPurdue University, USAOffice of Scientific and Technical

Information (OSTI), USALibrary of TU Delft,

The NetherlandsTechnical Information

Center of DenmarkThe British LibraryZB MED, GermanyZBW, GermanyGesis, GermanyLibrary of ETH ZürichL’Institut de l’Information Scientifique

et Technique (INIST), FranceSwedish National Data Service (SND)Australian National Data Service (ANDS)Conferenza dei Rettori delle Università Italiane (CRUI)National Research Council of Thailand (NRCT)The Hungarian Academy of Sciences University of Tartu, EstoniaJapan Link Center (JaLC)South African Environmental Observation Network (SAEON)

European Organization for Nuclear Research (CERN)

DataCite Mitglieder

Affiliated members:Digital Curation Center (UK)Microsoft ResearchInteruniversity Consortium for Political and Social Research (ICPSR) Korea Institute of Science and Technology Information (KISTI) Bejiing Genomic Institute (BGI)IEEEHarvard University LibraryWorld Data System (WDS)GWDG

Page 13: TIB DOI-Service und DataCite - PIDs, Best Practices

13

Datenzentren bei DataCite

Mitglied

Datenzentren

Mitglied

Datenzentren

ANDS 14 INIST 10

BL 17 MTAKIK

4

CDL 100 NRCT 1

CISTI 8 OSTI 7

CRUI 18 PURDUE

9

DELFT 5 SND 3

DK 5 ZBMED

17

ETHZ 28 ZBW 4

GESIS 30

Gesamt 280

Page 14: TIB DOI-Service und DataCite - PIDs, Best Practices

14

TIB Datenzentren

Die TIB arbeit derzeit mit 60+ Datenzentren zusammen, die bereits >800.000 DOI-Namen registriert haben, z.B.:

• Publishing Network for Geoscientific & Environmental Data (PANGAEA)

• ZALF – Leibniz-Zentrum für Agrarlandschaftsforschung• HZB - Helmholtz-Zentrum Berlin• UB München• UB Konstanz• Bibliothek des KIT• Julius-Kühn-Institut

Außerdem vergibt die TIB auch DOI-Namen für von der TIB gespeicherte Dokumente, wie BMBF-Forschungsberichte und Fahrtberichte, und natürlich die Medien im AV-Portal.

Page 15: TIB DOI-Service und DataCite - PIDs, Best Practices

15

DataCite Working Groups

Metadata• 12 Mitglieder aus 7 Nationen• Erstellen des Metadaten Schemas• Kommunikation mit der Community• Google Diskussionsgruppe:

https://groups.google.com/forum/?hl=en&fromgroups#!forum/datacite-metadata

Business Practices• 9 Mitglieder aus 6 Nationen• Entwicklung von Empfehlungen zu Geschäftsmodellen;

Formulierung der DataCite Policy, Best Practices• Zusammenarbeit mit anderen DataCite Working Groups• Business Models Principles: doi:10.5438/0007

Page 16: TIB DOI-Service und DataCite - PIDs, Best Practices

16

Das DataCite Metadaten Schema

• Vorgabe der IDF, ein Mindestmaß an identifizierenden Metadaten vorzuhalten.

• Aktuelle Version ist 3.0.

• Ein Metadatenschema für die Verlinkung von Daten und anderen Objekten.

• Disziplinübergreifend.

• Auf Dublin Core basierend.

• DOI-Namen des Schemas:

• Dokumentation: doi:10.5438/0005

• Schema Definition: doi:10.5438/0006

Page 17: TIB DOI-Service und DataCite - PIDs, Best Practices

17

Das DataCite Metadaten Schema

• Identifier (mit type Attribut)

• Creator (mit type und nameIdentifier Attributen)

• Title (mit optionalem type Attribut)

• Publisher

• PublicationYear

• Zitierung:

Creator (PublicationYear): Title. Publisher. Identifier 

Pflichtfelder

Page 18: TIB DOI-Service und DataCite - PIDs, Best Practices

18

Das DataCite Metadaten Schema

• Subject (mit scheme Attribut)

• Contributor (mit type und nameIdentifier Attributen)

• Date (mit type Attribut)

• Language• ResourceType (mit description Attribut)

• AlternateIdentifier (mit type Attribut)

• RelatedIdentifier (mit type und relationType Attributen)

• Size• Format• Version• Rights• Description (mit type Attribut)

• GeoLocation (mit point, box und place)

Optionale und Recommended Felder

Page 19: TIB DOI-Service und DataCite - PIDs, Best Practices

19

• ‚nichtsprechende‘ Zeichenfolge• Zeichen für DOI-Namen:

• A – Z• a – z• 0 – 9• : (Doppelpunkt)• . (Punkt)• - (Bindestrich)• _ (Unterstrich)• / (Schrägstrich)

Keine Umlaute und Sonderzeichen!

http://www.tib-hannover.de/fileadmin/informationsmaterial/flyer/TIB_DOI_Service_DOKU_DT.pdf

Best PracticesDer DOI-Name

Page 20: TIB DOI-Service und DataCite - PIDs, Best Practices

20

Best Practices

Drei Ansätze zur DOI-Vergabe und Zitierung:

• Cite a specific time slice (the set of updates to the dataset made during a particular period of time);

• Cite a specific snap shot (a copy of the entire dataset made at a specific time);

• Cite the continuously updated dataset, but add an Access Date and Time to the citation.

Note that a “time slice” and “snap shot” are versions of the dataset and require unique identifiers. The third option is controversial, because it necessarily means that following the citation does not result in observation of the resource as cited.

DataCite Metadata Documentation

Dynamische Daten

Page 21: TIB DOI-Service und DataCite - PIDs, Best Practices

21

“DataCite clients are the custodians of their data and therefore define the granularity of the data to which they are assigning DOIs. Because the aim of DataCite is to make data citable, however, all data registered should be easily and clearly citable.”

DataCite Business Models Principles

Best PracticesGranularität

Page 22: TIB DOI-Service und DataCite - PIDs, Best Practices

22

Best Practices

• Es gilt wie bei der Granularität: Jedes Datenzentrum ist selbst für die Bestimmung von Versionen verantwortlich.

• Prinzip des „gesunden Menschenverstandes“ – kleinste Korrekturen erfordern keinen neuen DOI, es sei denn sie können große Auswirkungen haben.

• Kennzeichnung von Versionen: Punkt (.)• Kennzeichnung von Teilen eines Ganzen: Schrägstriche (/)Beispiele• Ursprungs-DOI: 10.1234/abc123• DOI einer neuen Version: 10.1234/abc123.1• DOI eines Teils: 10.1234/abc123/2

Versionierung

Page 23: TIB DOI-Service und DataCite - PIDs, Best Practices

23

Kooperationen

• ORCID• ODIN Projekt: http://odin-project.eu/

http://datacite.labs.orcid-eu.org/

• re3data.org und Databib• Übernahme der Repository Listen:

http://www.datacite.org/node/115

• STM und DataCite Joint Statement (2012)• bi-directional linking, increase visibility of these links:

http://www.datacite.org/node/65

• Research Data Alliance (RDA)• MoU – organizational affiliate

Page 24: TIB DOI-Service und DataCite - PIDs, Best Practices

24

DataCite Services I

• http://mds.datacite.orgMetadata Store Userinterface zum manuellen Registrieren von DOIs und Hochladen von Metadaten

• http://schema.datacite.orgZugang zu allen Versionen des DataCite Metadatenschemas, mit Dokumentation, Schema Definition und Beispielen

• http://search.datacite.orgSuchmaschine für alle von DataCite gespeicherten Metadaten

• http://stats.datacite.orgStatistiken zu Registrierungen und Aufrufen von DOI-Namen

• http://test.datacite.orgTest-Umgebung der gesamten DataCite Infrastruktur

Page 25: TIB DOI-Service und DataCite - PIDs, Best Practices

25

DataCite Services II

• http://data.datacite.org DataCite Content Service stellt Metadaten in verschiedenen Formaten bereit.

In Zusammenarbeit mit CrossRef:

• http://crosscite.org/citeproc Der Citation Formater stellt Zitierungen in über 100 Formaten bereit.

• http://crosscite.org/cn/ Über die Content Negotiation kann maschinell direkt auf verschiedene (vorher hinterlegte) Medienformate eines Objektes zugegriffen werden.

Page 26: TIB DOI-Service und DataCite - PIDs, Best Practices

Vielen Dank für Ihre Aufmerksamkeit!