38
Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Network Fachbereich Physik Carl von Ossietzky-Universitä Oldenburg [email protected] Berlin, 7.7.200

Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Embed Size (px)

Citation preview

Page 1: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Wissenschaftliche Dokumentenserver:Nutzer - Standards - Management

Thomas Severiens

Institute for Science NetworkingFachbereich PhysikCarl von Ossietzky-UniversitätOldenburg

[email protected]

Berlin, 7.7.2000

Page 2: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Anforderungen an ein Dokumentenarchiv

Berlin, 7.7.20002

benötigter Rahmen:Standards: MetaDaten

DC / vcard RDF

XML RDF MathML CML

DigSig

Dienste information systems qualifying systems

Werkzeuge Suchmaschinen dynamic thesauri Upload-tools

Page 3: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20003

Beispiele: Publikation - elektronisches Äquivalent zum Paper Dissertation PrePrint - EPrint Conference Talk Arbeitsbericht, Projektbericht, ... Web-Seite, persönliche Homepage ...

Page 4: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20004

Zusammensetzung: Text Multimedia verschiedene Versionen des Dokumentes verschiedene Formate (Dateiformate) Anmerkungen Metadaten Verknüpfungen ...

Page 5: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20005

beispielsweiseDOC-Datei

Page 6: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20006

beispielsweiseDOC-Datei

Viewer-Formatebeispielsweise

HTML, PDF, PS, ...

Archiv-Formatewie SGML

Page 7: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20007

AusgangsformatViewer-Formate Archiv-Formate

Page 8: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20008

AusgangsformatViewer-Formate Archiv-Formate

HTMLMetadaten (=Daten über Daten)Beschreiben die Datei Autor Titel Abstract Datum Linking (Verknüpfung) ...

Page 9: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - mehr als nur ein Text

Berlin, 7.7.20009

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” Metadaten

Page 10: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200010

Wozu Metadaten: Beschreibung des Dokumentes automatisiert lesbar

definierte Syntax definierte Semantik

Dublin-Core vcard OAiMS ...

StandardisierungInternationalisierung

Page 11: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200011

Dublin Core - Beispiel einer Semantik: wenige = 15 genau = qualified definierte Begriffe zum “Object-Description”

http://purl.org/DC

Page 12: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200012

Dublin Core - die 15 Elemente:

September 1998RFC 2413

Title FormatCreator IdentifierSubject RelationDescription SourceDate LanguagePublisher CoverageContributor RightsType

Page 13: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200013

Dublin Core - DC.Creator - die Definition:Name: Creator Identifier: Creator Definition: An entity primarily responsible

for making the content of the resource.

Comment: Examples of a Creator include a person, an organisation, or a service. Typically, the name of a Creator should be used to indicate the entity.

Page 14: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200014

vcard: Beschreibung von Personen (RFC2426)

Definierte Felder:FN, N, NICKNAME, PHOTO, BDAY, ADR, LABEL, TEL, EMAIL, MAILER, TZ, GEO, TITLE, ROLE, LOGO, AGENT, ORG, CATEGORIES, NOTE, PRODID, REV, SORT-STRING, SOUND, URL, UID, VERSION, CLASS, KEY

Beispiel einer Felddefinition:N: Family Name, Given Name, Additional Names, Honorific Prefixes, Honorific Suffixes

Page 15: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Metadaten

Berlin, 7.7.200015

vcard: Beschreibung von Personen

im Shadow-File Vorteil: fester Bestandteil des Dokuments

Nachteil: bei Änderungen aufwendig zu pflegen

extern: Datenbank oder Homepage Vorteil: leicht pflegbar - evtl. durch die Person selbst

Nachteil: geht leichter verloren

rechtliche Probleme

Page 16: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Stichwort: Beschreibung v. PersonenRealisation einer externen Lösung

Berlin, 7.7.200016

Personal Homepages contain all needed information

names links to publication lists description of research-activities

Advantages Information up to date rights stay with author

Problems highly incoherent syntax personal layout highly dynamic information

Solution Professional Homepages

Upload Form Metadata Global Search

Page 17: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Web-Form

Personal Homepage

Qualified Professional Homepage

www.physik.uni-oldenburg.de/EPS/PHP

Developed together withR. Schwänzl and J. Plümer17 Berlin, 7.7.2000

Page 18: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

www.physik.uni-oldenburg.de/EPS/PHP

CacheCachehttp

http

http

Query

Answers

Links

Cache: Necessary to min. answering timeMaximum caching time: 1 week

professionalized homepages

Developed together withR. Schwänzl and J. Plümer

Distr.

Infor

m.

18 Berlin, 7.7.2000

Page 19: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Von HTML zu XML und RDF

Berlin, 7.7.200019

Shadow-File in HTML

Vorteile Alle Suchmaschinen verstehen HTML

Datei kann auch als “Inhaltsbeschreibung” für

menschliche Nutzer dienen.

Alle notwendigen Werkzeuge gibt es schon

Nachteile Lineares Datenmodell (Name - Value -Paare)

Page 20: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Was gibt es schon an Werkzeugen?(Autorentools)

Berlin, 7.7.20002020 . . .

www.physik.uni-oldenburg.de/EPS/mmm

Page 21: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Was gibt es schon an Werkzeugen?(Documentmanagementsystems)

Berlin, 7.7.200021

Erzeugung von MetaData Document-upload

Dokumenten-Pflege

Page 22: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

XML und RDF

Berlin, 7.7.200022

Welche Vorteile bieten XML und RDF?

XML als “Ergänzung” von SGML und HTML

XML bietet ein baumförmiges Datenmodell

RDF wird in XML repräsentiert

RDF dient der “Content-Description”

RDF bietet beliebig komplexe Datenstruktur

Page 23: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

RDF - ein Beispiel

Berlin, 7.7.200023

wurde programmiert

von

http://www.math.uos.de

S

hat als Autor

PXylo

O

X

Alion

wird behauptet von

Tamal

Page 24: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

RDF in XML - ein Beispiel

Berlin, 7.7.200024

<?xml version="1.0"?>

<RDF

xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:DC="http://purl.org/dc/elements/1.0#">

<Description about="http://www.math.uos.de/" bagID=“X">

<DC:Creator>Xylo</DC:Creator>

</Description>

<Description about=“#X" DC:Creator=“Tamal"/>

</RDF>

...

Page 25: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument

Berlin, 7.7.200025

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” Metadaten Beschreibung

XMLDokumentenserver für solcheDokumente gibt es schon - inkl. aller notwendigen Werkzeuge

Page 26: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument

Berlin, 7.7.200026

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” (Metadaten) Beschreibung

XML “Shadow-File” Metadaten Authentizität

Page 27: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - signierbare Elemente

Berlin, 7.7.200027

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Page 28: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - signierbare Elemente

Berlin, 7.7.200028

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Page 29: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - signierbare Elemente

Berlin, 7.7.200029

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Page 30: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - signierbare Elemente

Berlin, 7.7.200030

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Page 31: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Dokument - signierbare Elementeggf. durch unterschiedliche Instanzen

Berlin, 7.7.200031

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Page 32: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Auf dem Weg zum „Web of Trust“

Berlin, 7.7.200032

Authentizität Alle Beteiligten brauchen Zertifikate Problematik wenig publik Werkzeuge noch unvernetzt

DigSig in XML (W3C-Arbeitsgruppe) Canonicalization Hashing

MD5, ... Signature

DSA, RSA Encoding

Base64, HMAC, ...

Page 33: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Auf dem Weg zum „Web of Trust“DigSig in XML - Ein Beispiel

Berlin, 7.7.200033

<Signature> <SignedInfo> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <SignatureMethod Algorithm="http://www.w3.org/2000/01/xmldsig/dsa" /> <Reference IDREF="Creator_1"> <Transforms> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <Transform Algorithm="http://www.w3.org/2000/01/xmldsig/null" /> <Encoding Algorithm="http://www.w3.org/2000/01/xmldsig/base64" /> </Transforms> <DigestMethod Algorithm="http://www.w3.org/2000/01/xmldsig/sha1" /> <DigestValue>b6cbc1f60795623cd2978e1d3de00599a5d3</DigestValue> </Reference> </SignedInfo> <SignatureValue>89f6f699669da7f326cf5778a72e3fae</SignatureValue> <KeyInfo> <keyname>solo</keyname> </KeyInfo> </Signature>

Page 34: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Vom Dokument zum Dokumentenserver

Berlin, 7.7.200034

AusgangsformatViewer-Formate Archiv-Formate

“Shadow-File” “Shadow-File”HTML XML

Page 35: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Vom Dokument zum Dokumentenserver

Berlin, 7.7.200035

AusgangsformatViewer-Formate Archiv-Formate

“Shadow-File” “Shadow-File”HTML XML

Suchmaschine Metamaker (HTML / XML) Dokumenten-Uploader DigSig-Tool Dokumentenverwaltung

CARMEN - Global-Infowww.physik.uni-oldenburg.de/carmen

Dez.1999 - Okt. 2001

Page 36: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Suchmaschinen

Berlin, 7.7.200036

Anforderungen: Vernetzbarkeit (lokal vs. global) Format-Vielfalt Auswertung der Metadaten Konfigurierbarkeit

Vernetzung 2. Art Open-Archives-Initiative openarchives.org

S S S

S

SS

G

GG

G G

G

B

BB

B

BNutzer

HARVEST

Page 37: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Berlin, 7.7.200037

Page 38: Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for Science Networking Fachbereich Physik Carl von Ossietzky-Universität

Acknowledgement

Berlin, 7.7.200038

EPS European Physical Society (PhysNet) DFN (Eprint-Projekt) DFG (Dissertationen-Online) BMBF - Global-Info-Projekt (Carmen)

Roland Schwänzl, Judith Plümer (RDF-Beispiele) Michael Kaplan (DigSig-Beispiele) Eberhard R. Hilf, Kerstin Zimmermann, Michael Hohlfeld

Further Information: [email protected]