Wissenschaftliche Dokumentenserver: Nutzer - Standards - Management Thomas Severiens Institute for...

Preview:

Citation preview

Wissenschaftliche Dokumentenserver:Nutzer - Standards - Management

Thomas Severiens

Institute for Science NetworkingFachbereich PhysikCarl von Ossietzky-UniversitätOldenburg

severien@uni-oldenburg.de

Berlin, 7.7.2000

Anforderungen an ein Dokumentenarchiv

Berlin, 7.7.20002

benötigter Rahmen:Standards: MetaDaten

DC / vcard RDF

XML RDF MathML CML

DigSig

Dienste information systems qualifying systems

Werkzeuge Suchmaschinen dynamic thesauri Upload-tools

Dokument - mehr als nur ein Text

Berlin, 7.7.20003

Beispiele: Publikation - elektronisches Äquivalent zum Paper Dissertation PrePrint - EPrint Conference Talk Arbeitsbericht, Projektbericht, ... Web-Seite, persönliche Homepage ...

Dokument - mehr als nur ein Text

Berlin, 7.7.20004

Zusammensetzung: Text Multimedia verschiedene Versionen des Dokumentes verschiedene Formate (Dateiformate) Anmerkungen Metadaten Verknüpfungen ...

Dokument - mehr als nur ein Text

Berlin, 7.7.20005

beispielsweiseDOC-Datei

Dokument - mehr als nur ein Text

Berlin, 7.7.20006

beispielsweiseDOC-Datei

Viewer-Formatebeispielsweise

HTML, PDF, PS, ...

Archiv-Formatewie SGML

Dokument - mehr als nur ein Text

Berlin, 7.7.20007

AusgangsformatViewer-Formate Archiv-Formate

Dokument - mehr als nur ein Text

Berlin, 7.7.20008

AusgangsformatViewer-Formate Archiv-Formate

HTMLMetadaten (=Daten über Daten)Beschreiben die Datei Autor Titel Abstract Datum Linking (Verknüpfung) ...

Dokument - mehr als nur ein Text

Berlin, 7.7.20009

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” Metadaten

Stichwort: Metadaten

Berlin, 7.7.200010

Wozu Metadaten: Beschreibung des Dokumentes automatisiert lesbar

definierte Syntax definierte Semantik

Dublin-Core vcard OAiMS ...

StandardisierungInternationalisierung

Stichwort: Metadaten

Berlin, 7.7.200011

Dublin Core - Beispiel einer Semantik: wenige = 15 genau = qualified definierte Begriffe zum “Object-Description”

http://purl.org/DC

Stichwort: Metadaten

Berlin, 7.7.200012

Dublin Core - die 15 Elemente:

September 1998RFC 2413

Title FormatCreator IdentifierSubject RelationDescription SourceDate LanguagePublisher CoverageContributor RightsType

Stichwort: Metadaten

Berlin, 7.7.200013

Dublin Core - DC.Creator - die Definition:Name: Creator Identifier: Creator Definition: An entity primarily responsible

for making the content of the resource.

Comment: Examples of a Creator include a person, an organisation, or a service. Typically, the name of a Creator should be used to indicate the entity.

Stichwort: Metadaten

Berlin, 7.7.200014

vcard: Beschreibung von Personen (RFC2426)

Definierte Felder:FN, N, NICKNAME, PHOTO, BDAY, ADR, LABEL, TEL, EMAIL, MAILER, TZ, GEO, TITLE, ROLE, LOGO, AGENT, ORG, CATEGORIES, NOTE, PRODID, REV, SORT-STRING, SOUND, URL, UID, VERSION, CLASS, KEY

Beispiel einer Felddefinition:N: Family Name, Given Name, Additional Names, Honorific Prefixes, Honorific Suffixes

Stichwort: Metadaten

Berlin, 7.7.200015

vcard: Beschreibung von Personen

im Shadow-File Vorteil: fester Bestandteil des Dokuments

Nachteil: bei Änderungen aufwendig zu pflegen

extern: Datenbank oder Homepage Vorteil: leicht pflegbar - evtl. durch die Person selbst

Nachteil: geht leichter verloren

rechtliche Probleme

Stichwort: Beschreibung v. PersonenRealisation einer externen Lösung

Berlin, 7.7.200016

Personal Homepages contain all needed information

names links to publication lists description of research-activities

Advantages Information up to date rights stay with author

Problems highly incoherent syntax personal layout highly dynamic information

Solution Professional Homepages

Upload Form Metadata Global Search

Web-Form

Personal Homepage

Qualified Professional Homepage

www.physik.uni-oldenburg.de/EPS/PHP

Developed together withR. Schwänzl and J. Plümer17 Berlin, 7.7.2000

www.physik.uni-oldenburg.de/EPS/PHP

CacheCachehttp

http

http

Query

Answers

Links

Cache: Necessary to min. answering timeMaximum caching time: 1 week

professionalized homepages

Developed together withR. Schwänzl and J. Plümer

Distr.

Infor

m.

18 Berlin, 7.7.2000

Von HTML zu XML und RDF

Berlin, 7.7.200019

Shadow-File in HTML

Vorteile Alle Suchmaschinen verstehen HTML

Datei kann auch als “Inhaltsbeschreibung” für

menschliche Nutzer dienen.

Alle notwendigen Werkzeuge gibt es schon

Nachteile Lineares Datenmodell (Name - Value -Paare)

Was gibt es schon an Werkzeugen?(Autorentools)

Berlin, 7.7.20002020 . . .

www.physik.uni-oldenburg.de/EPS/mmm

Was gibt es schon an Werkzeugen?(Documentmanagementsystems)

Berlin, 7.7.200021

Erzeugung von MetaData Document-upload

Dokumenten-Pflege

XML und RDF

Berlin, 7.7.200022

Welche Vorteile bieten XML und RDF?

XML als “Ergänzung” von SGML und HTML

XML bietet ein baumförmiges Datenmodell

RDF wird in XML repräsentiert

RDF dient der “Content-Description”

RDF bietet beliebig komplexe Datenstruktur

RDF - ein Beispiel

Berlin, 7.7.200023

wurde programmiert

von

http://www.math.uos.de

S

hat als Autor

PXylo

O

X

Alion

wird behauptet von

Tamal

RDF in XML - ein Beispiel

Berlin, 7.7.200024

<?xml version="1.0"?>

<RDF

xmlns="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:DC="http://purl.org/dc/elements/1.0#">

<Description about="http://www.math.uos.de/" bagID=“X">

<DC:Creator>Xylo</DC:Creator>

</Description>

<Description about=“#X" DC:Creator=“Tamal"/>

</RDF>

...

Dokument

Berlin, 7.7.200025

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” Metadaten Beschreibung

XMLDokumentenserver für solcheDokumente gibt es schon - inkl. aller notwendigen Werkzeuge

Dokument

Berlin, 7.7.200026

AusgangsformatViewer-Formate Archiv-Formate

HTML“Shadow-File” (Metadaten) Beschreibung

XML “Shadow-File” Metadaten Authentizität

Dokument - signierbare Elemente

Berlin, 7.7.200027

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Dokument - signierbare Elemente

Berlin, 7.7.200028

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Dokument - signierbare Elemente

Berlin, 7.7.200029

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Dokument - signierbare Elemente

Berlin, 7.7.200030

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Dokument - signierbare Elementeggf. durch unterschiedliche Instanzen

Berlin, 7.7.200031

AusgangsformatViewer-Formate Archiv-Formate

HTML XML Metadaten Autor(en) Titel ...

Auf dem Weg zum „Web of Trust“

Berlin, 7.7.200032

Authentizität Alle Beteiligten brauchen Zertifikate Problematik wenig publik Werkzeuge noch unvernetzt

DigSig in XML (W3C-Arbeitsgruppe) Canonicalization Hashing

MD5, ... Signature

DSA, RSA Encoding

Base64, HMAC, ...

Auf dem Weg zum „Web of Trust“DigSig in XML - Ein Beispiel

Berlin, 7.7.200033

<Signature> <SignedInfo> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <SignatureMethod Algorithm="http://www.w3.org/2000/01/xmldsig/dsa" /> <Reference IDREF="Creator_1"> <Transforms> <CanonicalizationMethod Name="http://www.w3.org/TR/1999/WD-xml-c14n-19991115" /> <Transform Algorithm="http://www.w3.org/2000/01/xmldsig/null" /> <Encoding Algorithm="http://www.w3.org/2000/01/xmldsig/base64" /> </Transforms> <DigestMethod Algorithm="http://www.w3.org/2000/01/xmldsig/sha1" /> <DigestValue>b6cbc1f60795623cd2978e1d3de00599a5d3</DigestValue> </Reference> </SignedInfo> <SignatureValue>89f6f699669da7f326cf5778a72e3fae</SignatureValue> <KeyInfo> <keyname>solo</keyname> </KeyInfo> </Signature>

Vom Dokument zum Dokumentenserver

Berlin, 7.7.200034

AusgangsformatViewer-Formate Archiv-Formate

“Shadow-File” “Shadow-File”HTML XML

Vom Dokument zum Dokumentenserver

Berlin, 7.7.200035

AusgangsformatViewer-Formate Archiv-Formate

“Shadow-File” “Shadow-File”HTML XML

Suchmaschine Metamaker (HTML / XML) Dokumenten-Uploader DigSig-Tool Dokumentenverwaltung

CARMEN - Global-Infowww.physik.uni-oldenburg.de/carmen

Dez.1999 - Okt. 2001

Suchmaschinen

Berlin, 7.7.200036

Anforderungen: Vernetzbarkeit (lokal vs. global) Format-Vielfalt Auswertung der Metadaten Konfigurierbarkeit

Vernetzung 2. Art Open-Archives-Initiative openarchives.org

S S S

S

SS

G

GG

G G

G

B

BB

B

BNutzer

HARVEST

Berlin, 7.7.200037

Acknowledgement

Berlin, 7.7.200038

EPS European Physical Society (PhysNet) DFN (Eprint-Projekt) DFG (Dissertationen-Online) BMBF - Global-Info-Projekt (Carmen)

Roland Schwänzl, Judith Plümer (RDF-Beispiele) Michael Kaplan (DigSig-Beispiele) Eberhard R. Hilf, Kerstin Zimmermann, Michael Hohlfeld

Further Information: severien@uni-oldenburg.de