Goobi Präsentation Darmstadt 2009

Preview:

DESCRIPTION

Vorstellung des Produktions- und Präsentationssystems "Goobi" auf der Sektion IV Tagung des deutschen Bibliotheksverbandes 2009 in Darmstadt

Citation preview

Digitale Zukunft – Von der Digitalisierung zur Dokumentverfügbarkeit

Dipl. Sozw. Ralf Stockmann (SUB Göttingen)

Orientierung an den Praxisregeln der DFG

•  Formate –  TIFF, PDF, TEI

•  Qualität –  600/300 dpi

•  Volltexte –  TEI / XML

•  Schnittstellen –  OAI

•  Verfügbarkeit –  DFG-Viewer –  Persistent Identifier

•  Metadaten (METS/MODS) –  Bibliographische, Struktur,

technische

“es war eine gute Idee…“

Orientierung an den Praxisregeln der DFG

•  Formate –  TIFF, PDF, TEI

•  Qualität –  600/300 dpi

•  Volltexte –  TEI / XML

•  Schnittstellen –  OAI

•  Verfügbarkeit –  DFG-Viewer –  Persistent Identifier

•  Metadaten (METS/MODS) –  Bibliographische, Struktur,

technische

PR

OD

UC

TION

P

RE

SE

NTATIO

N

Ablauf eines Digitalisierungsprojektes

1.  Zielsetzung 2.  Auswahl des Materials 3.  Benchmarking / Standards 4.  Produktionsorganisation / Logistik

5.  Arbeitsvorbereitungen (AV) 6.  Digitalisierung 7.  Qualitätskontrolle (QK) 8.  Bildoptimierung / Verarbeitung 9.  OCR / Volltextgenerierung 10.  Metadatengenerierung

11.  Präsentation / Verwertung 12.  Zugang / Evaluation 13.  (Langzeit) Archivierung

Modularer Aufbau

Produktionsumgebung

Nutzermanagement

•  Personen •  Gruppen •  Rollen •  Projekte

“to-do” Listen für jede MitarbeiterIn

Workflowstatus auf Werkstückebene

METS Editor

METS Export zu ZVDD, DFG-Viewer, Europeana, DDB, …

Integrierter Image Viewer (AJAX) OCR Integration

Statistik und Controlling

Präsentationsumgebung

Präsentationsebene: TYPO 3 / Lucene Design und Funktionen online anpassbar

Volltextsuche

OCR Renderfarm beim GBV

•  ABBYY Recognition Server •  Vorletze Nacht: 300.000 Seiten •  NICHT: Fraktur •  Wortkordinaten •  Volltexte mit TEI Strukturierung

DFG Praxisregeln zu OCR •  Es sei aber ausdrücklich vor der Gefahr

gewarnt, dass Nutzer bei mangelnder Dokumentation zu falschen Ergebnissen geführt werden.

•  Auf die Suchbedingungen sollte an deutlich sichtbarer Stelle hingewiesen werden.

•  Vorteilhaft ist auch, den Text – selbst bei mäßiger Qualität – nicht zu verstecken, damit sich der Nutzer selbst ein Bild von der Qualität seiner Recherchebasis machen kann.

Anzeige des (TEI) Volltextes

OCR Layer über Image

OCR Layer über Image

OCR “Leselupe”

Auf OCR aufsetzende Funktionen

•  Named entity recognition – Personen – Orte – Ereignisse

•  Semantische Suche •  Historische „Plagiatsfälle“ (nach C. Mahnke)

Digitales Inhaltsverzeichnis mit Seitenzahlen

PDF download (auch Unterkapitel)

Projectcounter.org Nutzungsstatistiken

RSS feeds, OAI (konfigurierbar)

Integration des DFG-Viewers

Open Source

•  Entwicklergemeinschaft im Aufbau

Partner

Goobi Homepage

www.goobi.org

Recommended