40
Workfloworchestrierung Grundlage für effiziente und qualitativ hochwertige (Massen)Digitalisie rung Dipl. Sozw. Ralf Stockmann (SUB Göttingen)

Workfloworchestrierung Massendigitalisierung

Embed Size (px)

Citation preview

Page 1: Workfloworchestrierung Massendigitalisierung

Workfloworchestrierung

Grundlage für effiziente und qualitativ hochwertige

(Massen)Digitalisierung

Dipl. Sozw. Ralf Stockmann (SUB Göttingen)

Page 2: Workfloworchestrierung Massendigitalisierung

Laufende Projekte (Auszug)

• SSG Digitalisierung (Mathematik)

• VD17 / VD18

• EZOOLO 2

• Rezensionszeitschriften

• DigiWunschbuch

• > 5 Mio. Seiten

• Unterschiedliche Erschließung

Page 3: Workfloworchestrierung Massendigitalisierung

Öffnungswinkel

Page 4: Workfloworchestrierung Massendigitalisierung

Orientierung an den Praxisregeln der DFG

• Formate– TIFF, PDF, TEI

• Qualität– 600/300 dpi

• Volltexte– TEI / XML

• Schnittstellen– OAI

• Verfügbarkeit– DFG-Viewer– Persistent Identifier

• Metadaten (METS/MODS)– Bibliographische, Struktur,

technische

Page 5: Workfloworchestrierung Massendigitalisierung

Lösungsansätze

• Zerlegung des Produktionsprozesses in wieder verwendbare Workflows

• Bibl. Autopsie welcher Workflow angemessen ist

• Spezialisierung von Personal auf einzelne Bearbeitungsschritte

• Steuerung durch zentrale Software• Controlling und Qualitätskontrolle

Page 6: Workfloworchestrierung Massendigitalisierung

PR

OD

UC

TIO

NP

RO

DU

CT

ION

PR

ES

EN

TA

TIO

NP

RE

SE

NT

AT

ION

Ablauf eines Digitalisierungsprojektes

1. Zielsetzung2. Auswahl des Materials3. Benchmarking / Standards4. Produktionsorganisation / Logistik

5. Arbeitsvorbereitungen (AV)6. Digitalisierung7. Qualitätskontrolle (QK)8. Bildoptimierung / Verarbeitung9. OCR / Volltextgenerierung10. Metadatengenerierung

11. Präsentation / Verwertung12. Zugang / Evaluation13. (Langzeit) Archivierung

Page 7: Workfloworchestrierung Massendigitalisierung

Modularer Aufbau

Page 8: Workfloworchestrierung Massendigitalisierung

Produktionsumgebung

Page 9: Workfloworchestrierung Massendigitalisierung

Webbasiert

Page 10: Workfloworchestrierung Massendigitalisierung

Workflows

DigiWunschbuch

RezensionszeitschriftenRusDML

Page 11: Workfloworchestrierung Massendigitalisierung

Nutzermanagement

• Personen

• Gruppen

• Rollen

• Projekte

Page 12: Workfloworchestrierung Massendigitalisierung

Organisation, Rechte und Personen

Page 13: Workfloworchestrierung Massendigitalisierung

Organisation, Rechte und Personen

Page 14: Workfloworchestrierung Massendigitalisierung

Organisation, Rechte und Personen

Page 15: Workfloworchestrierung Massendigitalisierung

Organisation, Rechte und Personen

Page 16: Workfloworchestrierung Massendigitalisierung

Organisation, Rechte und Personen

Page 17: Workfloworchestrierung Massendigitalisierung

“to-do” Listen für jede MitarbeiterIn

Page 18: Workfloworchestrierung Massendigitalisierung

Flexibilität und Übersicht

Page 19: Workfloworchestrierung Massendigitalisierung

METS Editor

Page 20: Workfloworchestrierung Massendigitalisierung

METS Export zu ZVDD, DFG-Viewer, Europeana, DDB, …

Page 21: Workfloworchestrierung Massendigitalisierung

Integrierter Image Viewer (AJAX)

OCR Integration

Page 22: Workfloworchestrierung Massendigitalisierung

Statistik und Controlling

Page 23: Workfloworchestrierung Massendigitalisierung

Präsentationsumgebung

Page 24: Workfloworchestrierung Massendigitalisierung

Präsentationsebene: TYPO 3 / Lucene

Design und Funktionen online anpassbar

Page 25: Workfloworchestrierung Massendigitalisierung

Volltextsuche

Page 26: Workfloworchestrierung Massendigitalisierung

OCR Renderfarm beim GBV

• ABBYY Recognition Server

• 80 Seiten pro Minute

• NICHT: Fraktur

• Wortkoordinaten

• Volltexte mit TEI Strukturierung

Page 27: Workfloworchestrierung Massendigitalisierung

DFG Praxisregeln zu OCR

„Es sei aber ausdrücklich vor der Gefahr gewarnt, dass Nutzer bei mangelnder Dokumentation zu falschen Ergebnissen geführt werden.“

„Auf die Suchbedingungen sollte an deutlich sichtbarer Stelle hingewiesen werden.“

„Vorteilhaft ist auch, den Text – selbst bei mäßiger Qualität – nicht zu verstecken, damit sich der Nutzer selbst ein Bild von der Qualität seiner Recherchebasis machen kann.“

Page 28: Workfloworchestrierung Massendigitalisierung

Anzeige des (TEI) Volltextes

Page 29: Workfloworchestrierung Massendigitalisierung

OCR Layer über Image

Page 30: Workfloworchestrierung Massendigitalisierung

OCR Layer über Image

Page 31: Workfloworchestrierung Massendigitalisierung

OCR “Leselupe”

Page 32: Workfloworchestrierung Massendigitalisierung

Auf OCR aufsetzende Funktionen

• Named entity recognition– Personen– Orte– Ereignisse

• Semantische Suche

• Historische „Plagiatsfälle“ (nach C. Mahnke)

Page 33: Workfloworchestrierung Massendigitalisierung

Digitales Inhaltsverzeichnis mit Seitenzahlen

Page 34: Workfloworchestrierung Massendigitalisierung

PDF download (auch Unterkapitel)

Page 35: Workfloworchestrierung Massendigitalisierung

Projectcounter.org Nutzungsstatistiken

Page 36: Workfloworchestrierung Massendigitalisierung

RSS feeds, OAI (konfigurierbar)

Page 37: Workfloworchestrierung Massendigitalisierung

Integration des DFG-Viewers

Page 38: Workfloworchestrierung Massendigitalisierung

Open Source

Entwicklergemeinschaft im Aufbau

Page 39: Workfloworchestrierung Massendigitalisierung

Partner

Page 40: Workfloworchestrierung Massendigitalisierung

Goobi Homepage

www.goobi.org