Digitalisierung von Drucken des 17. Jahrhunderts an der ULB...

Preview:

Citation preview

Dr. Dorothea Sommer

Digitalisierung von Drucken des 17. Jahrhunderts an

der ULB Halle: ein Werkstattbericht zu einem DFG-

Projekt der Aktionslinie VD 16/ VD 17

DFG-Informationsveranstaltung „Digitalisierung“,

Bayerische Staatsbibliothek München, 14.11.2007

2

DFG- Aktionslinie „Digitalisierung der in nationalen

Verzeichnissen nachgewiesenen Drucke VD 16/ VD17“

Pilotprojekte zur Massendigitalisierung:

• Universitäts- und Landesbibliothek Sachsen-Anhalt, Halle „Digitalisierung der

Drucke des 17. Jahrhunderts aus der Sammlung Ponickau“

• Bayerische Staatsbibliothek München (VD 16)

• Herzog-August-Bibliothek Wolfenbüttel „Dünnhaupt digital“ (VD 17)

• Sächsische Landes- Universitäts- und Staatsbibliothek Dresden

„Quellensammlung zur Technikgeschichte“

(VD 17)

3

Rahmenbedingungen

• Paradigmenwechsel: selektive „Boutique Digitalisierung“ von besonders

wertvollen Trägern der kulturellen Überlieferung vs. Massendigitalisierung

• Google 5 Libraries + BSB München

• Europäische Digitale Bibliothek

• Public-Private Partnership: Zusammenarbeit mit Dienstleistern

4

VD 17 (Statistik 12/2006)

• 9 Partnerbibliotheken

• über 250.000 Titel

des 17. Jahrhunderts

• über 567.000 Druckexemplare

• ULB Halle: Projektende

Februar 2008: 80.000 Drucke

5

72.430 72.300

90.264

113.427

0

20.000

40.000

60.000

80.000

100.000

120.000Berlin

Dresden

Erfurt / Gotha

Göttingen

Halle

München

Nürnberg

Weimar

Wolfenbüttel

Anzahl der Exemplare der 9 VD 17-Bibliotheken (Stand 12/2006)

6

Webauftritt

7

Konzeptionelle Überlegungen (1)

1. Mengengerüst:

9.621 Drucke mit ca. 600.000 Seiten

2. Projektlaufzeit:

2 Jahre

3. Physische Bestandsanalyse: Heterogener Bestand im Quart-, Oktav-,

Folioformat, eingebundene Materialien in variierenden Formaten,

Kleinschrifttum, Sammelbände

8

Formatvielfalt der zu digitalisierenden Werke

9

Sonderformate

10

Konzeptionelle Überlegungen (2)

Zusammenarbeit mit Dienstleistern:

• Mikrounivers Berlin (MUB): Scanprozesse im bestandsschonenden Verfahren

• semantics GmbH Aachen zusammen mit Walter Nagel GmbH & Co. KG

Bielefeld: Automatisierte Datenaufbereitung für die Internetpräsentation mit

Visual Library

11

Konzeptionelle Überlegungen (3)

Standards, technische Parameter:

• Empfehlungen der DBV AG Handschriften / Alte Drucke zur Herstellung,

Internetpräsentation und Verwaltung von Digitalisaten alter Drucke und

Handschriften

http://www.bibliotheksverband.de/aghandschriften/dokumente/digi-

empfehlungen.html

• Praxisregeln im Förderprogramm „Kulturelle Überlieferung der DFG

http://www1.dfg.de/forschungsfoerderung/formulare/download/12_151.pdf

12

Projektziele

• Nachweis der Drucke in VD 17

• Nachweis der Drucke im GBV

• Erarbeitung eines Webauftritts für die Internetpräsentation

• Erschließung der Digitalisate durch Struktur- und Metadaten: METS / MODS

• Persistente Identifizierung der Digitalisate: URN

• Implementierung einer OAI-Schnittstelle

• Automatisierte Meldung der Daten an überregionale Verzeichnisse wie zvdd

• Speicherung und Archivierung der Master Images im Content-Management-

System des Universitätsrechenzentrums (URZ) im Rahmen des

universitätsweiten Backup-/Archivsystems

• Langzeitarchivierung der Digitalisate im URZ auf Bandrobotern

13

Inhaltliche Erschliessung: Optionen

• Einsatz von OCR: Antiqua, Fraktur - pro und contra

• Strukturdaten: Vereinheitlichte Terminologie der 4 Projektbibliotheken

vgl.: http://www.hab.de/bibliothek/wdb/dfgnavi/Strukturdaten21057-1-1.htm

• Gattungsbegriffe des VD 17

14

Korrekturmodus der Texterkennung mit Visual Library Manager

15

Beteiligte Institutionen und Partner

DNBGBV

ULBULB MUBsemantics

Visual Library

16

Workflow: Projektkoordination zwischen

Universitäts- und Landesbibliothek

Sachsen-Anhalt (ULB)

Vorbereitende Arbeiten, Nachbereitung,

Projektbegleitung, Kontrolle

Mikro-Univers Berlin GmbH (MUB) Scandienstleister, Strukturierung der

Digitalisate

semantics GmbH und Walter Nagel

GmbH & Co. KG

Internetpräsentation, Schnittstellen,

Metadaten

Gemeinsamer Bibliotheksverbund

(GBV)

Bereitstellen VD 17 Daten, Einspielen

von Online-Ressourcen

Universitätsrechenzentrum der Martin-

Luther-Universität Halle-Wittenberg

(URZ)

Langzeitarchivierung der digitalen

Master auf Landesebene

Deutsche Nationalbibliothek Aufbewahrung der „Last Copy“

17

Workflow und Datenaustausch

Datenaustausch

DNB VD17ZVDDOAI URZGBV

Workflow ULBULB MUB VL

18

Datenauszug aus VD 17

Grundlage für

• Produktionsdatenbank bei MUB

• Qualitätskontrolle der ULB (Abgleich des Bearbeitungsstatus)

19

Digitalisierung der Drucke bei MUB

• Generierung der Vorblätter mit bibliografischen Angaben und Barcodes

• Einrichtung der Produktionsdatenbank

• Anlegen von Verzeichnissen pro Band als Vorbereitung der Digitalisierung

• Scannen (300 dpi in Farbe, 24Bit Farbtiefe)

• Herstellung von strukturierten TIFFs als digitalem Master (entsprechend der Strukturdatenliste)

• Übernahme der Index-Daten in den TIFF-Header nach Vorgaben der ULB

• Lieferung der Daten zeitversetzt auf Festplatten an semantics

20

VD17-Nummer

Kurztitel + Ort + Erscheinungsjahr

Signatur

Barcode

Sammelbandvermerk

Vorblatt

21

Erstellung der Internetpräsentation mit VL

• Automatisierte Qualitätskontrolle der Digitalisate

• Automatisierte Einspielung der Digitalisate in die Internetpräsentation

• Automatisierte Generierung von Metadaten auf der Grundlage der VD 17-

Daten:

– OAI: MODS, MARCXML, OAI-DC

– METS: DFG Viewer, zvdd

– RSS: News Feed Reader

• Langzeitarchivierung

– Generierung der URN für die persistente Identifikation

• Automatisierte Erstellung von Sekundärausgaben der Online-Ressourcen im

GBV

22

Automatische Erzeugung des Katalogisats der Online-Ressource

• 0500 Oar

• 0701 ee

• 1100 1672

• 1108 Elektronische Ressource

• 1109 2007

• 1110 ep

• 1110 o3

• 1500 /1lat

• 2275 str- n-m. r-b- NuSi C 1672R

• 2277 VD17 1:045197K

• 3000 Caspar@Sagittarius!133397165!�ICaspar@Sagittarius ; PND-ID: 104063955�N

• 3001 Thomas@Weltz!366428357!�IThomas@Weltz ; PND-ID: 124800106�N

• 3060 @Liberae Urbis Imperialis Lindaviae Dnn. Consules Et Secretioris Consilii Assessores" [Widmungsempfänger]

• 3062 Heinricus@Linck [Beiträger]

• 3062 Hermann. Fridr.@Körber [Beiträger]

• 4000 Expositionem Infantum Superiorum Consensu Publico Eruditorum Examini Exponunt Caspar Sagittarius Philos. Mag. Et SS. Theol. Ddus Et Thomas Weltz Lindaviensis

• 4022 [Online-Ausg.]

• 4030 Ienae : Bauhoferus

• 4033 Jena

• 4043 !226732452!�IJohann Jakob@Bauhöfer. - Jena (1660-1692)�N

• 4049 Berlin : Mikro Univers GmbH

• 4060 [30] Bl.

• 4065 XA-DE#ULB Halle <Pon IIc 1122, QK>

• 4067 Halle, Saale : Universitäts- und Landesbibliothek Sachsen-Anhalt

• 4068 Online-Ressource (Text)

• 4083 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425

• 4088 <1>cgi =W 1:045197K_001:1 =W 1:045197K_002:2 =W 1:045197K_003:3

• 4110 Digitalisierung von Drucken des 17. Jahrhunderts aus der Sammlung Ponickau der Universitäts- und Landesbibliothek Sachsen-Anhalt

• 4201 Nicht identisch mit VD17 12:199214A (dort ohne Widmung auf der Rückseite des Titelblatts)

• 4218 Signaturformel: A - G4, H2

• 4233 Schlüsselseiten aus dem Exemplar der SBB-PK Berlin: Bibl. Diez 4ÿê 2513

• 4239 Universitäts- und Landesbibliothek Sachsen-Anhalt

• 4243 Primärausg.: Sagittarius, Caspar: Expositionem Infantum Superiorum Consensu Publico Eruditorum Examini ... N=GBV *535886810*

• 5550 Elektronische Publikation

• 5550 Online-Publikation

• 5570 Dissertation: phil.

• 7001 r3pon

• 7103 eBook

• 7133 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425

0500 Oar

0701 ee

1108 Elektronische Ressource

1110 ep

1110 o3

4022 [Online-Ausg.]

4049 Berlin : Mikro Univers GmbH

4065 XA-DE#ULB Sachsen-Anhalt <Pon IIc 1122, QK>

4067 Halle, Saale : Universitäts- und Landesbibliothek …

4068 Online-Ressource (Text)

4083 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425

4110 Digitalisierung von Drucken …

4239 Universitäts- und Landesbibliothek ..

4243 Primärausg.: Sagittarius, Caspar: Expositionem ... N=GBV

*535886810

5550 Elektronische Publikation

5550 Online-Publikation

7001 r3pon

7103 eBook

7133 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425

23

Abschluss der Arbeiten in der ULB

• Kontrolle der Datenpräsentation und Funktionalitäten der Internetpräsentation

• Vertiefte Beschreibungen der Strukturdaten

• Eintragen der URN im VD 17

• Abschluss des Ausleihvorgangs

• Rückführung der Drucke ins Magazin

• Einspielen der Master-TIFFs in das Datenbanksystem im URZ

24

Visual Library

• Intuitive Navigation innerhalb eines Drucks: Blättern, Thumbnails

• Betrachtung der Digitalisate in verschiedenen Vergrößerungsstufen

• Volltextsuche über die bibliographischen Einträge

• Detailanzeige der Metadaten

• OAI-Schnittstelle

• Texteinstieg durch Strukturdaten

• Blättern anhand der Seitenzahlen eines Drucks

• PDF als Download

• RSS-Feed

• Nachweis innerhalb der Bibliothek

• Nachweis im VD 17

• Online Hilfe

25

Webauftritt: Titelansicht

26

Webauftritt: Ansicht der Inhaltsstruktur

27

Webauftritt: Übersichtsansicht einer Publikation

28

Webauftritt: Seitenansicht einer Publikation

29

Zugang zum Digitalisat

• Internetpräsentation

• OAI-Schnittstelle

• VD 17

• GBV

• zvdd

• Suchmaschinen

(Google, MSN,

Yahoo usw.)

30

Datenaustausch

Qualitätskontrolle, Workflow und Datenaustausch

DNB VD17ZVDDOAI URZGBV

Qualitätskontrolle

Workflow ULBULB MUB VL

31

Qualitätssicherung mit Visual Library Manager

32

Qualtitätssicherungsprotokoll

33

Gegenwärtiger Stand

• 700 Drucke gescannt

• 229 Drucke in der Datenbank freigeschaltet

• Pro Lieferung: 1000 Titel

• Rhythmus:

– 3 Wochen Scanzeit,

– 1 Woche Qualitätskontrolle,

– 1 Tag vollautomatisierte Datenübernahme und Aufbereitung für die

Internetpräsentation

Recommended