Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Dr. Dorothea Sommer
Digitalisierung von Drucken des 17. Jahrhunderts an
der ULB Halle: ein Werkstattbericht zu einem DFG-
Projekt der Aktionslinie VD 16/ VD 17
DFG-Informationsveranstaltung „Digitalisierung“,
Bayerische Staatsbibliothek München, 14.11.2007
2
DFG- Aktionslinie „Digitalisierung der in nationalen
Verzeichnissen nachgewiesenen Drucke VD 16/ VD17“
Pilotprojekte zur Massendigitalisierung:
• Universitäts- und Landesbibliothek Sachsen-Anhalt, Halle „Digitalisierung der
Drucke des 17. Jahrhunderts aus der Sammlung Ponickau“
• Bayerische Staatsbibliothek München (VD 16)
• Herzog-August-Bibliothek Wolfenbüttel „Dünnhaupt digital“ (VD 17)
• Sächsische Landes- Universitäts- und Staatsbibliothek Dresden
„Quellensammlung zur Technikgeschichte“
(VD 17)
3
Rahmenbedingungen
• Paradigmenwechsel: selektive „Boutique Digitalisierung“ von besonders
wertvollen Trägern der kulturellen Überlieferung vs. Massendigitalisierung
• Google 5 Libraries + BSB München
• Europäische Digitale Bibliothek
• Public-Private Partnership: Zusammenarbeit mit Dienstleistern
4
VD 17 (Statistik 12/2006)
• 9 Partnerbibliotheken
• über 250.000 Titel
des 17. Jahrhunderts
• über 567.000 Druckexemplare
• ULB Halle: Projektende
Februar 2008: 80.000 Drucke
5
72.430 72.300
90.264
113.427
0
20.000
40.000
60.000
80.000
100.000
120.000Berlin
Dresden
Erfurt / Gotha
Göttingen
Halle
München
Nürnberg
Weimar
Wolfenbüttel
Anzahl der Exemplare der 9 VD 17-Bibliotheken (Stand 12/2006)
6
Webauftritt
7
Konzeptionelle Überlegungen (1)
1. Mengengerüst:
9.621 Drucke mit ca. 600.000 Seiten
2. Projektlaufzeit:
2 Jahre
3. Physische Bestandsanalyse: Heterogener Bestand im Quart-, Oktav-,
Folioformat, eingebundene Materialien in variierenden Formaten,
Kleinschrifttum, Sammelbände
8
Formatvielfalt der zu digitalisierenden Werke
9
Sonderformate
10
Konzeptionelle Überlegungen (2)
Zusammenarbeit mit Dienstleistern:
• Mikrounivers Berlin (MUB): Scanprozesse im bestandsschonenden Verfahren
• semantics GmbH Aachen zusammen mit Walter Nagel GmbH & Co. KG
Bielefeld: Automatisierte Datenaufbereitung für die Internetpräsentation mit
Visual Library
11
Konzeptionelle Überlegungen (3)
Standards, technische Parameter:
• Empfehlungen der DBV AG Handschriften / Alte Drucke zur Herstellung,
Internetpräsentation und Verwaltung von Digitalisaten alter Drucke und
Handschriften
http://www.bibliotheksverband.de/aghandschriften/dokumente/digi-
empfehlungen.html
• Praxisregeln im Förderprogramm „Kulturelle Überlieferung der DFG
http://www1.dfg.de/forschungsfoerderung/formulare/download/12_151.pdf
12
Projektziele
• Nachweis der Drucke in VD 17
• Nachweis der Drucke im GBV
• Erarbeitung eines Webauftritts für die Internetpräsentation
• Erschließung der Digitalisate durch Struktur- und Metadaten: METS / MODS
• Persistente Identifizierung der Digitalisate: URN
• Implementierung einer OAI-Schnittstelle
• Automatisierte Meldung der Daten an überregionale Verzeichnisse wie zvdd
• Speicherung und Archivierung der Master Images im Content-Management-
System des Universitätsrechenzentrums (URZ) im Rahmen des
universitätsweiten Backup-/Archivsystems
• Langzeitarchivierung der Digitalisate im URZ auf Bandrobotern
13
Inhaltliche Erschliessung: Optionen
• Einsatz von OCR: Antiqua, Fraktur - pro und contra
• Strukturdaten: Vereinheitlichte Terminologie der 4 Projektbibliotheken
vgl.: http://www.hab.de/bibliothek/wdb/dfgnavi/Strukturdaten21057-1-1.htm
• Gattungsbegriffe des VD 17
14
Korrekturmodus der Texterkennung mit Visual Library Manager
15
Beteiligte Institutionen und Partner
DNBGBV
ULBULB MUBsemantics
Visual Library
16
Workflow: Projektkoordination zwischen
Universitäts- und Landesbibliothek
Sachsen-Anhalt (ULB)
Vorbereitende Arbeiten, Nachbereitung,
Projektbegleitung, Kontrolle
Mikro-Univers Berlin GmbH (MUB) Scandienstleister, Strukturierung der
Digitalisate
semantics GmbH und Walter Nagel
GmbH & Co. KG
Internetpräsentation, Schnittstellen,
Metadaten
Gemeinsamer Bibliotheksverbund
(GBV)
Bereitstellen VD 17 Daten, Einspielen
von Online-Ressourcen
Universitätsrechenzentrum der Martin-
Luther-Universität Halle-Wittenberg
(URZ)
Langzeitarchivierung der digitalen
Master auf Landesebene
Deutsche Nationalbibliothek Aufbewahrung der „Last Copy“
17
Workflow und Datenaustausch
Datenaustausch
DNB VD17ZVDDOAI URZGBV
Workflow ULBULB MUB VL
18
Datenauszug aus VD 17
Grundlage für
• Produktionsdatenbank bei MUB
• Qualitätskontrolle der ULB (Abgleich des Bearbeitungsstatus)
19
Digitalisierung der Drucke bei MUB
• Generierung der Vorblätter mit bibliografischen Angaben und Barcodes
• Einrichtung der Produktionsdatenbank
• Anlegen von Verzeichnissen pro Band als Vorbereitung der Digitalisierung
• Scannen (300 dpi in Farbe, 24Bit Farbtiefe)
• Herstellung von strukturierten TIFFs als digitalem Master (entsprechend der Strukturdatenliste)
• Übernahme der Index-Daten in den TIFF-Header nach Vorgaben der ULB
• Lieferung der Daten zeitversetzt auf Festplatten an semantics
20
VD17-Nummer
Kurztitel + Ort + Erscheinungsjahr
Signatur
Barcode
Sammelbandvermerk
Vorblatt
21
Erstellung der Internetpräsentation mit VL
• Automatisierte Qualitätskontrolle der Digitalisate
• Automatisierte Einspielung der Digitalisate in die Internetpräsentation
• Automatisierte Generierung von Metadaten auf der Grundlage der VD 17-
Daten:
– OAI: MODS, MARCXML, OAI-DC
– METS: DFG Viewer, zvdd
– RSS: News Feed Reader
• Langzeitarchivierung
– Generierung der URN für die persistente Identifikation
• Automatisierte Erstellung von Sekundärausgaben der Online-Ressourcen im
GBV
22
Automatische Erzeugung des Katalogisats der Online-Ressource
• 0500 Oar
• 0701 ee
• 1100 1672
• 1108 Elektronische Ressource
• 1109 2007
• 1110 ep
• 1110 o3
• 1500 /1lat
• 2275 str- n-m. r-b- NuSi C 1672R
• 2277 VD17 1:045197K
• 3000 Caspar@Sagittarius!133397165!�ICaspar@Sagittarius ; PND-ID: 104063955�N
• 3001 Thomas@Weltz!366428357!�IThomas@Weltz ; PND-ID: 124800106�N
• 3060 @Liberae Urbis Imperialis Lindaviae Dnn. Consules Et Secretioris Consilii Assessores" [Widmungsempfänger]
• 3062 Heinricus@Linck [Beiträger]
• 3062 Hermann. Fridr.@Körber [Beiträger]
• 4000 Expositionem Infantum Superiorum Consensu Publico Eruditorum Examini Exponunt Caspar Sagittarius Philos. Mag. Et SS. Theol. Ddus Et Thomas Weltz Lindaviensis
• 4022 [Online-Ausg.]
• 4030 Ienae : Bauhoferus
• 4033 Jena
• 4043 !226732452!�IJohann Jakob@Bauhöfer. - Jena (1660-1692)�N
• 4049 Berlin : Mikro Univers GmbH
• 4060 [30] Bl.
• 4065 XA-DE#ULB Halle <Pon IIc 1122, QK>
• 4067 Halle, Saale : Universitäts- und Landesbibliothek Sachsen-Anhalt
• 4068 Online-Ressource (Text)
• 4083 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425
• 4088 <1>cgi =W 1:045197K_001:1 =W 1:045197K_002:2 =W 1:045197K_003:3
• 4110 Digitalisierung von Drucken des 17. Jahrhunderts aus der Sammlung Ponickau der Universitäts- und Landesbibliothek Sachsen-Anhalt
• 4201 Nicht identisch mit VD17 12:199214A (dort ohne Widmung auf der Rückseite des Titelblatts)
• 4218 Signaturformel: A - G4, H2
• 4233 Schlüsselseiten aus dem Exemplar der SBB-PK Berlin: Bibl. Diez 4ÿê 2513
• 4239 Universitäts- und Landesbibliothek Sachsen-Anhalt
• 4243 Primärausg.: Sagittarius, Caspar: Expositionem Infantum Superiorum Consensu Publico Eruditorum Examini ... N=GBV *535886810*
• 5550 Elektronische Publikation
• 5550 Online-Publikation
• 5570 Dissertation: phil.
• 7001 r3pon
• 7103 eBook
• 7133 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425
0500 Oar
0701 ee
1108 Elektronische Ressource
1110 ep
1110 o3
4022 [Online-Ausg.]
4049 Berlin : Mikro Univers GmbH
4065 XA-DE#ULB Sachsen-Anhalt <Pon IIc 1122, QK>
4067 Halle, Saale : Universitäts- und Landesbibliothek …
4068 Online-Ressource (Text)
4083 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425
4110 Digitalisierung von Drucken …
4239 Universitäts- und Landesbibliothek ..
4243 Primärausg.: Sagittarius, Caspar: Expositionem ... N=GBV
*535886810
5550 Elektronische Publikation
5550 Online-Publikation
7001 r3pon
7103 eBook
7133 <1>[Volltext] =G urn:nbn:de:gbv:3-100002425
23
Abschluss der Arbeiten in der ULB
• Kontrolle der Datenpräsentation und Funktionalitäten der Internetpräsentation
• Vertiefte Beschreibungen der Strukturdaten
• Eintragen der URN im VD 17
• Abschluss des Ausleihvorgangs
• Rückführung der Drucke ins Magazin
• Einspielen der Master-TIFFs in das Datenbanksystem im URZ
24
Visual Library
• Intuitive Navigation innerhalb eines Drucks: Blättern, Thumbnails
• Betrachtung der Digitalisate in verschiedenen Vergrößerungsstufen
• Volltextsuche über die bibliographischen Einträge
• Detailanzeige der Metadaten
• OAI-Schnittstelle
• Texteinstieg durch Strukturdaten
• Blättern anhand der Seitenzahlen eines Drucks
• PDF als Download
• RSS-Feed
• Nachweis innerhalb der Bibliothek
• Nachweis im VD 17
• Online Hilfe
25
Webauftritt: Titelansicht
26
Webauftritt: Ansicht der Inhaltsstruktur
27
Webauftritt: Übersichtsansicht einer Publikation
28
Webauftritt: Seitenansicht einer Publikation
29
Zugang zum Digitalisat
• Internetpräsentation
• OAI-Schnittstelle
• VD 17
• GBV
• zvdd
• Suchmaschinen
(Google, MSN,
Yahoo usw.)
30
Datenaustausch
Qualitätskontrolle, Workflow und Datenaustausch
DNB VD17ZVDDOAI URZGBV
Qualitätskontrolle
Workflow ULBULB MUB VL
31
Qualitätssicherung mit Visual Library Manager
32
Qualtitätssicherungsprotokoll
33
Gegenwärtiger Stand
• 700 Drucke gescannt
• 229 Drucke in der Datenbank freigeschaltet
• Pro Lieferung: 1000 Titel
• Rhythmus:
– 3 Wochen Scanzeit,
– 1 Woche Qualitätskontrolle,
– 1 Tag vollautomatisierte Datenübernahme und Aufbereitung für die
Internetpräsentation