15
CeBIT 2013, Hannover ECM-Forum „Shared Content“ PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung Thomas Zellmann - LuraTech Europe GmbH 07.03.2013, 13:00 Uhr

PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

Embed Size (px)

DESCRIPTION

Referent: Thomas Zellmann, LuraTech Europe GmbH

Citation preview

Page 1: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

CeBIT 2013, Hannover ECM-Forum „Shared Content“

PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung

Thomas Zellmann - LuraTech Europe GmbH

07.03.2013, 13:00 Uhr

Page 2: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

2

2001: Initiative der Administration of the U.S. Courts

2001: AIIM bittet ISO, ein Archivformat zu normieren

02/2002: 280 Teilnehmer starten Normungsarbeit

10/2002: erstes ISO 19005 Arbeitsgruppentreffen

10/2005: Veröffentlichung PDF/A-1

09/2006: PDF/A Competence Center wird gegründet

07/2011: Veröffentlichung PDF/A-2

10/2012: Veröffentlichung PDF/A-3

PDF/A – Entwicklung bis heute

Page 3: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

3

Ein Dateiformat für die Archivierung normieren

In (ferner) Zukunft auf unbekannten Systemen darstellen

Nur „ein“ Format pflegen, „kompatibler Container“ gesucht

Dateiformat zur statischen Erhaltung des Erscheinungsbildes

System-/Software-/Versions-/Geräte-unabhängig

Selbsttragend und selbstdokumentierend

Transparent, die Inhalte müssen einfach zu erschließen sein

Optional: Die Semantik erhalten

-> PDF war schon ein guter kompatibler Container

-> PDF/A: Sichere Verwendung von PDF in der Archivierung

Das kennt doch jeder (oder?): PDF/A Ziele

Page 4: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

4

Warum dann dauernd Änderungen?

-1, -2 und jetzt -3: Widerspricht „statischem Archivformat“?

Nur auf den ersten Blick:

PDF/A-1 entstand 2002-2005, basiert also auf PDF 1.4

Unkritische neue Features müssen auch archiviert werden

PDF entwickelt sich, inzwischen ISO Norm 32000 (-1, -2)

PDF/A-2 beschreibt „sichere Archivierung bis ISO 32000-1“

Und es geht natürlich weiter….!

-> DAHER…..

Page 5: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

5

Keine Versionen, sondern Normteile

Wichtig: PDF/A-2 ist keine „neue Version“, also:

• PDF/A-1 ist unverändert gut, richtig, aktuell

• Keine Migrationen von PDF/A-1 nach PDF/A-2 oder ähnliches!

• PDF/A-2 ist nicht „besser“ als PDF/A-1

Denn: Normteile liefern nur zusätzliche neue Featuresets:

• JPEG2000 nicht in PDF 1.4, erst in PDF 1.5

• Um JPEG2000 zu nutzen, muss PDF/A-2 verwendet werden

• Nutze ich kein neues Feature, verwende ich weiterhin PDF/A-1

-> Erweiterungen, keine Versionen

Page 6: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

6

PDF/A-1

Elektronisches Papier auf Basis PDF 1.4

Schon hier „alles drin“:

Einbettung aller Ressourcen wie Schriften und Farbräume

Keine Verschlüsselung

Keine aktiven Inhalte

Verwendung von XMP-Metadaten

Kein Optionaler Content

Keine Transparenzen

-> mehr braucht man nicht, um PDF/A Hauptziele zu erreichen

-> Das galt und gilt auch weiterhin

Page 7: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

7

PDF/A-2

Elektronisches Papier auf Basis PDF ISO 32000-1

Beispiele für neue Features:

JPEG2000

Sehr große Seitenformate

UNICODE verwendbar ohne volle semantische Information

Und vieles mehr

Aber auch: fast 6 Jahre Anwenderfeedback!

Transparenzen nun erlaubt

Behandlung von „Layern“ bzw. optionalem Content

Und weitere „eher technische Finessen“

-> es bleibt aber beim elektronischen Papier!

Page 8: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

8

PDF/A-2 – Beispiele, MRC-Kompression

Layer PDF/A-1 PDF/A-2

Text Color

Foreground

JPEG JPEG

JPEG2000

Text

b/w Mask

TIFF G4

JBIG2

TIFF G4

JBIG2

Color

Background

JPEG JPEG

JPEG2000

TIFF

65 kB 180 kB 60 kB

TIFF G4 PDF/A-1 JPEG

23,8 MB 55 kB

PDF/A-2

Page 9: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

9

PDF/A-2 – Beispiele, Collections

PDF/A-Dateien in PDF/A-Dateien einbetten

(Um-)Organisation

von eAkten

eMails mit

Attachments

Signierte Einzelseiten

zu Dokumenten

zusammenfassen

Page 10: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

10

Jeder kennt das: Copy „€“, Paste „ “

UNICODE hilft dagegen

PDF/A-2 – Beispiele, UNICODE

B

CID 2

B U+0042

CID 2 LATIN

CAPITAL

LETTER B

CID 1

€ U+20AC

CID 1 EURO

SIGN

Page 11: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

11

PDF/A-3 – Erweiterung des CONTAINER

Identisch zu PDF/A-2, zuzüglich nur ein einziges Feature:

Einbettung beliebiger Dateiformate in PDF/A

Also, z.B.: Original Excel und PDF/A untrennbar verknüpfen

Oder, z.B.: XML-Datensatz mit statischer visueller Repräsentanz

Beliebige Dateitypen!

Ziel ist, zwei Dokumentversionen untrennbar zu verbinden:

Maschinenlesbare oder „lebende“ Version

So lange die eben geht! (Danach Datenmüll…)

Ein archivierbares Derivat als visuell verlässliche Version

„Für immer“. Lesbar, statisch. Ausdruck für die Registratur.

Page 12: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

12

PDF/A-3

Mögliche Anwendungsgebiete:

PDF Rechnungen, PDF/A visuell mit XML-Daten!

Hot topic CeBIT: PDF/A-3 mit ZUGFeRD

Vorträge dazu, z.B. Donnerstag um 16 Uhr

Mehr als 10 Aussteller mit ersten Prototypen

Arztbriefe mit CDA

Geburtsurkunden

Einbettung von DWG-Dateien aus dem CAD-Bereich, …

-> Aber: weiterhin elektronisches Papier(!) plus X

Page 13: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

13

PDF/A-1, -2, -3. Da war noch was: a, b und u?

„Compliance Level, wie weit will/muss man gehen:

Level „a“ erfordert „Tagging“

und erst mal Verfügbarkeit der Strukturinformation

Sonst Level „b“ oder „u“

.

PDF/A- b u a

1 Elektronisches Papier

X Elektronisches Papier

mit UNICODE

und Semantik

2 Elektronisches Papier

Elektronisches Papier

mit UNICODE

Elektronisches Papier

mit UNICODE

und Semantik

3 Elektronisches Papier

Elektronisches Papier

mit UNICODE

Elektronisches Papier

mit UNICODE

und Semantik

Page 14: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

14

Das Unternehmen LuraTech

LuraTech liefert Software, Services und herausragenden Support für

die Dokumentenkonvertierung.

Dazu zählt der LuraDocument PDF Compressor Enterprise – eine

produktionstaugliche Anwendung zur Kompression, Wandlung nach

PDF(/A), Zeichenerkennung (OCR), Klassifikation sowie

Formulardatenextraktion.

Mit DocYard stellt LuraTech eine vollständige Plattform zur

Verfügung, die sämtliche Funktionen der Dokumentenkonvertierung in

zentral steuerbare Workflows integriert.

Member of:

Page 15: PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

CeBIT 2013, Hannover ECM-Forum „Shared Content“

Vielen Dank für Ihr Interesse!

Weitere Informationen unter: www.ecm-navigator.de

und www.ecmtoday.de