PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung | BITKOM ECM Forum auf der CeBIT 2013

Preview:

DESCRIPTION

Referent: Thomas Zellmann, LuraTech Europe GmbH

Citation preview

CeBIT 2013, Hannover ECM-Forum „Shared Content“

PDF/A – 1, 2 und jetzt schon 3?! Überblick und Einordnung

Thomas Zellmann - LuraTech Europe GmbH

07.03.2013, 13:00 Uhr

2

2001: Initiative der Administration of the U.S. Courts

2001: AIIM bittet ISO, ein Archivformat zu normieren

02/2002: 280 Teilnehmer starten Normungsarbeit

10/2002: erstes ISO 19005 Arbeitsgruppentreffen

10/2005: Veröffentlichung PDF/A-1

09/2006: PDF/A Competence Center wird gegründet

07/2011: Veröffentlichung PDF/A-2

10/2012: Veröffentlichung PDF/A-3

PDF/A – Entwicklung bis heute

3

Ein Dateiformat für die Archivierung normieren

In (ferner) Zukunft auf unbekannten Systemen darstellen

Nur „ein“ Format pflegen, „kompatibler Container“ gesucht

Dateiformat zur statischen Erhaltung des Erscheinungsbildes

System-/Software-/Versions-/Geräte-unabhängig

Selbsttragend und selbstdokumentierend

Transparent, die Inhalte müssen einfach zu erschließen sein

Optional: Die Semantik erhalten

-> PDF war schon ein guter kompatibler Container

-> PDF/A: Sichere Verwendung von PDF in der Archivierung

Das kennt doch jeder (oder?): PDF/A Ziele

4

Warum dann dauernd Änderungen?

-1, -2 und jetzt -3: Widerspricht „statischem Archivformat“?

Nur auf den ersten Blick:

PDF/A-1 entstand 2002-2005, basiert also auf PDF 1.4

Unkritische neue Features müssen auch archiviert werden

PDF entwickelt sich, inzwischen ISO Norm 32000 (-1, -2)

PDF/A-2 beschreibt „sichere Archivierung bis ISO 32000-1“

Und es geht natürlich weiter….!

-> DAHER…..

5

Keine Versionen, sondern Normteile

Wichtig: PDF/A-2 ist keine „neue Version“, also:

• PDF/A-1 ist unverändert gut, richtig, aktuell

• Keine Migrationen von PDF/A-1 nach PDF/A-2 oder ähnliches!

• PDF/A-2 ist nicht „besser“ als PDF/A-1

Denn: Normteile liefern nur zusätzliche neue Featuresets:

• JPEG2000 nicht in PDF 1.4, erst in PDF 1.5

• Um JPEG2000 zu nutzen, muss PDF/A-2 verwendet werden

• Nutze ich kein neues Feature, verwende ich weiterhin PDF/A-1

-> Erweiterungen, keine Versionen

6

PDF/A-1

Elektronisches Papier auf Basis PDF 1.4

Schon hier „alles drin“:

Einbettung aller Ressourcen wie Schriften und Farbräume

Keine Verschlüsselung

Keine aktiven Inhalte

Verwendung von XMP-Metadaten

Kein Optionaler Content

Keine Transparenzen

-> mehr braucht man nicht, um PDF/A Hauptziele zu erreichen

-> Das galt und gilt auch weiterhin

7

PDF/A-2

Elektronisches Papier auf Basis PDF ISO 32000-1

Beispiele für neue Features:

JPEG2000

Sehr große Seitenformate

UNICODE verwendbar ohne volle semantische Information

Und vieles mehr

Aber auch: fast 6 Jahre Anwenderfeedback!

Transparenzen nun erlaubt

Behandlung von „Layern“ bzw. optionalem Content

Und weitere „eher technische Finessen“

-> es bleibt aber beim elektronischen Papier!

8

PDF/A-2 – Beispiele, MRC-Kompression

Layer PDF/A-1 PDF/A-2

Text Color

Foreground

JPEG JPEG

JPEG2000

Text

b/w Mask

TIFF G4

JBIG2

TIFF G4

JBIG2

Color

Background

JPEG JPEG

JPEG2000

TIFF

65 kB 180 kB 60 kB

TIFF G4 PDF/A-1 JPEG

23,8 MB 55 kB

PDF/A-2

9

PDF/A-2 – Beispiele, Collections

PDF/A-Dateien in PDF/A-Dateien einbetten

(Um-)Organisation

von eAkten

eMails mit

Attachments

Signierte Einzelseiten

zu Dokumenten

zusammenfassen

10

Jeder kennt das: Copy „€“, Paste „ “

UNICODE hilft dagegen

PDF/A-2 – Beispiele, UNICODE

B

CID 2

B U+0042

CID 2 LATIN

CAPITAL

LETTER B

CID 1

€ U+20AC

CID 1 EURO

SIGN

11

PDF/A-3 – Erweiterung des CONTAINER

Identisch zu PDF/A-2, zuzüglich nur ein einziges Feature:

Einbettung beliebiger Dateiformate in PDF/A

Also, z.B.: Original Excel und PDF/A untrennbar verknüpfen

Oder, z.B.: XML-Datensatz mit statischer visueller Repräsentanz

Beliebige Dateitypen!

Ziel ist, zwei Dokumentversionen untrennbar zu verbinden:

Maschinenlesbare oder „lebende“ Version

So lange die eben geht! (Danach Datenmüll…)

Ein archivierbares Derivat als visuell verlässliche Version

„Für immer“. Lesbar, statisch. Ausdruck für die Registratur.

12

PDF/A-3

Mögliche Anwendungsgebiete:

PDF Rechnungen, PDF/A visuell mit XML-Daten!

Hot topic CeBIT: PDF/A-3 mit ZUGFeRD

Vorträge dazu, z.B. Donnerstag um 16 Uhr

Mehr als 10 Aussteller mit ersten Prototypen

Arztbriefe mit CDA

Geburtsurkunden

Einbettung von DWG-Dateien aus dem CAD-Bereich, …

-> Aber: weiterhin elektronisches Papier(!) plus X

13

PDF/A-1, -2, -3. Da war noch was: a, b und u?

„Compliance Level, wie weit will/muss man gehen:

Level „a“ erfordert „Tagging“

und erst mal Verfügbarkeit der Strukturinformation

Sonst Level „b“ oder „u“

.

PDF/A- b u a

1 Elektronisches Papier

X Elektronisches Papier

mit UNICODE

und Semantik

2 Elektronisches Papier

Elektronisches Papier

mit UNICODE

Elektronisches Papier

mit UNICODE

und Semantik

3 Elektronisches Papier

Elektronisches Papier

mit UNICODE

Elektronisches Papier

mit UNICODE

und Semantik

14

Das Unternehmen LuraTech

LuraTech liefert Software, Services und herausragenden Support für

die Dokumentenkonvertierung.

Dazu zählt der LuraDocument PDF Compressor Enterprise – eine

produktionstaugliche Anwendung zur Kompression, Wandlung nach

PDF(/A), Zeichenerkennung (OCR), Klassifikation sowie

Formulardatenextraktion.

Mit DocYard stellt LuraTech eine vollständige Plattform zur

Verfügung, die sämtliche Funktionen der Dokumentenkonvertierung in

zentral steuerbare Workflows integriert.

Member of:

CeBIT 2013, Hannover ECM-Forum „Shared Content“

Vielen Dank für Ihr Interesse!

Weitere Informationen unter: www.ecm-navigator.de

und www.ecmtoday.de

Recommended