Upload
sabine-monica-bretz
View
214
Download
0
Embed Size (px)
Citation preview
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Archivierung von Multimedia-Daten
W. D. IhlenfeldtComputer-Chemie-Centrum
Universität Erlangen-NürnbergD-91052 Erlangen
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Digitale Dissertationen und Archive
• Gewinn durch Originalaufzeichnungen (Audio, Video) Originaldaten Visualisierungen Dynamic Content Erschließung über Multimedia-Content
• Relevanzspanne u.U. Jahrzehnte und mehr
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Zukünftiger Zugriff auf Multimedia-Daten
Zukunftssicherheit erfordert
• Verwendung von zukunftsfesten Formaten
und/oder
• Nachkonvertierung der Daten
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Standard Multimedia-Typen
• Bilder• Audio• Video
• Interaktive Texte• Dynamic Content• Anbindung von Software
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Wissenschaftliche Multimedia-Typen
• Vektorzeichnungen• Animationen• 3D Szenen
• 2D Tabellen und Zeitreihen• Multidimensionale Messdaten• Chemie-spezifische Sonderformen (Strukturen, Reaktionen, Spektren)
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Anforderungen
• Nutzbar nach Jahrzehnten
• Voll dokumentiert• Verbreitet• Plattformunabhängig• Theoretisch und praktisch konvertierbar• Unlimitierter Vollzugriff• Nutzbar ohne Lizenz- und Patentfragen
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Erstrebtes Eigenschaftsprofil
• Verbreitete Formate• Standardisierung (International mit breiter Unterstützung)• Multiple Source – Unterstützung durch mehrere Hersteller• Format und Varianten automatisch erkennbar• ASCII/Unicode mit Mark-Up bevorzugt• Integration in Datensysteme (XML)
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Konvertierbarkeit
• Voll dokumentiertes Format• Eindeutig erkennbares Format• Verlustlose Datenkompression• Möglichst keine Verschlüsselung, Watermarks• Gutes Zeichen: Open-Source-Format
• JPEG, MPEG, Quicktime, MP3: etc.: Kompression verlustbehaftet!
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Überformate
• Kein einfaches Format, sondern Hülle
• Multiple CODECs
• Nicht nutzbar ohne spezifischen CODEC
• Beispiele: AVI, Quicktime
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Regeln zur Aufnahme von Multimedia-Content
• Einfachste Formate, die noch den Zweck erfüllen und alle notwendigen Informationen enthalten
• Keine undokumentierten, programmspezifischen Dateien
• Keine ausführbare Software
• Lieber mehr Speicherplatz als Lossy Compression
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Die IRIS Showcase Story
• Powerpoint-ähnliches Format auf SGI• Bis vor einigen Jahren in der Chemie recht beliebt• Support von SGI eingestellt• Läuft nicht mehr auf neueren IRIX-Versionen• Proprietäres, undokumentiertes, binäres Format• Kein Support durch Konkurrenzprodukte• Keine Freigabe des Formats wg. Rechtsstreitigkeiten
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Bilder
• GIF: Patentfragen, Farbtiefe, Maximalgröße• JPEG: Verlustbehaftete Kompression• XBM, BMP, XPM: Schlechter Support, groß• TIFF: Überformat, Gefahr unüblicher CODECS• EPS: Riesige Dateien
• PNG: Derzeit wohl bester Kompromiss
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Audio
• Samplingraten variabel, evtl. SW-Probleme• Verlustbehaftete Kompression• Multikanal-Problematik
• AIFF, WAV, AU: Nur leicht reversibel komprimiertes Signal• MP3, OV, RAM: Hoch und verlustbehaftet komprimiert• MIDI: Im Prinzip Noten
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Video
• Datenvolumen erfordert verlustbehaftete Kompression• Evtl. Animation statt Video zu empfehlen• Zahlreiche proprietäre CODECs
• MPEG: Standardformat• QT, AVI: Überformate• Motion-JPEG für Spezialanwendungen
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Vektorzeichnungen
• CGM: Standard, aber mit Variationen• DXF: Komplex, mit zahlreichen Erweiterungen• WMF: Proprietär, undokumentiert• EPS: Groß, schwierig zurückzulesen
• In Zukunft: SVG, XML-basiert
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: 2D Animationen
• Animated GIF: Groß, begrenzt, Patentfrage• VRML, X3D, Video: Overkill• Macromedia Flash/Shockwave: Jetzt offengelegt, wohl aktueller Standard
• In Zukunft: SVG
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: 3D Szenen
• Standard: VRML 1.0 und VRML 97• Animationen in 3D möglich• Guter Export-Support, Import über Java3D• VRML Weiterentwicklung eingestellt• Nachfolger X3D noch nicht einsatzreif
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Tabellen
• Proprietäre Spreadsheet-Formate indiskutabel• TSV, CSV: Verlust von Meta-Information• SYLK, DIF: Standardformate• Mangelnde Codierung von Formeln• MathML evtl. Lösung in der Zukunft
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Multidimensionale Daten
• Tabellenformate ungeeignet für Volumendaten, hierarchische Daten etc.• Proprietäre Formate generell nicht akzeptabel• HDF, netCDF sind Standards
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Chemiedaten
• Strukturen, Spektren, Reaktionen, Sequenzen• Dutzende von proprietären Formaten• Missbrauch von Standardformaten (PDB)• Komplexe Überformate (CXF, CIF)• Empfehlung: SDF, JCAMP, RXN• In der Entwicklung: CML, XML-basiert
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia:Präsentationen
• Verknüpfung von Text, Audio, Video zu interaktiven Präsentationen• Zahlreiche proprietäre, undokumentierte Formate• SMIL als Standard, aber noch mit Akzeptanzproblemen
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Anwendungsprogramme
• Hinterlegung von Quellcode unproblematisch• Wartung von compilierter Software i.A. kaum zu realisieren• Denkbare Möglichkeit: Java-Bytecode• Noch keine Langzeiterfahrungen
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Multimedia: Indexierung
• Erschließung des Textkorpus über nicht-textuelle Suchverfahren auf Multimedia-Content• Daneben klassische Metadaten von MM-Objekten• Etabliert in der Chemie für Strukturen, Spektren, Reaktionen, Sequenzen• Sonstige Anwendungen Forschungsfelder (Bildinhalt, Musikphrasen, Szenenanalyse, Formelanalyse)
/slides/cactvs/hdt.ppt© Ihlenfeldt 1999C3
Weitere Informationen
W. D. [email protected]
http://www2.ccc.uni-erlangen.de/wdi/