Grundlegendes zu Datenformaten und ihrer Standardisierung mit Schwerpunkt auf Microformats. Es werden keine konkreten Formate forgestellt, sondern allgemeine Prinzipien und Kodierungen (XML, JSON etc.)
- 1. Digitale Bibliothek Jakob Voss Datenformateund Standards
Digitale Bibliothek WS 2007/2008 Fachhochschule Hannover
Informationsmanagement (BA) 5. November 2007
2. Datenformate
- Konkrete Syntax oder Kodierung
- Verwendung eines Kodierungsverfahrens
- Beispiel: Namensliste an der Tafel ...
3. Datenformate
- Ein Datenformat definiert eine Struktur und legt darin
Mglichkeiten fr Inhalte fest
- Irrelevant: Semantik und Pragmatik
- Letztendlich sind alles nur Daten
- Aber: Ein Format lebt von seiner Benutzung
4. Einheitlichkeit und Validierung
- Was nicht festgelegt ist, wird verschieden gehandhabt
- Was nicht berprft werden kann, wird miachtet oder
ignoriert
- Was keine Auswirkungen hat ist irrelevant
5. Bibliothekarische Datenformate
- Bernhard Eversberg(1989, 1994, 1999) : Was sind und was sollen
Bibliothekarische
Datenformate?http://www.allegro-c.de/formate/
- MARC, MAB, PICA, Allegro ...
-
- Insellsungen (eigener Zeichensatz, eigene Werkzeuge, eigene
Sonderwege...)
- Heute : Unicode, XML, RDF, HTML ...
-
- Rein bibliothekarische Datenformate machen keinen Sinn
mehr
6. Wie sind Datenformate?
- Definiert durch Standards
-
- Leider oft Ausnahmen und Sonderwege
- Datenformate basieren aufeinander!
7. Beispiel: Stammbaum-Format
-
- Personen und Rollen: Vater, Mutter, Kind
-
- Relation: Nachkomme (Vater, Mutter, Kind)
8. Beispiel: Stammbaum-Format
-
- Personen und Rollen: Elter, Elter, Kind
-
- Relation: Nachkomme (Elter, Elter, Kind)
9. Visuelles Format 10. Prolog-Format
- kind( helios, klymene, aigle ) .
- kind( helios, klymene, phaetusa ) .
- kind( helios, klymene, lampetia ) .
- kind( helios, klymene, phaeton ) .
- geschwister( X, Y ) :- kind( A, B, X ), kind( A, B, Y ) .
11. GEDCOM-Format
- GEnealogical Data COMmunication Format (entwickelt um die Toten
zu Taufen ;-)
12. GEDCOM-XML-Format
13. Was sagt uns das?
- Es gibt viele Wege, die gleiche Information zu kodieren
- Unterschiedliche Formate und Kodierungen haben unterschiedliche
Eigenheiten
- Einigung, Konvertierung oder Sprachverwirrung
14. Konkrete Kodierungsformen
15. Feldbasierte Formate
-
- Autor : Krajewski, Markus
16. Extensible Markup Language
- Auszeichnung mittels Tags
- Hierarchische Struktur (XML-Baum)
17. JavaScriptObjectNotation (JSON)
18. Mikroformate
- Formate zur semantischen Auszeichnung in HTML
- Ergnzung von (X)HTML durch vereinbarte class ,relundrev
-Attribute
- Allgemeine Kodierungsmethode mit vielen konkreten
Einzelformaten
- Community-Initiative unter microformats.org
- Akademische Alternative : RDFa
19. Beispiel: hCalendar
- wieder unsere alljhrliche Weihnachtsfeier statt.
- Bitte tragt euch ein auf der
20. Beispiel: hCalendar
-
- wieder unsere alljhrliche Weihnachtsfeier statt.
- Bitte tragt euch ein auf der
21. Beispiel: hCalendar
-
- wieder unsere alljhrliche Weihnachtsfeier statt.
- Bitte tragt euch ein auf der
summary : Weihnachtsfeier dstart : 2007-12-19 url :
http://company.de/xmas/location : Neubau Datensatz 22. Konkrete
Microformats
-
- Veranstaltungen (hCalender)
- Teilweise angelehnt an andere Standards
(hCalendar/iCalender,hCard/vCard...)
- Teilweise aufeinander aufbauend
- Einbettung in XHTML, ATOM, RSS...
23. Einfaches Kopieren von Datenstzen
Auf der Web 2.0 Expo in Berlin (vom 5. bis zum 8. November) von
http://notizblog.org/ 24. Direkt in Firefox 3 und IE8 (?) 25.
Brauchen wir noch Dateien?
- Datenformate und Dateiformate
- Containerformate, eingebettete Metadaten
- Vom Hierarchischen Dateisystemzum Datenbank-Dateisystem
26. Standard-Mashups
- Standards basieren auf anderen Standards
-
- XML (W3C) basiert u.A. auf URI (RFC 2396), UTF-8 (RFC 2279),
Sprachcodes (RFC 1766) basierend auf ISO 693 und ISO 3166 ...
-
- OpenDocument basiert auf XML, ZIP, etc.
- Deshalb: Alles mussgenaudefiniert sein!
- Vorteil wie bei Mashups im Allgemeinen
-
- Rad nicht dauernd neu erfinden
-
- Nachnutzung bestehender Infrastruktur
27. Zeichen(de)kodierung
- Werden Daten in eine Struktur eingebettet, mssen in der Regel
einige Sonderzeichen speziell kodiert werden
- Mehrfachkodierung ber mehrere Schichten
- Achtung : wenn die Kodierung und Ebenen unbekannt sind, kommt
Zeichensalat heraus:
28. Beispiel: OpenURL und COinS
- COinS basiert auf OpenURL(http://ocoins.info/)
- Abstraktes Modell (siehe COinS generator)
- Konkrete Kodierung: URL-Parameter-Kodierung +
XML-Kodierung
29. Standards
- Welche Standards gibt es?
30. z.B. DEHOMAG-Lochkarten Bild: www.jewishvirtuallibrary.org
31. Arten von Standards
32. Arten von Standards
-
- Request For Comments (RFC) der IETF
- Bibliothekarische Standards
-
- MARC, MAB, Z39.50, SRU, FRBR ...
33. Normierungsorganisationen
- Europische Normen (EN) seit 1961
- ISO seit 1947/1926 (Vorlufer ISI)
-
- Noch frher: MKS-System (1889)
- Konsens-Prinzip aller Beteiligten
34. Beispiel: DIN 1
- Deutsche Institut fr Normung e. V.
- 1918: Erste Norm (DIN 1): EN 22339 / ISO 2339 Kegelstifte fr MG
08
35. Vor- und Nachteile von Normen
-
- Besttigung existierender Verfahren, zum Beispiel OpenDocument
(ISO/IEC 26300)
36. Standards in Bibliotheken
- Markus Krajewski: Zettelwirtschaft : Die Geburt der Kartei aus
dem Geiste der Bibliothek. Kulturverlag Kadmos, 2002
37. Schmutzige Tricks
- Standards zur Durchsetzung von Marktinteressen
- Monopole, Marktbehinderung, Startvorteile...
38. Schmutzige Tricks
-
- Patente und andere rechtliche Einschrnkungen
-
- Statt auf Etabliertes aufzubauen wird das Rad neu erfunden
-
-
- Andere Erklrung: Ignoranz oder Inkompetenz (trifft eher auf den
Bibliotheksbereich zu)
-
- Freie Standards und Implementierungen (sic!)
39. Offene Standards
- Offene Organisationen (RFC , W3C)
- Anschlieende Offenlegung(z.B. SRU/SRW)
- Community-basiert (Microformats)
- Offene Standards => Freie Mrkte
40. Bewertung
- Standards sind gemeinsameVereinbarungen zur Kommunikation
- Standards sind nur so gut wie die Verwendung
- Standards mssen offen und nutzbar sein
- Standards mssen berprfbar sein
- Keep it simple and provide tools!
- Es ist notwendig genau hinschauen, was genau ein Standard
vorschreibt und wo genau er eingesetzt wird