122
Einf ¨ uhrung in XML Seminar: XML in der Bioinformatik Frank Sch¨ onmann WS 2002/03

Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

  • Upload
    dokhanh

  • View
    217

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML

Seminar: XML in der Bioinformatik

Frank Schonmann

WS 2002/03

Page 2: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Uberblick

• Entwicklung von XML

• Regeln und Eigenschaften von XML

• Document Type Definition (DTD)

• Vor- und Nachteile von XML

• XML in der Bioinformatik

• Zusammenfassung

Page 3: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Motivation

• Praxis: WWW dient als Oberflache fur viele Informationssysteme

(Datenbanken, Warenkataloge, Mail-Archive)

Page 4: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Motivation

• Praxis: WWW dient als Oberflache fur viele Informationssysteme

(Datenbanken, Warenkataloge, Mail-Archive)

• reiche innere Struktur von Dokumenten geht jedoch durch Darstel-

lung mit HTML verloren

Page 5: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Motivation

• Praxis: WWW dient als Oberflache fur viele Informationssysteme

(Datenbanken, Warenkataloge, Mail-Archive)

• reiche innere Struktur von Dokumenten geht jedoch durch Darstel-

lung mit HTML verloren

• Nutzung der Daten ist nicht mehr moglich, hochstens noch Cut &Paste des Textes

Page 6: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Motivation

• Praxis: WWW dient als Oberflache fur viele Informationssysteme

(Datenbanken, Warenkataloge, Mail-Archive)

• reiche innere Struktur von Dokumenten geht jedoch durch Darstel-

lung mit HTML verloren

• Nutzung der Daten ist nicht mehr moglich, hochstens noch Cut &Paste des Textes

• Dies verhindert die Verwendung des Web als Plattform fur den

Informationsaustausch im großen Rahmen.

Page 7: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Allgemeines

• Name: Extensible Markup Language (Erweiterbare Auszeichnungs-

sprache)

Page 8: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Allgemeines

• Name: Extensible Markup Language (Erweiterbare Auszeichnungs-

sprache)

• Universalkonzept zur Datenspeicherung

Page 9: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Allgemeines

• Name: Extensible Markup Language (Erweiterbare Auszeichnungs-

sprache)

• Universalkonzept zur Datenspeicherung

• Aufteilung von Daten in Inhalt, Struktur und Layout

Page 10: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Allgemeines

• Name: Extensible Markup Language (Erweiterbare Auszeichnungs-

sprache)

• Universalkonzept zur Datenspeicherung

• Aufteilung von Daten in Inhalt, Struktur und Layout

• Entwicklung des W3C (World Wide Web Consortium)

Page 11: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML und SGML

• Teilmenge von SGML (Standard Generalized Markup Language),

eine Sprache zur Dokumentenreprasentation, die Struktur von Do-

kumenten beschreibt (ISO-8879)

Page 12: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML und SGML

• Teilmenge von SGML (Standard Generalized Markup Language),

eine Sprache zur Dokumentenreprasentation, die Struktur von Do-

kumenten beschreibt (ISO-8879)

• XML ist weniger umfangreich, aber ahnlich leistungsfahig

Page 13: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML und SGML

• Teilmenge von SGML (Standard Generalized Markup Language),

eine Sprache zur Dokumentenreprasentation, die Struktur von Do-

kumenten beschreibt (ISO-8879)

• XML ist weniger umfangreich, aber ahnlich leistungsfahig

• abschreckende SGML-Syntax wurde vereinfacht, komplexe und sel-

ten verwendete Eigenschaften von SGML entfernt

Page 14: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML und SGML

• Teilmenge von SGML (Standard Generalized Markup Language),

eine Sprache zur Dokumentenreprasentation, die Struktur von Do-

kumenten beschreibt (ISO-8879)

• XML ist weniger umfangreich, aber ahnlich leistungsfahig

• abschreckende SGML-Syntax wurde vereinfacht, komplexe und sel-

ten verwendete Eigenschaften von SGML entfernt

• zum Vergleich: XML auf 33 Seiten formal definiert, SGML auf mehr

als 500

Page 15: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Entwicklung von XML

1994 Tim Berners Lee grundet am MIT ein Entwickler-Forum un-

ter Leitung von Jon Bosak, um Definitionssprache fur Auszeich-

nungssprachen zu entwickeln. Zunachst gab es Konzepte, die SGML

außer Acht ließen, spater wurde XML selbst in SGML definiert

Page 16: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Entwicklung von XML

1994 Tim Berners Lee grundet am MIT ein Entwickler-Forum un-

ter Leitung von Jon Bosak, um Definitionssprache fur Auszeich-

nungssprachen zu entwickeln. Zunachst gab es Konzepte, die SGML

außer Acht ließen, spater wurde XML selbst in SGML definiert

1996 auf der SGML 96 Conference (Boston) wird ein Erstentwurf fur

XML vorgestellt

Page 17: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Entwicklung von XML

1994 Tim Berners Lee grundet am MIT ein Entwickler-Forum un-

ter Leitung von Jon Bosak, um Definitionssprache fur Auszeich-

nungssprachen zu entwickeln. Zunachst gab es Konzepte, die SGML

außer Acht ließen, spater wurde XML selbst in SGML definiert

1996 auf der SGML 96 Conference (Boston) wird ein Erstentwurf fur

XML vorgestellt

1998 erste sog. Empfehlung (Recommendation) des W3C fur XML;

danach Bemuhungen, XML zu etablieren und wichtige, bestehende

Auszeichnungssprachen (z. B. HTML) in XML zu definieren

Page 18: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• XHTML: Neudefinition von HTML (ursprunglich in SGML definiert)

Page 19: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• XHTML: Neudefinition von HTML (ursprunglich in SGML definiert)

<?xml version="1.0" encoding="iso-8859-1" ?><!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"><html><head><title>Einfache (X)HTML-Seite</title></head><body><h1>Uberschrift</h1><img alt="Bild" src="bild.png" /><hr /></body></html>

Page 20: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• MathML: Mathematische Formelsprache

(1998: MathML 1.0, 2001: MathML 2.0)

Page 21: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• MathML: Mathematische Formelsprache

(1998: MathML 1.0, 2001: MathML 2.0)

<msup><mfenced>

<mi>a</mi> <mo>+</mo> <mi>b</mi></mfenced><mn>2</mn>

</msup>

entspricht der Formel: (a + b)2

Page 22: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• CML: Chemical Markup Language

Page 23: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• CML: Chemical Markup Language

• BSML: Bioinformatic Sequence Markup LanguageSpeicherung von Sequenzdaten (DNA, RNA, Proteine), Struktur

und Informationsgehalt ahnlich zu EMBL, GenBank oder DDBJ

Page 24: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Bekannte XML-Anwendungen

• CML: Chemical Markup Language

• BSML: Bioinformatic Sequence Markup LanguageSpeicherung von Sequenzdaten (DNA, RNA, Proteine), Struktur

und Informationsgehalt ahnlich zu EMBL, GenBank oder DDBJ

• BioML: Biopolymer Markup Language

Page 25: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Dokument besteht immer aus einer Instanz und u. U. einer

DTD (Document Type Definition)

Page 26: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Dokument besteht immer aus einer Instanz und u. U. einer

DTD (Document Type Definition)

• DTD: eine Definition, in der Tags und ihre erlaubte Schachtelung

vereinbart werden

Page 27: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Dokument besteht immer aus einer Instanz und u. U. einer

DTD (Document Type Definition)

• DTD: eine Definition, in der Tags und ihre erlaubte Schachtelung

vereinbart werden

• Instanz: eine XML-Datei, die sich an die vereinbarten Regeln halt

Page 28: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Datei beginnt mit einer processing instruction, der XML-

Deklaration (zur Unterscheidung von XML- und SGML-Instanzen)

Page 29: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Datei beginnt mit einer processing instruction, der XML-

Deklaration (zur Unterscheidung von XML- und SGML-Instanzen)

• zur Verwendung einer DTD benotigt man eine document typedeclaration

Page 30: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Allgemeines

• XML-Datei beginnt mit einer processing instruction, der XML-

Deklaration (zur Unterscheidung von XML- und SGML-Instanzen)

• zur Verwendung einer DTD benotigt man eine document typedeclaration

<?xml version="1.0" ?><!DOCTYPE dtdname SYSTEM "dtdname.dtd">

Page 31: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• Tags werden als benannte Klammern verwendet, um den Inhalt in

Elemente zu gliedern

Page 32: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• Tags werden als benannte Klammern verwendet, um den Inhalt in

Elemente zu gliedern

<name>Hans Muller</name>

Page 33: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• Tags werden als benannte Klammern verwendet, um den Inhalt in

Elemente zu gliedern

<name>Hans Muller</name>

• Starttag (<name>) kennzeichnet den Beginn, ein Endtag (</name>)das Ende eines Elements.

Page 34: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• jedes offnende Tag muss auch wieder mit einem Endtag geschlossen

werden: <tag>Inhalt</tag>

Page 35: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• jedes offnende Tag muss auch wieder mit einem Endtag geschlossen

werden: <tag>Inhalt</tag>

• Alternative Syntax fur Tags ohne Inhalt: <tag/> oder <tag />

Page 36: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• jedes offnende Tag muss auch wieder mit einem Endtag geschlossen

werden: <tag>Inhalt</tag>

• Alternative Syntax fur Tags ohne Inhalt: <tag/> oder <tag />

• Elementnamen durfen nicht mit der Zeichenfolge xml und nicht mit

Ziffern beginnen; sie durfen keine =-Zeichen und keine Leerzeichen

enthalten

Page 37: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• durch Schachtelung von Elementen ergibt sich eine Baumstruktur

Page 38: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• durch Schachtelung von Elementen ergibt sich eine Baumstruktur

• innere Knoten drucken die Struktur aus, Blatter den Inhalt und

Elemente mit leerem Inhaltsmodell

Page 39: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

• durch Schachtelung von Elementen ergibt sich eine Baumstruktur

• innere Knoten drucken die Struktur aus, Blatter den Inhalt und

Elemente mit leerem Inhaltsmodell

<person><name>Hans Muller</name><email>[email protected]</email><birthday> <day>21</day><month>03</month><year>1970</year> </birthday>

</person>

Page 40: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Tags

Page 41: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Kommentare

• Kommentare konnen beliebigen Text enthalten

Page 42: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Kommentare

• Kommentare konnen beliebigen Text enthalten

• beginnen mit der Zeichenfolge <!-- und enden mit -->

• Kommentar durfen nicht geschachtelt werden

Page 43: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Kommentare

• Kommentare konnen beliebigen Text enthalten

• beginnen mit der Zeichenfolge <!-- und enden mit -->

• Kommentar durfen nicht geschachtelt werden

<!-- Kommentar -->

<!-- mehrzeiligerKommentar... -->

Page 44: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Attribute

• Tags konnen mit Attributen versehen werden, durch die sich die

Funktion des Tags in der Dokumentinstanz weiter spezialisieren

lasst

Page 45: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Attribute

• Tags konnen mit Attributen versehen werden, durch die sich die

Funktion des Tags in der Dokumentinstanz weiter spezialisieren

lasst

• Attribute sind Name-/Wert-Paare

Page 46: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Attribute

• Tags konnen mit Attributen versehen werden, durch die sich die

Funktion des Tags in der Dokumentinstanz weiter spezialisieren

lasst

• Attribute sind Name-/Wert-Paare

• Werte mussen in Anfuhrungszeichen stehen (’ oder ")

Page 47: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Beispiel

<?xml version="1.0"?><!DOCTYPE contacts SYSTEM "contacts.dtd">

<contacts type="private" desc="Personliches Addressbuch"><person id="42">

<name>Hans Muller</name><email>[email protected]</email><birthday>

<day>21</day><month>03</month><year>1970</year></birthday>

</person></contacts>

Page 48: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Zeichensatze

• Groß- und Kleinschreibung werden unterschieden

Page 49: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Zeichensatze

• Groß- und Kleinschreibung werden unterschieden

• Internationalisierung: alle Zeichen des Unicode-Standards (offizielle

Implementierung von ISO-10646) sind erlaubt

Page 50: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Zeichensatze

• Groß- und Kleinschreibung werden unterschieden

• Internationalisierung: alle Zeichen des Unicode-Standards (offizielle

Implementierung von ISO-10646) sind erlaubt

• dadurch ist XML z. B. auch fur asiatische Sprachen geeignet

Page 51: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Sonderzeichen

• XML-Sonderzeichen mussen zur Verwendung im normalen Text

maskiert werden:

Page 52: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Sonderzeichen

• XML-Sonderzeichen mussen zur Verwendung im normalen Text

maskiert werden:

< &lt;

> &gt;

& &amp;

" &quot;

’ &apos;

Page 53: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

Page 54: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

? XML-Deklaration (processing instruction)

Page 55: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

? XML-Deklaration (processing instruction)

? mindestens ein Datenelement

Page 56: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

? XML-Deklaration (processing instruction)

? mindestens ein Datenelement

? genau ein außerstes Element

Page 57: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

? XML-Deklaration (processing instruction)

? mindestens ein Datenelement

? genau ein außerstes Element

• valid : Dokument ist wohlgeformt und genugt zusatzlich den Regeln

einer DTD

Page 58: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Regeln und Eigenschaften: Bezeichnungen

• well formed : Regeln fur XML werden eingehalten:

? XML-Deklaration (processing instruction)

? mindestens ein Datenelement

? genau ein außerstes Element

• valid : Dokument ist wohlgeformt und genugt zusatzlich den Regeln

einer DTD

⇒ Dokumente ohne DTD sind moglich

Page 59: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Allgemeines

• Document Type Definition

Page 60: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Allgemeines

• Document Type Definition

• formale Grammatik, die eine bestimmte XML-Sprache definiert

Page 61: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Allgemeines

• Document Type Definition

• formale Grammatik, die eine bestimmte XML-Sprache definiert

• definiert werden Namen der in Dokumentinstanzen erlaubten At-

tribute, Entitaten sowie Tags und ihre mogliche Schachtelung (In-

haltsmodell)

Page 62: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Allgemeines

• Document Type Definition

• formale Grammatik, die eine bestimmte XML-Sprache definiert

• definiert werden Namen der in Dokumentinstanzen erlaubten At-

tribute, Entitaten sowie Tags und ihre mogliche Schachtelung (In-

haltsmodell)

• nur Syntax, keine semantische Aussage

Page 63: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Allgemeines

• Document Type Definition

• formale Grammatik, die eine bestimmte XML-Sprache definiert

• definiert werden Namen der in Dokumentinstanzen erlaubten At-

tribute, Entitaten sowie Tags und ihre mogliche Schachtelung (In-

haltsmodell)

• nur Syntax, keine semantische Aussage

• besonderer Tag: Dokumenttyp; tragt den selben Namen wie die

Sprache und dient als Startsymbol

Page 64: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

Page 65: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

? andere Tags (⇒ Baumstruktur)

Page 66: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

? andere Tags (⇒ Baumstruktur)

? #PCDATA (parseable character data, d. h. die gultigen Zeichen

des Alphabets)

Page 67: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

? andere Tags (⇒ Baumstruktur)

? #PCDATA (parseable character data, d. h. die gultigen Zeichen

des Alphabets)

? EMPTY: leeres Inhaltsmodell

Page 68: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

? andere Tags (⇒ Baumstruktur)

? #PCDATA (parseable character data, d. h. die gultigen Zeichen

des Alphabets)

? EMPTY: leeres Inhaltsmodell

? ANY: beliebiges Inhaltsmodell

Page 69: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell

• Bestandteile der Grammatik:

? andere Tags (⇒ Baumstruktur)

? #PCDATA (parseable character data, d. h. die gultigen Zeichen

des Alphabets)

? EMPTY: leeres Inhaltsmodell

? ANY: beliebiges Inhaltsmodell

• Verknupfung dieser Elemente durch Operatoren

Page 70: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

Page 71: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

| alternative Elemente

Page 72: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

| alternative Elemente

? optionale Elemente

Page 73: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

| alternative Elemente

? optionale Elemente

+ 1 . . . n Wiederholungen

Page 74: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

| alternative Elemente

? optionale Elemente

+ 1 . . . n Wiederholungen

* 0 . . . n Wiederholungen

Page 75: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Inhaltsmodell-Operatoren

, notwendig Elemente in fester Reihenfolge

| alternative Elemente

? optionale Elemente

+ 1 . . . n Wiederholungen

* 0 . . . n Wiederholungen

() Klammerung von Ausdrucken

Page 76: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Einfaches Beispiel

<!ELEMENT contacts (person*)>

<!ELEMENT person (name, email*, birthday?)>

<!ELEMENT name (#PCDATA)><!ELEMENT email (#PCDATA)>

<!ELEMENT birthday (year, month, day)>

<!ELEMENT year (#PCDATA)><!ELEMENT month (#PCDATA)><!ELEMENT day (#PCDATA)>

Page 77: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Attribute

• fur jedes Element lassen sich erlaubte Attribute angeben

Page 78: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Attribute

• fur jedes Element lassen sich erlaubte Attribute angeben

• jedem Attribut ist ein Typ zugeordnet: CDATA, ID, IDREF/IDREFS,Liste von Werten

Page 79: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Attribute

• fur jedes Element lassen sich erlaubte Attribute angeben

• jedem Attribut ist ein Typ zugeordnet: CDATA, ID, IDREF/IDREFS,Liste von Werten

• Attribute sind optional, obligatorisch oder konstant: #IMPLIED,#REQUIRED, #FIXED Wert, Standardwert

Page 80: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Beispiel mit Attributen

<!ELEMENT contacts (person*)><!ATTLIST contacts

type (private|work) #IMPLIEDdesc CDATA>

<!ELEMENT person (name, email*, birthday?)><!ATTLIST person id ID #REQUIRED>

<!ELEMENT name (#PCDATA)><!ELEMENT email (#PCDATA)><!ELEMENT birthday (year, month, day)><!ELEMENT year (#PCDATA)><!ELEMENT month (#PCDATA)><!ELEMENT day (#PCDATA)>

Page 81: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Entitaten

• mit Entitaten (entities) lassen sich Kurzel definieren, die spater in

der DTD oder der XML-Instanz verwendet werden konnen

Page 82: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Entitaten

• mit Entitaten (entities) lassen sich Kurzel definieren, die spater in

der DTD oder der XML-Instanz verwendet werden konnen

• Entitaten als Textbausteine: Makros zur Verwendung im XML-

Dokument mit &entityname; (z. B. Umlaute in XHTML)

Page 83: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Entitaten

• mit Entitaten (entities) lassen sich Kurzel definieren, die spater in

der DTD oder der XML-Instanz verwendet werden konnen

• Entitaten als Textbausteine: Makros zur Verwendung im XML-

Dokument mit &entityname; (z. B. Umlaute in XHTML)

• parameter entities: Makros zur Verwendung in der DTD

Page 84: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

DTD: Beispiel fur Entitaten

<!ENTITY xml "Extensible Markup Language"><!ENTITY auml "&#228;"><!ENTITY % bool "(true|false)">

<!ELEMENT person (name, email*, birthday?)><!ATTLIST person

id ID #REQUIREDpremiumcustomer %bool; "false"

><!ELEMENT birthday (year, month, day)><!ATTLIST birthday

sendgreeting %bool; #IMPLIED>

Page 85: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

Page 86: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

? wichtiger Schritt durch Standardisierung von XML selbst

Page 87: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

? wichtiger Schritt durch Standardisierung von XML selbst

? bisherige Datenformate in der Bioinformatik sind proprietar

Page 88: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

? wichtiger Schritt durch Standardisierung von XML selbst

? bisherige Datenformate in der Bioinformatik sind proprietar

• Offenheit:

Page 89: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

? wichtiger Schritt durch Standardisierung von XML selbst

? bisherige Datenformate in der Bioinformatik sind proprietar

• Offenheit:

? es entstehen leicht durchschaubare Auszeichnungssprachen, die

von vielen genutzt werden konnen

Page 90: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Standardisierung:

? wichtiger Schritt durch Standardisierung von XML selbst

? bisherige Datenformate in der Bioinformatik sind proprietar

• Offenheit:

? es entstehen leicht durchschaubare Auszeichnungssprachen, die

von vielen genutzt werden konnen

? DTD definiert Syntax

Page 91: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

Page 92: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

Page 93: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

? einfache Transformation in anderes Zielformat (XSL-FO, XSLT)

Page 94: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

? einfache Transformation in anderes Zielformat (XSL-FO, XSLT)

? einfache Anderungen durch lesbares Textformat

(content scalability)

Page 95: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

? einfache Transformation in anderes Zielformat (XSL-FO, XSLT)

? einfache Anderungen durch lesbares Textformat

(content scalability)

• Standardisierte Verarbeitungsmodelle:

Page 96: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

? einfache Transformation in anderes Zielformat (XSL-FO, XSLT)

? einfache Anderungen durch lesbares Textformat

(content scalability)

• Standardisierte Verarbeitungsmodelle:

? SAX-Parser: ereignis-basierter Parser

Page 97: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Einfachheit:

? schnelle Validierung durch einfache aber strenge Syntax

? einfache Transformation in anderes Zielformat (XSL-FO, XSLT)

? einfache Anderungen durch lesbares Textformat

(content scalability)

• Standardisierte Verarbeitungsmodelle:

? SAX-Parser: ereignis-basierter Parser

? DOM-Parser: Operationen auf dem XML-Baum

Page 98: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Internet-Orientierung:

Page 99: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Internet-Orientierung:

? reichhalte Fahigkeiten zur Verlinkung von Daten sind moglich

(Entities, XLL)

Page 100: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vorteile

• Internet-Orientierung:

? reichhalte Fahigkeiten zur Verlinkung von Daten sind moglich

(Entities, XLL)

? direkte Einbettung von Daten an anderen Adressen

Page 101: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

Page 102: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

? durch textbasiertes Format großerer Speicherbedarf

(25% bis 70%)

Page 103: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

? durch textbasiertes Format großerer Speicherbedarf

(25% bis 70%)

? hohere Ubertragungsmenge

Page 104: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

? durch textbasiertes Format großerer Speicherbedarf

(25% bis 70%)

? hohere Ubertragungsmenge

• Fehlende Skalierbarkeit:

Page 105: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

? durch textbasiertes Format großerer Speicherbedarf

(25% bis 70%)

? hohere Ubertragungsmenge

• Fehlende Skalierbarkeit:

? schlechte Performance bei Datenhaltung

Page 106: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Daten-Overhead:

? durch textbasiertes Format großerer Speicherbedarf

(25% bis 70%)

? hohere Ubertragungsmenge

• Fehlende Skalierbarkeit:

? schlechte Performance bei Datenhaltung

? mogliche Abhilfe durch Kombination mit Datenbanken

(XML als Input/Output)

Page 107: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Limitierte Modellierungsfahigkeiten:

Page 108: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Limitierte Modellierungsfahigkeiten:

? beschrankte Datentypisierung: fast nur Strings, keine Zahlen,

Tabellen, Matrizen, . . .

Page 109: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Limitierte Modellierungsfahigkeiten:

? beschrankte Datentypisierung: fast nur Strings, keine Zahlen,

Tabellen, Matrizen, . . .

? kein Mechanismus zur Beschreibung von Beziehungen zwischen

Elementen (Nachbildung durch ID und IDREF moglich)

Page 110: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Nachteile

• Limitierte Modellierungsfahigkeiten:

? beschrankte Datentypisierung: fast nur Strings, keine Zahlen,

Tabellen, Matrizen, . . .

? kein Mechanismus zur Beschreibung von Beziehungen zwischen

Elementen (Nachbildung durch ID und IDREF moglich)

? mogliche Abhilfe mit XML Schema

Page 111: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• Daten benotigen eine komplexe Modellierung und es gibt viele

verschiedene Datentypen

Page 112: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• Daten benotigen eine komplexe Modellierung und es gibt viele

verschiedene Datentypen

• es entstehen haufig neue Arten von Daten

Page 113: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• Daten benotigen eine komplexe Modellierung und es gibt viele

verschiedene Datentypen

• es entstehen haufig neue Arten von Daten

• Daten werden haufig aktualisiert und von Wissenschaftlern stark

ubers Internet verbreitet

Page 114: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• verschiedene Typen von Benutzern (Biologen, Programmierer, . . . )

brauchen Zugriff auf die Daten

Page 115: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• verschiedene Typen von Benutzern (Biologen, Programmierer, . . . )

brauchen Zugriff auf die Daten

• momentane Situation: bestehende Datenbanken mit uneinheitli-

chem Format; Daten sind mehrfach vorhanden und nur schwach

oder gar nicht miteinander verknupft

Page 116: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

XML in der Bioinformatik

• verschiedene Typen von Benutzern (Biologen, Programmierer, . . . )

brauchen Zugriff auf die Daten

• momentane Situation: bestehende Datenbanken mit uneinheitli-

chem Format; Daten sind mehrfach vorhanden und nur schwach

oder gar nicht miteinander verknupft

⇒ Vorteile von XML decken diese Aspekte ab, die meisten genannten

Nachteile lassen sich umgehen

Page 117: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vergleich von Losungen

XML-Format Feld/Wert (OO)DBMS

Ausdruckskraft ** * ****

Modellierungsfahigkeit ** * ****

Selbstbeschreibbarkeit ja nein ja

Abfragesprache ja nein ja

Flexibilitat **** * ****

Einfachheit **** **** **

Skalierbarkeit ** * ****

Kompatibilitat **** * ***

Page 118: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Vergleich von Losungen

XML-Format Feld/Wert (OO)DBMS

Ausdruckskraft ** * ****

Modellierungsfahigkeit ** * ****

Selbstbeschreibbarkeit ja nein ja

Abfragesprache ja nein ja

Flexibilitat **** * ****

Einfachheit **** **** **

Skalierbarkeit ** * ****

Kompatibilitat **** * ***

• (OO)DBMS zur Datenverwaltung, XML als Schnittstelle

Page 119: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Zusammenfassung

• benotigt werden einheitliche XML-Formate fur biologische Zwecke

Page 120: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Zusammenfassung

• benotigt werden einheitliche XML-Formate fur biologische Zwecke

• XML als Schnittstelle geeignet (z. B. standardisierter Austausch

zwischen Programmen)

Page 121: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Zusammenfassung

• benotigt werden einheitliche XML-Formate fur biologische Zwecke

• XML als Schnittstelle geeignet (z. B. standardisierter Austausch

zwischen Programmen)

• zur Datenverwaltung zu langsam und wenig skalierbar

Page 122: Einfuhrung in XML¨ - Technische Fakultät · PDF fileEinfuhrung in XML¨ Frank Schonmann¨ Motivation • Praxis: WWW dient als Oberfl¨ache f¨ur viele Informationssysteme (Datenbanken,

Einfuhrung in XML Frank Schonmann

Zusammenfassung

• benotigt werden einheitliche XML-Formate fur biologische Zwecke

• XML als Schnittstelle geeignet (z. B. standardisierter Austausch

zwischen Programmen)

• zur Datenverwaltung zu langsam und wenig skalierbar

• Problem der Modellierungsfahigkeit bleibt bestehen, lasst sich aber

moglicherweise durch XML Schema losen