26
BIOML & Friends George Gentsch, Lukas Stingelin

BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

Embed Size (px)

Citation preview

Page 1: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

BIOML & Friends

George Gentsch, Lukas Stingelin

Page 2: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

2

BIOML & Friends Übersicht

Allgemeine Einführung in BIOML Biologischer Kontext Implementation biologischer Sachverhalte Struktur und Elemente von BIOML Einführungbeispiele Beispiele aus einer „annotated“ Datenbank Spezieller BIOML Browser und Editor Evtl. „Friends“ von BIOML

Page 3: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

3

Kurzbeschreibung: BIOML erlaubt alle experimentellen Informationen über eine molekulare Einheit bestehend aus Biopolymeren wie zum Beispiel Proteine und Gene zu spezifizieren und darzustellen.

BIOML- Biopolymer Markup

Language

Working Draft Proposal (kein W3C Working Draft): 10.01.1999 (erste Version) von

Page 4: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

4

BIOML - Was sind die Ziele? BIOML soll...

ein erweiterbares „Framework“ für die Darstellung von Biopolymeren wie zum Beispiel Proteine und Gene liefern.

ein brauchbares Werkzeug für Biologen und andere Naturwissenschaftler liefern, um Informationen zu biopolymeren Sequenzen über das World Wide Web oder ein Intranet auszutauschen.

die entsprechende Darstellung vereinheitlichen, also einen (firmeninternen) Standard liefern.

Page 5: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

5

BIOML - Entwicklungskriterien BIOML Dokument soll eine zuverlässige Repräsentation

des Gen-Protein-Konzepts sein. Alle bekannten experimentellen Daten über dieses

Objekt sollen logisch, zu einem biologisch bedeutungsvollen und aussagekräftigen Gebilde zusammengefügt werden.

Das Dokument soll für den Forscher übersichtlich sein. Information soll gebündelt und hierarchisch in eine

Baum-Blatt-Struktur eingepasst werden. Dokument soll leicht erweiterbar, transferierbar und

implementierbar sein. Es soll Konversionen von anderen Daten zu BIOML und

vice versa unterstützen.

Page 6: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

6

BIOML – „Inhaltsverzeichnis“ Welche Typen von Informationen müssen mit der

biopolymeren Sequenz im BIOML Dokument abgelegt sein, damit die Information nützlich (für die biologische Forschung) ist?

Strukturinformation: Crosslinks Zusammensetzung Notizen zu Modifikationen und Aberrationen

Assoziierte Information (Funktion, Pathologie usw.) Allgemeine Information (Autor, Datum etc.) Literaturreferenzen (u.a. Webadressen) Vergleich mit anderen Daten aus Datenbanken „Key“ Attribute (für Datenbanken)

Page 7: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

7

BIOML – Biologischer Kontext

Proteine Vom Gen zum Protein Tags, Visualisierung im Browser,

DTD

Page 8: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

8

Proteine

Page 9: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

9

Proteine Kontrolle der Stoffwechselvorgänge Zellmaschinerie Strukturelemente Linearer Aufbau mit Querverbindungen

Page 10: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

10

Vom Gen zum Protein

Transkription (Compile) Translation (Run)

Page 11: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

11

Transkription 4 verschiedene Zeichen/Basen (ACTG) auf DNA Proteine aus 20 verschiedenen Aminosäuren

aufgebaut

agccctccaggacaggctgcatca

agc cct cca gga cag gct gca tca

Codons StopStart20 Aminosäuren

Abfolge der Codons = Abfolge der Aminosäuren

Page 12: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

12

Translation

Page 13: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

13

Translation

Page 14: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

14

Translation

Aneinanderreihung der Aminosäuren

3D Struktur Proprotein - Protein Domänen, Strukturen

Page 15: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

15

Tags

<dna>

<promotor>

<gene>

<exon>

<intron>

<ddomain>

<da>

<dmod>

<dvariant>

<dstart>

<dstop>

<rna>

<rdomain>

<ra>

<rmod>

<rvariant>

<rstart>

<rstop>

<protein>

<subunit>

<homolog>

<peptide>

<domain>

<aa>

<amod>

<alink>

<avariant>

Page 16: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

16

Erweiterbarkeit

domain type (Protein) aa type (Aminosäure)

Page 17: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

17

BIOML – Allgemeine Elemente (1)

Elemente zum allgemeinen Zweck meistens Blätter in der Baumstruktur z.B. <name>, <note>, <comment>, <copyright>

usw. Organismus definierende Elemente

umschliessen Tags der biopolymeren Sequenzen z.B <organism>, <species>, <common_name> usw.

Ortsdefinierende Elemente z.B <tissue>, <cell>, <organelle> usw.

Page 18: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

18

BIOML – Allgemeine Elemente (2) Literaturreferenzen

Tag <reference> Blätter von <reference>: <author>, <title>, <journal>,

<pages> usw. Sie haben nur eine Bedeutung, wenn sie von <reference>...</reference> umschlossen sind.

...<reference>

<author>Arber W.</author><title>restriction enzymes</title><journal>Nature</journal><pages>13</pages>...

</reference> ...

Page 19: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

19

BIOML – Allgemeine Elemente (3) Datenbankreferenzen

Tag <db_entry/> (immer leeres Element) Attribute: format, query, entry Beispiel:

...<reference>

<db_entry format="EMBL“ entry="L03655"/></reference> ...

...<reference>

<db_entry format="GENBANK" query="http://www2.ncbi.nlm.nih.gov/irx/cgi-bin/ birx_doc?genbank+444001"/>

</reference> ...

Page 20: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

20

BIOML – Allgemeine Elemente (4) URL-basierte Resourcen

Element <file/> mit Attribute: format, query Element <query/> mit Attribute: format, query (CGI) Beide Elemente sind immer leer.

...<file URL="http://www.proteome.com/YPD/STE20.html" format="HTML"/>...

Page 21: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

21

BIOML – Globale Attribute & Entitäten

Einige Attribute können in alle Elemente implementiert werden:

label Bezeichner für ein bestimmtes Element (Browser

braucht ihn als Platzhalter) state

„hide“, „open“ oder „close“. Information für Browser, wie das entsprechende Element dargestellt werden soll.

id Identifikationsnummer für Katalogisierungszweck

Entitäten - global zur Verfügung stehende Mnemonics: Å: &angstrom; usw.

Page 22: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

22

„Friends“ von BIOML

MoDL

SBML

CellMLStarDOM

GeneXMLMAGE-ML

GAME

BSML

MSAML

PROXIML

GEML

MAMLChemML

Page 23: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

23

„Friends“ von BIOML•MoDL: Molecular Dynamics [Markup] Language•SBML: Systems Biology Markup Language•CellML: Cell Markup Language•StarDOM: Transforming Scientific Data into XML•GeneXML: GeneX Gene Expression Markup Language•MAGE-ML: MicroArray and Gene Expression Markup Language•GAME: Genome Annotation Markup Elements•BSML: Bioinformatic Sequence Markup Language •MSAML: XML for Multiple Sequence Alignments•PROXIML: Protein Extensible Markup Language•GEML: Gene Expression Markup Language•MAML: Microarray Markup Language•ChemML: Chemical Markup Language

Page 24: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

24

BSML – Bioinformatic Sequence Markup Language

~ BIOML Standardisierung

Graphische Darstellung von Sequenzen und spezielle Ausprägungen

Zugriff auf fremde Ressourcen Durchmusterung von Genabschnitten mit Hilfe des

BSML-Browsers

Page 25: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

25

CellML – Cell Markup Language Speicherung und Austausch von computerbasierten

biologischen Modellen. Unterstützung verschiedener Modell bildenden

Programme Möglichkeit der Wiederverwendung von Komponenten

eines Modells in anderen Modellen > Beschleunigung der Modellbildung

Information zur Modellstruktur, wie die einzelnen Komponenten untereinander organisiert sind.

Information zur Mathematik (Gleichungen für biologische Prozesse) > MathML implementiert

Zusätzliche Daten für Suche von spezischen Modellen in Datenbanken

Page 26: BIOML & Friends George Gentsch, Lukas Stingelin. 5. Juni 2002 Seminar XML-Technologien/BIOML & Friends2 BIOML & Friends Übersicht Allgemeine Einführung

5. Juni 2002 Seminar XML-Technologien/BIOML & Friends

26

BIOML & Friends - Links BIOML

Homepage http://www.bioml.com/BIOML/index.html WDP http://www.bioml.com/BIOML/b_toc.htm DTD http://www.bioml.com/BIOML/bioml.dtd BioBrowser v1.3 http://www.proteometrics.com/gsc_BioML.

html#browser Übersicht http://xml.coverpages.org/bioml.html XML in Bioinformatik http://bio.perls.org/Projects/XML/

Friends Übersicht von OASIS http://xml.coverpages.org/

<kürzel>.html Praktisch jede Auszeichnungssprache hat ihre Homepage.

Z.B. http://www.bsml.org, http://www.cellml.org.