58
DNA - Computing DNA - Computing Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig

DNA - Computing

  • Upload
    havyn

  • View
    33

  • Download
    1

Embed Size (px)

DESCRIPTION

DNA - Computing. Seminar 2001 Institut Wissenschaftliches Rechnen TU Braunschweig. Überblick. Historische Entwicklung Biologische Grundlagen Hamilton Path Problem (HPP) Kombinatorische DNA – Lösung des HPP Modelle von DNA-Computing Nanostrukturen der DNA Ausblick. Einführung. - PowerPoint PPT Presentation

Citation preview

Page 1: DNA - Computing

DNA - ComputingDNA - Computing

Seminar 2001

Institut Wissenschaftliches Rechnen

TU Braunschweig

Page 2: DNA - Computing

ÜberblickÜberblick

Historische EntwicklungBiologische GrundlagenHamilton Path Problem (HPP)Kombinatorische DNA – Lösung des HPPModelle von DNA-ComputingNanostrukturen der DNA Ausblick

Page 3: DNA - Computing

EinführungEinführung

1993 Adleman lernt die Grundlagen der Molekularbiologie

1994 Adleman löst das HPP mit Hilfe von DNA 1994 Publizierung seiner Ergebnisse 1995 Formalisierung des ersten Modells durch

Lipton Heute Breite Forschung mit weltweiten

Konferenzen

Page 4: DNA - Computing

Biologische GrundlagenBiologische Grundlagen

• DNA als Informationsspeicher des DNA-Computers

• Operationen eines DNA-Computer

• Informationen kodieren• schreiben• lesen• manipulieren

Page 5: DNA - Computing

D N AD N A• 1944 von Avery entdeckt• Gundbaustein der Natur• besteht aus einzelnen Nukleotiden (Oligonukleotide)

• Zucker (desoxyribose)• Phosphatgruppe• Base

Page 6: DNA - Computing

Detaillierter Aufbau eines Detaillierter Aufbau eines NukleotidsNukleotids

Page 7: DNA - Computing

D N AD N AModell der DNA• -Doppelhelix• strickleiterartiger Doppelstrang aus gleichlangen Polynukliotidketten

5‘ 3‘

5‘3‘

Page 8: DNA - Computing

DNA als InformationsträgerDNA als Informationsträger

• herkömmliche Computer haben Alphabet X = {0, 1} • DNA besitzt Alphabet X‘ = {A, T, G, C}

Die DNA eines Menschen umfasst 6 Milliarden Basenpaarewas einer Information von ca. 500 Büchern mit 1500 Seiten entspricht.

Page 9: DNA - Computing

Amplifying (Replikation)Amplifying (Replikation)

Page 10: DNA - Computing

Annealing / MeltingAnnealing / Melting

Melting(erhitzen)

Annealing(abkühlen)

Page 11: DNA - Computing

SynthesizingSynthesizing

Page 12: DNA - Computing

CuttingCutting

Page 13: DNA - Computing

SeparatingSeparating

Page 14: DNA - Computing

ExtractingExtracting

Page 15: DNA - Computing

SubstitutingSubstituting

Page 16: DNA - Computing

Detecting / ReadingDetecting / Reading• Verwendung von PCR / Gelelektophorese• Einsatz von Blockmitteln bei der PCR• daraus resultieren kleinere Einzelstränge, die mit dem Hauptstrang zusammenhängen• durch veränderte Gelelektrophorese werden Positionen bestimmt

Neuere Methoden verwenden Leuchtstofffärbungen statt der PCR, die bei der Gelelektrophorese erkannt werden.

Page 17: DNA - Computing

...weitere Operationen...weitere Operationen

• Mixing (Crossover)• Ligating (Konkatenation)• Marking / Unmarking• Destroying (Exonuclease Enzyme)

Page 18: DNA - Computing

„„Ein DNA-Programm“Ein DNA-Programm“

• Gefäß mit in DNA kodierter Eingabe• ...Synthesizing...• ...Marking...• ...Ligating...• ...Reading...• ...• Ausgabe durch Detection als true / false oder wieder durch DNA kodiert

Page 19: DNA - Computing

Hamilton Path ProblemHamilton Path Problem

Gegeben: Ein gerichteter Graph, ein Start- und ein Endknoten

Gesucht: Ein Pfad vom Start- bis zum Endknoten, wobei jeder Knoten genau einmal besucht werden muß.

42

71

36

5

Richtiger Weg:1326547

Page 20: DNA - Computing

Lösen des HPP Lösen des HPP

1. Erzeuge eine Menge von zufällig bestimmten Pfaden durch den Graphen

2. Für alle Pfade in dieser Menge:a. Beginnt der Pfad mit dem Startknoten und endet mit

dem Endknoten ?b. Enthält der Pfad genau |V| Knoten ?c. Sind alle Knoten im Pfad vorhanden?

3. Alle Pfade in der verbleibenden Menge sind Lösungswege, ist die Menge leer gibt es keine Lösung.

Page 21: DNA - Computing

Umsetzung des Algorithmus Umsetzung des Algorithmus mit DNA - Sequenzenmit DNA - Sequenzen

Kodierung der Knoten und Kanten als DNA-Sequenzen durch Synthetisierung

Länge der Sequenzen jeweils 20 BasenJeder Knoten und jede Kante eindeutig

Page 22: DNA - Computing

Knoten und KantenKnoten und Kanten

TCAGGTCGAG TCAGGTCGAG GCCTACGTAG GCCTACGTAG

Knoten A Knoten B

AGTCCAGCTC CGGATGCATC

Kante A B

Komplement

Page 23: DNA - Computing

Erzeugung aller PfadeErzeugung aller Pfade

TGAATCGACTTCCGATAGCT

TGAACTGGGATCTAGCTAGC

1014 Moleküle

0,9 % NaCL0,9 % NaCL

100 Mikroliter Kochsalzlösung

= TT-100

Page 24: DNA - Computing

Erzeugung aller Pfade IIErzeugung aller Pfade II

• Hybridisierung von Knoten und Kanten• Ligation, zur Verstärkung des Rückrats der DNA

Page 25: DNA - Computing

Ausfilterung der Pfade ohne Ausfilterung der Pfade ohne richtigen Start- und Endknotenrichtigen Start- und Endknoten

• Melting Trennung der Doppelhelix• Hinzugabe von Sequenzen der Start- und Endknoten als Primer• DNA-Polymerase vermehrt die DNA-Sequenzen unterschiedlich:

• Mit Start- und Endknoten exponentiell• Mit Start- oder Endknoten verdoppelt• Mit keiner Entsprechung gar nicht

• Nach mehren Zyklen des Erwärmens, Abkühlens und Vermehrens wird eine Probe entnommen, die jetzt fast nur noch Pfade einen richtigen Start- und Zielknoten enthält.

Page 26: DNA - Computing

Kontrolle der LängeKontrolle der Länge

• Ein richtiger Pfad muß genau 140 bp (=Basenpaare) lang sein 7 Knoten a‘ 20 Basenpaaren• DNA-Sequenzen laufen elektrophoretisch über ein Agarose-Gel

Page 27: DNA - Computing

Überprüfung der Existenz Überprüfung der Existenz jeden Knotensjeden Knotens

•Wiederholung für alle Knoten mit entsprechenden Sonden •Melting, damit DNA-Einzelstränge vorliegen• Einbringung von Eisensonden mit Komplementstrang eines Knoten• Durch Anbringung eines Magneten bleiben alle Moleküle haften, die diesen Knoten enthalten• Abgießen der Lösung und neue Lösung ansetzen• Melting trennt Stränge von Sonden• Abgießen der Lösung in ein neues Reagenzglas

Falls noch DNA vorhanden ist, muß das die Lösung des Problems Falls noch DNA vorhanden ist, muß das die Lösung des Problems sein.sein.

Page 28: DNA - Computing

Eisensonden mit DNA-Eisensonden mit DNA-SequenzenSequenzen

Sonden-DNA

Eisenkugel

Enthaltener Knoten

Nicht passende DNA

Page 29: DNA - Computing

RückblickRückblick

Alle Pfade

Alle Pfade mit vS und vE

Alle Pfade mit der Länge |V|

Knoten 1 enthalten

Knoten 2 enthalten

Knoten n enthalten =Lösungsmenge

Page 30: DNA - Computing

Fehler beim DNA-ComputingFehler beim DNA-Computing

Pfad wird nicht erzeugtOperationen arbeiten nicht fehlerfrei

Falsche Lösungen bleiben erhaltenFehlerursache Größe, Menge und Masse der DNA

Nur statistisch wahrscheinliche Lösung !

Page 31: DNA - Computing

Beschränktes ModellBeschränktes Modell

DNA-Menge nimmt in der Berechnungsphase nicht mehr zu

DNA-Menge ist in der Initialisierungsphasebeschränkt

Anwendung von PCR wird ausgeschlossen

Page 32: DNA - Computing

Beschränktes ModellBeschränktes ModellBitvektoren kodierende Sequenzen werden erzeugt.

....A0

A1 A2 An-1

An

X0=1

X0=0

X1=1

X1=0

Xn-1=1

Xn-1=0

Vorteil: Wiederverwendung der Bitstrings für andere Probleme

Page 33: DNA - Computing

Beschränktes ModellBeschränktes ModellOperationenOperationen

ExtractionSequenzen werden getrennt, abhängig obSubsequenz vorhanden

MergeVereinigung zweier Mengen von DNA

DetectionTest, ob DNA überhaupt noch vorhanden

Page 34: DNA - Computing

Unbeschränktes ModellUnbeschränktes Modell

Erweiterung des beschränkten Modellesdurch Adleman

Menge der DNA darf zunehmenErweiterte Operation:

Amplify (PCR)

Page 35: DNA - Computing

Generator-ModellGenerator-Modell

Initialisierungsmenge effizienter nutzenSuchraum einschränken

Page 36: DNA - Computing

Generator-ModellGenerator-ModellOperationenOperationen

• Split Zufällige Aufteilung der DNA-Menge in zwei Mengen• Append Verlängerung der Sequenzen um Sequenzteile• Merge Vereinigung von zwei DNA-Mengen

Iteratives Anwenden von Split - Append - Merge erzeugt zufällige Bitvektoren. Wenn Split - Merge an bestimmten Positionen wegge-lassen wird, haben alle Sequenzen an der Stelle die gleiche Bitbelegung.Der Suchraum hat eine Dimension weniger.

Page 37: DNA - Computing

Surface-ModellSurface-Modell

DNA-Sequenzen fixiert auf einer OberflächeBessere KontrolleEinengung des Suchraums

Modell wird verwendet, um Erkenntnisse überOperationen und deren Fehler zu gewinnen

Page 38: DNA - Computing

Nanostrukturen von DNANanostrukturen von DNA

DNA-Cube

Page 39: DNA - Computing

Nanostrukturen von DNANanostrukturen von DNA

• Watson-Crick komplementär bildet Doppelhelix

• eine Zelle bildet verschiedene geometrische Gebilde

• Verhalten der Kreuzung ist vorhersagbar

• Oligonukleotide bis hin zu Superstrukturen können zur Realisierung verschiedener Rechenmodelle benutzt werden

Page 40: DNA - Computing

Nanostrukturen von DNANanostrukturen von DNA

• „self-assembly“ DNA

• kleine Anzahl von Oligonukleotiden bildet self-assembled DNA-Stränge

• self-assembly entspricht gewissen Regeln

Page 41: DNA - Computing

„„self-assembly“ - Einsatzself-assembly“ - Einsatz

Durch die Definition verschiedene Operationen auf den verschiedenen Strukturen kann folgender Einsatz erreicht werden• linear doppelte DNA-Sequenz entspricht regulärer Sprache• self-assembled verzweigte DNA kann kontextfreie Sprachen erzeugen• doppelte Crossover-Moleküle sind geeignet für universelle Berechnungen

Page 42: DNA - Computing

„„small Bricks“small Bricks“

Page 43: DNA - Computing

T A ET A E

Triple Doppelhelix mit anti-parallelen Überkreuzungen und einer geraden Anzahl von Halbdrehungen

Page 44: DNA - Computing

T A OT A O

Geeignet für Xor - Funktion / Integer - Addition

Page 45: DNA - Computing

D A ED A E

Geeignet für Integer - Addition / Lösen des HPP

X

Y

Z

W

Im folgenden Gebrauch schematisch dargestellt als:

Page 46: DNA - Computing

Ein-/Ausgabe mit Ein-/Ausgabe mit NanostrukturenNanostrukturen

Page 47: DNA - Computing

„„Adleman Graph“Adleman Graph“

65

71

42

3

Page 48: DNA - Computing

Ablauf des AlgorithmusAblauf des Algorithmus

• Erzeugen aller Pfade von Knotenpunkt 1 zu Knotenpunkt N.

• Sortieren der Knoten in jedem Pfad in ansteigender Ordnung.

•Kontrolle für jeden Pfad, dass das Resultat genau “1,2, 3,...N” ist.

• Ausgabe jedes Weges, der den Test erfüllt, wenn es einen gibt.

Page 49: DNA - Computing

Erzeugen aller PfadeErzeugen aller Pfade

Page 50: DNA - Computing

SortierenSortieren

Sortieren der einzelnen „Reihen“ durch „Odd-Even-Transposition Sort“

Page 51: DNA - Computing

Komplettieren der StrukturKomplettieren der Struktur

• Einfügen spezieller End - Einheiten• „DONE“ kann die Struktur in den Finalzustand überführen

Page 52: DNA - Computing

BeispielergebnisseBeispielergebnisse

Gültiger Hamilton-Pfad (1,4,5,2,3,6,7)

Page 53: DNA - Computing

BeispielergebnisseBeispielergebnisse

Ungültiger Pfad (1,2,3,4,5,2,3,6,7)

Page 54: DNA - Computing

Vergleich der AlgorithmenVergleich der Algorithmen

Adleman:• N (Nodes) + E (Edges) Oligonukleotide• N Laborschritte (durch Separating)

„self-assembled“:• E² / N + N² + N DAE Einheiten• konstante Anzahl von Laborschritten (Synthesizing, Annealing, Sequenzing)

Page 55: DNA - Computing

Ausblick und BewertungAusblick und BewertungVorteileVorteile

Hohe Parallelität der Berechnung– Maximum 270 DNA-Stränge in einem

Reagenzglas

Hohe Energieeffizienz – 1 Joule schafft 2*1019 Operationen

Geringer Platzbedarf– 1 Bit braucht 1nm³

Page 56: DNA - Computing

Ausblick und BewertungAusblick und BewertungNachteileNachteile

Viele Operationen sind zeitaufwendig– insbesondere Ein- und Ausgabe

NP-Probleme bleiben immer noch NP-Probleme

Operationen können fehlerhaft seinStatistisches VerfahrenKostenaufwendig

Page 57: DNA - Computing

Ausblick und BewertungAusblick und Bewertung

Interessant für Forschung und Technik (Medizin).Evolutionäre Algorithmen...

DNA-Computer werden in den nächsten 40 Jahrenvon-Neumann-Rechner für den Home-User nicht ablösen.

Page 58: DNA - Computing

The EndThe End

Viel Spaß auf dem Sportfest....Viel Spaß auf dem Sportfest....

...PROST....PROST.