118
Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur Heiner Kuhl Von der Fakultät III – Prozesswissenschaften der Technischen Universität Berlin zur Erlangung des akademischen Grades Doktor der Ingenieurswissenschaften -Dr. Ing.- genehmigte Dissertation Promotionsausschuss: Vorsitzender: Prof. Dr. Helmut Görisch Berichter: Prof. Dr. Roland Lauster Berichter: PD Dr. Lorenz Adrian Tag der wissenschaftlichen Aussprache: 07.03.2008 Berlin 2008 D83

Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz

zur Genomkartierung von Dicentrarchus labrax

vorgelegt von

Diplom-Ingenieur

Heiner Kuhl

Von der Fakultät III – Prozesswissenschaften

der Technischen Universität Berlin

zur Erlangung des akademischen Grades

Doktor der Ingenieurswissenschaften

-Dr. Ing.-

genehmigte Dissertation

Promotionsausschuss:

Vorsitzender: Prof. Dr. Helmut Görisch

Berichter: Prof. Dr. Roland Lauster

Berichter: PD Dr. Lorenz Adrian

Tag der wissenschaftlichen Aussprache: 07.03.2008

Berlin 2008

D83

Page 2: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diese Arbeit

wurde durchgeführt am

Max-Planck-Institut für

Molekulare Genetik Berlin

In der Arbeitsgruppe von

Dr. Richard Reinhardt

Page 3: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Hiermit erkläre ich an Eides Statt, dass ich die vorliegende Arbeit selbst angefertigt habe. Die

aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kenntlich

gemacht.

Heiner Kuhl Berlin, den

Page 4: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

DANKSAGUNG

Diese Arbeit entstand in der Zeit vom 1. Mai 2004 bis zum 30. November 2007 in der

Arbeitsgruppe von Dr. Richard Reinhardt am Max-Planck-Institut für Molekulare Genetik,

Berlin. Ihm danke ich für die vielfältigen technischen Möglichkeiten, welche mir in seiner

Arbeitsgruppe geboten wurden und für die verantwortungsvollen Aufgaben, die er mir

anvertraute.

Für technische Unterstützung bedanke ich mich aufs Herzlichste bei allen Mitarbeitern der

Arbeitsgruppe von Dr. Reinhardt. Besonderer Dank gilt dabei Gregor Wozniak für die

Programmierung der verschiedenen Roboter. Dr. Bernd Timmermann, Anna Kosiura und

Isabelle Kuehndahl möchte ich für die Unterstützung bei der DNA-Sequenzierung auf dem

Roche GS20-System danken. Dr. Alfred Beck, Dr. Michael Kube und Sven Klages danke ich

für bioinformatische Tipps und Tricks. Ebenso tausend Dank an Beatrice Baumann, Birol

Köysüren, Steffen Wiechert und Janina Thiel, die mit ihrer Arbeit zum reibungslosen Ablauf

der Sequenzierung von Dicentrarchus labrax beitrugen!

Herrn PD Dr. Lorenz Adrian und Herrn Professor Dr. Roland Lauster sei für die Betreuung

dieser Arbeit seitens der Technischen Universität Berlin herzlich gedankt.

Meiner Freundin Margot Kasper danke ich für die Jahre in Berlin und für Ihre immer wieder

erfolgreichen Aufmunterungsversuche in schwierigen Phasen der Doktorarbeit.

Page 5: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

I

INHALTSVERZEICHNIS

1. EINLEITUNG ................................................................................................................ 1

1.1. Bedeutung des Probendurchsatzes für die Genomsequenzierung....................... 1

1.2. Sequenzierungstechnologien der zweiten Generation ........................................... 2

1.3. DNA-Templates als limitierender Faktor der Sanger-Sequenzierung.................... 2

1.3.1. PCR ....................................................................................................................... 3

1.3.2. Rolling Circle Amplifikation .................................................................................... 3

1.3.3. Plasmid-Isolation ................................................................................................... 4

1.4. Aufreinigung von Plasmid-DNA im Hochdurchsatz ................................................ 5

1.4.1. Magnetische Partikel ............................................................................................. 6

1.4.2. Adsorption an Silica-Membranen........................................................................... 7

1.4.3. Präzipitation mit Alkoholen und direkte Sequenzierung aus Zelllysat ................... 8

1.5. Größenselektive DNA-Präzipitation in PEG / Salz Gemischen ............................... 9

1.5.1. Plasmid-Aufreinigung durch größenselektive Präzipitation ................................. 11

1.5.2. PCR-Produktaufreinigung durch größenselektive Präzipitation........................... 12

1.5.3. Automatisierung der PEG-Methode und ihre Grenzen ........................................ 12

1.6. Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen ........................... 13

1.6.1. BAC-Filterhybridisierung...................................................................................... 13

1.6.2. BAC-Klon Fingerprinting ...................................................................................... 14

1.6.3. Komparative Kartierung mit BAC-Endsequenzen................................................ 15

1.7. Der Wolfsbarsch - Dicentrarchus labrax ................................................................ 16

1.7.1. Fortgeschrittene Fischgenomprojekte für komparative Studien mit D. labrax ..... 17

1.8. Ziel der Arbeit............................................................................................................ 18

Page 6: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

II

2. MATERIAL UND METHODEN ................................................................................... 19

2.1. Verwendete Materialien und Geräte ........................................................................ 19

2.1.1. Chemikalien ......................................................................................................... 19

2.1.2. Enzyme und Reaktionspuffer............................................................................... 20

2.1.3. Besondere Verbrauchsmaterialien ...................................................................... 20

2.1.4. Primer für die Sequenzierung .............................................................................. 20

2.1.5. Längenmarker für die Agarose-Gelelektrophorese.............................................. 21

2.1.6. Geräte.................................................................................................................. 21

2.1.7. Puffer und Lösungen ........................................................................................... 22

2.1.8. BAC-Bibliothek von D. labrax .............................................................................. 24

2.1.9. Genomsequenzen von T. nigroviridis, O. latipes und G. aculeatus ..................... 24

2.2. Untersuchungen von PEG-Präzipitationsmethoden ............................................. 25

2.2.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen .......................... 25

2.2.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen......................... 26

2.2.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und

Substitution von PEG durch 2-Propanol .............................................................. 27

2.2.4. Aufreinigung von Plasmid-DNA durch größenselektive Fällung in PEG / KAcetat /

2-Propanol-Gemischen. ....................................................................................... 28

2.2.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol ....................... 30

2.2.6. Größenselektive Präzipitation von DNA für die Shotgun-Klonierung................... 30

2.2.7. Steigerung der Fosmid-DNA Ausbeute d. induzierbare high-copy Replikation ... 32

2.3. DNA-Sequenzierung ................................................................................................. 32

2.3.1. Sequenzierung von Plasmid-DNA ....................................................................... 32

2.3.2. Sequenzierung von Fosmid-DNA und BAC-DNA ................................................ 33

2.3.3. Ethanol / NaAcetat-Fällung von Sequenzierungsprodukten ................................ 34

2.3.4. Parameter für Sequenzanalyse auf dem ABI3730xl-System............................... 34

2.3.5. Sequenzierung eines Pools von 109 BACs auf dem Roche GS20-System ........ 35

2.3.6. CsCl-Gradientenzentrifugation von BAC-DNA .................................................... 35

2.4. Bioinformatische Datenanalyse .............................................................................. 36

2.4.1. Anordnung von D. labrax BAC-Endsequenzen auf den Genomen von Tetraodon

nigroviridis, Oryzias latipes und Gasterosteus aculeatus .................................... 36

2.4.2. Komparative Genomkartierung von D. labrax auf G. aculeatus .......................... 36

2.4.3. Abgleich von genetischer Kopplungskarte und komparativer Karte .................... 37

2.4.4. Abgleich der Radiation Hybrid-Kartierung von S. aurata und G. aculeatus ......... 38

2.4.5. Prozessierung der Sanger-Sequenzdaten........................................................... 38

Page 7: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

III

2.4.6. Assemblierung von BAC-Shotgun-Sequenzierungen.......................................... 38

2.4.7. Hybridassemblierung von GS20 und Sanger-Sequenzdaten .............................. 38

3. ERGEBNISSE ............................................................................................................ 40

3.1. Analyse der PEG-Präzipitation ................................................................................ 40

3.1.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen .......................... 40

3.1.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen......................... 42

3.1.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und

partielle Substitution von PEG durch 2-Propanol................................................. 42

3.1.4. Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol-Gemischen...... 44

3.1.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol ....................... 48

3.1.6. Weitere Anwendungen der größenselektiven Präzipitation ................................. 49

3.2. Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung......................... 50

3.2.1. Das 96-Well Format............................................................................................. 50

3.2.2. Das 384-Well Format........................................................................................... 51

3.3. Endsequenzierung von Fosmiden und BACs ........................................................ 54

3.3.1. Steigerung der Fosmid Ausbeute durch induzierbare high-copy Replikation ...... 54

3.3.2. Vergleich von Fosmid-Endsequenzierung mit und ohne Induktion...................... 55

3.3.3. BAC-Endsequenzierung ...................................................................................... 56

3.4. Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen ..... 57

3.4.1. Anordnung der D. labrax BAC-Endsequenzen auf Referenzgenomen ............... 57

3.4.2. Komparative Kartierung von D. labrax BAC-Klonen auf G. aculeatus ................. 58

3.4.3. Verifikation von angeordneten BAC Klonen ........................................................ 61

3.4.4. Abgleich von genetischer und komparativer Karte von D. labrax ........................ 62

3.4.5. Vergleich der Radiation Hybrid Kartierung von S. aurata mit G. aculeatus ......... 64

3.4.6. Sequenzierung von 109 BACs durch das GS20-System .................................... 65

3.4.7. Hybridassemblierung von Sanger- und GS20-Sequenzdaten eines D. labrax

Chromosoms........................................................................................................ 66

3.5. Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen ....... 66

3.5.1. EST-Sequenzierung ............................................................................................ 66

3.5.2. Fosmid-Endsequenzierung für die Genomanalyse von G. forsetii ...................... 67

3.5.3. Genomsequenzierung eines Archaebakteriums des rice-cluster-I durch

Metagenomanalyse mit Hilfe von Fosmid-Endsequenzen................................... 67

Page 8: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

IV

4. DISKUSSION.............................................................................................................. 69

4.1. Phasendiagramme der PEG-Präzipitation .............................................................. 69

4.1.1. Das PEG / NaCl-System...................................................................................... 70

4.1.2. Das PEG / MgCl2-System.................................................................................... 71

4.1.3. Das PEG / KAcetat-System................................................................................. 72

4.1.4. Fällungsparameter für die Plasmid-Präparation .................................................. 73

4.1.5. Fällungsparameter für die PCR-Produkt Aufreinigung ........................................ 74

4.1.6. Weitere Anwendungsmöglichkeiten der größenselektiven Präzipitation ............. 74

4.2. Automatisierung durch Robotik .............................................................................. 75

4.2.1. Das 96er MTP-Format ......................................................................................... 75

4.2.2. Das 384er MTP-Format ....................................................................................... 76

4.3. Sequenzierung unter Verwendung von unterschiedlichen Vektortypen............. 77

4.3.1. Plasmid-Sequenzierung....................................................................................... 78

4.3.2. Fosmid-Endsequenzierung.................................................................................. 79

4.3.3. BAC-Endsequenzierung ...................................................................................... 80

4.4. Komparative Genomkartierung von Dicentrarchus labrax ................................... 82

4.4.1. Referenzgenome ................................................................................................. 82

4.4.2. Alignment der Endsequenzen auf T. nigroviridis und G. aculeatus ..................... 82

4.4.3. Die komparative Genomkarte von D. labrax........................................................ 84

4.4.4. Abgleich von genetischer Kopplungskartierung und komparativer Kartierung .... 86

4.4.5. Verifikation von angeordneten BAC Klonen ........................................................ 88

4.4.6. Rückschlüsse auf die Genomgröße von D. labrax .............................................. 89

4.4.7. Nutzung von ultra-hochdurchsatz Sequenzierungstechniken.............................. 91

4.5. Ausblick ..................................................................................................................... 92

5. ZUSAMMENFASSUNG.............................................................................................. 95

6. QUELLEN................................................................................................................... 96

Page 9: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

V

ABBILDUNGSVERZEICHNIS

Abb. 1: Prinzip der DNA-Aufreinigung mit magnetischen Partikeln. .................................. 6 Abb. 2: Eines der automatisierten Systeme für die SPRI-Aufreinigung am JGI................. 7 Abb. 3: Glasfilterplatte für die Plasmid-DNA-Aufreinigung................................................. 7 Abb. 4: Sequentielle und parallele Fällung sonifizierter DNA nach Lis et al. ................... 10 Abb. 5.: Zusammenhang zwischen DNA-Konzentration und Ausbeute bei der

größenselektiven Präzipitation von DNA in PEG / NaCl. ..................................... 11 Abb. 6: Der Wolfsbarsch – Dicentrarchus labrax. ............................................................ 16 Abb. 7: Stammbaum der Knochenfische.......................................................................... 17 Abb. 8: Parameter der Plasmid, Fosmid und BAC Sequenzanalyse auf ABI3730xl-

Geräten................................................................................................................ 34 Abb. 9: Größenselektive Präzipitation von DNA in 1 M und 0,3 M NaCl bei

unterschiedlichen PEG-Konzentrationen............................................................. 40 Abb. 10: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / NaCl........... 41 Abb. 11: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / MgCl2. ........ 42 Abb. 12: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / KAcetat. ..... 43 Abb. 13: Größenselektive Fällung von DNA in Lösungen mit konstanter PEG- und KAcetat-

Konzentration, durch Zusatz von variierenden Mengen 2-Propanol.................... 43 Abb. 14: Messung der Absorption bei 260 nm von unterschiedlich gefällten Plasmid-

Präparationen. ..................................................................................................... 44 Abb. 15: Vergleich von Plasmid-Präparation mit und ohne RNAse.................................... 45 Abb. 16: Korrigierte Messwerte von Präparationen plasmid-haltiger Zellen. ..................... 46 Abb. 17: Leseweiten der Sequenzierung von PEG / 2-Propanol aufgereinigter Plasmide. 47 Abb. 18: Größenselektive Fällung von PCR-Produkten..................................................... 48 Abb. 19: Selektion von sonifizierten DNA-Fragmenten im Bereich von 1-4 kb durch

größenselektive Fällung. ...................................................................................... 49 Abb. 20: Anhand der Sequenzdaten ermittelte Insertgrößenverteilung von 4 BAC-Shotgun-

Banken................................................................................................................. 50 Abb. 21: Roboteranlage für Plasmid-, Fosmid- und BAC-DNA Aufreinigung im 96er MTP-

Format.................................................................................................................. 50 Abb. 22: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 96er

Format.................................................................................................................. 51 Abb. 23: Aufbau der „BigRobby“-Anlage zur automatisierten Plasmid-Aufreinigung im

384er-Format. ...................................................................................................... 52 Abb. 24: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 384er

MTP-Format. ........................................................................................................ 52

Page 10: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

VI

Abb. 25: Schema des durch die PEG / 2-Propanol-Aufreinigungsmethode vereinfachten

Ablaufs. ................................................................................................................ 53 Abb. 26: Zelldichte von L-Arabinose induzierten copy control Fosmid-Klonen in Abhängig-

keit von Inkubationszeit und Medienzusammensetzung...................................... 54 Abb. 27: Vergleich von Fosmid-Endsequenzierungen im 96er MTP- und im 384er MTP-

Format.................................................................................................................. 55 Abb. 28: Leseweitenverteilung von 102.282 Endsequenzen einer BAC-Bank des D. labrax

Genoms. .............................................................................................................. 56 Abb. 29: Elektropherogramm einer BAC-Endsequenzierung............................................. 56 Abb. 30: Menge der auf verschiedenen Fischgenomen angeordneten BAC-Endsequenzen

in Prozent............................................................................................................. 58 Abb. 31: Genomweite Darstellung der komparativen Karte von D. labrax auf den

Chromosomen von G. aculeatus. ........................................................................ 60 Abb. 32: Vergleich von durch komparative Kartierung auf G. aculeatus vorhergesagten

Koordinaten von BAC-Endsequenzen und realen Koordinaten auf D. labrax. .... 61 Abb. 33: Abgleich der genetischen Kopplungskarte von D. labrax und dem Genom von

G. aculeatus......................................................................................................... 63 Abb. 34: Unterschiede des Sequencing Coverage der 1000 größten Contigs eines Pools

von 109 auf dem GS20-System sequenzierten BAC-Inserts............................... 65 Abb. 35: PEG / NaCl-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher

Fragmentgrößen. ................................................................................................. 71 Abb. 36: PEG / MgCl2-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher

Fragmentgrößen. ................................................................................................. 71 Abb. 37: PEG / Kaliumacetat-Phasendiagramm für die Löslichkeit von DNA

unterschiedlicher Fragmentgrößen...................................................................... 72 Abb. 38: Durchmischung von hochkonzentrierter PEG / NaCl-Lösung mit Plasmid-DNA

durch Einwirkung der Schwerkraft. ...................................................................... 76 Abb. 39: Anzahl einseitig und beidseitig sequenzierter BAC-Klone................................... 81 Abb. 40: Vergleich der Anordnung von BAC-Endsequenzen auf dem Genom von

T. nigroviridis und G. aculeatus............................................................................ 83 Abb. 41: Grafische Darstellung des Bereichs aus Tab. 22. ............................................... 85 Abb. 42: Vergleich homologer Chromosomen von T. nigroviridis, S. aurata und

G. aculeatus, sowie komparativer BAC-Karte von D. labrax. .............................. 87 Abb. 43: Genstruktur der cyp19-Aromatase Isoformen, welche auf bassbac-27g15 und

bassbac-22g15 identifiziert wurden. .................................................................... 88 Abb. 44: Alignment eines 1,3 Mb Scaffold von D. labrax auf G. aculeatus und T. nigroviridis

durch VISTA. ....................................................................................................... 90

Page 11: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

VII

Abb. 45: Darstellung der Verteilung „virtueller“ Insertgrößen beidseitig angeordneter BACs

auf Genomen von T. nigroviridis, G. aculeatus und O. latipes. ........................... 90 Abb. 46: Vergleich von Sequenzierungsergebnissen des GS20-Systems. ....................... 91 Abb. 47: Vista Alignment der Sequenzdaten von 109 BACs, welche mit dem GS20 System

gepoolt sequenziert wurden................................................................................. 92 Abb. 48: Entwicklung des Sequenzierungsdurchsatzes am MPI f. Molekulare Genetik. ... 93

Page 12: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

VIII

TABELLENVERZEICHNIS

Tab. 1: Vor- und Nachteile von alternativen Methoden zur Produktion von Template-DNA

für die Sanger-Sequenzierung............................................................................... 5 Tab. 2: Einflussparameter auf die größenabhängige DNA-Fällung in PEG / NaCl

Gemischen nach Lis et al. ................................................................................... 10 Tab. 3: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / NaCl-Fällung. .. 25 Tab. 4: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen NaCl-

Versuchsreihen. ................................................................................................... 25 Tab. 5: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / MgCl2-Fällung.. 26 Tab. 6: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen MgCl2-

Versuchsreihen. ................................................................................................... 26 Tab. 7: Versuchsreihen zur Bestimmung von Eigenschaften der PEG/KAcetat-Fällung. 27 Tab. 8: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen KAcetat-

Versuchsreihen. ................................................................................................... 27 Tab. 9: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-

Fällung in Gegenwart von 2-Propanol.................................................................. 28 Tab. 10: Schrittweise Erhöhung der 2-Propanol-Konzentration in den einzelnen

Versuchsreihen mit Kaliumacetat / PEG. ............................................................. 28 Tab. 11: Versuchsreihen zur Bestimmung von Fällungsparametern zur Plasmid-DNA

Aufreinigung in PEG / Kaliumacetat / 2-Propanol. ............................................... 29 Tab. 12: Plasmidsafe-Reaktionsansätze zum Verdau von linearer genomischer DNA. .... 30 Tab. 13: Reaktionsbedingungen für die Reparatur der Enden von gescherter DNA. ........ 31 Tab. 14: Ligationsansatz für die Erstellung von Shotgun-DNA-Banken. ........................... 31 Tab. 15: Zusätze für die verzögerte Induktion der high-copy Replikation von pCC1Fos-

Vektoren............................................................................................................... 32 Tab. 16: Sequenzierungsreaktion für Plasmid-DNA. ......................................................... 32 Tab. 17: Temperaturprogramm für die Sequenzierung von Plasmid-DNA. ....................... 33 Tab. 18: Modifizierter Sequenzierungsansatz für BACs und Fosmide. ............................. 33 Tab. 19: Ergebnisse des D. labrax BAC-Endsequenzierungsprojekts............................... 57 Tab. 20: Oxford-Plot von 460 Markern der S. aurata Radiation Hybrid-Kartierung auf den

Chromosomen von G. aculeatus.......................................................................... 64 Tab. 21: Typische Ausbeuten und Leseweiten bei unterschiedlichen Vektorkonstrukten. 78 Tab. 22: Tabellarische Darstellung von angeordneten BAC-Endsequenzen auf dem

Genom von G. aculeatus. .................................................................................... 84

Page 13: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

IX

ABKÜRZUNGSVERZEICHNIS

2-prop 2-Propanol

Ab Absorption

AFLP amplified fragment-length polymorphism

AG Arbeitsgruppe

Abb. Abbildung

b Basen

BAC bacterial artificial chromosome

Baylor HGSC Baylor Human Genome Sequencing Center; USA

bp Basenpaare

cDNA komplementäre DNA

CGE capillary gelelectrophoresis, Kapillargelelektrophorese

Chr Chromosom

Contig lückenlose Sequenzdaten, welche aus überlappenden kürzeren

Sequenzen zusammengesetzt sind

d day, Tag

ddNTP Didesoxynukleotid

DNA Desoxyribonukleinsäure

dNTP Desoxynukleotid

EDTA Ethylendiamintetraessigsäure

ES Endsequenz

EST expressed sequence tag

et al. et alteri

FLI Fritz-Lipmann-Institut, Jena

G Erdbeschleunigung (9,81 m/sek2)

GBF Gesellschaft für Biotechnologische Forschung, Braunschweig

h hours, Stunden

HZI Helmholtz Zentrum für Infektionsforschung, Braunschweig

IMB Institut für Molekulare Biotechnologie, Jena

JGI Joint Genome Institute, USA

kb Kilobasen

Mb Megabasen

Mbp Megabasenpaare

MPI Max-Planck-Institut

MTP Mikrotiterplatte

OD Optische Dichte

Page 14: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

X

ORF open reading frame

Ori origin of replication, Replikationsursprung

PCR polymerase chain reaction, Polymerase-Kettenreaktion

PA Polyacrylamid

PEG Polyethylenglycol

PVDF Polyvinylidenfluorid

RCA rolling circle Amplifikation

RC-I Rice Cluster I

RH radiation hybrid

RIKEN Institute of Physical and Chemical Research, Japan

RNA Ribonukleinsäure

rpm rotations per minute, Umdrehungen pro Minute

RT Raumtemperatur

RZPD Deutsches Ressourcenzentrum für Genomforschung

SDS Sodium-dodecyl-sulfate, Natriumdodecylsulfat

s Sekunden

SNP single nucleotide polymorphism

SPRI solid phase reversible immobilization

Tab. Tabelle

TBE TRIS-Borat-EDTA

TE TRIS-EDTA

TIGR The Institute for Genome Research, USA

TRIS HCl Tris (hydroxymethyl) aminomethan Hydrochlorid

UV Ultraviolettstrahlung

VBA Visual Basic for Applications

v/v Volumen pro Volumen

w/v Gewicht pro Volumen

wga whole genome amplification

WGS whole genome shotgun

YAC Yeast artificial chromosome

YT Yeast Tryptone

λ-DNA Erbgut des Phagen Lambda

Page 15: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Bedeutung des Probendurchsatzes für die Genomsequenzierung 1

1. Einleitung

1.1. Bedeutung des Probendurchsatzes für die Genomsequenzierung

Nach der Aufklärung der DNA-Struktur 1953 (1) und der Entschlüsselung des genetischen

Codes 1961 - 1966 (2) wurden schnelle Methoden benötigt, die die Basenabfolge in DNA-

Molekülen bestimmen konnten. Die Arbeiten von Frederick Sanger (3) sowie Maxam und

Gilbert (4) ermöglichten die Bestimmung der Sequenz von DNA-Fragmenten gegen Ende

des Jahres 1977.

Mit Entwicklung der Polymerase-Kettenreaktion (PCR) ab 1983 (5, 6) konnte die Sanger-

Methode weiter verbessert werden, in dem man die Sequenzierungsreaktion als Cycle-

Sequencing in Thermocyclern durchführte. Durch Nutzung von Fluoreszenzfarbstoffen für die

Markierung der ddNTPs setzte sich die Sanger-Methode endgültig gegenüber der Maxam-

Gilbert-Methode durch, da die Arbeitsschritte ohne Radioaktivität durchgeführt wurden und

die Methode besser automatisiert werden konnte.

Die Leseweite von DNA-Fragmenten ist mit der Sanger-Methode auf ca. 1.000 b limitiert,

woraus resultierte, dass für die Sequenzierung größerer DNA-Moleküle Klonierungs-

strategien entwickelt werden mussten.

Die Shotgun-Klonierung (7) ist ihr bekanntester Vertreter. Die geringe Leseweite bei der

Sequenzierung kann mit der Shotgun-Methode durch eine Vielzahl von Sequenzierungen

zufällig überlappender Fragmente des ursprünglichen DNA-Strangs kompensiert werden. Im

Durchschnitt musste jede Base großer DNA-Moleküle statistisch betrachtet mindestens

10fach sequenziert werden, um die Basenabfolge des Moleküls aus kurzen überlappenden

Sequenzen lückenlos zu rekonstruieren. Methoden, die höhere Leseweiten erzielten als die

Sequenzierung nach Sanger, waren und sind bisher nicht bekannt. Die weitere Entwicklung

der Sequenzierungstechnologien musste also durch massive Parallelisierung vorangetrieben

werden.

Vor 1990 war nur die Sequenzierung kleiner viraler Genome und Plasmide möglich. Erst in

den 90er Jahren konnten polyacrylamidgel-basierte Sequenzierroboter bis zu 96 Proben in

ca. 8 - 10 h parallel bearbeiten und ermöglichten es, bakterielle Genome mit vertretbaren

Zeitaufwand zu sequenzieren (50.000 – 70.000 Sequenzierungen) (8). Ab 1999 nutzten

Sequenzierroboter die Kapillargelelektrophorese (9), um den Probendurchsatz bei

geringerem Personalbedarf weiter zu steigern. Durch internationale Kooperation wurde es

möglich, das menschliche Genom innerhalb weniger Jahre zu entschlüsseln (>30 Mio.

Sequenzierungen) (10, 11).

In den letzten Jahren wurden neue Sequenzierungstechnologien entwickelt, welche auf hohe

Durchsatzsteigerung bei kürzeren Leseweiten ausgelegt sind.

Page 16: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Sequenzierungstechnologien der zweiten Generation 2

1.2. Sequenzierungstechnologien der zweiten Generation

Mittlerweile sind verschiedene DNA-Sequenzierer der zweiten Generation erhältlich, welche

DNA-Sequenzierung im ultra-Hochdurchsatz ermöglichen (20 - 1000 Mb pro Gerätelauf). Im

Vergleich zur Sanger-Sequenzierung liefern diese Geräte relativ kurze Sequenzdaten von

25 – 250 b. Durch die parallele Analyse von 105 – 107 unterschiedlichen DNA-Molekülen

können die Nachteile der kurzen Sequenzen aber zum Teil ausgeglichen werden.

Das Einsatzgebiet der neuen Technologien ist abhängig von der Art des Genomprojekts. So

eignen sich Sequencing by Synthesis (Illumina / Solexa) und die SOLiD-Technologie (ABI)

wegen ihrer kurzen Leseweiten (25 – 50 b) weniger für die de novo Sequenzierung

unbekannter Genome (12, 13). Für die Resequenzierung von bereits bekannten Genomen,

z. B. zur Analyse von SNPs, stellen die kurzen Leseweiten weniger ein Problem dar. Die

Technologie eignet sich besonders für die Analyse von Expressionsprofilen, z.B. durch

SAGE (Serial Analysis of Gene Expression) oder direkte cDNA-Quantifizierung (14).

Die von Roche / 454 verwendete Pyrosequencing-Technologie erzielt immerhin Leseweiten

von 100 b (250 b in der FLX Version) und ist damit für die de novo Sequenzierung wenig

repetitiver Bakteriengenome prinzipiell geeignet (15).

Goldberg et al. zeigten allerdings anhand der Sequenzierung von mehreren marinen

Bakteriengenomen, dass für qualitativ hochwertige Genomassemblierung weiterhin eine

niedrige Genomabdeckung mit Sanger-Sequenzdaten benötigt wird (85).

1.3. DNA-Templates als limitierender Faktor der Sanger-Sequenzierung

Wie in 1.1 dargestellt erfordert die Sanger-Sequenzierung von Genom-, Metagenom- oder

EST-Projekten aufgrund der hohen Anzahl von Proben automatisierte Systeme, welche die

zur Sequenzbestimmung notwendigen Schritte im Hochdurchsatz durchführen.

Mit der Entwicklung des Cycle-Sequencing nach Sanger und der Kapillargelelektrophorese

besteht die Möglichkeit, Sequenzierungsreaktion und Sequenzanalyse in 384er

Mikrotiterplatten (MTP) durchzuführen, so dass ein hoher Probendurchsatz erzielt wird.

Limitierender Faktor des Probendurchsatzes ist dagegen die zuverlässige Herstellung

qualitativ hochwertiger DNA als Template für die Sequenzierung nach Sanger. Verschiedene

Möglichkeiten zur Produktion sequenzierungstauglicher DNA mit hohem Probendurchsatz

werden im Folgenden vorgestellt.

Page 17: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: DNA-Templates als limitierender Faktor der Sanger-Sequenzierung 3

1.3.1. PCR

Die enzymatische Amplifikation mittels PCR kann direkt aus der Übernachtkultur einzelner

Klone einer Klonbibliothek stattfinden (16). Prinzipiell werden die Inserts der Klone dabei so

stark vervielfältigt, dass Verunreinigungen (Zellbestandteile, Reste d. Kulturmediums)

gegenüber der DNA-Konzentration vernachlässigbar werden. Die PCR-Reaktionen können

in kleinen Reaktionsvolumina (10 – 20 µl) durchgeführt und DNA-Bibliotheken somit im 384er

MTP-Format bearbeitet werden, welches im Allgemeinen Volumina bis 40 µl pro Kavität

zulässt.

PCR-Produkte sind grundsätzlich gut geeignet für die Sequenzierung, wenn die Substrate

der Reaktion (Primer, dNTPs) während der Produktbildung verbraucht wurden. Ist dies nicht

der Fall, müssen insbesondere überschüssige Primer durch Aufreinigungsmethoden entfernt

werden, da sie sonst in der Sequenzierungsreaktion Fehlsignale verursachen, die die

Sequenzierungsqualität herabsetzen. Am MPI f. Molekulare Genetik wurden von Holger

Rauth und Richard Reinhardt seit 1996 verschiedene PCR-basierte Verfahren für die

automatisierte Template-Präparation entwickelt (17).

Im Hochdurchsatz ist die Anwendung der PCR auf DNA-Bibliotheken mit geringen

Insertgrößen von 0,1 - 4 kb beschränkt, wobei mit zunehmender Insertgröße die Anzahl an

Reaktionen steigt, welche keine ausreichende Amplifikation liefern. Eine nachträgliche

Qualitätskontrolle und eine Neuanordnung der Produkte (Rearraying) auf neuen MTPs ist

somit notwendig und verzögert den Sequenzierungsprozess maßgeblich.

Ein weiteres Problem der PCR-Methode ist der so genannte Amplification-Bias. Bestimmte

DNA-Sequenzen können nur schlecht oder gar nicht mittels PCR amplifiziert werden und

sind somit in den Ergebnissen der Sequenzierung unterrepräsentiert.

1.3.2. Rolling Circle Amplifikation

Ebenso wie bei der PCR wird DNA bei der Rolling Circle Amplifikation (RCA) durch eine

enzymatische Reaktion vervielfältigt. Die verwendete DNA-Polymerase aus dem

Bacteriophagen Φ29 besitzt eine Strand-Displacement Aktivität und kann ausgehend von

Brüchen (nicks) den DNA-Doppelstrang auftrennen und neu synthetisieren. An dem

verbleibenden Einzelstrang binden Hexamer-Primer zufälliger Sequenz und werden von der

Φ29-DNA-Polymerase zum Doppelstrang ergänzt (18).

Zwar ist die RC-Amplifikation unspezifisch und amplifiziert auch genomische DNA aus der

Übernachtkultur, die hohe Prozessivität der Polymerase (mittlere Produktgröße > 20 kb)

bewirkt jedoch, dass ringförmige Plasmide mit hoher Kopienzahl gegenüber linearen

Page 18: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: DNA-Templates als limitierender Faktor der Sanger-Sequenzierung 4

Fragmenten bevorzugt amplifiziert werden. Im Gegensatz zur PCR können also auch

Vektoren, welche Inserts größer 4 kb tragen mit RCA noch zuverlässig amplifiziert werden.

Bei Fosmid- oder BAC-Klonen mit Insertgrößen jenseits von 40 kb und niedriger Kopienzahl

pro Zelle ist jedoch ein vorausgehender Aufreinigungsschritt unerlässlich (19).

Die Reaktion läuft isothermal bei 30ºC ab, dies ist ein Vorteil gegenüber der PCR, welche in

Thermocyclern durchgeführt werden muss. Kommerziell erhältliche Reagenzien für RCA

liefern hohe Produktausbeuten von 150 - 300 ng/µl. Die Reaktion kann in sehr kleinen

Volumina (> 5 µl) durchgeführt werden, was die Nutzung von MTP bis hin zum 1536 Format

ermöglicht.

Die Qualitätskontrolle der RCA-Produkte gestaltet sich schwierig, da sie im Gegensatz zu

PCR-Produkten keine definierten Produkte liefert, sondern ein Gemisch verzweigter DNA

verschiedener Größe, welches auch in Negativ-Kontrollen ohne DNA aus den vorhanden

Hexamer-Primern gebildet wird.

Probleme durch Amplification-Bias sollen wesentlich geringer sein als bei der PCR, weshalb

die RCA bevorzugt auch für die Amplifikation ganzer Genome eingesetzt wird (20).

1.3.3. Plasmid-Isolation

Im Gegensatz zu den in 1.3.1 und 1.3.2 dargestellten enzymatischen Methoden, kann

Template-DNA für die Sequenzierung auch direkt aus den Zellen einer Klon-Bibliothek

gewonnen werden (Amplifikation in vivo). Die Amplifikation der Plasmid-DNA erfolgt dabei

durch Kultivierung der Zellen in größeren Volumen (meist 1,5 ml). Die Größe der Konstrukte

ist dabei nur durch den verwendeten Vektortyp und die Effizienz bakterieller Replikation

beschränkt. Ebenso werden Amplification-Bias Effekte vermieden. Da isolierte Plasmide

keine unverbrauchten Oligonukleotide oder unspezifische Produkte enthalten, ist die Qualität

der Sequenzdaten meist höher als bei unaufgereinigten PCR-Produkten.

Die Vorteile der Plasmid-Isolation gegenüber den enzymatischen Methoden werden durch

höheren methodischen Aufwand teuer erkauft. Laufende Kosten entstehen vor allem durch

verwendete Einwegmaterialien wie Filter und magnetische Partikel. Zusätzlich leidet der

Probendurchsatz unter den großen verwendeten Kulturvolumina, welche die Prozesse meist

an das 96er MTP-Format binden. In Tab. 1 sind die Vor- und Nachteile der dargestellten

Methoden zusammengefasst.

Page 19: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 5

Tab. 1: Vor- und Nachteile von alternativen Methoden zur Produktion von Template-DNA für die Sanger-Sequenzierung.

Prinzip Amplifikation in vivo

Amplifikation in vitro

Methode

alkalische Lyse + Aufreinigung mit

magnetischen Partikeln oder Filterplatten

PCR Rolling Circle Amplifikation

Vorteile: geringe Konta-minationsproblematik, Stabilität verwendeter Reagenzien

Vorteile: in kleinen Volumen durchführbar (384er MTP-Format), wenige Arbeits-schritte

Vorteile: in kleinsten Volumen durchführbar (1536er MTP), wenige Arbeitsschritte Hochdurchsatz-

fähigkeit / Automatisier-

barkeit

Nachteile: zeitaufwendig, große Volumina werden benötigt (bisher meist nur 96 Mikrotiterplatten-format)

Nachteile: Instabilität des Enzymansatzes, Kontaminationsproblematik, aufgrund von Ausfällen Rearraying der positiven Produkte notwendig

Nachteile: extreme Kontaminations-problematik, hohe Instabilität des verwendeten Enzyms

Kosten

hoch, da kommerzielle Systeme viele Einweg- materialien verbrauchen (Spitzen, Filter, Beads), 0,4 – 1 Euro pro Klon

niedrig, insofern Enzyme und PCR-Reaktionspuffer selbst hergestellt werden, < 0,1 Euro pro Klon, zusätzliche Kosten für Rearraying der Produkte

hoch, da bisher nur kommerzielle Kits von Amersham-Pharmacia erhältlich 0,25 - 1 Euro pro Klon

Größenbereich amplifizierter

DNA

sämtliche Vektortypen können aufgereinigt werden, 3 kb (pUC) bis 300 kb (BAC), unabhängig von der Insertgrößenverteilung in der DNA-Bank

Im Hochdurchsatz sinkt die Ausbeute ab ca. 4 kb drastisch, gut im Bereich 0,1 kb - 2 kb, enger Größenbereich der Inserts in DNA-Bank ist von Vorteil

im Bereich 3kb - 10kb gute Ausbeuten, größere low-copy Konstrukte können nur nach Aufreinigung der Proben DNA amplifiziert werden

Qualität der Sequenzdaten

sehr gut, auch Bereiche die sich mit PCR nicht amplifizieren lassen

gut, es gibt jedoch Sekundärstrukturen, welche sich nicht amplifizieren lassen

Qualität der Sequenzen liegt über der von PCR-Produkten, reicht jedoch nicht an die von Plasmid Präparationen heran, vor allem bei Vektoren > 10 kb

Qualitäts-kontrolle

Qualitätskontrolle der DNA über Agarosegele gut, photometrische Methoden sind je nach verwendetem System eingeschränkt möglich

Qualitätskontrolle über Agarosegele sehr gut

Qualitätskontrolle nur sehr unzuverlässig, auch Negativkontrol-len ohne DNA bilden Produkte -> Restrikt-ionsverdau notwendig!!!

1.4. Aufreinigung von Plasmid-DNA im Hochdurchsatz

Wie in 1.2 dargestellt, ist die Plasmid-Präparation die flexibelste, aber auch technisch

aufwändigste Methode zur Herstellung von qualitativ hochwertigen DNA-Templates. In den

großen Sequenzierungszentren sind deshalb automatisierte Anlagen konzipiert worden, um

den nötigen Probendurchsatz von bis zu 50.000 Plasmiden pro Tag zu gewährleisten und die

Page 20: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 6

Kosten zu reduzieren. Die Verfahren unterscheiden sich maßgeblich in den verwendeten

Strategien zur Plasmid-Aufreinigung.

1.4.1. Magnetische Partikel

Elkin et al. veröffentlichten 2001 ein Verfahren, das am Joint Genome Institute (JGI) für die

Plasmid-Aufreinigung im Zuge des Humangenomprojekts entwickelt und angewendet

wurde (21). Die Plasmid-Isolation erfolgte im 96er MTP-Format durch Zelllyse in Lyso-

zym / Detergenz-Puffer und anschließender Plasmid-DNA-Aufreinigung durch Solid Phase

Reversible Immobilization (SPRI) mit Hilfe von carboxylierten magnetischen Partikeln (22).

Das Prinzip des Aufreinigunsschrittes ist in Abb. 1 dargestellt.

Abb. 1: Prinzip der DNA-Aufreinigung mit magnetischen Partikeln. Plasmid-DNA (rot) bindet in Gegenwart eines Bindungspuffers an magnetische Partikel (schwarz). Verun-reinigungen (grün) werden entfernt. Plasmid-DNA wird in konzentrierter Form in Elutionspuffer gelöst und von den Partikeln getrennt.

Durch vergleichende Sequenzierung von Plasmiden, welche mit Ethanol-Fällung oder SPRI

aufgereinigt worden waren, konnte gezeigt werden, dass die Qualität der Aufreinigung durch

SPRI wesentlich höhere Leseweiten (582 ± 51,6 b gegenüber 446 ± 81,2 b) und mehr

erfolgreiche Sequenzierungen (91 ± 5,6% gegenüber 69,1 ± 15,4%) auf Megabace 1000

Kapillarsequenzierern erzielte (21).

Der Aufreinigungsschritt wurde auf einem Robotersystem automatisiert und erzielte einen

Probendurchsatz von ca. 600.000 Plasmiden pro Monat (20.000 / d) (siehe Abb. 2). Da die

Plasmid-DNA durch Magnetseparatoren von Verunreinigungen getrennt wurde, konnten

Zentrifugationsschritte vermieden werden, so dass die Automatisierung vereinfacht wurde.

Mittlerweile sind Reagenzien auf Basis der SPRI-Technik kommerziell erhältlich, welche die

Aufreinigung auch im 384er MTP-Format ermöglichen (23). Die Kosten pro Probe reduzieren

sich dabei auf ca. 15 Cents für die verwendeten Reagenzien.

Page 21: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 7

Abb. 2: Eines der automatisierten Systeme für die SPRI-Aufreinigung am JGI. Das System bewältigt 11 x 96er MTPs pro Stunde (21).

1.4.2. Adsorption an Silica-Membranen

Itho et al. präsentierten 1999 ein System für die Plasmid-Aufreinigung im Hochdurchsatz am

japanischen Forschungsinstitut RIKEN (24). Für die Aufreinigung wurden Glasfilterplatten im

96 MTP-Format konstruiert. Der Ablauf erlaubt es, die Zelllyse durch Lysozym / SDS-Puffer,

selektive Bindung der Plasmid-DNA an die Silicamatrix in Anwesenheit von Guanidin / HCl,

Waschschritte und Elution in einer einzigen Filterplatte durchzuführen. Der Durchfluss der

Reagenzien durch die Filterplatten wird durch ein angelegtes Vakuum möglich, wodurch

aufwändig zu automatisierende und durchsatzlimitierende Zentrifugationsschritte vermieden

werden (siehe Abb. 3).

Abb. 3: Glasfilterplatte für die Plasmid-DNA-Aufreinigung. Das Vo-lumen der Wells beträgt 600 µl. Am Boden jeder Platte befindet sich ein Glasfilter und eine hydrophile PVDF Membran mit einer Porengröße von 0,45 µm. Die Glasfilter sind so ausgelegt, dass E. coli Zellen ge-erntet werden können und Plasmid-DNA in Gegenwart von Guanidin-HCl nach der Lyse adsorbiert wird. Die PVDF Membran hält die Lö-sungen an ihrem Platz (24).

Page 22: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 8

Ein vollautomatisiertes System zur Plasmid-DNA-Aufreinigung wurde als Fließband

konzipiert, auf dem etwa 15.000 Proben in 8 h (45.000 / d) aufbereitet werden können. Ein

Test zeigte, dass 295 von 384 Proben gute Ausbeuten an Plasmid-DNA aufwiesen (76,8%),

von denen wiederum 276 (93,5%) gute Sequenzdaten lieferten. Die relativ hohen Verluste

bei der Präparation wurden auf Wachstumsprobleme der zugrunde liegenden Bakterien-

kulturen zurückgeführt. Die mittlere Leseweite auf einem ABI 377 Sequenzer betrug 450 b

(Ergebnisse sind nicht vergleichbar mit denen von 1.4.1, da verschiedene Geräte für die

Sequenzanalyse verwendet wurden).

Eppendorf bietet kommerzielle Aufreinigungssysteme für Plasmid-DNA auf Basis von 384-

Well Filterplatten mit DNA-Bindungskapazität an (25).

Dederichs et al. beschreiben eine äußerst preisgünstige Alternative zur Aufreinigung von

Plasmiden, welche am Baylor College of Medicine verwendet wird (26). Hierbei handelt es

sich um die Adsorption von Plasmid-DNA an Glasperlen (Ø 212 - 150 µm) in Gegenwart von

2-Propanol. Die Methode wurde nicht automatisiert, konnte aber trotzdem einen Durchsatz

von etwa 10.000 Proben pro Tag gewährleisten, wobei der Anteil erfolgreicher

Sequenzierungen bei ca. 82% lag und Leseweiten von durchschnittlich 500 b auf ABI 3700

Sequenzierern erreicht wurden. Die Kosten der Methode schätzte man auf 10 US-Cents pro

Plasmid. Sie lagen zum damaligen Zeitpunkt (2002) bei 10% des Marktpreises.

1.4.3. Präzipitation mit Alkoholen und direkte Sequenzierung aus Zelllysat

Das Labor von Bruce Roe am Advanced Center for Genome Technology der Universität

Oklahoma hat Protokolle zur Isolation von Plasmiden aus 384er MTPs im Internet öffentlich

zugänglich gemacht (27). Das Protokoll nutzt die alkalischen Lyse und anschließende

2-Propanol Fällung (28). Es kann hier kaum von einer wirklichen Aufreinigung gesprochen

werden, da 2-Propanol auch verdaute RNA und Proteine präzipitiert. Deshalb ist es

fragwürdig, ob die Qualität und Ausbeute der DNA auch für schwieriger zu sequenzierende

Templates, wie BACs oder Fosmide ausreicht. Über Ausfallrate und Leseweite gibt es keine

Angaben.

Ein ähnliches Verfahren zur Isolation von Plasmid-DNA bedient sich Filterplatten von

Corning (29). Hierbei wird das Zelllysat der alkalischen Lyse in einem einzigen

Zentrifugationsschritt durch einen 0,45 µm PVDF-Filter geklärt und in 2-Propanol gefällt. Die

Kosten werden mit 7 US-Cents pro Plasmid angegeben. Die erzielte Leseweite liegt bei

durchschnittlich 599 b auf ABI 3700 CGE-Sequenzern. Über Ausfallraten ist nichts bekannt.

Eine weitere sehr preisgünstige Methode wurde von Marra et al. am Washington Genome

Sequencing Center implementiert (30). Wie im Protokoll von Bruce Roe wird hier ebenfalls

auf eine wirkliche Aufreinigung der DNA verzichtet, die Zellen werden durch eine

Kombination von enzymatischer Lyse durch Lysozym und anschließender Hitzeeinwirkung

Page 23: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 9

durch Mikrowellenbestrahlung in 96 MTPs aufgeschlossen. Das Zelllysat wird zentrifugiert

und der Überstand direkt für die DNA-Sequenzierung verwendet. Auf polyacrylamidgel-

basierten ABI377-Sequenzierern konnten durchschnittlich 425 b gelesen werden, wobei 70%

aller Sequenzen Leseweiten über 400 b aufwiesen. Der Preis pro Plasmid-Präparation lag

bei 3 US-Cents und ist derzeit der niedrigste veröffentlichte Wert.

Eine der von Marra et al. ähnliche Methode wurde von Applied Biosystems auf neuerer

Sequenzierungstechnologie und im 384er MTP-Format angewendet. Ein wissenschaftliches

Poster hierzu findet sich im Internet (31). Die Verwendung des ABI3730 Sequenzierroboters

und der BigDye3.1 Sequenzierungsreagenzien erzielten typische Leseweiten von 700 -

800 b mit sehr geringen Ausfallraten.

Alle der in 1.4.3 dargestellten Methoden sind zwar für die Sequenzierung von high-copy

Vektoren geeignet, erweisen sich jedoch problematisch, wenn es um große Vektor-

Konstrukte mit geringer Kopienzahl (BACs, Fosmide) geht.

Außerdem werden wegen des hohen Preisdrucks, der auf öffentlichen Instituten wie auch

kommerziellen Sequenzierungsfirmen lastet, Reagenzien für den Sequenzierungsansatz

meist verdünnt eingesetzt. Hochverdünnte Sequenzierungsreagenzien werden allerdings mit

unzureichend aufgereinigten Plasmid-Templates zunehmend instabil.

Zusätzlich besteht das Problem, dass die Kapillaren moderner CGE-Sequenzierer anfällig für

Verunreinigungen sind und bei unzureichender Template Qualität häufiger gewechselt

werden müssen. Die preisgünstigen Methoden ziehen also Folgekosten nach sich, welche

den Vorteil der Methoden relativieren.

Eine bisher wenig beachtete alternative Aufreinigungsmethode für Plasmide wird im

Folgenden dargestellt. Die Präzipitation von DNA in Polyethylenglycol (PEG) erzielt eine gute

Reinheit der DNA und kommt ohne teure Einwegprodukte wie Filterplatten oder magnetische

Partikel aus.

1.5. Größenselektive DNA-Präzipitation in PEG / Salz Gemischen

Lis et al. beschrieben 1975 erstmals, dass die Löslichkeit von DNA-Molekülen in PEG / Salz

Gemischen von ihrer Größe abhängig ist (32). In dem sie sonifizierte λ-DNA in NaCl-Lösung

mit unterschiedlichen Mengen PEG-6000 versetzten, zeigten sie, dass eine Trennung von

Fragmentgrößen bei relativ niedriger Zentrifugalbeschleunigung durch Präzipitation möglich

ist.

Page 24: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 10

Abb. 4: Sequentielle und parallele Fällung sonifizierter DNA nach Lis et al.. Die Fällung großer DNA-Fragmente beginnt bei niedrigen PEG-Konzentrationen. Mit steigender PEG-Konzentration werden auch kleinere Fragmentgrößen ausgefällt (32).

Lis et al. überprüften unterschiedlichste Einflussparameter auf die fraktionierte Fällung,

welche in Tab. 2 zusammenfassend dargestellt sind.

Tab. 2: Einflussparameter auf die größenabhängige DNA-Fällung in PEG / NaCl Gemischen nach Lis et al.

Parameter Effekt

PEG-Konzentration Mit zunehmender Konzentration verschiebt sich die Löslich-

keitsgrenze zu kleineren DNA-Fragmentgrößen

NaCl-Konzentration

Unter 0,2 M keine fraktionierte Fällung / ab 0,35 M steigend

verschiebt sich die Löslichkeitsgrenze zu kleineren DNA-

Fragmentgrößen

DNA-Konzentration

Unter 10 ng/µl DNA kommt es zu massiven Ausbeuteverlusten

von 50% und mehr, mit steigender DNA-Konz. nähert sich die

Ausbeute 100%

Zentrifugalbeschleunigung im Bereich von 1.900 x G bis 27.000 x G kein Einfluss auf die

Fällung

zweiwertige Kationen Verschieben die Löslichkeitsgrenze zu kleineren DNA-

Fragmentgrößen

Equilibrierungszeit längere Zeiten erhöhen Ausbeute und verschieben die

Löslichkeitsgrenze zu größeren DNA-Fragmenten

pH-Wert im Bereich 5 – 8,3 kein Einfluss auf die Löslichkeit

Page 25: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 11

1.5.1. Plasmid-Aufreinigung durch größenselektive Präzipitation

Die größenselektive Fällung in PEG-Systemen kann auch zur Trennung von Protein-

gemischen angewendet werden. Eine Vorhersage der Löslichkeitsgrenze für bestimmte

Proteine ist wegen der Heterogenität dieser Molekülklasse allerdings nicht möglich. Ein

Vergleich der Fällungsparameter von Proteinen und DNA zeigt jedoch, dass Proteine erst bei

wesentlich höheren PEG-Konzentrationen präzipitieren als DNA-Fragmente mit Größen von

über 1.000 bp (33).

Die PEG-Fällung kann also eine Trennung großer DNA-Moleküle (z.B. Plasmide) von

Proteinen sowie kleinen Nukleinsäuren, wie z.B. RNAse behandelte RNAs, in einem einzigen

Schritt erzielen. Aus diesem Grund erfüllt diese Methode alle Anforderungen zur

Aufreinigung und Konzentrierung von Plasmiden aus geklärten Zelllysaten, in denen Proteine

und RNA den größten Anteil an Verunreinigungen darstellen.

Mehrere Methoden zur Aufreinigung von Plasmiden durch PEG-Präzipitation mit geringem

Probendurchsatz sind veröffentlicht worden. Pulleyblank et al. (34) nutzten eine PEG / LiCl-

Methode zur Aufreinigung von Plasmiden nach Pronase / SDS-Lyse der Zellen. Die Methode

ist relativ umständlich, da ein Ultrazentrifugationsschritt sowie eine Chloroformextraktion

benötigt wurden. Nicoletti et al. (35) verwendeten dagegen eine Kombination aus

PEG / MgCl2 mit dem Vorteil, dass die Fällung schon bei wesentlich geringeren Ionenstärken

durchgeführt werden konnte (ab 10 mM gegenüber >0,5 M bei NaCl).

Erst Schmitz et al. veröffentlichten 2006 eine Methode, welche durch Nutzung des

PEG / NaCl Systems die Aufreinigung von Plasmid-DNA direkt aus dem geklärten Zelllysat

erlaubte und somit den methodischen Aufwand erheblich verringerte (36). Auf Grund der in

Tab. 2 dargestellten Mindestkonzentration an DNA im Fällungsansatz, musste das Volumen

der zur alkalischen Lyse eingesetzten Puffer minimiert und auch die Fällungsreagenzien

PEG / NaCl mussten möglichst hochkonzentriert zugegeben werden. Erst wenn diese

Bedingungen erfüllt waren, konnte eine direkte Fällung aus dem Überstand der alkalischen

Lyse mit guter Ausbeute gelingen. Den Zusammenhang zwischen Ausbeute und DNA-

Konzentration im Fällungsansatz zeigt Abb. 5:

Abb. 5.: Zusammenhang zwischen DNA-Konzentration und Ausbeute bei der größenselektiven Präzipitation von DNA in PEG / NaCl (36).

Page 26: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 12

1.5.2. PCR-Produktaufreinigung durch größenselektive Präzipitation

Anders als bei der Aufreinigung von Plasmiden sind PCR-Produkte mit unverbrauchten

Primern und dNTPs verunreinigt, welche sich negativ auf die Sequenzierungsreaktion

auswirken. Die Größe von PCR-Produkten liegt meist im Bereich 150 b bis 4.000 b. Es

müssen also wesentlich höhere PEG- oder Salz-Konzentrationen gewählt werden, um eine

Fällung kleiner PCR-Produkte zu erzielen (36). Die Trennung von Primern und dNTPs ist

dennoch unproblematisch, da die Trennschärfe der PEG-Methode zu kleineren

Nukleinsäuren hin zunimmt (siehe Abb. 4). Auch die Konzentration von PCR-Produkten ist

im Gegensatz zur Plasmid-Aufreinigung weniger kritisch, da sie meist über 20 ng/µl liegt.

1.5.3. Automatisierung der PEG-Methode und ihre Grenzen

Bisher gibt es in der Literatur keine Veröffentlichungen zu Anlagen, welche die Aufreinigung

von Plasmiden oder PCR-Produkten durch PEG-Präzipitation im Hochdurchsatz

ermöglichen. Dies liegt wahrscheinlich darin begründet, dass die Automatisierung der PEG-

Präzipitation durch mehrere Faktoren erschwert wird. Dazu zählen notwendige

Zentrifugationsschritte, die Viskosität hochkonzentrierter PEG-Lösungen und der hohe

Salzgehalt der Fällungsansätze.

Die Automatisierung von Zentrifugationsschritten ist aufwendig und erfordert speziell dafür

konzipierte Zentrifugen (z.B. Hettich Rotanta). Zudem ist die Zentrifugation im 96er MTP-

Format eine Limitierung für den Probendurchsatz. Dies ist einer der Gründe, weshalb viele

der in 1.4 dargestellten Methoden die Immobilisierung der DNA an Festphasen gegenüber

der Zentrifugation bevorzugen. Die Nutzung von 384er MTPs, welche auch stapelweise

zentrifugiert werden können, relativiert diesen Nachteil.

Die Durchmischung von Lysat und PEG / Salz zur Fällung kann sich gerade in den kleinen

Kavitäten von 384er MTPs als sehr schwierig erweisen, da die verwendeten PEG / Salz

Lösungen eine hohe Viskosität und Dichte aufweisen. Die PEG-Methode ist zudem relativ

empfindlich, was Pipettierungenauigkeiten betrifft und gerade diese werden durch hohe

Viskosität und niedriges Volumen gefördert.

Der hohe Salzgehalt, der für die größenselektive Präzipitation notwendig ist (Tab. 2),

erfordert mehrfaches Waschen der pelletierten DNA, um eine Inhibierung der

Sequenzierungsreaktion auszuschließen. Die Waschschritte erhöhen die Anzahl der nötigen

Zentrifugationsschritte und limitieren so wiederum den Probendurchsatz.

Trotz der zuvor genannten Probleme, würde sich ein automatisiertes, auf PEG-Präzipitation

basierendes DNA-Aufreinigungsverfahren, wegen des zugrunde liegenden Mechanismus der

Page 27: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 13

selektiven Fällung von unterschiedlichen DNA-Molekülgrößen, nicht nur für die

kostengünstige Plasmid-Isolation, sondern auch besonders für die Aufreinigung großer

Vektorkonstrukte eignen, wie sie u.a. zur physikalischen Kartierung von eukaryotischen

Genomen verwendet werden.

1.6. Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen

Shizuya et al. beschrieben 1992 ein neuartiges Vektorsystem auf Basis des F-Plasmids von

E. coli, welches die Klonierung von großen DNA-Fragmenten eukaryotischer Genome

erlaubt und bacterial artificial chromosome (BAC) genannt wurde (37). Die parA- und parB-

Gene des F-Plasmids sorgen für eine niedrige Kopienzahl von 1 - 2 pro Zelle, so dass die

genetische Stabilität der bis zu 300 kb großen Inserts im Vergleich zu den aus Hefe

bekannten yeast artificial chromosomes (YAC) oder Cosmid-Vektoren wesentlich höher ist.

Die BAC-Vektoren wurden im Laufe der Zeit verbessert, z.B. wurde der Vektor pCC1BAC

durch einen zusätzlichen high-copy Replikationsursprung ergänzt (38). Durch Zusatz von

L-Arabinose ins Medium kann dieser indirekt induziert werden und die Ausbeute an BAC-

DNA um ein Vielfaches steigern.

Mittlerweile haben sich BACs als Klonierungssystem für große DNA-Fragmente etabliert und

für viele Organismen sind BAC-Bibliotheken erhältlich (http://bacpac.chori.org/). BAC-

Bibliotheken leisten insbesondere einen Beitrag zur physikalischen Kartierung großer

Genome. Verschiedene Strategien für die Genomkartierung mit Hilfe von BAC-Bibliotheken

sind im Folgenden dargestellt.

1.6.1. BAC-Filterhybridisierung

Mit BACs transformierte Klone können auf Nylon-Membranen gezüchtet werden. Nach Lyse

der Zellen und Denaturierung der DNA bleiben die einzelsträngige genomische und die BAC-

DNA auf der positiv geladenen Membran immobilisiert. Auf diesen BAC-Filtern können

mehrere 10.000 Klone durch Hybridisierung mit radioaktiv markierten Sonden parallel

untersucht werden.

Diese Technik wurde u. a. für die Genomkartierung von Medaka (Oryzias latipes) verwendet

(39). Dafür wurden 2.363 35mer-Oligonukleotide anhand von bekannten Medaka cDNA-

Sequenzen synthetisiert. Diese wurden radioaktiv markiert und auf BAC-Filtern mit 36.864

Klonen hybridisiert. Unterschiedliche Klone, welche nach Hybridisierung eines

Oligonukleotids ein Signal geben, können einander zugeordnet werden. Theoretisch muss

für jedes Oligonukleotid eine Hybridisierung durchgeführt werden, was einen immensen

Page 28: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 14

Arbeitsaufwand bedeutet. Durch eine 2D-Poolingstrategie konnte der Aufwand immerhin um

den Faktor 3,4 auf 695 nötige Hybridisierungen reduziert werden. Trotzdem ist die Methode

aufwändig und wegen des Arbeitens mit Radioaktivität schlecht automatisierbar.

Die Kartierung des Medaka Genoms (~800 Mb) lieferte 902 Bereiche, welche von

überlappenden BAC-Inserts abgedeckt wurden (BAC-Contigs). Von diesen konnten 462 den

24 Chromosomen von Medaka zugeordnet werden.

1.6.2. BAC-Klon Fingerprinting

Das Fingerprinting von BAC-Klonen erfolgt durch den Verdau der BAC-DNA mittels

Restriktionsenzymen. Dabei entsteht ein klonspezifisches Muster verschiedener

Fragmentgrößen, welches durch Elektrophoresetechniken sichtbar gemacht werden kann.

Klone, die teilweise überlappen, werden einige gemeinsame Banden in ihren Restriktions-

mustern aufweisen und können einander so zugeordnet werden. Dabei gilt grob: Je mehr

gemeinsame Banden, desto größer die Überlappung und desto höher ihre Signifikanz.

Die Größe von BAC-Inserts macht die Analyse durch Agarose-Gelelektrophorese äußerst

schwierig. Setzt man selten schneidende Restriktionsenzyme ein, so erhält man zwar mit

Standardfärbemethoden gut nachweisbare Fragmente, welche aber wegen ihrer Größe

schlecht auftrennbar sind. Zusätzlich müssen BAC-Klone stärker überlappen, um größere

gemeinsame Banden aufweisen zu können. Werden die BAC Klone mit häufiger

schneidenden Enzymen fragmentiert, so lassen sich die kleinen Fragmente zwar besser

auftrennen, durch die große Anzahl der Fragmente relativiert sich dieser Effekt allerdings.

Zusätzlich werden kleinere Fragmente mit Standardfärbemethoden schwerer nachweisbar.

Durch Nutzung von Fluoreszenzmarkierung der Restriktionsfragmente in Kombination mit

hochauflösender Kapillargelelektrophorese, können diese Probleme bewältigt werden und es

steht ein besser automatisierbares Analyseverfahren zur Verfügung. Die Methode wurde

bisher zur Kartierung zahlreicher Genome verwendet (40, 41) und ist weiter verbessert

worden. Die Enden von DNA-Fragmenten, welche von verschiedenen Restriktionsenzymen

geschnitten wurden, können mit unterschiedlichen Farbstoffen markiert werden. Diese SnaP-

Shot genannte Methode erhöht die Anzahl unterscheidbarer Fragmente und ermöglicht somit

auch weniger stark überlappende BACs einander signifikant zuzuordnen (42). Die erwähnten

Referenzen erzielten die Anordnung von mehreren 10.000 BAC-Klonen in 750 – 2.000 BAC-

Contigs.

Page 29: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 15

1.6.3. Komparative Kartierung mit BAC-Endsequenzen

Während beim BAC-Fingerprinting das gesamte Insert eines BACs charakterisiert wird, kann

durch BAC-Endsequenzierung nur etwa 1/100 des BAC-Inserts analysiert werden, nämlich

jeweils etwa 600 – 800 b vom Anfang und Ende des Inserts. Allerdings erfolgt dies mit

wesentlich höherer Genauigkeit auf der Sequenzebene, so dass es möglich wird Vergleiche

mit bereits kartierten und sequenzierten Genomen über Alignment-Algorithmen wie BLAST

(43, 44) durchzuführen. Der Erfolg dieses komparativen Ansatzes hängt von der evolu-

tionären Divergenz der zu vergleichenden Organismen und der Anzahl endsequenzierter

BAC-Inserts ab.

Können beide Endsequenzen eines BAC-Inserts auf der Referenzsequenz mit Signifikanz

angeordnet werden, wobei sie aufeinander gerichtet orientiert sind und ihr Abstand mit der

Insertgröße der Klone ungefähr übereinstimmt, so kann man den Klon als sicher angeordnet

betrachten. Werden nun weitere Klone gefunden, die versetzt im selben Bereich liegen, so

kann man diese, wie bei den in 1.6.1 & 1.6.2 dargestellten Methoden in Contigs

zusammenfassen und eine physikalische Karte des Genoms erstellen. Der Vorteil gegenüber

den zuvor genannten Methoden ist einerseits die Verwendung etablierter

hochdurchsatzfähiger Sequenzierungstechnologien und Auswertungssoftware und anderer-

seits, dass benachbarte Contigs auf Grund der Daten des Referenzgenoms mit hoher

Wahrscheinlichkeit vorausgesagt werden können. Außerdem gewähren die gewonnenen

Sequenzdaten bereits einen frühen Einblick in den Aufbau sequenzierter Gene,

Repeatstrukturen usw. und sind für Genomprojekte in fortgeschrittener Phase notwendige

Hilfsmittel.

Die komparative Strategie wurde u.a. zur Kartierung des Schimpansen-Genoms

angewendet, wobei das sehr ähnliche Human-Genom als Referenz diente (45). Auch bei

weniger verwandten Species wie Rind und Mensch waren komparative Ansätze erfolg-

reich (46). Es ist eine Einschränkung, dass die komparative Genomkartierung mit BAC-

Endsequenzen auf verwandte, bereits sequenzierte Genome angewiesen ist. Mit

zunehmender Anzahl von vollendeten Genomprojekten wird diese Methode in Zukunft

allerdings immer häufiger Anwendung finden.

Die Kombination von komparativer Genomkartierung durch BAC-Endsequenzierung mit den

zuvor dargestellten Sequenzierungstechnologien der ersten und zweiten Generation kann

die Analyse der kompletten Sequenz von eukaryotischen Genomen, wie z. B. dem Genom

von Dicentrarchus labrax (Wolfsbarsch, siehe 1.7), stark beschleunigen. Gerade in der

Gruppe der Teleosten (Knochenfische) stehen bereits fünf Referenzgenome für komparative

Studien zur Verfügung (siehe 1.7.1).

Page 30: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Der Wolfsbarsch - Dicentrarchus labrax 16

1.7. Der Wolfsbarsch - Dicentrarchus labrax

D. labrax (Teleostei, Perciformes, Moronidae) ist an den europäischen und nordafrikanischen

Atlantik und Mittelmeerküsten verbreitet. Er erreicht eine Größe von bis zu 100 cm und

ernährt sich von Garnelen, Mollusken und kleineren Fischen. Äußere Merkmale sind ein

länglicher grauer Körper, der sich zum Bauch hin aufhellt, sowie zwei Rückenflossen mit

8 - 10 Rückenflossenstacheln und 12 – 13 Rückenflossenweichstrahlen (47).

Abb. 6: Der Wolfsbarsch – Dicentrarchus labrax (47).

Als gefragter Speisefisch hat D. labrax in den vergangenen 10 Jahren zusammen mit der

Goldbrasse (Sparus aurata) einen hohen Stellenwert in der europäischen Fischindustrie

erlangt. Seine Anpassungsfähigkeit an verschiedene Habitate (Süß-, Brack und Meerwasser)

und Wassertemperaturen ermöglichen die Zucht in Aquakultur (48, 49). Aufgrund seiner

Bedeutung als Nahrungsquelle und wegen weiterer besonderer Merkmale, wie z.B. einer

temperaturabhängigen Geschlechtsdifferenzierung (50), gehört D. labrax zu einer der am

intensivsten erforschten Fischspecies der vergangenen Jahre. Die Bereitstellung

genomischer Sequenzdaten wird teilweise vom EU-Netzwerk „Marine Genomics Europe

(MGE)“ gefördert und wird nicht nur neue Ansatzpunkte für die Forschung an D. labrax

ermöglichen, sondern sich auch auf die Forschung an nahe verwandten Species wie Sparus

aurata (Goldbrasse) und Oreochromis niloticus (Buntbarsch) positiv auswirken.

Page 31: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Der Wolfsbarsch - Dicentrarchus labrax 17

1.7.1. Fortgeschrittene Fischgenomprojekte für komparative Studien mit D. labrax

Die verwandtschaftlichen Beziehungen verschiedener Ordnungen der Knochenfische

(Teleosten) sind in Abb. 7 dargestellt. Teleosten bilden mit etwa 23.600 lebenden Species

die größte Gruppe der Vertebraten. Die

Genome einiger Teleosten wurden in den

letzten Jahren nahezu vollständig se-

quenziert, dazu gehören:

Danio rerio (Zebrafish)

(siehe Ostariophysi) (51)

Oryzias latipes (Medaka)

(siehe Atherinomorpha) (52)

Gasterosteus aculeatus (Stichling)

(siehe Gasterosteiformes) (53)

Tetraodon nigroviridis (grüner Kugelfisch)

(siehe Tetraodontiformes) (54)

Takifugu rubripes (japanischer Kugelfisch)

(siehe Tetraodontiformes) (55)

Abb. 7: Stammbaum der Knochenfische (56).

D. labrax ist den Perciformes zugeordnet. Der Vergleich mit Abb. 7 zeigt, dass vier der oben

genannten Fische aus derselben Superordnung (Acanthopterygii) stammen. Die

Sequenzdaten dieser Genome eignen sich aufgrund ihrer näheren Verwandtschaft für

Sequenzvergleiche mit D. labrax.

Page 32: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Einleitung: Ziel der Arbeit 18

1.8. Ziel der Arbeit

Der zeit- und kostenlimitierende Faktor vieler molekulargenetischer Analyseverfahren ist die

Produktion von aufgereinigten DNA-Molekülen. Besonders im Bereich der DNA-

Sequenzierung werden Systeme benötigt, die dem hohen Probendurchsatz moderner CGE-

Sequenzierroboter gerecht werden.

Zahlreiche zum Teil auch vollautomatisierte Systeme sind erhältlich, welche meist mit dem

96er MTP-Format arbeiten. Um höheren Probendurchsatz zu gewährleisten und gleichzeitig

die Kosten pro Probe zu verringern, müssen Aufreinigungsmethoden für das 384er MTP-

Format entwickelt und automatisiert werden. Dabei können viele der im 96er Format

gängigen Methoden aufgrund von Durchmischungsproblemen und / oder aufwendig zu

produzierenden Verbrauchsmaterialien nicht kostengünstig und stabil umgesetzt werden.

In der Dissertation soll dargestellt werden, wie sich mit der Anwendung von größenselektiver

DNA-Präzipitation in PEG / Salz-Gemischen ein kostengünstiges, automatisiertes und hoch-

durchsatzfähiges Verfahren zur Aufreinigung von Plasmiden, Fosmiden und BACs sowie

PCR-Produkten realisieren lässt. Das Verfahren soll bei der Durchführung zahlreicher

Genom, Metagenom-, EST- und Resequenzierungsprojekte eingesetzt werden. Ein

besonderes Augenmerk soll dabei auf der Endsequenzierung von Large-Insert-Klonen wie

z.B. BACs gelegt werden, da diese aufgrund von niedrigen Template-Ausbeuten mit

herkömmlichen Methoden im 384er MTP-Format nicht bearbeitet werden können.

Eine hochdurchsatzfähige Methode zur Endsequenzierung von BAC-Klonen kann vor allem

bei der Kartierung großer eukaryotischer Genome neue Möglichkeiten erschließen. Die

Endsequenzierung einer BAC-Bibliothek des Genoms von Dicentrarchus labrax

(Wolfsbarsch) soll anhand der zuvor erarbeiteten Methodik durchgeführt werden und eine

komparative Kartierung des Genoms ermöglichen.

Page 33: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 19

2. Material und Methoden

2.1. Verwendete Materialien und Geräte

2.1.1. Chemikalien

Chemikalien Hersteller Bestellnummer

2-Propanol Merck 1.09634.2500

Agarose electrophoresis grade Invitrogen 15510-019

Ampicillin Natriumsalz Roth K029.2

Chloramphenicol Roth K3886.1

D-Glucose Monohydrat Merck 1.08342.2500

EDTA / Titriplex Merck 1.08418.1000

Ethanol absolut Merck 108543

Ethidiumbromid Sigma E-1510

HCl Merck 1.0317.2500

Hypochlorit-Lösung 2% (Bleach) Fluka 71696

Kaliumacetat Merck 1.04820.1000

Kanamycin-Lösung Sigma K0254

L-Arabinose Fluka 10845

MgCl2*6H2O Merck 5833

NaCl Merck 1.06404.1000

NaOH Merck 1.06498.1000

PEG-6000 Merck 8.07491.1000

SDS / Natriumlaurylsulfat Roth 4360.1

TBE-Puffer Merck 106177

TRIS HCl Merck 1.08382.0500

Tryptone Fluka 93655

Yeast Extract Merck 103753

Page 34: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 20

2.1.2. Enzyme und Reaktionspuffer

Enzyme und Reaktionspuffer Hersteller Bestellnummer

Big Dye Terminator V3.1 Applied Biosystems 4314849

Big Dye sequencing buffer Applied Biosystems 4305603

DNA-Polymerase I (Klenow) New England Biolabs #M0210 l

EcoRI+ Reaktionspuffer New England Biolabs #R0101S, B0210S

ElectroMAX DH10B komp. Zellen Invitrogen 18290-015

Plasmidsafe™ Exonuklease Epicentre E3101K

Ribonuclease A Sigma R-5503

T4-DNA-Ligase + Puffer Roche 799009

T4-DNA-Polymerase + Puffer Fermentas #EP0062

2.1.3. Besondere Verbrauchsmaterialien

besondere Verbrauchsmaterialien Hersteller Bestellnummer

384 MTP PCR 4titude 4ti-0384/G

384 MTP Kultur deep well Abgene AB 1178

384 well UV plate Corning 3675

384 MTP Kultur small Genetix XGE05006

384 Pin Replikatoren Genetix X5050

2.1.4. Primer für die Sequenzierung

Primer Hersteller Sequenz

T7 Invitrogen 5´-TAA TAC GAC TCA CTA TAG GG-3´

M13-40 Invitrogen 5´-GTT TTC CCA GTC ACG ACG-3´

M13-28 Invitrogen 5´-AGG AAA CAG CTA TGA CCA T-3´

SP6 Invitrogen 5´-ATT TAG GTG ACA CTA TAG-3´

Page 35: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 21

2.1.5. Längenmarker für die Agarose-Gelelektrophorese

Marker Hersteller Fragmentgrößen in bp

17 kb Marker MPI f. Mol Genetik 17000, 8000, 4500, 2500, 2000, 1600,

1300, 900, 700, 600, 400, 250, 100

(Restriktionsverdau eines Fosmid-Klons)

4 kb Marker MPI f. Mol. Genetik 4000, 2000, 1000, 500

(PCR-Produkte)

2.1.6. Geräte

Geräte Hersteller Typ

Autom. Zentrifuge Hettich Rotanta

Brutschrank Memmert nicht bekannt

Brutschüttler mit aktiver Kühlung New Brunswick Scientific Innova 4230

Brutschüttler mit passiver Kühlung New Brunswick Scientific Innova 4080

CGE-Sequenzierer Applied Biosystems ABI 3730xl

Elektroporator Bio-Rad E.coli-Pulser

Gelkammer MPI f. mol. Genetik Minigel

Laborschüttler mit Heizelement Eppendorf Thermomixer 5436

Microplate Dispenser Bio-Tek µ-Fill

Photometer Molecular Devices Spectramax+ 384

Pipettierroboter für 384er Beckmann Biomek NX

Pipettierroboter für 384er Beckmann Multimek 384

Pyrosequencer Roche Diagnostics GS 20

Roboterarm CRS-Robotics F3

Roboterarm CRS-Robotics A465

Schüttler für 384er Kulturen Heidolph Inkubator 1000

Thermocycler Applied Biosystems GeneAmp 9700

Transilluminator Ultraviolett Product inc. Ultra Cam

Ultraschall Gerät Branson Sonic Power Co Cell Disruptor B-30

Ultrazentrifuge Beckman Coulter L8-M Ultracentrifuge

Vakuumtrockner für 384er MTP Savant Speedvac+ SC210A

Zentrifuge f. 4x384MTP mit Kühlung Eppendorf 5810R

Zentrifuge f. 2x 384 MTP mit Kühlung Eppendorf 5804R

Zentrifuge f. Eppendorfgefäße Eppendorf 5403R

Page 36: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 22

2.1.7. Puffer und Lösungen

2YT-Nährmedium

Für 1 Liter Medium werden 10 g yeast extract, 16 g Tryptone und 5 g NaCl in doppelt

destilliertem Wasser gelöst. Das Nährmedium wird im Autoklav sterilisiert. Ungeöffnete

Medien können bei RT aufbewahrt werden.

SOC-Nährmedium

Für 1 Liter Medium werden 20 g Trypton, 5 g Yeast extract, 0,5 g NaCl und 2,5 ml KCl 1 M in

900 ml doppelt destilliertem Wasser gelöst. Der pH-Wert wird mit 10 M NaOH auf 7

eingestellt. Sterilisation erfolgt durch autoklavieren. Vor Gebrauch werden dem Medium

20 ml 1 M D-Glucose, 10 ml 1 M MgCl2 und 10 ml 1 M MgSO4 (alle Zusätze durch 0,45 µm

Filter sterilisieren) zugesetzt.

20% (w/v) D-Glucose als Zusatz zum Medium

10 g D-Glucose einwiegen und mit doppelt destilliertem Wasser lösen (Endvolumen 50 ml).

Die Lösung steril filtrieren und bei 4ºC aufbewahren.

20% (w/v) L-Arabinose als Zusatz zum Medium

10 g L-Arabinose einwiegen und mit doppelt destilliertem Wasser lösen (Endvolumen 50 ml).

Die Lösung steril filtrieren und bei 4ºC aufbewahren.

TRIS 1 M pH 8

Für einen Liter Puffer-Lösung 121,14 g TRIS*HCl abwiegen und in 300 ml doppelt

destilliertem Wasser lösen. Mit rauchender HCl einen pH-Wert von 8 einstellen.

Anschließend auf 1 Liter mit doppelt destilliertem Wasser auffüllen. Achtung der pH-Wert von

TRIS-Puffern ist stark temperaturabhängig. Die Angaben sollten sich immer auf RT (25ºC)

beziehen. Bei 4ºC aufbewahren.

EDTA 0,5 M pH 8

Für 500 ml Lösung 93,06 g EDTA abwiegen und in 400 ml doppelt destilliertem Wasser

lösen. Mit NaOH-Plätzchen das EDTA in Lösung bringen und den pH-Wert auf 8 einstellen

(es werden ungefähr 10 g NaOH benötigt). Auf 500 ml Endvolumen mit doppelt destilliertem

Wasser auffüllen. Bei 4ºC aufbewahren.

Page 37: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 23

S1-Puffer +/- Rnase (50 mM TRIS HCl, 10 mM EDTA, pH 8)

Für 1 Liter Lösung 50 ml TRIS 1 M pH 8 mit 20 ml in 930 ml doppelt destilliertem Wasser

verdünnen. Je nach Verwendung 100 mg RNAse zugeben und gut durchmischen. Bei 4ºC

aufbewahren.

S2-Puffer (0,2 M NaOH, 1% SDS)

Für 1 Liter Lösung zunächst 8 g NaOH in 200 ml doppelt destilliertem Wasser lösen

(Achtung Lösung erhitzt sich stark). 10 g SDS unter dem Abzug einwiegen und zu der

NaOH-Lösung geben. Die Lösung auf 1 Liter mit doppelt destilliertem Wasser auffüllen.

Bei RT aufbewahren!

S3 (2,8 M KAcetat, ~ pH 5)

Für einen Liter Lösung 274,82 g Kaliumacetat einwiegen und in 350 ml doppelt destilliertem

Wasser lösen. Den pH-Wert durch Zugabe von exakt 360 ml Eisessig einstellen. Die Lösung

auf ein Endvolumen von 1 Liter mit doppelt destilliertem Wasser auffüllen. Bei 4ºC

aufbewahren.

Achtung: niemals den pH-Wert mit zusätzlichem Eisessig auf z.B. 4,8 einstellen wie in

anderen Protokollen beschrieben.

Achtung: Für das in dieser Arbeit entwickelte Protokoll muss der S3 Puffer 3fach verdünnt

werden (z.B. 667 ml H2O+ 333 ml S3)!

PEG 40% (w/v)

Für einen Liter Lösung 400 g PEG-6000 in einen großen Messzylinder einwiegen. Den

Messzylinder bis etwa 900 ml mit doppelt destilliertem Wasser füllen und mit Parafilm dicht

verschließen. Das PEG durch kräftiges Schütteln in Lösung bringen, auf einem Magnetrührer

ca. 1 h bei RT rühren und zwischendurch auf exakt 1 Liter mit doppelt destilliertem Wasser

auffüllen. Die klare Lösung in eine Schottflasche überführen und bei RT aufbewahren.

10% (w/v) PEG-6000 / 75% 2-Propanol (v/v)

Für einen Liter Lösung zu 250 ml PEG 40% (w/v) 750 ml 2-Propanol zugeben und durch

kräftiges Schütteln mischen. Bei RT aufbewahren.

TRIS 1 mM (Elutionspuffer)

Für 1 Liter Lösung 999 ml doppelt destilliertes Wasser mit 1 ml TRIS 1 M pH8 versetzen und

gut durchmischen. Bei 4ºC aufbewahren.

Page 38: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Verwendete Materialien und Geräte 24

Ampicillin-Lösung (110 mg/ml)

1,5 g Ampicillin werden mit doppelt destilliertem Wasser in einem Endvolumen von 14 ml

gelöst und steril filtriert. Die Lösung sollte innerhalb einer Woche verbraucht werden und

kann so lange bei 4ºC aufbewahrt werden.

Chloramphenicol-Lösung (20 mg/ml)

1 g Chloramphenicol in 100%-Ethanol lösen (Endvolumen 50 ml). Steril filtrieren! Bei -20ºC

aufbewahren.

2.1.8. BAC-Bibliothek von D. labrax

Die von Whitaker et al. (74) konstruierte BAC-Bibliothek umfasst 69.120 Klone, welche in

180 x 384er MTPs archiviert sind. Die mittlere Insertgröße der Klone wird mit 150 – 160 kb

angegeben. Die Abdeckung des D. labrax Genoms durch die BAC-Bibliothek wird auf 13fach

geschätzt.

Die BAC-Bibliothek wurde vom ehemaligen Deutschen Ressourcenzentrum für Genom-

forschung (RZPD) zur Verfügung gestellt.

2.1.9. Genomsequenzen von T. nigroviridis, O. latipes und G. aculeatus

Die Sequenzdaten, der in dieser Arbeit verwendeten Referenzgenome, sind auf

www.ensembl.org oder dem zugehörigen FTP-Server per Download im Fasta-

Sequenzformat verfügbar. Es wurden folgende Datensätze verwendet:

Oryzias latipes

Assembly: HdrR, Oct 2005

Tetraodon nigroviridis

Assembly: TETRAODON 7, Apr 2003

Gasterosteus aculeatus

Assembly: BROAD S1, Feb 2006

Page 39: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 25

2.2. Untersuchungen von PEG-Präzipitationsmethoden

2.2.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen

DNA-Fragmente im Größenbereich von 100 – 17000 bp wurden mit den in Tab. 3

dargestellten Mengen PEG-6000 (w/v) und NaCl versetzt. Die Endkonzentrationen von

PEG-6000 und NaCl in den Gemischen wurden so gewählt, dass die größten DNA-

Fragmente kurz vor der Präzipitation standen. Die Ansätze wurden nach intensivem Mischen

für 15 min bei RT equilibriert.

Tab. 3: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / NaCl-Fällung.

1 2 3 4 5 6 7 NaCl 5,38M 55,8 µl 44,6 µl 33,5 µl 27,8 µl 22,3 µl 16,7 µl 11,2 µlPEG 14, 18 o. 22% 85,7 µl 91,1 µl 105 µl 115,7 µl 128,6 µl 116,7 µl 136,4 µlH2O 8,5 µl 14,3 µl 11,5 µl 6,5 µl 0 µl 16,6 µl 2,4 µlDNA 0,1-17kb 135 µl 135 µl 135 µl 135 µl 134,1 µl 135 µl 135 µlEndkonz. NaCl 1,05 M 0,842 0,632 M 0,525 M 0,421 M 0,315 M 0,211 MEndkonz. PEG(w/v) 4,21% 4,48% 5,16% 5,68% 6,32% 7,37% 10,53%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl

Von den Ansätzen 1 - 7 wurden 19 µl Aliquots in 12 Positionen auf einer 384 MTP pipettiert

und darauf folgend je 1 µl einer PEG-Verdünnungsreihe zu den Ansätzen hinzugegeben, so

dass die PEG-Konzentration bei konstanter NaCl-Konzentration in den zwölf Aliquots

ansteigt (siehe Tab. 4).

Tab. 4: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen NaCl-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 3 gegeben, so wurden die in Reihe 1 – 7 dargestellten PEG-Endkonzentrationen (w/v) erzielt.

Reihe: 1 2 3 4 5 6 7 NaCl Konz. Reihe: 1 M 0,8 M 0,6 M 0,5 M 0,4 M 0,3 M 0,2 M PEG 1% 4,05% 4,30% 4,95% 5,45% 6,05% 7,05% 10,05%PEG 2% 4,10% 4,35% 5,00% 5,50% 6,10% 7,10% 10,10%PEG 4% 4,20% 4,45% 5,10% 5,60% 6,20% 7,20% 10,20%PEG 6% 4,30% 4,55% 5,20% 5,70% 6,30% 7,30% 10,30%PEG 8% 4,40% 4,65% 5,30% 5,80% 6,40% 7,40% 10,40%PEG 10% 4,50% 4,75% 5,40% 5,90% 6,50% 7,50% 10,50%PEG 14% 4,70% 4,95% 5,60% 6,10% 6,70% 7,70% 10,70%PEG 18% 4,90% 5,15% 5,80% 6,30% 6,90% 7,90% 10,90%PEG 22% 5,10% 5,35% 6,00% 6,50% 7,10% 8,10% 11,10%PEG 28% 5,40% 5,65% 6,30% 6,80% 7,40% 8,40% 11,40%PEG 34% 5,70% 5,95% 6,60% 7,10% 7,70% 8,70% 11,70%PEG 40% 6,00% 6,25% 6,90% 7,40% 8,00% 9,00% 12,00%

Nach intensiven Mischen der 84 Ansätze und weiterer Equilibrierung für 15 min bei RT

wurde die präzipitierte DNA durch Zentrifugation bei 2750 x G und 25ºC für 20 min

sedimentiert. Danach wurde die gelöste DNA-Fraktion im Überstand durch Zentrifugation der

Page 40: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 26

umgedrehten Platte bei 172 x G für 1 min verworfen. Die sedimentierte DNA wurde in 9 µl 1x

TE-Puffer durch 30 min schütteln bei 37ºC gelöst.

Die Analyse der unter den verschiedenen Bedingungen präzipitierten DNA-Fraktionen

erfolgte durch Elektrophorese in 1,3% Agarosegelen in Anwesenheit von 0,001%

Ethidiumbromid.

2.2.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen

Die zum Test der Präzipitation in PEG / MgCl2 vollzogenen Arbeitsschritte entsprachen dem

in 2.2.1 dargestellten Ablauf, wobei jedoch die in Tab. 5 dargestellten Versuchsreihen

angesetzt wurden.

Tab. 5: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / MgCl2-Fällung.

1 2 3 4 5 6 7 MgCl2 0.5 / 0.25 M 60 µl 45 µl 60 µl 42 µl 30 µl 18 µl 12 µlPEG 8 / 10 / 14% 52,5 µl 56,5 µl 67,5 µl 78,75 µl 97,5 µl 120 µl 128,6 µlH2O 37,5 µl 48,75 µl 22,5 µl 29,25 µl 22,5 µl 12 µl 9,4 µlDNA 0,1-17kb 135 µl 135 µl 135 µl 135 µl 135 µl 135 µl 135 µl

Endkonz. MgCl2 0,105 M 0,079 M 0,053 M 0,037 M 0,026 M 0,016 M 0,211 MEndkonz. PEG(w/v) 1,474% 1,579% 1,895% 2,211% 2,737% 4,211% 10,53%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl

Die Ansätze wurden zu je 19 µl aliquotiert und mit je 1 µl PEG-Lösungen unterschiedlicher

Konzentration versetzt, so dass die 84, in Tab. 6 dargestellten, Fällungsansätze resultierten.

Tab. 6: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen MgCl2-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 5 gegeben, so wurden die in Reihe 1 – 7 dargestellten PEG-Endkonzentrationen (w/v) erzielt.

Reihe: 1 2 3 4 5 6 7 MgCl2 Konz. Reihe: 0,1 M 0,075 M 0,05 M 0,035 M 0,025 M 0,015 M 0,01 M PEG 1% 1,45% 1,55% 1,85% 2,15% 2,65% 4,05% 6,05% PEG 2% 1,50% 1,60% 1,90% 2,20% 2,70% 4,10% 6,10% PEG 4% 1,60% 1,70% 2,00% 2,30% 2,80% 4,20% 6,20% PEG 6% 1,70% 1,80% 2,10% 2,40% 2,90% 4,30% 6,30% PEG 8% 1,80% 1,90% 2,20% 2,50% 3,00% 4,40% 6,40% PEG 10% 1,90% 2,00% 2,30% 2,60% 3,10% 4,50% 6,50% PEG 14% 2,10% 2,20% 2,50% 2,80% 3,30% 4,70% 6,70% PEG 18% 2,30% 2,40% 2,70% 3,00% 3,50% 4,90% 6,90% PEG 22% 2,50% 2,60% 2,90% 3,20% 3,70% 5,10% 7,10% PEG 28% 2,80% 2,90% 3,20% 3,50% 4,00% 5,40% 7,40% PEG 34% 3,10% 3,20% 3,50% 3,80% 4,30% 5,70% 7,70% PEG 40% 3,40% 3,50% 3,80% 4,10% 4,60% 6,00% 8,00%

Page 41: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 27

2.2.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und

Substitution von PEG durch 2-Propanol

Die Experimente zur DNA-Präzipitation in PEG / KAcetat mit und ohne 2-Propanol

entsprachen dem in 2.2.1 dargestellten Ablauf, wobei jedoch die in Tab. 7 dargestellten

Versuchsreihen angesetzt wurden.

Tab. 7: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-Fällung.

1 2 3 4 5 6 7 8 KAc 2.8M pH4,8 107,1 µl 85,7 µl 75 µl 64,3 µl 53,6 µl 42,9 µl 32,1 µl 21,4 µlPEG34/22/28/40% 39,7 µl 64,8 µl 69,55 µl 75 µl 85,2 µl 75 µl 75 µl 97,5 µlH2O 3,2 µl 0 µl 5,45 µl 10,7 µl 11,2 µl 32,1 µl 42,9 µl 31,1 µlDNA 0,1-17kb 135 µl 134,5 µl 135 µl 135 µl 135 µl 135 µl 135 µl 135 µlEndkonz. KAc 1,05 M 0,842 M 0,737 M 0,632 M 0,527 M 0,422 M 0,315 M 0,210 MEndkonz. PEG(w/v) 4,74% 5,00% 5,37% 5,79% 6,58% 7,37% 10,53% 13,68%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl

Die Ansätze wurden zu je 19 µl aliquotiert und mit je 1 µl PEG-Lösungen unterschiedlicher

Konzentration versetzt, so dass 96 verschiedene, in Tab. 8 dargestellte, Fällungsansätze

resultierten.

Tab. 8: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen KAcetat-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 5 gegeben, so wurden die in Reihe 1 – 8 dargestellten PEG-Endkonzentrationen (w/v) erzielt.

Reihe: 1 2 3 4 5 6 7 8 KAc Konz. : 1 M 0,8 M 0,7 M 0,6 M 0,5 M 0,4 M 0,3 M 0,2 M PEG 1% 4,55% 4,80% 5,15% 5,55% 6,30% 7,05% 10,05% 13,05%PEG 2% 4,60% 4,85% 5,20% 5,60% 6,35% 7,10% 10,10% 13,10%PEG 4% 4,70% 4,95% 5,30% 5,70% 6,45% 7,20% 10,20% 13,20%PEG 6% 4,80% 5,05% 5,40% 5,80% 6,55% 7,30% 10,30% 13,30%PEG 8% 4,90% 5,15% 5,50% 5,90% 6,65% 7,40% 10,40% 13,40%PEG 10% 5,00% 5,25% 5,60% 6,00% 6,75% 7,50% 10,50% 13,50%PEG 14% 5,20% 5,45% 5,80% 6,20% 6,95% 7,70% 10,70% 13,70%PEG 18% 5,40% 5,65% 6,00% 6,40% 7,15% 7,90% 10,90% 13,90%PEG 22% 5,60% 5,85% 6,20% 6,60% 7,35% 8,10% 11,10% 14,10%PEG 28% 5,90% 6,15% 6,50% 6,90% 7,65% 8,40% 11,40% 14,40%PEG 34% 6,20% 6,45% 6,80% 7,20% 7,95% 8,70% 11,70% 14,70%PEG 40% 6,50% 6,75% 7,10% 7,50% 8,25% 9,00% 12,00% 15,00%

Um den Einfluss von 2-Propanol auf die Fällung in einem PEG / KAcetat-System

abzuschätzen, wurden die Versuchsreihen in Tab. 9 angesetzt.

Page 42: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 28

Tab. 9: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-Fällung in Gegenwart von 2-Propanol.

1 2 3 4 5 6

KAc 2.8M pH4,8 21,4 µl 32,1 µl 42,9 µl 53,6 µl 64,3 µl 85,7 µlPEG 40% (w/v) 107,3 µl 73,5 µl 52,5 µl 45,8 µl 41,3 µl 36,0 µlH2O 0,0 µl 0,0 µl 9,6 µl 5,7 µl 0,0 µl 0,0 µlDNA 0,1-17kb 111,4 µl 134,4 µl 135,0 µl 135,0 µl 134,5 µl 118,3 µl

Endkonz. KAc 0,25 M 0,375 M 0,5 M 0,625 M 0,75 M 1 MEndkonz. PEG (w/v) 17,88% 12,25% 8,75% 7,63% 6,88% 6,00%Endvolumen 240 µl 240 µl 240 µl 240 µl 240 µl 240 µl

Die Ansätze 1 - 6 wurden zu je 16 µl aliquotiert und mit je 4 µl der in Tab. 10 dargestellten

2-Propanol-Verdünnungsreihe versetzt, so dass 72 verschiedene Fällungsansätze mit den

folgenden Endkonzentrationen an PEG / KAcetat / 2-Propanol resultierten.

Tab. 10: Schrittweise Erhöhung der 2-Propanol-Konzentration in den einzelnen Versuchsreihen mit Kaliumacetat / PEG. Je 4 µl der 2-Propanol-Ver-dünnung (erste Spalte) wurde zu 16 µl Aliquots der Ansätze aus Tab. 5 ge-geben, so wurden die in Reihe 1 – 6 dargestellten Endkonzentrationen (v/v für 2-Propanol bzw. w/v für PEG) erzielt.

Reihe: 1 2 3 4 5 6 PEG / KAc Konz. :

4,8% / 0,8 M

5,5% / 0,6 M

6,1% / 0,5 M

7,0% / 0,4 M

9,8% / 0,3 M

14,3% / 0,2 M

2-Propanol 0% 0% 0% 0% 0% 0% 0% 2-Propanol 5% 1% 1% 1% 1% 1% 1% 2-Propanol 10% 2% 2% 2% 2% 2% 2% 2-Propanol 20% 4% 4% 4% 4% 4% 4% 2-Propanol 30% 6% 6% 6% 6% 6% 6% 2-Propanol 40% 8% 8% 8% 8% 8% 8% 2-Propanol 50% 10% 10% 10% 10% 10% 10% 2-Propanol 60% 12% 12% 12% 12% 12% 12% 2-Propanol 70% 14% 14% 14% 14% 14% 14% 2-Propanol 80% 16% 16% 16% 16% 16% 16% 2-Propanol 90% 18% 18% 18% 18% 18% 18% 2-Propanol 100% 20% 20% 20% 20% 20% 20%

2.2.4. Aufreinigung von Plasmid-DNA durch größenselektive Fällung in PEG /

KAcetat / 2-Propanol-Gemischen.

Zwei Bakterienstämme wurden ausgehend von Glycerol-Stocks in 2YT-Medium für 16 h bei

37ºC kultiviert. Bei beiden Stämmen handelte es sich um E. coli DH10B, wobei einer der

beiden unverändert vorlag, der andere jedoch ein pUC19-Plasmid mit ca. 2 kb Insert

beherbergte und deshalb unter Selektion mit 110 µg/ml Ampicillin angezogen wurde. Die

optische Dichte der Kulturen wurde bei 600 nm bestimmt und beide Kulturen wurden durch

Zugabe von 2YT-Medium auf eine OD von 3 eingestellt. Von beiden Kulturen wurden 60 –

200 µl in eine 384er MTP mit 250 µl Kavitäten (Abgene, AB 1178) überführt (siehe

Page 43: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 29

Pipettierschema). Die Zellen wurden durch 5 min Zentrifugation bei 2750 x G pelletiert und

der Überstand verworfen. Je 192 der Pellets wurden in 20 µl S1-Puffer mit RNAse

(100 µg/ml) resuspendiert, die weiteren 192 in 20 µl S1-Puffer ohne RNAse resuspendiert

(siehe Tab. 11). Die Zellen wurden darauf folgend mit je 20 µl S2-Puffer (0,2 M NaOH, 10%

SDS) 1 min geschüttelt und weitere 4 min bei RT inkubiert. Die Neutralisation erfolgte mit

20 µl 0,333fach S3 Puffer (KAcetat 0,933 M pH 4,8) und kurzem Mischen für 20 s, sowie

etwa 10 min Inkubation bei RT. Mit SDS präzipitierte Proteine und Zellbruchstücke wurden

für 30 min bei 2750 x G und RT pelletiert. Von dem geklärten Zelllysat wurden 40 µl in eine

neue 384er MTP (Abgene, AB 1178) überführt und mit verschiedenen Mengen (18 µl, 19 µl

und 28 µl) eines 10% PEG-6000 (w/v) / 75% 2-Propanolgemisches versetzt, so dass von

jeder Fällungsbedingung 3 Ansätze vorlagen (siehe Pipettierschema). Zum Vergleich wurde

ein Teil der Proben mit 35 µl reinem 2-Propanol gefällt. Nach Durchmischung und 15 min

Equilibrierung bei RT wurde das Präzipitat durch Zentrifugation für 30 min bei 2750 x G und

4ºC sedimentiert. 20 µl des Überstands wurden abpipettiert und in eine 384er MTP überführt.

Der restliche Überstand wurde durch Zentrifugation der umgedrehten Platte bei 172 x G für 1

min verworfen. Das Pellet wurde 5 min bei 60ºC getrocknet und in 20 µl 1 mM TRIS pH 8 für

30 min bei 60ºC gelöst.

Zum Vergleich der verschiedenen Fällungsbedingungen wurde die Absorption im UV-Bereich

bei 260 nm und 280 nm vom Überstand und gelösten Pellets bestimmt. Ausgewählte Proben

wurden zusätzlich durch Elektrophorese in 1% Agarose in Gegenwart von 0,001%

Ethidiumbromid analysiert.

Tab. 11: Versuchsreihen zur Bestimmung von Fällungsparametern zur Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol (jeweils 3 Replikate). Zahlen in den Feldern: Volumen der Zellkultur (OD = 3) in µl. Oberste Zeile: Zellen mit/ohne (+/-) Plasmid. Rechte Spalte: Lyse mit/ohne (+/-) RNAse. Unterste Zeile: Eingesetzte Mengen von Präzipitationsreagenzien.

Plasmid + - + - + - + - + - + - + - + - + - + - + - + -

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 RNAse

A 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 +

B 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 -

C 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 +

D 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 -

E 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 +

F 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 -

G 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 +

H 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 -

I 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 +

J 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 -

K 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 +

L 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 -

M 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 +

N 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 -

O 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 +

P 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 -

18 µl 10% Peg / 75% 2-Prop. 19 µl 10% Peg / 75% 2-Prop. 28 µl 10% Peg / 75% 2-Prop. 35 µl 2-Propanol

Page 44: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 30

Die Sequenzierung der Plasmide erfolgte nach den in 2.3.1 beschriebenen Protokollen,

wobei von jeder Probe jeweils 1 µl eingesetzt wurde, ohne einen Konzentrationsangleich

durchzuführen.

2.2.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol

Gefällte PCR-Produkte mit Fragmentgrößen von 100, 256, 500, 756 und 1000 bp wurden in

100 µl PCR-Reaktionspuffer (75 mM Tris pH9, 20 mM (NH4)2SO4, 2,5 mM MgCl2, 500 mM

Betain, 0,01% Tween, 0,3 mM dNTPs und 0,3 µM Primer) gelöst. Die gelöste DNA wurde in

acht 10 µl Aliquots aufgeteilt. Als Fällungsreagenz wurden 200 ml 40% PEG-6000 mit 600 ml

2-Propanol und 120 ml 2,8 M Kaliumacetat-Puffer gemischt (Endkonzentration:

8,7% PEG (w/v) / 65,2% 2-Propanol (v/v) / 0,365 M KAcetat). Zu den aliquotierten Marker

DNAs wurde jeweils 7, 8, 9, 10, 11, 12, 13 und 14 µl des Fällungsreagenz pipettiert. Die

Proben wurden durchmischt und für 15 min bei RT equilibriert. Die Sedimentation der

gefällten DNA erfolgte anschließend bei 2750 x G und RT für 20 min. Der Fällungsüberstand

wurde bei 172 x G für 1 min aus der umgedrehten Platte zentrifugiert. Nach kurzem

Trocknen wurde die gefällte Marker DNA in 10 µl 1x TE Puffer durch Mischen mit einer

Pipette resuspendiert. Die Analyse der unter den verschiedenen Bedingungen präzipitierten

DNA-Fraktionen erfolgte durch Elektrophorese in 2,1% Agarosegelen in Anwesenheit von

0,001% Ethidiumbromid.

2.2.6. Größenselektive Präzipitation von DNA für die Shotgun-Klonierung

Aus 20 ml Kulturen (OD600 3 - 5) von ausgewählten BAC-Klonen der D. labrax BAC-Bank

wurde BAC-DNA durch alkalische Lyse (Einsatzmenge der Puffer: S1+RNAse, S2 und S3

jeweils 0,1faches Kulturvolumen) und anschließende Aufreinigung mit PEG / 2-Propanol

(0,475faches Volumen des Überstands) hergestellt, wobei Inkubations- und

Zentrifugationsschritte wie in 2.2.4 durchgeführt wurden. Die gefällte DNA wurde direkt in

170 µl PlasmidSafe-Exonuklease Puffer gelöst (siehe Tab. 12), um Reste von genomischer

DNA abzubauen. Inkubation erfolgte bei 37ºC für mindestens 90 min. Die Inaktivierung der

Exonuclease erfolgte bei 72ºC für 30 min.

Tab. 12: Plasmidsafe-Reaktionsansätze zum Verdau von linearer genomischer DNA.

PlasmidSafe Kit Volumen Endkonzentration PlasmidSafe 10x Puffer 17,0 µl 1x ATP 25 mM 22,8 µl 3,4 mM ATP-dependent Exonuclease 10 U/µl 5,4 µl 0,3 U/µl PCR H2O 124,8 µl - gesamt Volumen 170,0 µl -

Page 45: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 31

Von der BAC-DNA wurden 30 µl in einem Eppendorfgefäß durch Einwirkung von Ultraschall

für 9 - 10 s geschert (Einstellungen: 40% Duty Cycle, 5 output control, continuous). Die

Enden der fragmentierten DNA wurden mittels T4-DNA-Polymerase und Klenow-Fragment

repariert (siehe Tab. 13).

Tab. 13: Reaktionsbedingungen für die Reparatur der Enden von gescherter DNA.

Nach 30 min Inkubation bei RT wurden 20 µl des Ansatzes mit dem gleichen Volumen PEG /

NaCl / 2-Propanol Gemisch versetzt, so dass eine größenselektive Fällung in Gegenwart von

4% PEG (w/v), 0,673 M NaCl und 12,5% 2-Propanol (v/v) stattfand. Dieser Ansatz wurde für

15 min bei RT equilibriert und anschließend bei 2750 x G für 30 min bei RT zentrifugiert. Der

Überstand wurde durch Abzentrifugieren bei 172 x G für 1 min entfernt und die gefällte DNA

bei 60ºC in 12 µl TRIS 1 mM pH8 für 30 min gelöst. Je 2 µl der größenselektierten DNA-

Fragmente wurden auf einem 1% Agarosegel mit 4 µl der nicht selektierten Fragmente

verglichen. Die größenselektierte DNA wurde mit T4-Ligase in pUC19-Vektoren kloniert,

dazu wurde folgender Ansatz pipettiert und 16 h bei 16ºC im Wasserbad inkubiert.

Tab. 14: Ligationsansatz für die Erstellung von Shotgun-DNA-Banken.

Ligationsansatz Volumen Endkonzentration Ligationspuffer 10x 0,6 µl 1 x ATP 5mM 0,6 µl 0,5 mM T4-DNA-Ligase 1,25 U/µl 0,6 µl 0,075 U/µl pUC19/SmaI 25ng/µl 0,6 µl 2,5 ng/µl DNA 10 - 20 ng/µl 3,6 µl 3,6 – 7,2 ng/µl

Nach der Inkubation wurden 3 µl Chloroform und 6 µl H2O zum Ligationsansatz pipettiert,

gemischt und 5 min bei 18000 x G zentrifugiert. Danach wurde die obere Phase (ca. 13 µl) in

ein neues Eppendorfgefäß überführt. 25 µl elektrokompetente Zellen (Invitrogen Electromax

DH10B) wurden mit 1 µl der rekombinanten Plasmide durch Elektroporation (1,8 KV)

transformiert und direkt in 1 ml SOC-Lösung aufgenommen. Danach wurden die Zellen 1 h

bei 37ºC in SOC-Medium inkubiert und auf großen Agarplatten (Nunc, 245 x 245 x 25 mm)

ausgestrichen. Selektion der Klone erfolgte durch 110 µg/ml Ampicillin im Agar. Inkubation

erfolgte für 16 h bei 37ºC im Brutschrank. Ca. 2000 Transformanden wurden durch

End-Repair Ansatz Volumen Endkonzentration DNA fragmentiert 28,0 µl ca. 20 - 40 ng/µl T4-DNA-Polymerase Puffer 5x 8,0 µl 1fach dNTPs 2 mM 2,0 µl 0,2 mM T4-DNA-Polymerase 1,0 µl 0,83 U/µl Klenow-Fragment 1,0 µl 0,83 U/µl

Page 46: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: DNA-Sequenzierung 32

blau / weiß Selektion identifiziert und von einem automatischen Picking-System in 384er

Kulturplatten überführt. Plasmid-Präparation erfolgte durch automatisierte Aufreinigung mit

PEG / KAcetat / 2-Propanol (Sequenzierung siehe 2.3.1).

2.2.7. Steigerung der Fosmid-DNA Ausbeute durch induzierbare high-copy

Replikation

Ein Fosmid-Klon aus einer am MPI f. Molekulare Genetik mit dem pCC1Fos-Vektor erstellten

genomischen DNA-Bank des Bakteriums Azoarcus Stamm mXyN1 (57) wurde in 2YT-

Medium unter Selektion mit Chloramphenicol (20 µg/ml) bis zu einer OD von 0,8 bei 37ºC

kultiviert. Mit 3 ml dieser Kultur wurden 8 weitere 100 ml Kulturen in Erlenmeyerkolben

angeimpft, welche unterschiedliche Mengen an D-Glucose und L-Arabinose enthielten (siehe

Tab. 15).

Tab. 15: Zusätze für die verzögerte Induktion der high-copy Replikation von pCC1Fos-Vektoren.

Kultur 1 2 3 4 5 6 7 8L-Arabinose (w/v) 0% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2%D-Glucose (w/v) 0,2% 0,2% 0,18% 0,16% 0,14% 0,1% 0,05% 0%

Das Wachstum jeder Kultur wurde durch photometrische Bestimmung der optischen Dichte

bei 600 nm halbstündlich verfolgt.

2.3. DNA-Sequenzierung

2.3.1. Sequenzierung von Plasmid-DNA

Für die Sanger-Sequenzierung von Plasmid-DNA wurden pro Reaktion die in Tab. 16

genannten Reagenzien verwendet. Die Wahl der Sequenzierungsprimer ist abhängig vom

sequenzierten Plasmidtyp, für pUC19-Plasmide wurden M13-40 und M13-28 Standard-

Primer verwendet. Die BigDyeV3.1 Reagenzien wurden 9fach verdünnt eingesetzt. Aufgrund

der hohen Verdünnung des BigDyeV3.1 musste der Reaktionsansatz mit PCR-Puffer (ohne

Primer) ergänzt werden. Angaben zum verwendeten PCR-Mix siehe 2.2.5.

Tab. 16: Sequenzierungsreaktion für Plasmid-DNA.

Primer [5µM] BigDyeV3.1 PCR-Puffer H2O gesamt Vol. Sequenzierungsansatz für Plasmide 1 µl 1,5 µl 0,15 µl 1,35 µl 4 µl

Page 47: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: DNA-Sequenzierung 33

Als Vorbereitung der Sequenzierung im 384er MTP-Format wurden die Reagenzien in

großvolumigen Ansätzen pipettiert, zu je 4 µl in die MTPs aliquotiert und dann bei -80ºC

gelagert. Die Sequenzierung erfolgte durch Zugabe von ca. 20 ng (0,5 µl - 1 µl)

aufgereinigter Plasmid-DNA in diese Platten, Durchmischung und das in Tab. 17 dargestellte

Temperaturprogramm.

Tab. 17: Temperaturprogramm für die Sequenzierung von Plasmid-DNA.

Temperatur Dauer Anzahl Wdh.

Denaturierung 96°C 2:30 min 1

Denaturierung 96°C 20 s

M13-40: 55°C Primer

Hybridisierung M13-28: 50°C

10 s

Elongation 60°C 4 min

35 Zyklen

Ende 10°C ∞ 1

2.3.2. Sequenzierung von Fosmid-DNA und BAC-DNA

Die Sequenzierung von Fosmid- oder BAC-DNA in 384er MTPs erfolgte durch die in 2.3.1

beschriebene Vorgehensweise mit den in Tab. 18 dargestellten angepassten Reaktions-

bedingungen. Für die Fosmid-Endsequenzierung wurden ca. 30 - 40 ng (1 µl - 2 µl)

Template-DNA eingesetzt. Bei BACs wurden mit 3 µl (ca. 50 – 100 ng) etwa 1/3 der

vorhandenen DNA eingesetzt, welche aus 2 x 200 µl Kulturvolumen aufgereinigt wurde (UV-

Messwerte zwischen 40 ng/µl und 100 ng/µl waren nicht zuverlässig)

Tab. 18: Modifizierter Sequenzierungsansatz für BACs und Fosmide.

Primer [14,3 µM] BigDyeV3.1 ABI Seq.-Buffer gesamt Vol. Sequenzierungsansatz für Fosmide und BACs 0,35 µl 2,5 µl 0,15 µl 3 µl

Das verwendete Temperaturprogramm wurde wie in Tab. 17 beschrieben ausgeführt, wobei

die Anzahl der Zyklen für Fosmide auf 60 und für BACs auf 70 erhöht wurde. Für die

Fosmid / BAC-Endsequenzierung in dieser Arbeit wurden T7 (Annealingtemperatur 50ºC)

und M13-28 als Sequenzierungsprimer verwendet.

Page 48: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: DNA-Sequenzierung 34

2.3.3. Ethanol / NaAcetat-Fällung von Sequenzierungsprodukten

Die Sequenzierungsprodukte wurden durch Fällung mit Ethanol / NaAcetat gefällt, um

fluoreszenzmarkierte ddNTPs und Salze zu entfernen. Dazu wurde Ethanol 100% mit

3 M NaAcetat-Puffer (pH 4,8 - 5,2) 25:1 gemischt. Von dieser immer frisch angesetzten

Lösung (NaAcetat kann mit der Zeit ausfallen) wurden 13 µl je Sequenzierungsreaktion

pipettiert, so dass die Fällung nach Durchmischung in Gegenwart von 83,3 mM NaAcetat

und 69,4% Ethanol stattfand. Die Platten wurden für 60 min bei RT und 2750 x G

zentrifugiert. Der Überstand wurde verworfen und Reste bei 27,5 x G aus der umgekehrten

Platte zentrifugiert. Die gefällten Produkte wurden nachfolgend mit 20 µl 70% Ethanol

gewaschen und erneut für 30 min bei 2750 x G und RT zentrifugiert. Der Überstand wurde

erneut verworfen und Reste wie oben beschrieben abzentrifugiert. Die gefällten Produkte

wurden 10 min bei RT getrocknet. Anschließend wurde jedes Well mit 15 µl 1 M Betain

befüllt und die mit einem Heatsealer verschlossene Platte für 30 min bei RT geschüttelt.

2.3.4. Parameter für Sequenzanalyse auf dem ABI3730xl-System

Die in 1 M Betain gelösten DNA-Sequenzierprodukte wurden auf ABI3730xl Sequenzern

analysiert, indem die Proben mit den in Abb. 8 dargestellten Parametern aufgetrennt wurden.

Dabei wurden in den Geräten 50 cm oder 36 cm Kapillaren verwendet. Die Protokolle für

Plasmid, Fosmid und BAC-DNA unterscheiden sich in der Injektionszeit (10, 20 und 30 s), da

so schwache Signale aufgrund von geringen Template-Mengen bei Fosmiden und BACs

verstärkt werden konnten. Plasmide Fosmide BACs

50 cm

Kap

illare

n36

cm K

apilla

ren

Abb. 8: Parameter der Plasmid, Fosmid und BAC Sequenzanalyse auf ABI3730xl-Geräten.

Page 49: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: DNA-Sequenzierung 35

2.3.5. Sequenzierung eines Pools von 109 BACs auf dem Roche GS20-System

Anhand der komparativen Genomkartierung von D. labrax wurden 109 minimal

überlappende BACs ausgewählt. Die Klone wurden in dreifacher Ausführung in 96er MTPs

mit einem Kulturvolumen von 1,5 ml (2YT Medium + 20 µg/ml Chloramphenicol) angezogen.

Die Inkubation erfolgte für 18 h bei 37ºC und 260 rpm im Schüttler.

Nach der Inkubation wurden die Zellen bei 2750 x G für 5 min pelletiert, die Mediumreste

verworfen und die Zellpellets in 150 µl S1-Puffer+RNase resuspendiert. Die alkalische Lyse

der Zellen erfolgte durch Zugabe von 150 µl S2-Puffer und vorsichtiges Schütteln sowie

anschließende Inkubation für 5 min bei RT. Der Ansatz wurde mit 150 µl 0,33 x S3-Puffer

neutralisiert und vorsichtig durchmischt und etwa 15 min bei RT inkubiert.

Durch 30 min Zentrifugation bei 2750 x G und RT wurde das Zelllysat geklärt. Je 350 µl des

Überstands von drei Lyseansätzen eines Klons wurden in eine neue 96er MTP überführt und

erneut zentrifugiert, um eventuell verschleppte Präzipitate aus der alkalischen Lyse zu

pelletieren. Von dem zweifach zentrifugierten Überstand wurden 1000 µl in eine neue

96 MTP überführt und mit 700 µl 2-Propanol bei 2750 x G und 4ºC für 30 min gefällt. Nach

der Fällung wurde der Überstand durch Zentrifugation der umgekehrten Platte bei 172 x G

für 1 min verworfen. Die Pellets wurden für 5 min bei 70ºC im Trockenschrank getrocknet

und dann in 25 µl TRIS 1 mM pH8 bei sanftem Schütteln und 60ºC für 60 min gelöst. Danach

wurden die Proben langsam abgekühlt.

Die Proben wurden nun vereinigt und durch CsCl-Gradientenzentrifugation wurde

supercoiled BAC-DNA von genomischer E. coli-DNA und linearisierter BAC-DNA getrennt

(siehe 2.3.6).

Etwa 5 - 6 µg der gewonnenen BAC-DNA wurde für die Herstellung einer einzelsträngigen

DNA-Bank und die anschließende Sequenzierung mit dem Roche GS20-System verwendet.

Die dazu nötigen Arbeitschritte erfolgten gemäß den Protokollen des Herstellers. Zusätzlich

wurde ein Teil der DNA, wie in 2.2.6 (ab Ultraschallbehandlung) beschrieben, für die

Konstruktion einer Plasmid-Shotgun-Klonbank verwendet, welche zur Generierung

zusätzlicher Sanger-Sequenzdaten verwendet wurde.

2.3.6. CsCl-Gradientenzentrifugation von BAC-DNA

BAC-DNA wurde aus 400 - 500 ml Kulturvolumen isoliert und mit 4,5 g CsCl versetzt. Die

Lösung wurde mit 1x TE-Puffer auf ein Gewicht von 8,5 g aufgefüllt und mit 400 µl

Ethidiumbromid (10 mg/ml) angefärbt. Dieser Ansatz wurde in Beckmann-Röhrchen für die

Ultrazentrifugation überführt. Ein zweites Röhrchen mit CsCl in 1x TE diente als

Page 50: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Bioinformatische Datenanalyse 36

Gegengewicht (max. 0,02 g Gewichtsunterschied!). Beide Röhrchen wurden zugeschweißt

und bei 45000 rpm (100.000 x G) und 20ºC für 17 h zentrifugiert.

Nach der Zentrifugation wurden unter UV-Licht zwei Banden sichtbar. Die untere Bande

(supercoiled BAC-DNA) wurde mit einer Kanüle abgezogen. Mit Hilfe von 1 ml gesättigter

2-Propanol / CsCl-Lösung wurde Ethidiumbromid in die obere 2-Propanol-Phase extrahiert

und verworfen. Dieser Vorgang wurde insgesamt dreimal wiederholt. Die DNA-haltige Phase

wurde mit 4 ml H2O verdünnt und die BAC-DNA durch Zugabe von 8 ml 100% Ethanol

gefällt. Der Fällungsansatz wurde zur Steigerung der Ausbeute für 30 min bei -20ºC inkubiert

und dann für 20 min bei 4ºC und 2750 x G zentrifugiert. Die sedimentierte DNA wurde mit

4 ml 70% Ethanol gewaschen und erneut 15 min bei 4ºC und 2750 x G zentrifugiert. Der

Waschschritt wurde insgesamt zweimal wiederholt. Nach dem Trocknen des DNA-Pellets

wurde dieses in 100 µl 1x TE-Puffer resuspendiert.

2.4. Bioinformatische Datenanalyse

2.4.1. Anordnung von D. labrax BAC-Endsequenzen auf den Genomen von

Tetraodon nigroviridis, Oryzias latipes und Gasterosteus aculeatus

Zu Testzwecken wurden 10.000 BAC-Endsequenzen aus der BAC-Bibliothek von D. labrax

wurden mit BLASTN (43, 44) auf den Genomen von T. nigroviridis, O. latipes und G.

aculeatus angeordnet. Die entsprechende Software und Datenbanken wurden lokal

verfügbar gemacht. Dabei wurden folgende Parameter verwendet:

blastall -p blastn -i <BAC-Endsequenzen.fasta> -d <ReferenzgenomDB> -o <Output> -W 15 -e 1e-5

Die Output-Datei wurde gefiltert, so dass die Anzahl angeordneter Endsequenzen

ausgegeben wurde:

grep Value <Output> | wc

2.4.2. Komparative Genomkartierung von D. labrax auf G. aculeatus

Die Anordnung aller BAC-Endsequenzen (102.282) auf dem Genom von G. aculeatus

erfolgte durch folgende BLAST-Parameter:

blastall -p blastn -i <BAC-Endsequenzen.fasta> -d <G.aculeatusDB> -o <Output> -W 7 –q -1 -e 1e-5

Page 51: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Bioinformatische Datenanalyse 37

Die gegenüber 2.4.1 veränderten Parameter W und q steigerten die Sensitivität des BLAST-

Algorithmus, beanspruchten allerdings auch mehr Rechenzeit. Der BLAST-Output wurde

durch den BLAST-Filter MSPcrunch in eine Tabelle umgewandelt, welche in die

Tabellenkalkulation MS Excel weiter verarbeitet werden konnte.

MSPcrunch –d „Output“ > output.msp

Mit der Tabellenkalkulation konnte der Datensatz durch implementierte Befehle als auch

selbst programmierte VBA-Makros weiter gefiltert werden (siehe 3.4.2 & 4.4.2).

Ausgewählte beidseitig sequenzierte Klone konnten anhand der Chromosomen von

G. aculeatus und den Koordinaten der Alignments sortiert werden und so relativ zueinander

angeordnet werden. Aus diesen überlappenden Klonen wurde ein minimum tiling path

berechnet. Listen von zuvor ausgeschlossenen Klonen wurden erstellt und erneut mit

stringenteren BLAST-Parametern (W = 15) angeordnet. Nach Filterung repetitiver

Sequenzen (>5 Alignments) wurden diese der Kartierung hinzugefügt.

Die graphische Darstellung erfolgte durch ein VBA-Makro in CorelDraw11, welches die

Koordinaten der berechneten BAC-Contigs aus den Excel Tabellen einlas und mit einer

Genauigkeit von 10 bp zeichnete.

2.4.3. Abgleich von genetischer Kopplungskarte und komparativer Karte

Sequenzdaten, welche bei der genetischen Kopplungskartierung von D. labrax Verwendung

fanden und die resultierende Kopplungskarte, wurden von Filip Volckaert (KU Leuven,

Belgien) zur Verfügung gestellt. Dabei handelte es sich um 151 Sequenzen von

Mikrosatelliten und 31 EST-Sequenzen.

Die Sequenzdaten wurden mittels des BLAST-Servers der Ensembl-Webseite

(www.ensembl.org) auf dem Genom von G. aculeatus angeordnet, wobei als BLAST-

Parameter „Distant homologies“ ausgewählt wurde. Die manuelle Auswertung erfolgte,

indem zunächst Sequenzen, welche mit einem E-Value von <1*10-4 angeordnet waren oder

nur einen einzigen Treffer im Genom anzeigten, in der genetischen Kopplungskarte rot

markiert wurden. Sequenzen mit weniger signifikanter Anordnung wurden nur berücksichtigt,

wenn sie in Nachbarschaft von besser angeordneten Markern lagen, welche von derselben

Kopplungsgruppe stammten. Die zugeordneten Chromosomen von G. aculeatus wurden

neben den Kopplungsgruppen von D. labrax mit den entsprechenden Verbindungslinien zu

den angeordneten Markern eingezeichnet.

Page 52: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Bioinformatische Datenanalyse 38

2.4.4. Abgleich der Radiation Hybrid-Kartierung von S. aurata und G. aculeatus

Die Sequenzdaten von 725 Markern der Radiation Hybrid Genomkartierung von Sparus

aurata wurden von Elena Sarropoulou (HCMR, Griechenland) zur Verfügung gestellt. Die

Sequenzen wurden mit BLASTN auf der Genomsequenz von G. acuelatus angeordnet,

wobei eine Wordsize von 7, Output in tabellarischer Form (-m 8) und ansonsten

Standardeinstellungen verwendet wurden. Die besten Alignments wurden nach G. aculeatus

Chromosomen sortiert und ihre Anzahl je Radiation Hybrid-Gruppe bestimmt. Die

Häufigkeiten der Treffer pro Gruppe und Chromosom wurden in einem Oxford-Plot

dargestellt.

2.4.5. Prozessierung der Sanger-Sequenzdaten

Die Sequenz-Rohdaten von ABI3730xl-Geräten wurden durch den PHRED-Basecaller

prozessiert (58). Anschließend wurden die Sequenzen mit LUCY (59) auf Teile des

Sequenzierungsvektor untersucht und diese maskiert (Vectorclipping). Durch Megablast (60)

wurden Sequenzen, welche von E. coli stammten oder Klonierungsvektoren (z.B. pCC1BAC)

zuzuordnen waren, aussortiert. Diese Schritte wurden durch das Perl-Skript sp3.pl von

Steffen Scheer S. und Klages S. in unserer Arbeitsgruppe automatisiert.

2.4.6. Assemblierung von BAC-Shotgun-Sequenzierungen

Für die Assemblierung von Shotgun-Sequenzierungen wurde die PHRAP-Software (61)

verwendet. Die assemblierten Daten wurden mit Gap4 (Staden Softwarepaket) oder mit

CONSED (62) bearbeitet.

2.4.7. Hybridassemblierung von GS20 und Sanger-Sequenzdaten

Sequenzdaten des GS20-Systems wurden in Form von SFF-Files an den Genomassembler

Newbler V1.0.53.17 (Roche, Penzberg) übergeben. Nach der Assemblierung wurden die im

FASTA-Format vorliegenden Contigs der 454 Daten in phd-Files umgewandelt und

zusammen mit den Sanger-Sequenzierungen durch PHRAP assembliert. Die resultierende

ACE-Datenbank wurde mit CONSED bearbeitet.

Page 53: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Material und Methoden: Bioinformatische Datenanalyse 39

Contigs dieses Hybridassemblys wurden mit BLASTN auf dem G. aculeatus Genom

angeordnet. Die Anordnung wurde manuell in einer Tabellenkalkulation überprüft und

unsichere Anordnungen entfernt. Die resultierende Reihenfolge der Contigs und ihre

Orientierung wurde in einer Tabelle abgelegt. Anhand dieser Tabelle erstellte das Perl-Skript

„HK.pl“ von Beck A. aus unserer Arbeitsgruppe eine zusammenhängende Sequenz im

FASTA-Format aus den einzelnen Contigs, wobei zwischen den Contigs jeweils 10 n´s

eingefügt wurden.

Page 54: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 40

3. Ergebnisse

3.1. Analyse der PEG-Präzipitation

3.1.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen

DNA-Fragmente im Größenbereich von 100 - 17000 bp wurden mit 84 verschiedenen

PEG / NaCl-Konzentrationen gefällt. Die Auswertung von zwei Versuchsreihen sind als

Beispiel in Abb. 9 dargestellt .

Fällung in 1M NaCl

PEG 6000:

4,1% 4,2% 4,3% 4,4% 4,5% 4,7% 4,9% 5,1% 5,4% 5,7% 6% Marker

1700080004500

2500200016001300

900

700600

400

250

100

Fällung in 0,3M NaCl

PEG 6000:

Marker 7,05% 7,1% 7,2% 7,3% 7,4% 7,5% 7,7% 7,9% 8,1% 8,4% 8,7% 9,0%

Abb. 9: Größenselektive Präzipitation von DNA in 1 M und 0,3 M NaCl bei unterschiedlichen PEG-Konzentrationen. Mit steigender PEG-Konzentration werden zunehmend auch kleinere DNA-Fragmente gefällt. Die schwarze Linie zeigt die Fällungsgrenze.

Für jede PEG / NaCl-Kombination wurde mittels der Gelbilder eine Fällungsgrenze anhand

der sichtbaren Bandengröße geschätzt. Die ermittelten Fällungsgrenzen von Proben mit

konstantem Salzgehalt wurden als Versuchsreihen in Abhängigkeit von der PEG-

Konzentration graphisch aufgetragen. Durch Koordinatentransformationen wurde versucht

eine Modellgleichung für die Datenreihen zu finden. Potenzfunktionen lieferten dabei die

besten Regressionskoeffizienten (0,9684 – 0,9869), wenn die Messwerte zuvor doppelt

logarithmisch aufgetragen wurden. Daraus ließ sich folgender Zusammenhang für PEG-

Konzentration und Fällungsgrenze herleiten:

Formel 1: [Fällungsgrenze in bp] = 10(a*log([peg])^-k

Page 55: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 41

Dabei sind a sowie k abhängig von der eingesetzten Salzkonzentration. Die graphische

Darstellung in Abb. 10 zeigt die gute Übereinstimmung von experimentellen und berechneten

Werten.

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

3,5 4,5 5,5 6,5 7,5 8,5 9,5 10,5 11,5 12,5

PEG % (w/v)

Fällu

ngsg

renz

e [b

p]

1M calc0,8M calc0,6M calc0,5M calc0,4M calc0,3M calc0,2M calc1M0,8M0,6M0,5M0,4M0,3M0,2M

Abb. 10: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / NaCl. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen NaCl-Konzen-trationen wurden über der zugehörigen PEG-Konzentration aufgetragen.

Die ermittelten Daten können auch als Phasendiagramm dargestellt werden, in dem

Salzkonzentration über der PEG-Konzentration aufgetragen wird und alle Messpunkte mit

gleicher Fällungsgrenze verbunden werden. Auch hier kann eine Modelgleichung gefunden

werden, welche das Phasendiagramm eines PEG / Salz-Systems in guter Näherung

beschreibt:

Formel 2: [Salz] = C * tan(A*[peg]+B)+D

Bei A, C und D handelt es sich um Konstanten, während B abhängig von der Fällungsgrenze

ist. Diese Darstellungsform wird im Diskussionsteil 4.1 verwendet und verdeutlicht die

Eigenschaften der DNA-Präzipitation in PEG / Salz-Systemen.

NaCl-Konz.:

Page 56: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 42

3.1.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen

Die DNA-Fällung in Gegenwart von PEG / MgCl2 unterscheidet sich von der Fällung in PEG /

NaCl hauptsächlich dadurch, dass 10 - 20fach niedrigere Salzkonzentrationen und etwa die

halbe PEG-Konzentration für die Fällung benötigt werden. Trotz dieser Unterschiede ist die

Darstellung der Fällungsgrenzen in Abhängigkeit von der PEG-Konzentration in Abb. 11 mit

den Ergebnissen aus 3.1.1 vergleichbar.

Die Datenreihen können außerdem durch die zuvor verwendeten Gleichungen (Formel 1 &

Formel 2) mit guter Näherung beschrieben werden. Das PEG / MgCl2-Phasendiagramm wird

unter 4.1.2 diskutiert.

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0

PEG % (w/v)

Fällu

ngsg

renz

e [b

p]

100mM calc75mM calc50mM calc35 mM calc25mM calc15mM calc10mM calc10mM15mM25mM35mM50mM75mM100mM

Abb. 11: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / MgCl2. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen MgCl2-Konzen-trationen wurden über der zugehörigen PEG-Konzentration aufgetragen.

3.1.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und

partielle Substitution von PEG durch 2-Propanol

Viele molekularbiologische Methoden verwenden Kaliumacetat-Puffer, z.B. wird dieser Puffer

zur Neutralisierung nach der alkalischen Lyse von Bakterien benötigt. Im Hinblick auf die

Automatisierung einer PEG-basierten Plasmid-Aufreinigungsmethode lag es deshalb nahe,

die DNA-Präzipitation mit PEG in diesem Puffersystem zu prüfen. Die Darstellung der

Fällungsdaten in Abb. 12 weist auf ein ähnliches Verhalten wie das PEG / NaCl-System hin.

Beim Einsatz gleicher Molarität der Salze benötigt das KAcetat-System jedoch 1 - 4% höhere

PEG-Konzentrationen als das NaCl-System, um dieselben Fällungsergebnisse zu erzielen.

Dies hängt wahrscheinlich mit der besseren Löslichkeit von KAcetat gegenüber NaCl

zusammen.

MgCl2-Konz.:

Page 57: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 43

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

4,0 6,0 8,0 10,0 12,0 14,0 16,0

PEG % (w/v)

Fällu

ngsg

renz

e [b

p]1M calc0,8M calc0,7M calc0,6M calc0,5M calc0,4M calc0,3M calc0,2M calc1M0.8M0.7M0.6M0.5M0.4M0.3M0.2M

Abb. 12: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / Kaliumacetat. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen Kaliumacetat-Konzentrationen wurden über der zugehörigen PEG-Konzentration aufgetragen.

Um höhere PEG-Konzentrationen und damit zusammenhängende Probleme, wie erhöhte

Viskosität, zu vermeiden, wurde das PEG / KAcetat-System mit Zusatz von 2-Propanol

getestet. Die Messpunkte in Abb. 13 zeigten, dass die Zunahme der 2-Propanol-

Konzentration im Fällungsansatz bei konstantem PEG / KAcetat Gehalt einen ähnlichen

Effekt wie die Erhöhung der PEG-Konzentration erzielten. Die Daten wurden an die Model-

gleichungen des reinen PEG / KAcetat-Systems in erster Näherung angepasst, indem abge-

schätzt wurde, dass der Einfluss von 2-Propanol auf die größenselektive Präzipitation ca.

7fach geringer ist als die von PEG-6000.

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

4,0 6,0 8,0 10,0 12,0 14,0 16,0

PEG % (w/v)+ 1/7*2-Propanol % (v/v)

Fällu

ngsg

renz

e [b

p]

0,8M KAc berechnet0,6M KAc berechnet0,5M KAc berechnet0,4M KAc berechnet0,3M KAc berechnet0,2M KAc berechnet0,2M KAc 14,3 % PEG + x 2-prop0,3M KAc 9,8 % PEG + x 2-prop0,4M KAc 7,0 % PEG + x 2-prop0,5M KAc 6,1% PEG + x 2-prop0,6M KAc 5,5 % PEG + x 2-prop0,8M KAc 4,8 % PEG + x 2-prop

Abb. 13: Größenselektive Fällung von DNA in Lösungen mit konstanter PEG- und KAcetat-Konzentration durch Zusatz von variierenden Mengen 2-Propanol (Messpunkte von links nach rechts x = 0, 1, 2, 4, 6 … 20% [v/v] 2-Propanol). Die durchgezogenen Linien stellen die aus Abb. 12 ermittelten Fällungsgrenzen im PEG / KAcetat-System dar. Durch Anpassung der x-Achse (PEG[w/v] = 1/7*2-Propanol[v/v]) konnten Messungen der unterschiedlichen Prä-zipitationsbedingungen überlagert und verglichen werden.

KAc-Konz.:

Page 58: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 44

3.1.4. Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol-Gemischen

Zunächst wurden die verschiedenen Fällungen von Plasmid-DNA betrachtet, welche zuvor

einer alkalischen Lyse mit Zusatz von RNAse unterzogen worden waren. Dabei wurde

deutlich, dass die UV-Messwerte bei einer reinen 2-Propanol Fällung sehr hoch lagen.

Gelbilder zeigten (n. dargestellt), dass dies nicht durch besonders hohe DNA-Ausbeuten zu

begründen war, sondern dadurch, dass die Präzipitation mit 2-Propanol keine effektive

Trennung von RNA-Abbauprodukten erzielte. Die Fällung mit 28 µl PEG / 2-Propanol

reduzierte die Absorptionswerte merklich, allerdings lagen die Messwerte immer noch

erheblich über realistischerweise zu erwartenden Plasmid-DNA Ausbeuten. Mit Reduktion

der Menge des PEG / 2-Propanol-Gemisches ging der zuvor exponentielle Anstieg der

Absorptionswerte auf ein lineares Verhältnis zurück. Die Unterschiede zwischen 18 µl und

19 µl eingesetzter Fällungslösung waren nur noch minimal (siehe Abb. 14).

0

50

100

150

200

250

300

350

0 50 100 150 200 250

Kulturvolumen (OD = 3) [µl]

A26

0*50

ng/

µl

Aufreinigung mit35 µl 2-propAufreinigung mit28 µl PEG/2-propAufreinigung mit18 µl PEG/2-propAufreinigung mit19 µl PEG/2-prop

Abb. 14: Messung der Absorption bei 260 nm von unterschiedlich gefällten Plasmid-Präparationen. Fällung mit 2-Propanol führt zu unrealistisch hohen Messwerten, da degradierte RNA ausgefällt wird. Durch größenselektive Präzipitation mit kleinen Mengen eines Gemischs von 10% (w/v) PEG / 75% (v/v) 2-Propanol (2-prop) kann Plasmid-DNA besser aufgereinigt werden und zeigt realistischere Messwerte.

Es war anzunehmen, dass bei Einsatz von 18 µl bzw. 19 µl Fällungsreagenz Bedingungen

erzielt wurden, welche die Trennung des überwiegenden Teils degradierter RNA von

Plasmid-DNA durch größenselektive Präzipitation erzielten. Diese Annahme bestätigte sich

beim Vergleich mit den Plasmid-Präparationen, welche ohne RNAse durchgeführt wurden.

Page 59: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 45

0

100

200

300

400

500

600

700

800

0 50 100 150 200 250

Kulturvolumen (OD = 3) [µl]

A26

0*50

ng/

µlAufreinigung mit 18 µlPEG/2-prop mit RNAse

Aufreinigung mit 19 µlPEG/2-prop mit RNAse

Aufreinigung mit 19 µlPEG/2-prop ohne RNAse

Aufreinigung mit 18 µlPEG/2-prop ohne RNAse

Abb. 15: Vergleich von Plasmid-Präparation mit und ohne RNAse. Unter größenselektiven Fällungsbedingungen kann bei geringeren Zellmengen (60 - 120 µl) eine Aufreinigung der DNA auch ohne Einsatz von RNAse erzielt werden. Größere Zellmengen verändern den Salzgehalt des Fällungsansatzes und führen zur Präzipitation von nicht degradierter RNA.

Abb. 15 zeigt, dass die gemessenen Absorptionswerte bei Aufreinigung aus 60 – 100 µl

Zellen (OD600nm = 3) für RNAse behandelte und RNAse unbehandelte Ansätze nahezu

identisch sind. In diesem Bereich war es möglich auch schwach degradierte RNA von

Plasmid-DNA zu trennen, was für die Selektivität der Fällungsbedingungen sprach.

Bei Einsatz der geringsten Menge PEG / 2-Propanol waren auch die Werte für 120 µl Zellen

identisch. Wurden dagegen höhere Zellvolumina eingesetzt so verschlechterte sich die

Selektivität. Dies war dadurch erklärbar, dass sich die Ionenstärke im Fällungsansatz mit

zunehmender Zellmenge steigerte. So wurde die Fällungsgrenze nach unten verschoben,

was zum Ausfall von weniger degradierter RNA führte. Diese Probleme können allerdings,

wie bereits oben gezeigt wurde, durch Zusatz von RNAse bei der alkalischen Lyse

vermieden werden. Bei Einsatz von PEG / 2-Propanol-Mengen unter 18 µl verringerte sich

die Ausbeute an Plasmid-DNA (Ergebnisse nicht dargestellt), weshalb es keinen Sinn

machte geringere Volumina des PEG / 2-Propanol-Gemisches für die Plasmid-Aufreinigung

zu verwenden.

Durch den Vergleich der Absorptionswerte von Überstand und gelöstem Pellet konnte

gezeigt werden, dass unter selektiven Fällungsbedingungen etwa 97% der bei 260 nm

absorbierenden Substanzen (größtenteils RNA) mit dem Überstand von der gefällten

Plasmid-DNA abgetrennt werden konnten. Der Vergleich mit Fällungen von Präparationen

des Stammes DH10B, dem ein Plasmid fehlte, zeigte, dass etwa 55,3% des

Absorptionswertes der gelösten Pellets von der Plasmid-DNA herrührte (beide Werte

konnten linear korreliert werden) (siehe Abb. 16).

Page 60: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 46

So konnte abgeschätzt werden, dass unter selektiven Fällungsbedingungen nur noch etwa

1,5% der zuvor vorhandenen RNA-Menge in der aufgereinigten Plasmid-DNA vorhanden

war. 2-Propanol lieferte bei vergleichbaren Fällungsansätzen (RNAse+ / Plasmid+) mit einem

durchschnittlichen Anteil von 12% RNA-Kontamination in der gefällten DNA etwa 8fach

schlechtere Werte.

y = 0,5529xR2 = 0,9848

0

5

10

15

20

25

30

35

40

0 10 20 30 40 50 60 70

A260 plasmid(+) *50 ng/µl

[A26

0 pla

smid

(+) m

inus

A26

0 Pla

smid

(-)] *

50 n

g/µl

Abb. 16: Messwerte von Präparationen plasmid-haltiger Zellen wurden mit Messwerten von Präparationen von Zellen, welche keine Plasmide beherbergten, korrigiert (Abb. links). Durch Vergleich der Messwerte von Überstand und Pellet konnte gezeigt werden, dass die Fällung in PEG / 2-Propanol bis zu 8 mal selektiver ist als eine reine 2-Propanolfällung (Abb. rechts).

Die Bestimmung des Gesamtproteingehalts der Plasmid-Präparationen mit Methoden, wie

z.B. Bradford, war problematisch, da diese durch vorhandene Plasmid-DNA und RNA

verfälscht wurden. Der Vergleich von Präparationen aus Zellen mit und ohne Plasmid zeigte

2 - 3fach erhöhte Werte des Proteingehalts, wenn Plasmid-DNA vorlag. Es gab eigentlich nur

zwei mögliche Gründe für den Anstieg des Proteingehalts in diesem Maße, entweder

plasmid-assoziierte Proteine wurden mitgefällt, oder aber die DNA reagierte mit dem

Farbstoff des Nachweis-Systems. Die gemessenen Werte ließen allerdings die Aussage zu,

dass der Proteingehalt der Plasmid-Präparationen unter selektiven Fällungsbedingungen

15 ng/µl nicht übersteigt und wahrscheinlich unter 5 ng/µl liegt, da diese Werte bei

Präparationen des plasmidfreien DH10B Stammes gemessen wurden.

Die für unsere Arbeitsgruppe wichtigste Qualitätskontrolle war allerdings die DNA-

Sequenzierung selbst. Die unter selektiven Bedingungen (18 & 19 µl PEG / 2-Propanol)

gefällten Plasmide wurden mit BigDye3.1-Reagenzien sequenziert. Die Sequenzanalyse

fand auf einem ABI3730xl Sequenzer mit einem 50 cm Kapillararray statt.

0%

2%

4%

6%

8%

10%

12%

14%

16%

Ant

eil v

on g

esam

t A26

0 (Ü

bers

tand

+Pel

let)

in P

elle

t

Aufreinigung mit35 µl 2-Propanol

Aufreinigung mit28 µl PEG/2-prop

Aufreinigung mit19 µl PEG/2-prop

Aufreinigung mit18 µl PEG/2-prop

Page 61: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 47

0

100

200

300

400

500

600

700

800

900

60 80 100 120 140 160 180 200

Kulturvolumen (OD = 3) aus dem Plasmide aufgereinigt wurden [µl]

Lese

wei

te P

hred

>Q

20 [b

]

Aufreinigung mit 19 µlPEG/2-prop ohne RNAseAufreinigumg mit 19 µlPEG/2-prop mit RNAseAufreinigung mit 18 µlPEG/2-prop ohne RNAseAufreinigung 18 µlPEG/2-prop mit RNAse

Abb. 17: Leseweiten der Sequenzierung von PEG / 2-Propanol aufgereinigter Plasmid-DNA aus unterschiedlichen Zellmengen.

Der Vergleich der Leseweiten der verschiedenen Plasmid-Präparationen zeigte, dass die

Sequenzierung mit einer Leseweite von 700 - 800 Phred-Q20 Basen konstant gute

Ergebnisse lieferte. Die minimalen Qualitätsunterschiede zwischen Präparationen mit / ohne

RNAse und Fällung mit 18 / 19 µl PEG / 2-Propanol scheinen eher zufälliger Natur zu sein.

Interessant ist auch, dass die Sequenzierung mit unterschiedlichen Plasmid-Mengen von ca.

17 ng (Ausbeute aus 60 µl Zellen) – 40 ng (200 µl Zellen) gleichwertige Ergebnisse lieferten.

Die Sequenzierung von geringeren Template-Mengen um die 20 ng wurde aber vorgezogen,

da die hohen Signalstärken zu Auflösungsverlusten zu Beginn und am Ende der

Sequenzdaten führen konnten. Die Sequenzen waren auch jenseits der Phred Q20-

Leseweite auswertbar. Bis zu 950 b (mit 1 - 2% Sequenzierungsfehlern) konnten mittels

BLAST-Algorithmus auf dem humanen X-Chromosom, dem Ursprung des Plasmid-Inserts,

angeordnet werden.

Aus den zuvor verwendeten Bedingungen wurde für die Automatisierung die alkalische Lyse

in Gegenwart von RNAse gewählt. So konnte eine selektive Fällung in einem breiteren

Spektrum von Zelldichten gewährleistet werden. Zur direkten Aufreinigung der Plasmid-DNA

aus dem geklärten Überstand der alkalischen Lyse wurde 19 µl PEG / 2-Propanol verwendet,

da so die Verdunstung des 2-Propanols bei längeren Standzeiten während der

automatisierten Plasmid-Aufreinigung ausgeglichen werden konnte. Wie in Kap. 4.2

schematisch dargestellt, konnte auf dieser methodischen Basis ein hochdurchsatzfähiges

Plasmid-Aufreinigungssystem entwickelt werden.

Page 62: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 48

3.1.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol

Im Gegensatz zur Aufreinigung von Plasmid-DNA muss eine Aufreinigung von PCR-

Produkten wesentlich kleinere DNA-Moleküle fällen. Außerdem sind die PCR-

Reaktionsbedingungen meist zu salzarm, um eine effektive Fällung ohne Salzzugabe zu

gewährleisten. Aus diesen Gründen wurde ein Präzipitationspuffer konzipiert, der in

Anlehnung an die Bedingungen für Plasmid-Aufreinigung neben PEG und 2-Propanol die

nötige Salzmenge in Form von Kaliumacetat-Puffer enthielt. Wie in Abb. 18 dargestellt,

konnten, durch die Zugabe verschiedener Volumenanteile an Präzipitationsreagenz, Be-

dingungen ermittelt werden, die die Aufreinigung von sehr kleinen PCR-Produkten

ermöglichten.

Abb. 18: Größenselektive Fällung von PCR-Produkten. Die PCR-Produkte wurden mit dem in den Spalten angegebenem Vielfachen des Probenvolumens (z.B. 0,7x) an Präzipitationsreagenz gefällt.

Eine dem 1,2fachen Volumen der PCR-Reaktion entsprechende Menge an

Präzipitationsreagenz konnte sämtliche Fragmente bis 100 b in unserem Testansatz mit

guten Ausbeuten fällen (Endkonzentration im Ansatz: 4,75% PEG / 35,6% 2-Propanol /

0,2 M KAcetat). Diese Bedingung konnte zur Aufreinigung der meisten PCR-Produkte

verwendet werden, da diese durch die größenselektive Fällung von überschüssigen Primern

und dNTPs getrennt wurden. In dem Fall, dass größere PCR-Produkte und zusätzlich um

den Faktor 0,5 kleinere unspezifische Produkte vorlagen, konnten geringere Volumina des

Fällungsreagenz eingesetzt werden. So konnten auch die unspezifischen Produkte entfernt

Fragment-

Größen [bp]

Page 63: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Analyse der PEG-Präzipitation 49

werden. Die Konzentration von aufgereinigten Proben konnte durch UV-Photometrie

bestimmt werden. Ebenso wie bei der Aufreinigung von Plasmiden waren für eine

erfolgreiche Sequenzierung der aufgereinigten PCR-Produkte keine weiteren Waschschritte

nötig (Ergebnisse nicht dargestellt).

Diese verbesserte Methode wurde u.a. erfolgreich zur Sequenzierung amplifizierter

Kandidatengene eingesetzt. In Kooperation mit Heymut Omran (Universitätsklinikum

Freiburg) konnten durch Analyse der DNAH5-Gene von 109 an Primärer Ciliärer Dyskinesie

erkrankten Patienten 33 neue Mutationen nachgewiesen werden, welche mit der

Erbkrankheit assoziiert sind (63).

3.1.6. Weitere Anwendungen der größenselektiven Präzipitation

Die größenselektive Präzipitation wurde zur Konstruktion von Shotgun-DNA-Banken

eingesetzt. Aufwendige Schritte, wie die Elution gewünschter Fragmentgrößen aus

Agarosegelen, konnten so ersetzt werden, und es wurde ermöglicht eine größere Anzahl von

Proben parallel zu bearbeiten (siehe Abb. 19).

Abb. 19: Selektion von sonifizierten DNA-Fragmenten im Bereich von 1 - 4 kb durch größenselektive Fällung. DNA wurde jeweils vor und nach der Fällung aufgetragen.

Die Ergebnisse der Shotgun-Sequenzierung von 4 BAC Klonen zeigten, dass eine

Größenverteilung der BAC-Fragmente im Bereich von 1 – 3 kb oder 2 – 4 kb erzielt wurde.

Dabei konnte die obere Grenze durch Dauer der Ultraschallbehandlung und die untere

Grenze durch Einsatz der PEG / Salzmenge beeinflusst werden (siehe Abb. 20).

vor nach vor nach vor nach nach vor Marker

4 kb

2 kb

1 kb

0,5 kb

Bassbac-35c1 Bassbac-46e19 Bassbac-31e6 Bassbac-18k1

Page 64: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 50

0

5

10

15

20

25

30

0 1000 2000 3000 4000 5000 6000 7000

Insertgröße [bp]

rel.

Häu

figke

it [%

]

Bassbac-31e6Bassbac-35c1Bassbac-46e19Bassbac-18k1

Abb. 20: Anhand der Sequenzdaten ermittelte Insertgrößenverteilung von 4 BAC-Shotgun-Banken, welche durch Anwendung von größenselektiver Präzipitation erstellt wurden.

3.2. Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung

3.2.1. Das 96-Well Format

Abb. 21 zeigt die verwendeten Komponenten zur Automatisierung der Plasmid-Präparation

im 96er MTP-Format. Der Roboterarm (A: F3, CRS-Robotics) bestückt den 96-Spitzen-

Pipettierer (B: Multimek96, Beckman-Coulter), die Zentrifuge (C: Rotanta, Hettich), sowie das

Karoussel (D: ISRA), welches Reagenzien und Kulturplatten beherbergt. Zusätzlich sind zwei

Magnetschüttler (Teleshake, Variomag) und eine Spitzenwaschstation integriert.

Abb. 21: Roboteranlage für Plasmid, Fosmid und BAC-DNA Aufreinigung im 96er MTP-Format.

Page 65: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 51

Der schematische Ablauf der Methode ist in Abb. 22 dargestellt. Der Ablauf wurde durch

verschiedene Testläufe herausgearbeitet und vermeidet essentielle Probleme, die bei der

Automatisierung anfangs auftraten (siehe 4.2.1).

Inkubation: in 1,5 ml 2YT bei 300 rpm und 37 C 18hPelletieren der Zellen und Dekantieren des Mediums

Resuspendieren der Zellen in S1+RNAse

O

Zell-Lyse durch S2-Puffer2 min mischen

Mit S3-Puffer neutralisierenKurz mischen

4x96

Zentrifugation 30 min bei 4000 rpm 25 CO

Überstand abnehmen und in leere 96 Mtp überführenIsopropanol zugeben

Mischen

4x96Elutionspuffer zugeben mischen

Überstand über Abfalltrog auskippenUmgedrehte Platten für 1 min bei 400 rpm trocken

zentrifugieren

Zentrifugation 30 min bei 4000 rpm 4 CO

4x96

Konzentrierte Proben von 4x96 MTPIn 1x 384er MTP überführen

Pro

benv

orbe

reitu

ng

(man

uell)

Pla

smid

-Isol

atio

n / -

Konz

entra

tion

Auf

rein

igun

g m

it P

EG /

NaC

l

Zugabe von PEG / NaCl LösungDurchmischung durch umdrehen der Platte

Zentrifugation 30 min bei 4000 rpm 25 CO

4x384

N=4

Überstand abnehmen und verwerfen70% Ethanol zugeben

durch umdrehen der Platte mischen

N=3

4x384

Überstand abnehmen und verwerfenProben trocknen

In gewünschtem Puffer und Volumen lösen4x384

Prob

enna

chbe

reitu

ng

(man

uell) Qualitätskontrolle und Konzentrationsabschätzung

Agarosegelelektrophorese von Stichproben

Abb. 22: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 96er Format.

Der mit der Anlage erzielte Probendurchsatz lag bei 1536 - 1920 Proben pro Tag und wurde

hauptsächlich durch die verwendeten 96 MTPs, sowie die mehrfachen Zentrifugations- und

Waschschritte begrenzt. Dieser Probendurchsatz war ausreichend für die Endsequenzierung

kleinerer Fosmid-Banken, wie sie zur Genomsequenzierung von Bakteriengenomen

Verwendung finden.

3.2.2. Das 384-Well Format

Erfolgreiche Versuche, DNA-Templates aus kleineren Kulturvolumina zu isolieren, ebneten

den Weg zu höherem Probendurchsatz durch Verwendung des 384er MTP-Formats.

Die hierzu verwendete Anlage (siehe Abb. 23) wurde ursprünglich von Holger Rauth (17) im

Rahmen des Humangenomprojektes für PCR-Anwendungen konzipiert. Der Umstieg auf

Plasmid-Präparation erforderte den Wechsel von Hydra 96 Pipettierrobotern mit fest

installierten Spitzen hin zu zwei 384er Systemen des Typs Biomek NX / Multimek 384

(Beckman-Coulter) mit wechselbaren Spitzen. Für Zentrifugationsschritte wurden zwei

Page 66: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 52

Zentrifugen (Rotanta, Hettich) installiert. Ein UV-Photometer (Spectramax plus 384,

Molecular Devices) wurde in die Anlage integriert. Quell- und Zielplatten werden in zwei

temperierbaren Karoussels (ISRA) und einem Kühlschrank beherbergt, diese bieten Platz für

mehr als 200 MTPs. Alle Geräte können von dem auf einer Schiene beweglichen

Roboterarm (A465, CRS-Robotics) bestückt werden.

Biomek NX Multimek 384

Deckel-abwurf

AbfallZentrifuge 2

Zentrifuge 1

Karoussel 1+ 2 für je 8 x 13 MTP temperierbar auf 8 Co

Kühlschrank mit 18 Plätzentemperierbar auf 4oC

Roboterarm auf Schiene beweglich

12 Thermocycler für PCR /cycle sequencing

UV-Photometer

Abfall

bidest.H O2

Abb. 23: Aufbau der „BigRobby“-Anlage zur automatisierten Plasmid-Aufreinigung im 384er-Format.

Der Ablauf der Plasmid-Aufreinigung mit der PEG / NaCl-Methode im 384er MTP-Format ist

in Abb. 24 schematisch dargestellt.

Inkubation: in 0,2 ml 2YT bei 1100 rpm und 37 C 17hPelletieren der Zellen und Dekantieren des Mediums

Resuspendieren der Zellen in S1+RNAse

O

Zell-Lyse durch S2-Puffer2 min mischen

Mit S3-Puffer neutralisierenKurz mischen

Pl1-8

Zentrifugation x min bei 4000 rpm 25 COÜberstand abnehmen und in leere 384 Mtp

überführenIsopropanol zugeben

Pl1-8Überstand über Abfalltrog auskippen

Umgedrehte Platten für 1 min bei 400 rpm trocken zentrifugieren in Zentrifuge 2

Zentrifugation x min bei 4000 rpm 4 CO

Pl1-8

Pro

benv

orbe

reitu

ng

(man

uell)

Pla

smid

-Isol

atio

n / -

Konz

entra

tion

Auf

rein

igun

g m

it P

EG /

NaC

l

Lösen der Proben in ElutionspufferUmpipettieren der DNA in Aufreinigungsplatte

Zentrifugation 30 min bei 4000 rpm 25 CO

16x384

Überstand abnehmen und verwerfen70% Ethanol zugeben

durch umdrehen der Platte mischen

N=3

16x384

Überstand abnehmen und verwerfenProben trocknen

In gewünschtem Puffer und Volumen lösen16x384

Prob

enna

chbe

reitu

ng

(man

uell) Qualitätskontrolle und Konzentrationsabschätzung

Agarosegelelektrophorese von Stichproben

Zell-Lyse durch S2-Puffer2 min mischen

Mit S3-Puffer neutralisierenKurz mischen

Pl1-16

Zentrifugation x min bei 4000 rpm 25 CO

Überstand abnehmen und in leere 384 Mtp überführen

Isopropanol zugeben

Zentrifugation x min bei 4000 rpm 4 CO

Pl9-16

Pl9-16Überstand über Abfalltrog auskippen

Umgedrehte Platten für 1 min bei 400 rpm trocken zentrifugieren in Zentrifuge 2

Pl9-16

Platten trocknen bei RT Pl1-16

Zugabe von PEG / NaCl LösungDurchmischung durch umdrehen der Platte 16x384

Abb. 24: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 384er MTP-Format.

Page 67: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 53

Der komplette Ablauf benötigte für 16 x 384 Proben etwa 12 h, so dass sich der

Probendurchsatz gegenüber dem 96er MTP-Format ca. 8fach gesteigert wurde. Dieser

erhöhte Durchsatz war einerseits durch das 384er MTP-Format bedingt (4fache Steigerung),

andererseits durch die effizientere Nutzung der Geräte (2fache Steigerung).

Durch die Kombination des bereits automatisierten Verfahrens für die alkalische Lyse und

der in 3.1.4 beschriebenen modifizierten PEG-Präzipitation in Gegenwart von KAcetat und

2-Propanol, konnte der Aufreinigungsprozess nochmals beschleunigt werden. Der ver-

besserte Prozess ist in Abb. 25 dargestellt.

Inkubation: in 0,2 ml 2YT bei 1100 rpm und 37 C 17hPelletieren der Zellen und Dekantieren des Mediums

Resuspendieren der Zellen in S1+RNAse

O

Zell-Lyse durch S2-Puffer2 min mischen

Mit S3-Puffer neutralisierenKurz mischen

Pl1-8

Zentrifugation x min bei 4000 rpm 25 COÜberstand abnehmen und in leere 384 Mtp

überführenPEG/Isopropanol-Mix zugeben

Pl1-8Überstand über Abfalltrog auskippen

Umgedrehte Platten für 1 min bei 1000 rpm trocken zentrifugieren in Zentrifuge 2

Zentrifugation x min bei 4000 rpm 4 CO

Pl1-8

Pro

benv

orbe

reitu

ng

(man

uell)

Pla

smid

-Isol

atio

n +A

ufre

inig

ung

Prob

enna

chbe

reitu

ng

(man

uell) Lösen der Proben in Elutionspuffer

Qualitätskontrolle aller Proben durch UV photometrische Messung

Zell-Lyse durch S2-Puffer2 min mischen

Mit S3-Puffer neutralisierenKurz mischen

Pl1-16

Zentrifugation x min bei 4000 rpm 25 CO

Überstand abnehmen und in leere 384 Mtp überführen

PEG/Isopropanol-Mix zugeben

Zentrifugation x min bei 4000 rpm 4 CO

Pl9-16

Pl9-16Überstand über Abfalltrog auskippen

Umgedrehte Platten für 1 min bei 1000 rpm trocken zentrifugieren in Zentrifuge 2

Pl9-16

Platten trocknen bei RT Pl1-16

Abb. 25: Schema des durch die PEG / 2-Propanol-Aufreinigungsmethode vereinfachten Ablaufs.

Durch Integration eines zweiten Biomek NX Pipettierers in die Anlage konnten nun 32

Platten in etwa 8 h bearbeitet werden, was einem theoretischen Probendurchsatz von 36.864

Templates pro Tag entspricht.

Page 68: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Endsequenzierung von Fosmiden und BACs 54

3.3. Endsequenzierung von Fosmiden und BACs

Die zuvor dargestellte Anlage erlaubte, neben der Plasmid-Präparation, die Aufreinigung von

großen Vektorkonstrukten (Fosmide 30 - 45 kb, BACs >100 kb) durch größenselektive

Präzipitation. Wie im Folgenden dargestellt, mussten hierfür Strategien entwickelt werden,

welche die geringen Ausbeuten dieser Vektorsysteme kompensieren konnten, um ihre

Endsequenzierung zu ermöglichen.

3.3.1. Steigerung der Fosmid-DNA Ausbeute durch induzierbare high-copy

Replikation

Fosmid-Vektoren des Typs pCC1Fos sind neben dem low-copy Ori des F-Plasmids mit

einem high-copy Ori des RK2-Plasmids ausgestattet. Durch Zusatz von L-Arabinose im

Medium kann der high-copy Mechanismus induziert werden und so die sonst niedrige

Ausbeute an Fosmid-DNA gesteigert werden. Die Anzucht in Medium mit L-Arabinose erwies

sich allerdings als problematisch, da das Wachstum der Zellen sich stark verlangsamte. Eine

Zugabe von L-Arabinose zu einem späteren Zeitpunkt konnte diesen Nachteil verhindern,

war aber in der Praxis nicht durchführbar, da die Kulturen meist mitten in der Nacht hätten

induziert werden müssen. Aus diesem Grund wurde versucht das Einsetzen der Induktion

durch Katabolitrepression mit D-Glucose zu verzögern. Die Wachstumskurven eines Fosmid-

Klons in Medien mit unterschiedlichen D-Glucose / L-Arabinose Anteilen zeigten, dass sich

bei einer Konzentration von 0,2% (w/v) L-Arabinose und 0,05% (w/v) D-Glucose die Induk-

tion in einer Verlangsamung des Wachstums äußerte. Im späteren Verlauf wurden allerdings

immer noch ähnlich hohe Zelldichten, wie bei Wachstum ohne Induktion, erzielt (Abb. 26).

Abb. 26: Zelldichte (OD600) von L-Arabinose (arab) induzierten copy control Fosmid-Klonen in Abhängigkeit von Inkubationszeit und Medienzusammensetzung. Von Beginn an induzierte Zellen (0% D-Glucose) wachsen deutlich langsamer als verzögert oder nicht induzierte Zellen. Die Glucosekonzentration (G) bestimmt das Einsetzen der Induktion zu unter-schiedlichen Zeiten. Das Abflachen der Kurven bei höheren OD ist auf Sauerstofflimitierung und inhibierende Stoffwechselprodukte zurückzuführen.

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0 50 100 150 200 250 300 350 400

t in M inuten

OD

600 (

1:5

verd

ünnt

)

arab 0% ; G 0,2%

arab 0,2% ; G 0,2%

arab 0,2% ; G 0,18%

arab 0,2% ; G 0,16%

arab 0,2% ; G 0,14%

arab 0,2% ; G 0,1%

arab 0,2% ; G 0,05%

arab 0,2% ; G 0%

Page 69: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Endsequenzierung von Fosmiden und BACs 55

Diese Wachstumsbedingungen wurden mit leichten Anpassungen (0,2% (w/v) L-Arabinose /

D-Glucose 0,03% (w/v)) auf die Kultivierung von Fosmid-Klonen in 384er MTPs übertragen

und ermöglichten es, ausreichende Mengen an Fosmid-DNA für die Sequenzierung aus

200 µl Kulturvolumen aufzureinigen. Die Ausbeute an Fosmid-DNA konnte durch Induktion

etwa 10 - 20fach gesteigert werden.

3.3.2. Vergleich von Fosmid-Endsequenzierung mit und ohne Induktion

Der Übergang von Fosmid-Präparation im 96er Format hin zum 384er Format erfolgte

zeitgleich mit der Sequenzierung des Genoms eines Archaebakteriums des Rice Cluster I,

so dass hier eine große Datenmenge beider Präparationsvarianten verglichen werden

konnte.

Die Fosmid-Präparation aus induzierten Kulturen im 384er MTP-Format erzielte gegenüber

der Präparation im 96er Format einen höheren Probendurchsatz und ca. 10% mehr End-

sequenzen mit einer Leseweite >500 bp (siehe Abb. 27). Dies konnte einerseits auf die

bessere Handhabung von 384er MTPs bei der Fosmid-Aufreinigung zurückgeführt werden,

andererseits auf den durch die Induktion erhöhten Anteil an Fosmid-DNA gegenüber

anderen Zellbestandteilen.

Abb. 27: Vergleich von jeweils 3.072 Fosmid-Endsequenzierungen im 96er MTP- und im 384er MTP-Format. Im 384er Format wurde die high-copy Replikation der Fosmide durch Zusatz von L-Arabinose und D-Glucose verzögert induziert.

74,7

11,6

3,410,3

84,9

6,22,5

6,3

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

>500 >300 >100 <100

Leseweite Q20 [b]

%

RC1 Fosmid Endsequenzen 96er Format (n=3072)RC1 Fosmid Endsequenzen 384er Format (n=3072)

Page 70: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Endsequenzierung von Fosmiden und BACs 56

3.3.3. BAC-Endsequenzierung

Um genügend BAC-DNA zur Bestimmung von Endsequenzen zu erhalten, mussten DNA-

Präparationen aus doppelten Ansätzen erstellt werden (2 x 384er MTP mit 200 µl je Well).

Außerdem wurde das Aufreinigungsprotokoll um einen Waschschritt mit 70% Ethanol

ergänzt, da wesentlich höhere Mengen der präparierten DNA für die Sequenzierung

eingesetzt wurden und deshalb Salzreste in den DNA-Präparationen die Sequenzierungs-

reaktion stören konnten. Weitere Anpassungen wurden an den Protokollen für

Sequenzierungsreaktionen, Thermocycler und Beladung der ABI3730xl-Sequencer

vorgenommen (siehe 2.3.2).

0

5000

10000

15000

20000

25000

30000

35000

250-

299

b

300-

349

b

350-

399

b

400-

449

b

450-

499

b

500-

549

b

550-

599

b

600-

649

b

650-

699

b

700-

749

b

750-

799

b

800-

849

b

850-

899

b

900-

949

b

950-

999

b

1000

-104

9 b

Klassen von Leseweiten

abso

lute

Häu

figke

it

Abb. 28: Leseweitenverteilung von 102.282 Endsequenzen einer BAC-Bank des D. labrax Genoms.

Wie in Abb. 28 dargestellt, konnten durch diese Anpassungen 102.282 BAC-Endsequenzen

einer genomischen BAC-Bank des Wolfsbarsches (Dicentrarchus labrax) bestimmt werden,

wobei die mittlere Leseweite bei 678 b lag (siehe auch Abb. 29).

Abb. 29: Elektropherogramm einer BAC-Endsequenzierung.

Page 71: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 57

Wie in Tab. 19 dargestellt verliefen im Durchschnitt 89,3% der Sequenzierungen einer 384er

MTP erfolgreich (Kriterium: Q20 Leseweite > 300 b).

Tab. 19: Ergebnisse des D. labrax BAC-Endsequenzierungsprojekts.

ABI3730xl: 50 cm Kapillaren 36 cm Kapillaren 50 cm & 36 cm Kap.

abs. rel. abs. rel. abs. rel.

BAC-Ends 24480 75,4% 78348 80,4% 102828 79,2%

leerer Vektor 3279 10,1% 9846 10,1% 13125 10,1%

Fehlerhaft 4689 14,5% 9224 9,5% 13913 10,7%

Gesamt 32448 100,0% 97418 100,0% 129866 100,0%

Durchschn. Lesew. von

BAC-Ends einer 384er MTP

754 b +/- 62 b (n=85 MTPs)

655 b +/- 30 b (n=254 MTPs)

678 b +/- 60 b

Der Anteil an leeren BAC-Vektoren wurde nach Prozessierung der Sequenzen auf 10,1%

bestimmt, so dass im Durchschnitt die Enden von 79,2% der BAC-Klone sequenziert

wurden. Dies entsprach einer erfolgreichen Sequenzierung von ca. 88% der insertragenden

Klone. Die Sequenzanalyse wurde zunächst auf mit 50 cm Kapillaren bestückten ABI3730xl

Sequenzierern durchgeführt und erzielte Leseweiten (Q20) von durchschnittlich 754 b. Die

Sequenzierung von BAC-Templates reichte somit nahe an die Qualität von Plasmid-

Sequenzierung heran.

Um den Durchsatz der Sequenzanalyse auf den ABI3730xl Geräten zu verdoppeln, wurden

diese mit 36 cm Kapillaren ausgestattet. Die mittlere Leseweite reduzierte sich nun um 99 b

(13%) und erreichte dieselben Werte wie die Sequenzierung von Plasmid-DNA, was

daraufhin deutet, dass die Trennschärfe der Kapillaren nun die Leseweite limitierte und nicht

mehr die Unterschiede in der Qualität der DNA-Templates.

3.4. Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen

3.4.1. Anordnung der D. labrax BAC-Endsequenzen auf Referenzgenomen

Um das optimale Referenzgenom zur Anordnung der BAC-Endsequenzen zu ermitteln,

wurden 10.000 Sequenzen des Datensatzes auf vier verschiedenen Fischgenomen durch

BLASTN angeordnet. Dabei wurden eine Wordsize von 15 und ansonsten die

Grundeinstellungen der BLAST-Parameter verwendet, als maximales berücksichtiges E-

Value wurde 10-5 gewählt. Die Ergebnisse zeigten, dass D. rerio (Zebrafisch) am wenigsten

Homologien aufwies (1.128 von 10.000 angeordnete ES). T. nigroviridis und O. latipes lagen

Page 72: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 58

etwa gleichauf (2.536 bzw. 2.702 angeordnete ES). G. aculeatus erwies sich als nächster

bereits sequenzierter Verwandter von Dicentrarchus labrax mit 4.359 angeordneten BAC-

Endsequenzen.

Danio rerio

Tetraodon nigroviridis

Oryzias latipes

Gasterosteus aculeatus

0,00%

10,00%

20,00%

30,00%

40,00%

50,00%

Ang

eord

nete

BAC

-End

sequ

enze

n

Abb. 30: Menge der auf verschiedenen Fischgenomen angeordneten BAC-Endsequenzen in Prozent.

3.4.2. Komparative Kartierung von D. labrax BAC-Klonen auf G. aculeatus

Der gesamte Datensatz von 102.828 Endsequenzen wurde auf den Chromosomen von

G. aculeatus durch BLASTN angeordnet. Durch geringere Stringenz der BLAST-Parameter

(W=7, q=1) konnten beide BAC-Endsequenzen von 21.581 Klonen angeordnet werden

(43162 Sequenzen). Zunächst wurden nur paarige Endsequenzen betrachtet, d.h.

Endsequenzen von einem BAC-Insert, welches von beiden Seiten ansequenziert und

angeordnet wurde.

Die Zuordnung der BLAST-Alignments zu Chromosomen von G. aculeatus ergab, dass die

Endsequenzen von 8.968 Klonen unterschiedlichen Chromosomen zugeordnet wurden

(Gruppe 1). 12.613 Klone wurden mit beiden Enden auf demselben Chromosom angeordnet

(Gruppe 2). Ein Vergleich der Häufigkeit von BLAST-Alignments für beide Gruppen zeigte,

dass die Zuordnung auf unterschiedliche Chromosomen hauptsächlich durch repetitive

Sequenzen bedingt war. Der Median der Alignmentanzahl lag bei 2 für paarige

Endsequenzen, welche auf demselben Chromosom angeordnet wurden, erreichte aber

einen Wert von 23 für paarige Endsequenzen auf unterschiedlichen Chromosomen.

Zusätzlich konnte nicht ausgeschlossen werden, dass die BAC-Bank von D. labrax chimäre

Klone enthielt, so dass die Klone der Gruppe1 für die komparative Genomkartierung nicht

verwendet wurden.

Page 73: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 59

Um die Sicherheit der Anordnung von Klonen der Gruppe 2 zu erhöhen, wurden diese weiter

gefiltert, indem nur Endsequenzen berücksichtigt wurden, deren Abstand im Bereich der

Größenverteilung auf G. aculeatus lag (20 kb – 225 kb / siehe Abb. 45 unter 4.4.6), und

deren Endsequenzen die korrekte Orientierung aufwiesen (ES1 -> <- ES2). Auf diese Weise

wurden weitere 1.801 BAC-Klone (3.602 Endsequenzen) von der komparativen Kartierung

ausgeschlossen. 21.624 Endsequenzen von 10.812 BAC-Klonen waren konsistent und

konnten für die komparative Kartierung verwendet werden.

Die zunächst ausgeschlossenen Klone wurden erneut mit stringenteren Parametern durch

BLASTN (W=15) angeordnet und diesmal in der Weise gefiltert, dass nur Endsequenzen für

die Kartierung berücksichtigt wurden, welche 5 oder weniger Alignments auf G. aculeatus

zeigten. Für die Anordnung der Endsequenzen wurde die Position des Alignments mit dem

besten Score-Wert gewählt. Auf diese Weise konnten Endsequenzen von weiteren 20.286

einseitig sequenzierten Klonen in der komparativen Karte berücksichtigt werden.

Die aus den Daten ermittelte komparative Karte ist umseitig in Abb. 31 dargestellt und wird

unter 4.4.3 diskutiert.

Page 74: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 60

Abb. 31: Genomweite Darstellung der komparativen Karte von D. labrax auf den

Chromosomen von G. aculeatus (grün = paarweise angeordnete BAC-ES, rot = nur eine ES von BACs angeordnet).

chr1

5ch

r16

chr1

7ch

r18

chr1

9ch

r20

chr2

116

1987

6418

1157

8814

6031

4116

2827

1620

2406

6019

7320

7111

7174

8717

2425

324

4431

717

9375

711

8082

018

4788

615

1899

817

3629

979

,54%

76,06

%77

,00%

69,64

%73

,82%

79,93

%81

,78%

2839

3439

3937

1614

616

413

613

917

417

110

9

G.ac

uleatu

s chr

omos

ome

chr1

chr2

chr3

chr4

chr5

chr6

chr7

chr8

chr9

chr1

0ch

r11

chr1

2ch

r13

chr1

4to

tal si

ze [b

p]28

1859

1423

2956

5216

7985

0632

6329

4812

2513

9717

0836

7527

9374

4319

3687

0420

2494

7915

6574

4016

7060

5218

4010

6720

0831

3015

2464

61

large

st BA

C co

ntig

[bp]

4475

141

2100

554

1914

933

3466

479

1342

356

5034

932

2349

428

1990

114

1487

582

1368

348

1957

589

2950

055

3468

445

9961

09co

vere

d by B

AC m

inima

l tilin

g path

74,44

%83

,53%

76,66

%72

,67%

79,59

%75

,81%

75,70

%75

,85%

67,28

%73

,21%

72,99

%75

,00%

79,10

%73

,79%

BAC

cont

igs62

4428

5929

2856

4742

3827

3841

37

numb

er of

BAC

s in m

inima

l tilin

g path

259

215

146

270

116

137

252

172

167

140

139

149

179

131

Page 75: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 61

3.4.3. Verifikation von angeordneten BAC Klonen

Durch die Shotgun-Sequenzierung von 10 überlappenden BAC-Klonen, welche eine etwa

1,3 Mb große Region im Genom von D. labrax abdeckten, konnte die komparative

Anordnung von 145 BAC-Endsequenzen auf der homologen Region von G. aculeatus

überprüft werden. Die Herstellung der BAC-Shotgun-Banken erfolgte wie in 2.2.6 & 3.1.6

beschrieben.

11800000

12000000

12200000

12400000

12600000

12800000

13000000

13200000

0 200000 400000 600000 800000 1000000 1200000 1400000

BAC-Endsequenz Position auf D. labrax 1.3 mb scaffold

BAC-E

ndse

quen

z Pos

ition

auf

G. a

cule

atus

Chr

2

Abb. 32: Vergleich von durch komparative Kartierung auf G. aculeatus vorhergesagten Koordinaten von BAC-Endsequenzen und realen Koordinaten auf D. labrax.

Abb. 32 zeigt die durch BLAST ermittelten Positionen von 138 Endsequenzen auf beiden

Genomen. Es stellte sich heraus, dass 8 Endsequenzen auf Grund eines repetitiven

Sequenzmotivs falsch angeordnet wurden. Weitere 7 Endsequenzen konnten überhaupt

nicht angeordnet werden. Bei genauerer Betrachtung der komparativen Karte zeigte sich,

dass 14 der 15 nicht richtig angeordneten Sequenzen zu BAC-Klonen gehörten von denen

nur eine der zwei Endsequenzen angeordnet werden konnte. Diese waren zusätzlich mit

relativ niedriger Signifikanz angeordnet worden.

Von den für die komparative Kartierung wichtigeren Klone, deren Endsequenzen beide

positioniert werden konnten, waren 81 von 82 (98,8%) Endsequenzen richtig angeordnet.

Die fehlende Sequenz konnte wahrscheinlich aufgrund einer Sequenzierungslücke in der

D. labrax Sequenz nicht angeordnet werden.

3 Sequenzen !

Page 76: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 62

3.4.4. Abgleich von genetischer und komparativer Karte von D. labrax

Von 182 Markern der genetischen Kopplungskarte von D. labrax (79) konnten 97 Marker

(53,3%) für einen Vergleich mit dem Genom von G. aculeatus verwendet werden. Die

Anordnung der Marker auf beiden Genomen ist in Abb. 33 auf dieser Seite und umseitig

dargestellt.

0.0DLA001511.0DLA016412.0DLA003823.2

27.837.1

DLA012245.0DLA013048.0DLA0051DLA013251.0

52.353.557.266.5

DLA001673.6

77.4DLA0021104.7

126.1132.6

DLA0139135.7DLA20DLA0113136.7DLA0048DLA0237e139.8

140.7141.1141.4

DLA0134141.8DLA0236DLA0209143.8DLA0213145.8DLA0251e149.9DLA0167162.4

1-Average

DLA01040.012.414.6

DLA0200DLA0102DLA0036DLA0147

17.0

DLA010618.0DLA000424.1DLA011825.1

39.6DLA013145.2DLA003960.9

2-Average

0.0DLA00265.3

12.6

DLA0223e30.031.0

DLA013335.139.546.6

DLA012748.7DLA011450.7SaGT41b56.3DLA0262e63.6

3-Average

0.0DLA003111.0DLA002417.1

18.0DLA0257e18.8DLA001319.7DLA011922.2

26.129.731.4

DLA000534.0DLA021935.3DLA024737.9DLA011538.9DLA004044.0DLA021259.5DLA003564.2

67.9

14-Average

G.a

cule

atus

Chr

V

G.a

cule

atus

Chr

IV

G.a

cule

atus

Chr

VII

G.a

cule

atus

Chr

XV

II

Map

ped

via

T.ni

grov

iridi

s C

hr11

0.0DLA01662.3

10.2DLA0148DLA0225e12.7DLY1315914.7DLA011715.7

18.7DLA023219.7DLA016020.8DLA019923.9

27.7DLA012547.7DLA0258e57.1

4-Average

0.0

DLA014915.023.5

DLA0112DLA0023k27.0DLA003231.3DLA000235.7DLA024044.6DLA015351.6

54.6DLA0274e62.4DLA0231e63.8DLA013765.9

68.7

5-Average

DLA02160.0DLA0211DLA00062.0

DLA0019DLASTR147.0

DLA001112.114.5

DLA22ST26.729.9

DLA0238e42.9DLA015045.1DLA0230e49.5

58.7DLA0272eDLA019163.2

DLA0275e77.6

6-Average

G.ac

ulea

tus

Chr

VIII

G.ac

ulea

tus

Chr

II

G.ac

ulea

tus

Chr

XIX

DLA00490.0DLA000912.0DLA012315.0DLA021517.0DLA010718.0SOX1020.4

23.4DLA016125.2DLA012827.2

28.7DLA017046.2DLA004256.0

66.7

7-Average

0.0DLA0280e2.3

5.4DLA00438.6

DLA0226eDLA0227e31.1DLA0192DLA010547.7

48.048.4

DLA001848.8DLA020755.7DLA0233e60.8

65.4DLA010381.4

8-Average

DLA00230.0DLA024510.0DLA000712.1DLA012120.2

9-Average

G.a

cule

atus

Chr

IX

G.a

cule

atus

Chr

X

G.a

cule

atus

Chr

XI

DLA00100.0DLA0273e1.1

3.3

DLA0120DLA0229e29.8DLA0218DLA0256eDLA016530.8DLA019333.9

43.3DLA014646.5

48.8

10-Average

0.02.7

DLA0267eDLA0202DLA01434.7

10.6DLA004111.8DLA017113.7

18.2DLA013522.5

29.429.832.3

11-Average

0.0DLA014113.8DLA023518.5DLA0046DLA012421.2DLA002023.2

26.331.932.7

DLA015835.738.443.850.366.9

12-Average

G.ac

ulea

tus

Chr

III

G.ac

ulea

tus

Chr

VI

G.ac

ulea

tus

Chr

XV

Page 77: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 63

DLAMTP30.0DLA018811.2DLA0154DLA0111DLA0014DLA0242

14.2

28.2

13-Average

0.0DLA0277e10.9

14.2DLA001720.2DLA014221.2

23.6DLA024826.1

26.6DLA014036.6DLA005039.7

44.4

15-Average

0.0DLA0196DLA00129.6DLA004510.6Lab815.7

16.2DLA020116.7DLA016918.7

22.7DLA0254PXN128.9

16-Average

0.0

9.415.620.7

DLA002930.3DLA000836.5

24-Average

G.a

cule

atus

Chr

XVI

G.a

cule

atus

Chr

XX

G.a

cule

atus

Chr

I

0.0DLA004714.3

21.9DLA013827.3DLA0145DLA0034DLA0144DLA017330.4DLA1233.4DLA015734.4DLA0252e35.4

36.7DLA0261ERA40.5

17-Average

DLA02100.0DLA0198DLA00287.0

19.2

30.440.342.5

DLA003744.8DLA0033DLA0126DLA0195DLA015558.1

60.4

18-Average

0.0DLA01724.6DLA024312.6DLA0003DLA011618.3DLA015924.0DLA020534.1DLA021736.1

40.248.150.7

19-Average

G.ac

ulea

tus

Chr

XV

III

G.ac

ulea

tus

Chr

XIV

G.ac

ulea

tus

Chr

XX

I

0.02.3

DLA02036.5DLA01568.6

10.7DLA020412.7

15.4DLA0152DLA0249

36.4DLA0250e39.7

43.6

20-Average

0.0DLA0255e0.3

2.1DLA02416.3

6.8DLA01747.3

14.817.318.4

22-Average

G.a

cule

atus

Chr

XIII

G.a

cule

atus

Chr

XII

Abb. 33: Abgleich der genetischen Kopplungskarte von D. labrax (79) und dem Genom von G. aculeatus. Durch BLASTN signifikant positionierte Marker sind in rot dargestellt. Marker, welche mit niedriger Signifikanz angeordnet wurden, sind grün dargestellt. Für schwarz dargestellte Marker wurde keine Anordnung gefunden.

Allen 21 Chromosomen von G. aculeatus konnten 22 Kopplungsgruppen von D. labrax

zugeordnet werden. Die zwei fehlenden Kopplungsgruppen sind wahrscheinlich nur schlecht

kartiert und waren deshalb nicht anzuordnen. Das G. aculeatus Chromosom IV zeigte einen

großen Bereich, dem keine Kopplungsgruppen zugeordnet werden konnten. Hier liegen

möglicherweise zwei weitere Kopplungsgruppen von D. labrax, welche in der Kopplungs-

kartierung nur als Vielzahl kleinerer Fragmente vorkommen.

Die Zuordnungen von Chromosomen zu Kopplungsgruppen deutet daraufhin, dass die 24

Chromosomen von D. labrax durch Fusionsereignisse und Chromosomenbrüche aus den 21

Chromosomen von G. aculeatus rekonstruiert werden können und somit die Contigs der

komparativen BAC-Klonkarte aus 3.4.2 ebenfalls der genetischen Karte zugeordnet werden

können (Diskussion siehe 4.4.4).

Page 78: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 64

3.4.5. Vergleich der Radiation Hybrid Kartierung von S. aurata mit G. aculeatus

Da genauere Kartierungen als die genetische Kopplungskartierung für D. labrax noch nicht

verfügbar sind, wurde alternativ eine Radiation Hybrid-Kartierung (RH) des Fisches Sparus

aurata mit G. aculeatus verglichen. Sparus aurata wird den Perciformes zugeordnet und ist

deshalb näher verwandt mit D. labrax als G. aculeatus. Ähnlichkeiten zwischen G. aculeatus

und S. aurata würden den Ergebnissen aus 3.4.4 mehr Signifikanz verleihen.

Von 725 Markern konnten 460 (63,5%) mit hoher Signifikanz auf dem Genom von

G. aculeatus durch BLASTN angeordnet werden.

Tab. 20: Oxford-Plot von 460 Markern der S. aurata Radiation Hybrid-Kartierung auf den Chromo-somen von G. aculeatus. Rot = mehr als 15, grün = 14 bis 5, hellblau = weniger als 5 übereinstimmende Marker.

Gasterosteus aculeatus Chr1 Chr2 Chr3 Chr4 Chr5 Chr6 Chr7 Chr8 Chr9 Chr10 Chr11 Chr12 Chr13 Chr14 Chr15 Chr16 Chr17 Chr18 Chr19 Chr20 Chr21

RH1 11 RH25 8 1 2 1 RH18 25 1 RH6 21 1 1

RH22 2 1 18 2 RH4 7

RH11 15 1 RH7 1 13 1

RH15 1 10 RH9 18 1 RH2 24 1

RH17 1 1 27 RH19 7 RH20 8 RH24 1 1 24 RH23 27 1 RH16 1 28 RH3 11 RH8 1 11

RH10 1 1 2 29 1 RH21 1 1 12 RH13 1 17 RH12 1 22 RH14 1 19

Spa

rus

aura

ta

RH5 13

Der Oxford-Plot in Tab. 20 zeigt, dass der überwiegende Teil der Marker einer RH-Gruppe

auch einem Chromosom von G. aculeatus zugeordnet wird. Dabei wird deutlich, dass drei

Fusionen von jeweils zwei S. aurata RH-Gruppen die Chromosomen 1, 4 und 7 von

G. aculeatus rekonstruieren und somit den Unterschied in der Chromosomenanzahl

zwischen den beiden Species erklären. Die zusammengehörenden RH-Gruppen 19 und 20

konnten von Sarropoulou et al. über eine genetische Kopplungskarte einem einzigen

S. aurata Chromosom zugewiesen werden und stellen keine Veränderung gegenüber dem

Genom von G. aculeatus dar (80).

Page 79: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 65

3.4.6. Sequenzierung von 109 BACs durch das GS20-System

Durch die komparative Kartierung von D. labrax war es möglich BAC-Klone auszuwählen,

welche den Großteil eines Chromosoms abdecken. Um die Kombination von neuen

Sequenzierungstechniken mit der Sanger-Sequenzierung zu erproben, wurden 109 minimal

überlappende BAC-Klone ausgewählt, welche das Chromosom 21 von G. aculeatus zu mehr

als 80% abdeckten.

Die Sequenzierung durch das GS20-System analysierte insgesamt 2.559.838 Sequenzen

mit einer mittleren Leseweite von 100 b. Durch den Newbler Assembler (Roche) konnten

2.412.497 Sequenzen (94,2%) zu Contigs assembliert werden. Nach Screening auf E. coli

und pCC1BAC-Vektorkontamination konnten 2.215.241 Sequenzen (91,8% der

assemblierten Daten) verwendet werden, welche mit 7.026 Contigs 12.496.066 b abdeckten.

Die 109 BACs wurden also im Durchschnitt 17,7fach abgedeckt, wobei beachtet werden

muss, dass Überlappungen von BAC-Inserts in dieser Rechnung doppelt gewichtet werden.

Betrachtet man die 1.000 größten Contigs (7,8 Mb), so bewegte sich die Abdeckung im

Bereich von 10 - 16fach. In der Häufigkeitsverteilung zeigte sich ein zweites, kleineres

Maximum im Bereich einer Abdeckung von 20 - 30fach, dieses wurde auf Überlappung von

Klonen und somit bei der Sequenzierung stöchiometrisch doppelt vorhandene Sequenzen

zurückgeführt (siehe Abb. 34). Das größte Contig umfasste 49.711 b.

0

50

100

150

200

250

0 3,5 7 10,5 14 17,5 21 24,5 28 31,5 35 38,5 42

Sequencing Coverage

Con

tig a

bs. H

äufig

keit

Abb. 34: Unterschiede des Sequencing Coverage der 1000 größten Contigs eines Pools von 109 auf dem GS20-System sequenzierten BAC-Inserts.

Page 80: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 66

3.4.7. Hybridassemblierung von Sanger- und GS20-Sequenzdaten eines D. labrax

Chromosoms

Durch die Assemblierung der GS20-Sequenzdaten mit zusätzlichen Sanger-Sequenzdaten

wurde geprüft, ob die Kombination beider Methoden eine Verbesserung der Daten-

Assemblierung erzielen konnte.

Dazu wurde von dem Pool aus 109 BACs eine pUC19-Klonbank nach der Shotgun-Methode

erstellt und davon ausgehend zusätzlich zu den GS20-Daten 21.700 Sequenzen durch die

klassische Sanger-Methode erzeugt. Außerdem konnten aus 596.539 Sequenzen eines

Whole Genome Shotgun von D. labrax 16.927 Sequenzen gefunden werden, welche auf die

GS20-Daten passten. Ebenfalls konnten 1.344 BAC-Endsequenzen von 672 beidseitig

sequenzierten BAC-Klonen dem Chromosom zugeordnet werden und wurden dem

Datensatz hinzugefügt. Die Sanger-Sequenzdaten repräsentierten somit eine ca. 2fache

Abdeckung der etwa 12,5 Mb großen chromosomalen Regionen und ermöglichten anhand

von beidseitig sequenzierten Klonen die Zuordnung von einzelnen Contigs untereinander

(scaffolding).

Die Sanger-Sequenzdaten wurden mit den bereits assemblierten Daten des GS20-Systems

durch PHRAP assembliert. Das größte Contig umfasste nun 89.000 b. Von dem

resultierenden Datensatz konnten 1.698 Contigs auf dem Chromosom 21 von G. aculeatus

angeordnet werden, welche 12.060.442 b und somit 96,5% der erwarteten 12,5 Mb

abdeckten.

3.5. Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen

3.5.1. EST-Sequenzierung

Für ein in Kooperation mit der AG Mundlos (Charité / MPI f. Mol. Genetik) durchgeführtes

EST-Sequenzierungsprojekt, zur Untersuchung der differentiellen Genexpression während

der Knochenfrakturheilung bei Schafen, wurden 32.032 Plasmide erfolgreich sequenziert.

Weitere 15.177 Sequenzen wurden durch Sequenzierung von PCR-Produkten ermittelt. Ein

Vergleich der Sequenzdaten von Plasmid- und PCR-Templates zeigte, dass in den letzteren

Daten bestimmte Gene unterrepräsentiert waren. Dies deutet auf eine Benachteiligung

bestimmter Gene bei der Amplifikation durch PCR hin, welche durch Sequenzmotive oder

durch die starken Schwankungen der Insertgrößen in cDNA-Bibliotheken verursacht werden

kann (die Erfolgsrate der PCR nimmt zu größeren Inserts hin ab). Durch Sequenzierung von

Plasmid-Templates werden solche als Amplification-Bias bekannten Effekte reduziert. Mit der

Veröffentlichung der Daten verfünffachte sich die Anzahl an frei zugänglichen ESTs für Ovis

Page 81: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 67

aries und es konnten Gene identifiziert werden, die bisher nicht mit der Knochenheilung in

Verbindung gebracht wurden (64).

3.5.2. Fosmid-Endsequenzierung für die Genomanalyse von G. forsetii

Fosmid-Bibliotheken werden für das Finishing von Genomprojekten eingesetzt. Die durch

das Transfektionssystem vorgegebene enge Verteilung der Insertgrößen zwischen 35 -

45 kb erleichtert die automatisierte Kontrolle von assemblierten Whole Genome Shotgun-

Daten (WGS). Lücken zwischen einzelnen Contigs können von Fosmiden überspannt

werden und so die Anordnung (Scaffolding) von Contigs erlauben, deren Orientierung

zueinander vorher unbekannt oder unsicher war. Das anschließende Finishing einer

Genomsequenz profitiert von Fosmid Daten, indem verbleibende Lücken durch Shotgun-

Sequenzierung eines Fosmids gerichtet geschlossen werden können.

Diese Strategie wurde unter anderem für die Genomsequenzierung des Bacterioplanktons

Gramella forsetii in Kooperation mit dem MPI für Marine Mikrobiologie in Bremen

angewendet. Dieser Organismus besitzt Gene für eine Vielzahl von proteo- und glycolytisch

aktiven Enzymen und ist scheinbar auf den Abbau von hochpolymerisierten organischen

Substanzen spezialisiert. Die Hypothese, dass diese Species damit eine wichtige Aufgabe im

marinen Kohlenstoffzyklus erfüllt, konnte durch die Analyse des 3,8 Mbp Genoms unterstützt

werden (65).

3.5.3. Genomsequenzierung eines Archaebakteriums des rice-cluster-I durch

Metagenomanalyse mit Hilfe von Fosmid-Endsequenzen

Fosmid-Bibliotheken stellen ein effizientes Werkzeug für die Analyse von Metagenomen dar,

d.h. die Analyse ganzer Mikroorganismenpopulationen eines Biotops. Dabei besitzt die

Endsequenzierung von Fosmiden gegenüber Plasmid-Sequenzierung den Vorteil, dass man

später über die Fosmid-Klone auf wesentlich größere Genombruchstücke zurückgreifen

kann. So wird es möglich einzelne Genome aus der Population über ausgewählte Fosmid-

Klone zu rekonstruieren, insofern die Abdeckung des Metagenoms durch Fosmide ausreicht

und eine Unterscheidung von ähnlichen Organismen anhand der Endsequenzdaten möglich

ist. Das bereits erwähnte RC-I-Projekt ist hierfür ein gutes Beispiel. Von der DNA einer

angereicherten Mischkultur aus dem Boden italienischer Reisfelder wurde eine Fosmid-Bank

erstellt. Durch die beidseitige Sequenzierung von 11.278 Fosmiden war es möglich, 3.734

Fosmide mit hoher Wahrscheinlichkeit einem Bakteriengenom zuzuordnen. Diese Anzahl

entsprach der 40fachen Abdeckung eines durchschnittlichen Bakteriengenoms, somit war es

rein statistisch betrachtet äußerst unwahrscheinlich, dass ein Bereich des Genoms nicht

abgedeckt wurde.

Page 82: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 68

Die Endsequenzierung der Fosmid-Bibliothek ermöglichte somit die Genomanalyse einer

bisher nicht in reiner Form kultivierbaren methanogenen Archaea aus dem rice-cluster-I (RC-

I). Die DNA der 3.734 identifizierten Fosmide wurde vereinigt. Aus dieser DNA wurde eine

Shotgun-Bibliothek in pUC19-Vektoren erstellt. Durch die Kombination von 41.246 Shotgun-

Sequenzen und 22.556 Fosmid-Endsequenzen konnte das 3,18 Mbp Genom 12-fach

abgedeckt werden. Die Annotation des Genoms deutet darauf hin, dass die maßgeblich an

der Produktion des Treibhausgases Methan beteiligten RC-I Archaeen Stoffwechsel-

leistungen vollbringen können, welche von anderen methanogenen Bakterien bisher nicht

bekannt waren (66).

Page 83: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 69

4. Diskussion

Das MPI f. Molekulare Genetik hat, neben dem FLI-Jena und dem HZI-Braunschweig

(ehemals IMB bzw. GBF), seit der Teilnahme Deutschlands am Humangenomprojekt unter

der Federführung von Prof. Dr. Hans Lehrach eine Vorreiterrolle in der deutschen

Genomforschung. Gerade im Bereich der Automatisierung für die DNA-Sequenzierung im

Hochdurchsatz wurde seit Ende der 90er Jahre unter der Leitung von Dr. Richard Reinhardt

eine Infrastruktur geschaffen, welche es erlaubte einen maßgeblichen Beitrag zu nationalen

und internationalen Projekten zu leisten (67). Auf internationaler Ebene wird die

Sequenzanalyse von großen Forschungseinrichtungen wie Sanger-Center, Baylor HGSC,

TIGR, JGI, Genoscope und RIKEN dominiert. Für Institute wie das MPI f. Molekulare Genetik

ist es deshalb von besonderer Bedeutung Verfahren zu entwickeln, welche es ermöglichen

spezielle Problemstellungen bei der Sequenzanalyse im Hochdurchsatz zu lösen, um

weiterhin in internationale Projekte eingebunden zu bleiben. Die Endsequenzierung von

Fosmiden und BACs im Hochdurchsatz stand deshalb seit Anfang des Jahres 2003 im

Fokus der Entwicklung. Gerade für die Genomanalyse von großen eukaryotischen Genomen

ist die Endsequenzierung von Fosmiden und BACs von Bedeutung für die physikalische

Genomkartierung und eine hochwertige Assemblierung von Whole Genome Shotgun Daten.

Durch den Einsatz von drei ABI3730xl Sequenzierern am MPI für Molekulare Genetik im

Jahr 2003 war es außerdem nötig, neue Methoden für die Template-Präparation zu

etablieren, um den höheren Probendurchsatz dieser Geräte ausnutzen zu können.

Zusätzlich zur Produktion von Templates mittels PCR wurde versucht die Rolling Circle

Amplifikation (RCA) zu etablieren. Die Sequenzierungsergebnisse der RCA-Produkte waren

allerdings in den angestrebten niedrigen Reaktionsvolumen schwer reproduzierbar. Auf der

Suche nach einem geeigneten Aufreinigungsprotokoll für die RCA-Produkte wurde neben

der am MPI etablierten Aufreinigung mit magnetischen Partikeln eine auf PEG / NaCl-Fällung

basierende Methode untersucht.

Diese Methode lieferte wesentlich bessere Ausbeuten als die Aufreinigung mit Hilfe

magnetischer Partikel. Die Aufreinigung mit PEG / NaCl ermöglichte eine Messung der RCA-

Produktkonzentration und die Sequenzierung von RC-amplifizierten BACs und Fosmiden,

was ohne Aufreinigung nicht möglich war. Dennoch war die Reproduzierbarkeit der RC-

Amplifikationen weiterhin unbefriedigend (19).

Es zeigte sich, dass einfache DNA-Präparationen durch alkalische Lyse und 2-Propanol

Fällung von BACs, Fosmiden und Plasmiden, welche mit der PEG / NaCl-Methode

aufgereinigt wurden, bei geringeren Herstellungskosten besser sequenzierbar waren als

RCA-Produkte.

Page 84: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Phasendiagramme der PEG-Präzipitation 70

Die Automatisierung der PEG / NaCl basierten Methode im 96er und im 384er MTP-Format

wird im Folgenden in 4.2 diskutiert. Durch Experimente mit den Fällungsparametern

PEG / Salz, welche zuvor in 4.1 diskutiert werden, konnte diese Methode erheblich

verbessert werden und führte zu dem in Abb. 25 dargestellten Verfahren. Anpassung für die

Sanger-Sequenzierung verschiedener Vektorsysteme und ihre Eigenheiten werden in 4.3

betrachtet. Die komparative Genomkartierung des Wolfsbarschs (Dicentrarchus labrax)

mittels BAC-Endsequenzierung wurde durch das entwickelte Verfahren am MPI für

Molekulare Genetik durchführbar und wird in 4.4 diskutiert.

4.1. Phasendiagramme der PEG-Präzipitation

Die bisherigen Veröffentlichungen zur PEG-Präzipitation von DNA werten den Einfluss der

Salz-Konzentrationen auf die PEG-Fällung kaum. Zum Beispiel erwähnen Lis et al. nur

nebensächlich, dass beim PEG / NaCl-System die Präzipitation von DNA erst über 0,2 M

NaCl möglich wird (32). Die Größenselektion von DNA wird in der Literatur meist bei

konstanten Salzkonzentrationen und nur durch das Variieren der PEG-Konzentration erzielt.

Durch diese Vereinfachung wird zwar das Arbeiten mit der PEG-Präzipitationsmethode leicht

verständlich, gleichzeitig verliert man allerdings einen Freiheitsgrad bei der Komposition der

Fällungsansätze. Dies kann gerade bei der Automatisierung zu Problemen führen, weil hohe

Salzgehalte unnötige Waschschritte mit sich bringen bzw. hohe Viskosität und Dichte zu

Durchmischungsproblemen führen. Ein genaueres Verständnis der PEG / Salz-Systeme wird

erst durch Phasendiagramme möglich, welche die Löslichkeit von verschiedenen DNA-

Fragmentgrößen in Abhängigkeit von PEG- und Salz-Konzentration darstellen.

4.1.1. Das PEG / NaCl-System

Die unter 3.1 dargestellten Präzipitationsversuche lassen sich in Phasendiagrammen wie in

Abb. 35 (umseitig) zusammenfassen. Das PEG / NaCl System verhält sich wie von Lis et al.

beschrieben, es werden jedoch auch bisher unbeschriebene Eigenschaften deutlich (32). Bei

Konzentrationen im Bereich von 0,15 - 0,2 M NaCl ist immer noch eine Fällung möglich. Die

Trennschärfe leidet allerdings unter den geringen NaCl-Konzentrationen und wird

maßgeblich durch geringe Unterschiede in der Salzkonzentration beeinflusst. Die PEG-

Konzentration spielt in diesem Bereich eine untergeordnete Rolle.

Bei hohen Salzkonzentrationen > 1 M erreicht die Methode ihre maximale Trennschärfe, was

durch den vergrößerten Abstand der Präzipitationslinien deutlich wird. Hier verhält sich das

System umgekehrt und die Größenselektivität wird maßgeblich durch die PEG-Konzentration

beeinflusst.

Page 85: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Phasendiagramme der PEG-Präzipitation 71

0,15

0,25

0,35

0,45

0,55

0,65

0,75

0,85

0,95

3,5 5,5 7,5 9,5 11,5

PEG % (w/v)

NaC

l [M

]

700 bp calc1300 bp calc2000 bp calc4500 bp calc8000 bp calc17000 bp calc17000 bp8000 bp4500 bp2000 bp1300 bp700 bp

Abb. 35: PEG / NaCl-Phasendiagramm für die Löslichkeit von DNA unterschied-

licher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von NaCl und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.

Wie in allen PEG / Salz-Systemen verringert sich die Trennschärfe mit zunehmender

Fragmentgröße, wobei im Bereich bis etwa 4000 bp Fragmentgrößen voneinander getrennt

werden können, welche sich in ihrer Größe um den Faktor 2 unterscheiden. Bei Fragmenten

>8000 bp wird eine Trennung immer schwieriger und ist mit großen Ausbeuteverlusten

verbunden.

4.1.2. Das PEG / MgCl2-System

Die Fällung mit PEG / MgCl2 wurde erstmals von Nicoletti et al. beschrieben, es wurden

jedoch auch hier keine Angaben zu den Einflussgrößen PEG / Salz-Konzentration ge-

macht (35). Das Phasendiagramm zeigt auf den ersten Blick ein ähnliches Verhalten wie das

PEG / NaCl-System.

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,1

1 3 5 7 9

PEG % (w/v)

MgC

l 2 [M

]

700 bp calc1300 bp calc2000 bp calc4500 bp calc8000 bp calc17000 bp calc17000 bp8000 bp4500 bp2000 bp1300 bp700 bp400 bp400 bp calc

Abb. 36: PEG / MgCl2-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von MgCl2 und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.

Page 86: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Phasendiagramme der PEG-Präzipitation 72

Es ist jedoch auffällig, dass die Fällung schon bei wesentlich geringeren Ionenstärken erfolgt.

Außerdem scheint die Trennschärfe der Methode insbesondere bei Fragmentgrößen über

8 kb geringer zu sein als die der PEG / NaCl-Methode, zumindest konnte in den

Versuchsreihen seltener eine eindeutige Trennung erzielt werden. Beide Effekte sind

wahrscheinlich dadurch erklärbar, dass die zweifach geladenen Mg2+-Ionen stärker mit den

negativ geladenen Phosphatgruppen von verschiedenen DNA-Fragmenten wechselwirken

können als einfach geladene Na+-Ionen. Dadurch können schon geringere Konzentrationen

eine Fällung erzielen, allerdings leidet die Trennschärfe, weil unterschiedliche

Fragmentgrößen durch Mg2+-Ionen scheinbar zusammengehalten werden.

Ein Nachteil dieser Fällungsvariante ist, dass MgCl2 sich negativ auf nachfolgende

enzymatische Reaktionen auswirken kann. Die Verwendung von PEG / MgCl2 sollte aber in

Betracht gezogen werden, wenn es um die Entsalzung, Konzentration und Entfernung von

markierten ddNTPs nach der Sanger-Sequenzierungsreaktion geht, da im Anschluss keine

enzymatischen Reaktionen stattfinden und diese Methode wesentlich geringere Ionenstärken

verwendet und selektiver ist als die normalerweise verwendete Ethanol-Fällung in

Anwesenheit von NaAcetat-Puffer.

4.1.3. Das PEG / KAcetat-System

Bei der Verwendung der alkalischen Lyse für den Zellaufschluss werden große Mengen

Kalium Acetat-Puffer zur Neutralisation des hohen pH-Wertes eingesetzt (28). Es ist also

möglich auf den Zusatz anderer Salze zu verzichten und die Fällung durch alleinige Zugabe

von PEG-Lösung zu erzielen. Das Vermeiden von zusätzlichen Salzen im Fällungsansatz

kann dabei helfen, nachfolgende Waschschritte mit Ethanol zu vermeiden und die Plasmid-

Aufreinigung stark beschleunigen.

0,15

0,25

0,35

0,45

0,55

0,65

0,75

0,85

0,95

4 6 8 10 12 14 16

PEG % (w/v)

KA

ceta

t [M

]

17000 bp8000 bp4500 bp2000 bp1300 bp700 bp17000 calc8000 calc4500 calc2000 calc1300 calc700 calc

Abb. 37: PEG / Kaliumacetat-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von Kaliumacetat und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.

Page 87: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Phasendiagramme der PEG-Präzipitation 73

Ein Problem aller PEG-Methoden sind zunehmende Ausbeuteverluste bei niedrigen DNA-

Konzentrationen von unter 10 ng/µl im Fällungsansatz (36, 68). Gerade für die direkte

Plasmid-Aufreinigung aus dem geklärten Zelllysat ist es deshalb wichtig, dass die

Reagenzien, welche für die alkalische Lyse eingesetzt werden, in kleinen Volumen

verwendet werden. Ebenso muss das zugegebene Volumen an PEG reduziert werden, um

eine zu starke Verdünnung zu vermeiden. Dies hat zur Folge, dass stark konzentrierte PEG-

Lösungen pipettiert werden müssen, was sich negativ auf die Automatisierbarkeit der

Methode auswirkt, da es wegen hoher Viskosität zu Durchmischungs- und Pipettier-

problemen kommt.

Wie in 3.1.3 gezeigt wurde, können diese Probleme durch Zugabe von 2-Propanol zur

Fällung mit PEG / KAcetat aufgehoben werden. Durch Zusatz von 2-Propanol kann die

Fällung bei niedrigeren PEG-Konzentrationen durchgeführt werden, so dass Volumen,

Dichte, Viskosität und Oberflächenspannung reduziert werden. Dies hat zur Folge, dass eine

Fällung mit hoher Ausbeute direkt aus dem geklärten Zelllysat möglich wird und der

Fällungsüberstand durch Abzentrifugieren effizient entfernt werden kann. Die am DNA-Pellet

haftenden PEG und Salzreste verringern sich dabei soweit, dass weitere Waschschritte nicht

mehr benötigt werden. Die Messung der DNA-Konzentration kann dann kostengünstig mit

UV-Photometrie bewerkstelligt werden.

4.1.4. Fällungsparameter für die Plasmid-Präparation

Die Fällungsbedingungen für Plasmid-Präparationen können durchaus von den in 4.1.1,

4.1.2 und 4.1.3 dargestellten Diagrammen abweichen, welche mit bereits aufgereinigter DNA

erstellt wurden. Anzuchtmedium, Zelldichte und damit einhergehende Schwankungen der

Ionenstärke haben einen Einfluss auf die Parameter der Fällung, so dass diese angepasst

werden müssen.

Ein einfacher Weg diese Anpassung vorzunehmen ist es, die Plasmide durch alkalische Lyse

mit und ohne RNAse zu isolieren und dann verschiedene Konzentrationen von 2-Propanol

und PEG für die Fällung zu testen. Die optimalen Bedingungen sind gegeben, wenn die UV-

photometrischen Messwerte von RNAse behandelten Zellen denen gleichen, welche nicht

mit RNAse behandelt wurden. Ist dies der Fall, sind selektive Bedingungen erzielt worden,

welche Plasmid-DNA auch von größeren RNAs trennen. Die Messung des Proteingehalts

ergänzt diese Vorgehensweise und sollte ebenfalls eine effektive Trennung aufzeigen.

Durch diese Vorgehensweise konnten Bedingungen ermittelt werden, welche Plasmid-DNA

aus 40 µl geklärten Zelllysat selektiv ausfällt. Dazu wurde das 0,475fache Volumen (19 µl)

eines 10% PEG-6000 / 75% 2-Propanol-Gemisches benötigt. Die Fällung erfolgte also in

Gegenwart von etwa 3,2% PEG-6000, 24,2% 2-Propanol und 210 mM KAcetat, welches aus

der alkalischen Lyse stammt.

Page 88: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Phasendiagramme der PEG-Präzipitation 74

Im Vergleich zu bekannten Methoden konnten Salz- und PEG-Konzentrationen 2 - 3fach

reduziert werden, wodurch die Sequenzierung der ausgefällten DNA ohne weitere Wasch-

schritte möglich wurde (32, 35, 36). Die Durchmischung in Mikrotiterplatten durch einfache

Magnetschüttler wird durch die geringere Viskosität der Proben begünstigt. Des Weiteren ist

das PEG / 2-Propanol-Gemisch leichter als das Lysat, so dass es in den Kavitäten der

Mikrotiterplatten zuoberst auf der Flüssigkeitssäule sitzt, wo die Durchmischung turbulenter

erfolgt.

4.1.5. Fällungsparameter für die PCR-Produkt Aufreinigung

Die Aufreinigung von PCR-Produkten unterscheidet sich von der Plasmid-Aufreinigung vor

allem in der Größenordnung der Produkte. Während selbst kleine Plasmide aufgrund des

Vektoranteils eine Mindestgröße von > 2 kb aufweisen, können PCR-Produkte wesentlich

kleiner sein (kleine Produkte typischerweise 200 - 400 bp). Die Fällungsparameter müssen

also in Richtung kleinerer DNA-Fragmente verschoben werden. Dabei ist es wichtig, dass die

Trennung von PCR-Produkt und Primerresten erhalten bleibt. Die Fällung kleiner PCR-

Produkte in PEG / NaCl kann erst bei relativ hohen PEG- und Salz-Konzentrationen erfol-

gen (36). Die dadurch entstehenden Nachteile können wiederum durch die Verwendung von

PEG / KAcetat / 2-Propanol umgangen werden. In Anlehnung an die unter 4.1.4 genannten

Bedingungen können kleine PCR-Produkte (100 - 200 bp) von Primerresten in einem

Fällungsansatz mit 4,75% PEG-6000, 199 mM KAcetat und 35,5% 2-Propanol getrennt

werden.

4.1.6. Weitere Anwendungsmöglichkeiten der größenselektiven Präzipitation

Neben der Aufbereitung von DNA-Templates für die Sanger-Sequenzierung kann die

größenselektive Fällung auch für andere molekularbiologische Arbeiten eingesetzt werden.

Die Erstellung von DNA-Banken beinhaltet meist eine Größenselektion der zu klonierenden

DNA. Diese erfolgt durch Ausschneiden bestimmter Größenbereiche aus Agarosegelen,

oder durch chromatographische Säulen (69, 70). Diese Vorgehensweisen führen meist zu

stark verdünnten Proben, welche anschließend durch weitere Aufarbeitungsschritte

aufgereinigt und konzentriert werden müssen.

Durch Fällung in PEG / NaCl / 2-Propanol können diese Methoden ersetzt werden, wodurch

die parallele Bearbeitung einer größeren Menge DNAs möglich wird und die DNA direkt in

konzentrierter Form gewonnen werden kann. Experimente zeigten, dass diese Methode

auch auf Silica-Spin-Columns (Quiagen) durchgeführt werden kann (Ergebnisse n.

dargestellt), wobei die DNA nicht durch längere Zentrifugation pelletiert wird, sondern an die

Silicamembran gebunden wird, was die Bearbeitungszeit weiter verkürzt und die

Page 89: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Automatisierung durch Robotik 75

Handhabung auch für Ungeübte vereinfacht. Auch eine am MPI f. Molekulare Genetik von

Rauth et al. entwickelte und auf magnetischen Partikeln basierende Technologie (71) kann

prinzipiell als Träger für größenselektiv präzipitierte DNA dienen.

4.2. Automatisierung durch Robotik

Nach ersten erfolgreichen Sequenzierungen von PEG / NaCl gereinigter Fosmid- und BAC-

DNA wurde anfangs ein kleineres Robotersystem zur automatischen Template-DNA

Präparation aus 96 Well Platten verwendet (siehe 3.2.1). Dabei wurde die Plasmid-Isolation

zunächst mit alkalischer Lyse und 2-Propanolfällung bewerkstelligt, danach erfolgte ein

Aufreinigungsschritt mit PEG / NaCl. Die Trennung der Schritte Zellaufschluss / Kon-

zentration von der DNA-Aufreinigung musste erfolgen, weil die in 4.1 dargestellten

Zusammenhänge noch nicht bekannt waren. Diese Vorgehensweise wurde später auf das

384er MTP übertragen und schließlich durch die Anpassung der Fällungsparameter stark

vereinfacht, was den Ablauf entsprechend beschleunigte.

Im Folgenden werden Eigenschaften der Plasmid-Aufreinigung in PEG / Salz-Systemen

diskutiert, welche die Automatisierung erschwerten.

4.2.1. Das 96er MTP-Format

Die Automatisierung von zuvor im Labormaßstab manuell durchgeführten Methoden wird

meist durch Arbeitschritte behindert, die nur schlecht oder gar nicht durch Robotik ersetzt

werden können. So musste zum Beispiel das Resuspendieren der Zellpellets aus dem

automatisierten Ablauf herausgenommen werden. Scheinbar bildeten die in den Pellets sehr

dicht gepackten E. coli-Zellen Stoffe, welche sich nach der anschließenden Lyse durch

Bildung von Schleim negativ auswirken können. Dies führte zu vermehrten Ausfällen durch

verstopfende Spitzen. Deshalb war es notwendig, die Zellen direkt nach der Zentrifugation in

S1-Puffer zu resuspendieren, was von der Anlage nicht zuverlässig bewerkstelligt werden

konnte und manuell durchgeführt werden musste.

Die Bildung unlöslicher Substanzen an der Oberfläche des geklärten Zelllysats konnte

außerdem maßgeblich durch die Dichte des Lyseansatzes beeinflusst werden. Lag diese

über der Dichte der ausgefällten Substanzen, so setzten sich die Präzipitate nach der

Zentrifugation an der Flüssigkeitsoberfläche ab (Auftrieb). Die hohe Dichte des geklärten

Lysats war zum Großteil auf den Neutralisationspuffer (normalerweise 2,8 M – 3 M

Kaliumacetat) zurückzuführen. Wurde dieser Puffer auf ein Drittel verdünnt, reichte die

Pufferkapazität immer noch aus, um eine Neutralisation des Ansatzes zu gewährleisten, man

erzielte aber den Vorteil, dass sich weniger Präzipitat an der Flüssigkeitsoberfläche absetzte

und das ansonsten notwendige Filtrieren des Lysats vermieden werden konnte.

Page 90: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Automatisierung durch Robotik 76

Die Automatisierung des PEG / NaCl Aufreinigungsschritts wurde hauptsächlich durch

Durchmischungsprobleme beeinträchtigt. Nach der alkalischen Lyse wurden die durch

2-Propanolfällung aufkonzentrierten Proben von vier 96er MTPs in einer 384er MTP

gesammelt und durch Zugabe des einfachen Probenvolumens PEG 20% in 2,5 M NaCl

gefällt. Allerdings konnte die Durchmischung der viskosen und schweren PEG / NaCl-Lösung

mit der Plasmid-DNA auf keinem der verfügbaren Schüttler bewerkstelligt werden. Eine

einfache Lösung nutzte genau die Eigenschaften des PEG / NaCl-Gemisches, welche die

Durchmischung behinderte. Stellte man die Platte auf den Kopf, so floss in Folge der

Schwerkraft die PEG / NaCl - Phase nach unten, wobei eine langsame Durchmischung mit

der Plasmid-DNA erfolgte. Die Oberflächenspannung hielt die Lösung in den kleinen

Kavitäten fest. Nach mehrmaligem Umdrehen der offenen MTP durch den Roboterarm

konnte die Durchmischung dann auf einem Schüttler erzielt werden (siehe Abb. 38).

Ein weiteres Problem des PEG / NaCl-Aufreinigungsschrittes war die geringe Festigkeit des

DNA-Pellets. Wie in (19) gezeigt wurde, konnte der Überstand nicht einfach durch

Zentrifugation der umgedrehten Platte entfernt werden, da die Gefahr bestand, das Pellet zu

verlieren. Der Überstand musste deshalb abpipettiert und verbleibende PEG / NaCl-Reste

mit drei Ethanol-Waschschritten zeitaufwendig entfernt werden.

Abb. 38: Durchmischung von hochkonzentrierter PEG / NaCl-Lösung mit Plasmid-DNA durch Ein-wirkung der Schwerkraft.

4.2.2. Das 384er MTP-Format

Im Vergleich zum 96er MTP-Format konnte der Ablauf für die alkalische Lyse erheblich

beschleunigt werden, da jeweils zwei 384er MTPs als Stapel zentrifugiert wurden. Die

Anzahl bearbeiteter Proben pro Zentrifugationslauf verachtfachte sich so von 384 auf 3072.

Eine weitere Durchsatzsteigerung gegenüber dem 96er MTP-Format wurde durch Parallel-

isierung von Arbeitsschritten erzielt. Der verwendete Biomek NX war in der Lage, eigen-

ständig MTPs zu stapeln und konnte bis zu 16 MTPs unabhängig vom Roboterarm der

Anlage bearbeiten. Dadurch konnten Arbeitsschritte, wie die alkalische Lyse der Zellen,

2750

x g

Page 91: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 77

parallel zu Aufgaben, wie z.B. Be- und Entladen der Zentrifugen, erfolgen. Die

Zentrifugationszeiten wurden nicht mehr festgesetzt, sondern nach einer Mindestdauer an

die Zeit angepasst, die der Biomek NX benötigte, um die nächsten Platten bereitzustellen.

Durch diese Verbesserungen des Ablaufs wurden alle Kulturplatten schon relativ früh der

alkalischen Lyse unterzogen. Lange Standzeiten der Zellen in S1-Puffer, wie beim Ablauf für

96er MTPs, wurden vermieden, was sich positiv auf die Qualität der geklärten Zelllysate

auswirkte (Schleimbildung etc.). Die PEG / NaCl-Aufreinigung erfolgte nach dem bekannten

Schema, limitierte allerdings nun aufgrund der vielen Waschschritte den Probendurchsatz

des Verfahrens.

Der Probendurchsatz der Anlage war mit 12.288 Templates / d zunächst ausreichend, um

drei ABI3730xl-Sequenzierer auszulasten. Allerdings konnte der Sequenzierungsdurchsatz

auf diesen Geräten durch Verwendung schneller Elektrophorese-Protokolle ebenfalls

verbessert werden, so dass eine weitere Steigerung des Probendurchsatzes bei der

Template-Präparation notwendig war. Durch Implementation der direkten Template-

Aufreinigung aus dem Zelllysat, durch größenselektive Präzipitation in PEG / KAcetat / 2-

Propanol, konnte der Probendurchsatz weiter gesteigert werden.

Im Vergleich zu dem in Abb. 24 dargestellten Ablauf wird deutlich, dass die komplette

PEG / NaCl-Aufreinigung, welche zuvor etwa 50% der Zeit beanspruchte, eingespart wurde.

Die Zeit für die Bearbeitung von 16 x 384 Plasmiden verkürzte sich somit auf 6 - 7 h und es

wurden höhere Plasmid-DNA Ausbeuten erzielt, da keine Waschschritte mehr benötigt

wurden, die zu Ausbeuteverlusten führten. Die Qualität der DNA-Präparationen verbesserte

sich gegenüber der PEG / NaCl-Methode, weil die Parameter der PEG / 2-Propanol-Fällung

besser an die Problematik der Plasmid-Isolation angepasst wurden (optimierte Trennung von

RNA + Protein). Dies hatte den Vorteil, dass UV-photometrische Messungen zur

Qualitätskontrolle eingesetzt werden konnten. Eine Methode, die im Gegensatz zur zuvor

verwendeten Agarose-Gelelektrophorese mit hohem Probendurchsatz arbeitet und auto-

matisiert werden kann.

Die entwickelte Anlage produziert mittlerweile mehr als 80% der Template-DNA für die am

MPI f. Molekulare Genetik durchgeführten Sanger-Sequenzierungen. Seit Etablierung der

Methode wurden mehrere Millionen Plasmide für verschiedenste Sequenzierungsprojekte

aufgereinigt, wobei die Kosten bei unter 1 Cent pro Probe lagen. Eigenschaften der

unterschiedlichen Vektorsysteme und Anpassungen werden im Folgenden diskutiert.

4.3. Sequenzierung unter Verwendung von unterschiedlichen Vektortypen

Typische Prozessierungszeiten und DNA-Ausbeuten des in entwickelten Verfahrens für ver-

schiedene Vektorsysteme sind umseitig in Tab. 21 zusammengefasst.

Page 92: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 78

Tab. 21: Typische Ausbeuten und Leseweiten bei unterschiedlichen Vektorkonstrukten.

Vektor Prozesszeit (32 MTPs)

Ausbeute pro Klon (200 µl Kultur)

Anzahl möglicher Sequenzierungen

typische Leseweiten

(Q20 ABI3730xl)

plasmid (pUC ORI) 8h 400 - 800 ng ~ 20 750-850 b

plasmid (pBR ORI) 8h 200 - 400 ng ~ 10 700- 800 b

Cosmid 8h 300 - 600 ng ~ 6 650 - 750 b

Fosmid (copy control) 8h 300 - 600 ng ~ 6 650 - 750 b

Fosmid (low copy) 16h 60 - 120 ng 2 600 - 750 b

BAC (low copy) 16h 200 - 400 ng 2 600 - 750 b

Die DNA-Aufreinigung durch PEG / 2-Propanol / KAcetat ermöglichte es, eine Vielzahl von in

Sequenzierungsprojekten verwendeten Vektortypen zu sequenzieren. Die geringen

Ausbeuten von low-copy Vektoren wie Fosmiden oder BACs und Insertgrößen von 40 kb

bzw. 160 kb erschwerten allerdings die Sequenzierung. Erst durch die Optimierung von

Kulturbedingungen, Cycle-Sequencing und Probeninjektion auf den CGE-Sequenzierern

wurden hier Leseweiten erzielt, die vergleichbar mit der Sequenzierung von high-copy

Vektoren wie pUC19 waren.

4.3.1. Plasmid-Sequenzierung

Die Sequenzierung von kleinen high-copy Vektoren machen den Großteil der am MPI

sequenzierten Projekte aus. Dazu zählen auf pUC19-Plasmiden basierende Shotgun-

Sequenzierung von genomischer, Fosmid- und BAC-DNA oder EST-Sequenzierungen von

cDNA-Banken basierend auf Vektoren wie z.B. pDONR oder pAL32.

Wegen der hohen Kopienzahl pro Zelle lieferte der Aufreinigungsprozess dieser Plasmid-

Typen gute Ausbeuten, welche bis zu 20 Sequenzierungen pro Template erlaubten

(20 ng / Sequenzierung). Die Qualitätskontrolle durch UV-Photometrie funktionierte

zuverlässig, da der DNA-Anteil gegenüber gemessenem Hintergrund hoch war. Die

Sequenzierung von Plasmiden lieferte je nach Qualität der DNA-Bank 80 - 95% erfolgreiche

Sequenzierungen mit langen bis mittleren Leseweiten. Zu Problemen konnte es kommen,

wenn die Klone einer DNA-Bank ungleichmäßiges Wachstum aufwiesen, oder das

Wachstum aller Klone zu schwach war, um ausreichende Zelldichten zu liefern. Diese

Probleme wurden hauptsächlich bei Vektoren mit Kanamycin-Resistenz beobachtet und

konnten durch Vorkultur oder Inokulation mit größeren Volumina reduziert werden. Vektoren

mit Ampicillin- oder Chloramphenicol-Resistenz sollte daher der Vorzug bei der Konstruktion

von DNA-Banken gegeben werden.

Page 93: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 79

4.3.2. Fosmid-Endsequenzierung

Die Sanger-Sequenzierung von Fosmid-DNA-Templates ist im Allgemeinen schwieriger als

die von Plasmid-DNA. Einerseits sind Fosmide um den Faktor 6 – 10mal größer als

Plasmide. Andererseits liegen sie mit etwa 100 – 200fach niedrigerer Kopienzahl pro Zelle

vor (72). Daraus folgt, dass die DNA-Isolation und Aufreinigung von Fosmiden nur etwa

1/30 - 1/10 der Ausbeuten liefert, wie man sie bei Plasmiden erwartet. Gleichzeitig wird für

die Sequenzierung größerer Konstrukte entsprechend mehr DNA-Template benötigt.

Extrapoliert man die optimalen Werte für die Sequenzierung von Plasmid-DNA von etwa

20 ng pro Sequenzierung, so würde man etwa 200 ng DNA pro Fosmid-Endsequenzierung

benötigen, eine Fosmid-DNA-Menge, welche nicht aus 200 µl Kultur gewonnen werden

kann. Diese Problematik kann durch Anpassung von weiteren Parametern während des

Sequenzierungsablaufes verbessert werden.

Durch die Verdopplung der Menge an Sequenzierungsreagenzien bei gleichzeitiger

Verdopplung der Zyklenanzahl des Cycle-Sequencing konnte die theoretisch benötigte

Template-Menge halbiert werden, da mehr terminal markierte Sequenzierprodukte

entstanden. Die Beladung dieser Produkte auf CGE-Sequenzierer erfolgt durch

elektrokinetische Injektion. Hier konnte die Injektionszeit beeinflusst werden. Die Erhöhung

der Injektionszeit von 10 s (Plasmid-Sequenzierung) auf 20 s halbierte die benötigte

Template-Menge ein weiteres Mal, so dass eine Menge von 30 - 50 ng Fosmid-DNA für die

Sequenzierung ausreichte. Trotz dieser Anpassungen mussten Fosmide auf unserem

System in doppelter Ausführung bearbeitet werden, um genügend Template für das

Sequenzieren von beiden Seiten zu generieren. Deshalb reduzierte sich, wie in Tab. 21

dargestellt, der Probendurchsatz auf die Hälfte. Ein weiterer Nachteil war, dass wegen der

geringen Ausbeuten die UV-Messung bei low-copy Vektoren nicht mehr aussagekräftig war.

Die gemessenen Absorptionen stellten hauptsächlich den Hintergrund aus RNA und

Proteinresten dar.

Diese Nachteile konnten durch „Copy Control“ Fosmid-Vektoren, wie z.B. pCC1fos

aufgehoben werden (73). Neben dem Replikationsursprung des F-Plasmids beherbergt

dieser Vektor einen high-copy Replikationsursprung des RK2-Plasmids (38). Die Replikation

mit hoher Kopienzahl kann indirekt durch das Arabinose-Operon eng reguliert werden. Durch

den Zusatz von L-Arabinose in das Nährmedium wird die high-copy Replikation induziert.

Durch D-Glucose kann sie unterdrückt werden (Katabolitrepression).

Dies vereint die Vorteile von Fosmiden bei der Klonierung und Wartung der Library

(Strukturstabilität der Inserts durch Verringerung der Rekombinationswahrscheinlichkeit) mit

den Vorteilen von high-copy Vektoren (einfachere Isolation von großen DNA-Mengen,

verringerter Anteil an genomischer DNA). Tab. 21 zeigt, dass die Ausbeute an Fosmid-DNA

Page 94: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 80

auf unserem System durch Verwendung der pCC1-Fosmide 10 - 20fach gesteigert werden

konnte. Der Probendurchsatz von Fosmid-Templates stand so dem von Plasmiden in nichts

mehr nach.

4.3.3. BAC-Endsequenzierung

Im Gegensatz zu Fosmiden ist bei BAC-Vektoren die Insertgröße nicht durch ein

Transfektionssystem (bei Fosmiden der Phagenpartikel) beschränkt (37). Dies hat den

Vorteil, dass mit BAC-Bibliotheken sehr große durchschnittliche Insertgrößen von 120 –

300 kb möglich sind. Die Replikation der BAC-Vektoren erfolgt ebenso wie bei Fosmiden

durch den OriF des F-Plasmids. Die resultierende niedrige Kopienzahl von 1 – 2 pro Zelle

erschwert die Produktion von ausreichenden Template-Mengen für die Sequenzierung. Zwar

liegen die DNA-Ausbeuten bei gleicher Zelldichte entsprechend der Größe von BACs 3 -

5fach über der von Fosmiden, es wird allerdings auch entsprechend mehr DNA für eine

Sequenzierung benötigt (600 – 1000 ng pro Sequenzierung). Ebenso wie in 4.3.2

beschrieben war es möglich die benötigte Menge an DNA zu reduzieren, indem andere Se-

quenzierungsparameter (2fache Zyklenanzahl und Sequenzierungsreagenzien,

elektrokinetische Injektion 30 s) an BAC-Templates angepasst wurden. Die Steigerung der

BAC-DNA Ausbeute durch BAC-Vektoren, welche analog zu pCC1Fos-Vektoren mit einem

high-copy Replikationsursprung (pCC1BAC) ausgestattet sind, erwies sich als nicht

empfehlenswert. Der Grund hierfür ist, dass die Schwankungsbreite von Insertgrößen in

BAC-Bibliotheken wesentlich größer als bei Fosmid-Bibliotheken ist. Je nach Qualität der

Bibliothek gibt es z.B. bis zu 10% Klone, welche kein Insert tragen und lediglich eine Größe

von ca. 8 kb aufweisen. Die Kopienanzahl nach Induktion des high-copy Mechanismus wird

durch die maximale DNA-Syntheseleistung der Zelle limitiert, so dass kleine BACs bis zu

100fach, große BACs aber nur 2 - 3fach amplifiziert werden. Die resultierenden starken

Schwankungen der Template-Mengen führten bei der Sequenzanalyse zu Problemen durch

Überstrahlungseffekte zwischen verschiedenen Proben. Wegen der zuvor genannten

Gründe, halbierte sich der Probendurchsatz für BAC-Templates (siehe Tab. 21), da aus-

reichende Template-Mengen erst durch den Ansatz von zwei Präparationen gewährleistet

werden konnten.

Eine weitere Anpassung des Aufreinigungsprotokolls an BAC-DNA war ein kurzer

Waschschritt mit 70%-Ethanol, welcher aus Zeitgründen manuell durchgeführt wurde. Dieser

sollte verhindern, dass aufgrund der höheren Template-Volumina eingetragene Salze im

Sequenzierungsansatz die Sequenzierungsreaktion inhibieren. Trotz dieses zusätzlichen

Waschschritts ließ die Qualitätskontrolle von BAC-DNA durch UV-Photometrie, wie auch bei

Page 95: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 81

low-copy Fosmiden, keine Rückschlüsse auf die genaue BAC-DNA-Konzentration zu, reichte

aber aus, um erfolgreiche von misslungenen BAC-Präparationen zu unterscheiden.

Die beidseitige Sequenzierung der BAC-Bibliothek des Wolfsbarschs (Dicentrarchus

labrax, (74)) zeigte, dass das entwickelte Verfahren die normalerweise an das 96er MTP-

Format gebundene BAC-DNA Aufreinigung im 384er MTP-Format erfolgreich bewältigen

konnte. Der Vergleich mit der Endsequenzierung von Templates einer BAC-Bibliothek von

Bos taurus (Rind), welche im 96er MTP-Format aufgereinigt wurden, zeigte, dass unsere

Aufreinigungsmethode ca. 10% mehr erfolgreiche Sequenzierungen erzielte, wobei im

Durchschnitt um 31,7% höhere Leseweiten erzielt wurden (46).

Überblick über die Endsequenzierungsergebnisse der D. labrax BAC-Bibliothek

13164

44832

einseitig sequenzierte BAC-Inserts (22,7%) beidseitig sequenzierte BAC-Inserts (77,3%)

Abb. 39: Anzahl einseitig und beidseitig sequenzierter BAC-Klone.

Für die weitere Auswertung des Datensatzes wurden zunächst die ansequenzierten Klone

mit Insert betrachtet. Aus Abb. 39 wird ersichtlich, dass die Mehrheit der Klone beidseitig

sequenziert werden konnte. Die von Whitaker et al. beschriebene durchschnittliche

Insertgröße der verwendeten BAC-Library beträgt ca. 160 kb (74). Die Genomgröße von

D. labrax wurde von Peruzzi et al. auf 763 Mb geschätzt (75). Das Genom wurde durch

beidseitig sequenzierte BAC-Klone also ca. 9,4fach abgedeckt. Die nur von einer Seite

ansequenzierten BAC-Klone deckten das Genom ca. 2,7fach ab. In 4.4 dargestellte

Vergleiche weisen darauf hin, dass die wirkliche Genomgröße von D. labrax unter dem von

Peruzzi et al. veröffentlichen Wert liegt. Daraus würde resultieren, dass die physikalische

Abdeckung des Genoms mit sequenzierten BAC-Klonen sogar noch höher ist.

Die hohe physikalische Genomabdeckung durch BAC-Klone reicht theoretisch aus, um damit

eine Genomkartierung zu ermöglichen. Allerdings ist die Wahrscheinlichkeit überlappende

BAC-Klone anhand der Endsequenzen zu finden sehr gering. Lediglich die Enden der Klone

sind bekannt, so dass die Sequenzdaten insgesamt weniger als das 0,1fache (69,7 Mb) der

Genomsequenz abdecken. Die Wahrscheinlichkeit, dass zwei Endsequenzen überlappen

Page 96: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 82

beträgt also nur ca. 0,12 => 1% und reicht nicht aus, um genügend BAC-Klone aneinander

anzuordnen.

Eine Genomkartierung durch BAC-Endsequenzierung ist allerdings möglich, sobald

Referenzgenome nahe verwandter Species zur Verfügung stehen. Wie im Folgenden

dargestellt, war eine komparative Genomkartierung von D. labrax durch fortgeschrittene

Genomprojekte anderer Fischspecies möglich.

4.4. Komparative Genomkartierung von Dicentrarchus labrax

4.4.1. Referenzgenome

Die einleitend dargestellten evolutionären Beziehungen spiegeln sich in der Anzahl von

D. labrax BAC-Endsequenzen wieder, welche durch den BLAST-Algorithmus auf den

Sequenzen anderer Fischgenome angeordnet werden können. Das Genom von D. rerio war

für eine komparative Kartierung ungeeignet, da nur etwa 11,3% der BAC-Endsequenzen

angeordnet werden konnten. Die Genomsequenzdaten von Takifugu rubripes sind bisher

keinen Chromosomen zugeordnet, weshalb bei einer komparativen Genomkartierung

anhand dieser Daten essentielle Informationen, wie Anordnung einzelner BAC-Contigs

untereinander, verloren gehen würden.

Die Daten von O. latipes, G. aculeatus und T. nigroviridis sind für eine komparative

Anordnung von BAC-Klonen besser geeignet, da hier die Sequenzdaten größtenteils

Chromosomen zugeordnet sind. Ordnet man die BAC-Endsequenzen auf diesen Genomen

an, so erhält man die größte Anzahl Treffer für G. aculeatus, gefolgt von O. latipes und

T. nigroviridis.

4.4.2. Alignment der Endsequenzen auf T. nigroviridis und G. aculeatus

Die Anordnung von BAC-Endsequenzen auf den Genomen von T. nigroviridis und

G. aculeatus wurde durch Einstellungen von sensitiveren Parametern für den BLAST-

Algorithmus weiter verbessert. Zunächst wurde der Parameter Wordsize auf den

kleinstmöglichen Wert von 7 eingestellt. Die Wordsize legt die minimale exakte

Übereinstimmung von zwei Sequenzen fest, welche vom BLAST-Algorithmus berücksichtigt

wird, d.h. in diesem Fall sieben Nukleotide. Der Wahl der Parameter von BLAST kann die

Resultate von Homologievergleichen maßgeblich beeinflussen, dies wurde u.a. von Gotea et

al. eingehend untersucht (76).

Page 97: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 83

Abb. 40: Vergleich der Anordnung von BAC-Endsequenzen auf dem Genom von G. aculeatus (links) und T. nigroviridis (rechts).

Auf dem Genom von T. nigroviridis konnten mit diesen Einstellungen 29.421 (28,6%) End-

sequenzen angeordnet werden. Wie in Abb. 40 dargestellt, konnte von einem Großteil der

Klone nur eine Endsequenz angeordnet werden. Von 3.105 Klonen konnten beide End-

sequenzen (6.210) auf denselben Chromosomen platziert werden (paarweise angeordnete

Endsequenzen). 3.584 Endsequenzen waren repetitiv, d.h. sie konnten an unterschiedlichen

Stellen im Genom mit sehr ähnlichen Qualitätswerten angeordnet werden und waren für eine

Kartierung ungeeignet.

Durch Verwendung des Genoms von G. aculeatus und weiterer Anpassungen der BLAST-

Parameter konnte die Menge angeordneter Endsequenzen gesteigert werden. Dazu wurde

die Wertung von nicht zueinander passenden Nukleotiden im Alignment von -3 auf -1

verringert, woraus resultierte, dass der BLAST-Algorithmus auch weniger genaue

Übereinstimmungen von Sequenzen berücksichtigte. Die Menge durch BLAST angeordneter

Endsequenzen steigerte sich so auf 63.448 (61,7%) um mehr als das Zweifache. Dies hatte

die positive Folge, dass der Anteil Klone, von denen beide Endsequenzen angeordnet

werden konnten, überproportional zunahm. Negativ wirkte sich die verringerte Stringenz

dagegen auf den Anteil der Endsequenzen aus, welche wegen Repetitivität nicht genau

angeordnet werden konnten.

Um fehlerhafte Anordnung durch unstringente BLAST-Parameter zu vermeiden, wurden

deshalb paarweise angeordnete Endsequenzen auf ihren Abstand und ihre Orientierung

zueinander hin überprüft (siehe 3.4.2). Diese Prüfung war bei Endsequenzen, welche nicht

paarweise angeordnet werden konnten, nicht möglich. Deshalb wurden diese erneut mit

stringenteren BLAST-Parametern (Wordsize 15) angeordnet. Diese Vorgehensweise

resultierte in den in Abb. 40 dargestellten Ergebnissen. Insgesamt wurden 41.910 (40,8%)

der BAC-Endsequenzen für eine komparative Kartierung verwendet, was einer 1,6fachen

Steigerung gegenüber den mit T. nigroviridis erzielten Ergebnissen entsprach. Die Anzahl

paarweise angeordneter Endsequenzen stieg dabei überproportional um den Faktor 3,5 auf

Angeordnete BAC-Endsequenzen auf T. nigroviridis (n=29427 / 28,6%)

6210

19633

3584

paarige ES auf selbem Chr. angeordnet nur eine ES angeordnetAnordnung aufgrund von Repetitivität verworfen

Angeordnete BAC-Endsequenzen auf G. aculeatus (n=63448 / 61,7%)

21624

20286

21538

paarige ES auf selbem Chr. angeordnet nur eine ES angeordnetAnordnung aufgrund von Repetitivität verworfen

Page 98: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 84

21.624, diese 10.812 Klone decken das Genom von D. labrax ca. 2,3 - 2,8fach ab (in

Abhängigkeit von der geschätzten Genomgröße).

4.4.3. Die komparative Genomkarte von D. labrax

Die selektierten BLAST-Ergebnisse wurden in tabellarischer Form zusammengefasst. Die

Anordnung der BAC-Endsequenzen auf dem Genom von G. aculeatus konnte so durch

Sortierung nach Koordinaten und Chromosomen relativ einfach erfolgen. Für die Kartierung

sind paarweise angeordnete Endsequenzen eines BAC-Klons von besonderem Interesse, da

Überlappungen zwischen benachbarten BAC-Klonen relativ sicher vorhergesagt werden

können. Aus diesem Grund wurden alle paarig angeordneten BAC-Endsequenzen farblich

markiert und der Abstand zur nächsten Endsequenz berechnet.

In Tab. 22 ist die tabellarische Darstellung der Daten auszugsweise dargestellt. Abb. 41 zeigt

die graphische Darstellung dieser Daten. Hier wird deutlich, dass viele der angeordneten

Klone redundant sind. Im Folgenden sollte aus den angeordneten BAC-Klonen eine

Untergruppe gewählt werden, welche das kartierte Genom mit minimaler Redundanz

maximal abdeckt (minimal tiling path) (77).

Tab. 22: Tabellarische Darstellung von angeordneten BAC-Endsequenzen auf dem Genom von G. aculeatus (paarweise angeordnete ES grün).

Score

Ident. %

Start

End

BAC-Klon Name

Start auf Chr.

Ende auf Chr.

Chr.

Abstand paariger

ES

Klone in minimal tiling

path

434 77.46 400 470 1bassbac-1k14.r 12232892 12232962 groupII 109676Contig Start 12232892 bassbac-1k14.r

311 91.78 311 239 bassbac-140g18.r 12236213 12236285 groupII

372 87.62 266 162 bassbac-25b21.r 12244370 12244468 groupII

344 94.74 1 76 bassbac-97o21.r 12248023 12248098 groupII

715 78.84 91 381 1bassbac-16l18.f 12269277 12269562 groupII 119211

188 93.02 495 453 bassbac-112e6.f 12274627 12274669 groupII

614 93.53 579 441 bassbac-98o15.r 12287389 12287527 groupII

215 76.98 352 474 1bassbac-11k18.r 12302426 12302551 groupII 94803 bassbac-11k18.r

689 86.10 76 262 bassbac-62k15.r 12324994 12325178 groupII

1601 87.62 75 486 bassbac-112h16.f 12329464 12329875 groupII

383 90.91 810 441 1bassbac-1k14.f 12342195 12342568 groupII 109676 bassbac-1k14.f

281 80.43 1 715 1bassbac-137a10.r 12345123 12345857 groupII 113433

219 80.07 3 585 1bassbac-12j5.r 12345123 12345725 groupII 141772

414 84.88 1 290 1bassbac-57g12.f 12352517 12352806 groupII 131040

1111 81.13 198 442 1bassbac-101l2.r 12354146 12354410 groupII 142333 bassbac-101l2.r

214 92.00 151 102 bassbac-83e5.r 12354835 12354884 groupII

614 72.46 308 445 1bassbac-106n6.r 12368064 12368193 groupII 118774

988 74.67 571 120 1bassbac-16l18.r 12388038 12388488 groupII 119211

581 88.97 275 131 bassbac-128k18.r 12388344 12388488 groupII

1247 89.35 833 525 bassbac-21p9.r 12389350 12389659 groupII

710 80.56 108 1 1bassbac-11k18.f 12397122 12397229 groupII 94803 bassbac-11k18.f

Page 99: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 85

Abb. 41: Grafische Darstellung des Bereichs aus Tab. 22.

Die Berechnung des minimal tiling path erfolgte zunächst durch das Kriterium der minimalen

Redundanz. Von einem BAC-Klon ausgehend, der nur zu einer Seite mit anderen BACs

überlappte (Bedingung für Start / Ende eines BAC-Contigs), wurde jener BAC als

Anschlussklon gewählt, welcher minimal mit dem Ausgangsklon überlappte. Die Ergebnisse

dieser Vorgehensweise waren allerdings unbefriedigend, da häufig Contigs gebildet wurden,

welche nicht die maximal mögliche Länge erreichten.

Aus diesem Grund wurde der minimal tiling path durch das Kriterium der Maximierung der

Contiglänge alternativ berechnet. Der Start-Klon wurde also durch jenen Anschlussklon

erweitert, welcher den größten Längenzuwachs des Contigs erzielte.

In Abb. 41 können beide Varianten nachvollzogen werden. Minimale Redundanz würde zur

Wahl der BACs 1k14, 11k18 und 106n6 führen, maximale Contiglänge zur Wahl der BACs

1k14, 11k18 und 101l2. Für die Berechnung des minimal tiling path von BAC-Contigs wurde

die Maximierung der Contiglänge bevorzugt, da so die maximale Contiglänge / Ge-

nomabdeckung bei minimierter Contiganzahl erzielt wird. Die Darstellung der berechneten

BAC-Contigs auf den 21 Chromosomen von G. aculeatus ist in Abb. 31 dargestellt.

Im Durchschnitt können 75,9% der Chromosomen von G. aculeatus durch D. labrax BAC-

Contigs abgedeckt werden, welche in Abb. 31 grün dargestellt sind und aus 3511 nach den

obigen Kriterien ausgewählten beidseitig sequenzierten BAC-Klonen bestehen. Das größte

Contig auf Chromosom 6 deckt dabei etwa 5 Mb ab und besteht aus 52 überlappenden BAC-

Klonen. In den roten Bereichen in Abb. 31 konnten nur einseitig sequenzierte Klone

positioniert werden, oder es handelt sich um Lücken in der Sequenz von G. aculeatus. Die

Mehrheit dieser Bereiche ist hauptsächlich an den Enden von Chromosomen positioniert. Es

ist anzunehmen, dass die repetitiven Strukturen von Telomeren die Kartierung dort

behindern (78). Zusätzlich ist die Qualität von Genomassemblys in diesen Bereichen

Page 100: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 86

normalerweise weniger akkurat, so dass BAC-Endsequenzen möglicherweise im falschen

Abstand oder im Extremfall auf falschen Chromosomen angeordnet werden. BAC-Klone,

welche in diesen Bereichen angeordnet wurden, müssen oft aufgrund fehlerhaften Abstands

oder nicht konsistenter Orientierung der Endsequenzen zueinander ausgeschlossen werden,

da es nicht möglich ist sie von Chimären-Klonen zu unterscheiden. Auch an zentralen

Positionen auf den Chromosomen sind schlecht kartierte Bereiche zu finden. Hierbei handelt

es sich wahrscheinlich um Centromerregionen, welche ebenfalls hochrepetitiv sind.

Mit insgesamt 808 angeordneten nicht redundanten BAC-Contigs sind die Ergebnisse der

komparativen Kartierung denen anderer BAC basierter Kartierungsmethoden mindestens

ebenbürtig (39, 41).

4.4.4. Abgleich zwischen genetischer Kopplungskartierung und komparativer

Kartierung

Die berechneten BAC-Contigs deuten eine hohe Synthenie zwischen dem Genom von

G. aculeatus und D. labrax an. Andererseits ist es nicht sicher, ob benachbarte Contigs auch

im Genom von D. labrax wirklich nebeneinander positioniert sind oder ob die Lücke in der

Kartierung aufgrund von inter- oder intrachromosomalen Neuanordnungen im Laufe der

Evolution entstanden ist. Deshalb wurde versucht die Informationen aus einer genetischen

Kopplungskartierung von D. labrax mit den komparativen Daten abzugleichen. Dazu wurden

flankierende Sequenzen von Mikrosatelliten, welche für die genetische Kopplungskartierung

verwendet wurden (79), auf dem Genom von G. aculeatus mittels des BLAST-Algorithmus

angeordnet. Die relativ kurzen und repetitiven Sequenzdaten sind allerdings nur zu 53,3%

und mit relativ niedriger Signifikanz dem G. aculeatus Genom zuzuordnen.

Trotz der niedrigen Anzahl von angeordneten Mikrosatelliten wird auch hier die Synthenie

der G. aculeatus und D. labrax Genome deutlich. Marker, welche auf einer Kopplungsgruppe

liegen, sind auch auf dem Referenzgenom benachbart.

Vertikale schwarze Pfeile in Abb. 42 bezeichnen Bereiche des G. aculeatus Genoms auf

denen zwei oder mehr Marker einer Kopplungsgruppe von D. labrax angeordnet werden

konnten. Horizontale Pfeile bezeichnen einzelne Marker. Rote Pfeile bezeichnen

Chromosomen auf denen keine Marker gefunden wurden.

Page 101: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 87

Abb. 42: Vergleich homologer Chromosomen von T. nigroviridis (grau), S. aurata (blau) und G. aculeatus, sowie komparativer BAC-Karte von D. labrax auf G. aculeatus (rot/grün) mit zugewiesenen Kopplungsgruppen (Pfeile, schwarz und rot) der genetischen Kopplungs-analyse von D. labrax.

Der Abstand der Marker voneinander ist zum Teil größer als 10 Mb und deutet darauf hin,

dass ganze Regionen und Chromosomen von G. aculeatus homolog zu D. labrax sind,

wobei die Auflösung allerdings zu gering ist, um eventuelle Inversionen und Deletionen zu

detektieren. Chromosom VII von G. aculeatus können zwei Kopplungsgruppen (3 und 14)

zugeordnet werden, d.h. der Bruch dieses Chromosoms trägt zur erhöhten

Chromosomenanzahl in D. labrax bei. Vergleicht man die Größe von Chromosomen und

Muster schlecht kartierter Bereiche (rot), so können auch Brüche des Chromosoms IV

angenommen werden. Die Chromosomen V & XVII scheinen dagegen in D. labrax fusioniert

zu sein, da auf diesen beiden Marker der Kopplungsgruppe 1 identifiziert wurden.

Um weitere Rückschlüsse zu ziehen, wurde auf Kartierungsergebnisse von Sparus aurata

(Goldbrasse) zurückgegriffen. Sparus aurata ist wie auch D. labrax den Perciformes

zugeordnet und besitzt ebenfalls 24 Chromosomen. Sarropoulou et al. (80) veröffentlichten

eine radiation hybrid-Kartierung (RH) des Sparus aurata Genoms. Im Gegensatz zur

genetischen Kopplungsanalyse, welche auf polymorphe Marker (Mikrosatelliten, AFLPs)

angewiesen ist, kann bei der RH-Kartierung jede Art von nicht repetitiver DNA-Sequenz als

Marker dienen. Für die Kartierung von Sparus aurata wurden hauptsächlich ESTs als Marker

verwendet, was sehr vorteilhaft für den Vergleich mit G. aculeatus war. So konnten 63,5%

der RH-Marker auf dem G. aculeatus Genom mit hoher Signifikanz angeordnet werden. In

Abb. 42 sind die RH-Gruppen von S. aurata in blau dargestellt, zusätzlich werden Vergleiche

mit T. nigroviridis Chromosomen aus (80) in grau dargestellt. Die zuvor durch den Vergleich

Page 102: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 88

mit den genetischen Kopplungsgruppen von D. labrax angestellten Spekulationen wurden

durch den Vergleich mit S. aurata und T. nigroviridis unterstützt. Drei der vier vermuteten

Chromosomenbrüche (Chr I, IV und VII) sind in S. aurata und sogar in T. nigroviridis

vorhanden. Zwischen T. nigroviridis, S. aurata und G. aculeatus sind 13 Chromosomen über

weite Bereiche homolog, wobei die Anordnung der RH-Marker sich allerdings auf den

verschiedenen Genomen unterscheiden kann, d.h. intrachromosomale Neuanordnungen

können vorhanden sein (aus Gründen der Übersichtlichkeit in Abb. 42 nicht dargestellt).

Die in Abb. 42 dargestellten Vergleiche zeigen, dass relativ wenige inter- und intra-

chromosomale Veränderungen zwischen den Genomen verschiedener Acanthopterygii

stattgefunden haben. Es ist also anzunehmen, dass die komparative BAC-Klon Kartierung

von D. labrax anhand des G. aculeatus Genoms einer physikalischen Karte sehr nahe

kommt. Eine RH-Kartierung des Genoms von D. labrax ist derzeit in Arbeit (Francis Galibert,

Univertsité de Rennes, Frankreich). Die Integration der komparativen Kartierung von BAC-

Klonen, der RH-Kartierung und der genetischen Karte wird eine hochauflösende

physikalische Karte des D. labrax Genoms ermöglichen.

4.4.5. Verifikation von angeordneten BAC Klonen

Die komparative Karte konnte schon im frühen Stadium für die Identifikation von BAC-Klonen

eingesetzt werden. So wurden für Kooperationspartner zwei Klone identifiziert, welche die

zwei Isoformen (A1 & A2) der cyp19-Aromatase tragen (81, 82). Dazu wurden bekannte

mRNA-Sequenzen (AY138522, DQ177458) der cyp19-Aromatasen von D. labrax auf dem

Referenzgenom angeordnet und anschließend BAC-Klone (27g15 und 22g15) ausgewählt,

welche diese Bereiche überspannen. Die BAC-Inserts wurden durch die Shotgun-Strategie

komplett sequenziert und ermöglichten die Analyse der Cyp19-Gene mitsamt der Promotor-,

Intron- und Terminations-Regionen (siehe Abb. 43).

Transmembrane helix I-helix Ozol´s peptide Aromatase-specific Heme-binding

promoter

Translation

Cyp19A2 (brain isoform)

I III IV V VI VII X

Transcription Stop

II III IV V VI IX

StopTranslation

Cyp19A1 (gonadal isoform)

promoter

Transcription

VII VIIII

IXVIIIII

Abb. 43: Genstruktur der cyp19-Aromatase Isoformen, welche auf bassbac-27g15 und bassbac-22g15 identifiziert wurden (Quelle: Dr. Francesc Piferrer, CSIC, Barcelona, Spanien).

Page 103: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 89

Diese rein bioinformatische Identifizierung von BAC-Klonen durch komparative Kartierung

erfolgte innerhalb von wenigen Minuten, während Vorgehensweisen wie PCR-Screening-

oder Filterhybridisierungs-Experimente Wochen in Anspruch nehmen können und häufig

falsch positive Resultate liefern.

Zur weiteren Prüfung der Kartierung wurden zehn Klone aus zwei benachbarten BAC-

Contigs ausgewählt. Jeder Klon wurde durch die Shotgun-Strategie sequenziert. Aus den

assemblierten Daten konnte ein ca. 1,3 Mb großes Scaffold gebildet werden. Die in dieser

Region auf dem G. aculeatus Genom angeordneten BAC-Endsequenzen konnten nun auf

der realen D. labrax Sequenz verifiziert werden. Die Ergebnisse in 3.4.3 zeigen, dass die

Fehlerrate bei paarweise angeordneten Sequenzen bei 1,23% liegt. Zusätzlich belegte die

Sequenzierung in diesem Fall, dass die Anordnung zweier in der komparativen Karte

benachbarter BAC-Contigs auch im D. labrax Genom erhalten war.

Dies verdeutlichte, dass die komparative Kartierung im Gegensatz zu genetischer

Kopplungskartierung oder Radiation Hybrid Kartierung einen schnellen Zugriff auf

spezifische Loci des Genoms über die angeordneten BAC-Klone erlaubt und so

weiterführende Studien von definierten Regionen oder Genen ermöglicht.

Es kann spekuliert werden, dass über die 10.812 komparativ beidseitig angeordneten BAC-

Klone auf mehr als 75% der Gene von D. labrax zugegriffen werden kann, da die schlecht

kartierten Bereiche des Genoms (~25%) zum Großteil in heterochromatischen Regionen

(Centromere, Telomere) des Genoms liegen, welche eine niedrigere Dichte von

proteinkodierenden Sequenzen als Euchromatin aufweisen.

4.4.6. Rückschlüsse auf die Genomgröße von D. labrax

Die sequenzierte 1,3 Mb Region wurde mit Hilfe der Vista Tools (83) auf den Genomen von

T. nigroviridis und G. aculeatus angeordnet. Die Graphen in Abb. 44 stellen die prozentuale

Identität der Sequenzen auf Nukleotidebene dar (Windowsize: 100 bp). Die Identität von

G. aculeatus ist dabei durchgehend größer als die von T. nigroviridis und reflektiert die in

4.4.2 dargestellten Resultate des Alignments der BAC-Endsequenzen auf den Genomen.

Page 104: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 90

Abb. 44: Alignment eines 1,3 Mb Scaffold von D. labrax auf G. aculeatus und T. nigroviridis durch VISTA.

Die sequenzierte Region unterscheidet sich allerdings in allen drei Genomen in ihrer Größe.

Diese Unterschiede scheinen in direktem Zusammenhang mit der Genomgröße der Fische

zu stehen. Dabei ist die Region in D. labrax etwa 1,31fach größer als in G. aculeatus und

1,58fach größer als in T. nigroviridis. Ein weiterer Vergleich mit O. latipes (Medaka) zeigte,

dass hier die Region in D. labrax um 0,95fach kleiner war.

Die Betrachtung des Abstands paarig angeordneter Endsequenzen auf dem jeweiligen

Referenzgenomen zeigt, dass diese Werte nicht nur spezifisch für die gewählte Region sind,

sondern im Durchschnitt für die gesamten Genome gelten (siehe Abb. 45). Die Verhältnisse

der Verteilungsmaxima ergeben einen Faktor von 1,5 für das Größenverhältnis D. labrax / T.

nigroviridis, einen Faktor von 1,3 für D. labrax / G. aculeatus und einen Faktor von 0,88 für

D. labrax / O. latipes.

0

20

40

60

80

100

120

0 50000 100000 150000 200000 250000 300000

Abstand der BAC-Enden

Häu

figke

it (n

orm

alis

iert)

T.nigrovirids G.aculeatus D.labrax O.latipes

y = 494,64x

R2 = 0,9724

300

400

500

600

700

800

900

0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5

Größe der homologen Region [Mb]

Gen

omgr

öße

[Mb]

Abb. 45: Darstellung der Verteilung „virtueller“ Insertgrößen beidseitig angeordneter BACs auf Genomen von T. nigroviridis, G. aculeatus und O. latipes, sowie reale Insertgrößenverteilung der BACs in D. labrax (links). Abhängigkeit von Genomgröße und Größe homologer Bereiche (rechts).

2k 42k 82k 122k 162k 202k 242k 282k 322k 371k 411k 451k 491k 531k 571k 611k 651k

100%

50%

660k 700k 740k 780k 820k 860k 900k 940k 980k

100%

50%

bassbac2911bassbac46e19

bassbac35c1bassbac10k6 bassbac93m21 bassbac25b21bassbac62k15bassbac119g5

bassbac1k14 bassbac88h11

Dicentrarchus labrax: 1.3 Mb von 10 überlappenden BACs

Gasterosteus aculeatus Chr 2: 0.99 Mb

Tetraodon nigroviridis Chr 5: 0.82 Mb

Page 105: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 91

Interpoliert man die Werte, welche sich aus dem Sequenzvergleich ergeben, so errechnet

sich für D. labrax eine Genomgröße von ca. 640 Mb (siehe Abb. 45). Mit den Werten aus

dem genomweiten Vergleich der Abstände paariger BAC-Endsequenzen ermittelt man eine

Genomgröße von ca. 605 Mb. Es ist also anzunehmen, dass das Genom von D. labrax bis

zu 160 Mb kleiner sein könnte, als bisher angenommen wurde (75).

Wie von Imai et al. gezeigt wurde, werden ähnliche Zusammenhänge auch zwischen

genomischen Bereichen von Fugu rubripes und O. latipes gefunden (84). Die Evolution der

Genomgröße von Teleosten wird dabei hauptsächlich durch Veränderungen in nicht-

kodierenden Bereichen getrieben. Mehr als die Hälfte (54%) des Größenunterschieds

machen Veränderungen in repetitiven Sequenzmotiven aus. Ein weiterer großer Anteil der

Sequenzunterschiede ist hauptsächlich in Introns und nicht-repetitiven Sequenzen zwischen

Genen angeordnet. Größenunterschiede in ORFs haben einen Anteil von weniger als 0,1%.

4.4.7. Nutzung von ultra-hochdurchsatz Sequenzierungstechniken

Die komparative Kartierung durch BAC-Klone ermöglichte es das D. labrax Genom in

kleinere Bereiche aufzuteilen, welche mit dem Roche GS20-Sequenzer sequenziert wurden.

Diese Sequenzierungsstrategie sollte spätere Probleme bei der Assemblierung der Daten

einschränken und wurde mit 109 BACs, welche 9,6 Mb des Chr XXI von G. aculeatus als

minimal tiling path abdeckten, getestet.

Sequenzierungen des BAC-Pools auf einem GS20-Sequencer erzeugten ca. 220 Mb

Sequenzdaten, was einer durchschnittlich 16 - 17fachen Abdeckung der BAC-Klone

entsprach. Trotz der hohen Abdeckung erzeugte die Assemblierung der Daten eine hohe

Anzahl von 7026 Contigs. Der Vergleich mit einem bakteriellen Genomprojekt (Erwinia sp.),

welches ebenfalls mit dem GS20-System bearbeitet wurde zeigte deutliche Unterschiede in

der Anzahl von Contigs pro Mb Sequenzdaten (siehe Abb. 46).

Vergleich der Sequenzierung von bakterieller- und Fisch-DNA mit dem GS20-System

0

500

1000

1500

2000

2500

3000

0 5 10 15 20

sequencing coverage

Anz

ahl d

er C

ontig

s pr

o M

b Co

ntig

-S

eque

nzda

ten

Erwinia sp.D.labrax

Abb. 46: Vergleich von Sequenzierungsergebnissen des GS20-Systems.

Page 106: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Ausblick 92

Bei gleicher Abdeckung der Sequenz ist die Anzahl der assemblierten Contigs des

eukaryotischen Genoms wesentlich höher als die Contiganzahl eines prokaryotischen

Genoms. Der negative Einfluss repetitiver Sequenzen auf die Datenassemblierung, welche

von den kurzen Leseweiten des GS20-Systems nicht überspannt werden können, wird hier

deutlich. Aus diesem Grund wurden zusätzlich zu den GS20-Daten, Sequenzdaten durch

Plasmid-Sequenzierung erzeugt. Eine zweifache Chromosomenabdeckung dieser Daten

reichte bereits aus, um die Qualität der Genom-Assemblierung erheblich zu verbessern

(1.698 Contigs decken 12,06 Mb ab), außerdem erlauben die beidseitig sequenzierten

Plasmide die Anordnung von Contigs zu Scaffolds.

Abb. 47: Vista Alignment der Sequenzdaten von 109 BACs, welche mit dem GS20 System gepoolt sequenziert wurden. Die Sequenzierungsergebnisse decken die durch komparative Kartier-ung vorhergesagten Bereiche auf Chr 21 von G. aculeatus ab.

Das Alignment der Daten zeigte, dass die ca. 12,06 Mb der 1.698 größten Contigs die

kartierten Bereiche von G. aculeatus Chr XXI abdecken. 8 Lücken in der komparativen Karte

konnten anhand von BAC-Klonen, welche nicht auf G. aculeatus aber auf der Sequenz von

D. labrax angeordnet werden, geschlossen werden.

Wie bei der Sequenzierung von Bakteriengenomen (85) kann die Kombination von Sanger-

Sequenzierung und Sequenzierungstechniken der zweiten Generation eine schnellere und

kostengünstigere Analyse von eukaryotischen Chromosomen und Genomen ermöglichen.

4.5. Ausblick

Wie dargestellt, ermöglichte die automatisierte Template-DNA Aufreinigung durch

größenselektive Präzipitation in PEG / Salz-Systemen die hochdurchsatz Sequenzierung

verschiedenster Vektortypen. Insbesondere von BACs und Fosmiden, welche aufgrund ihrer

Größe und niedriger Template-Ausbeuten schwieriger zu sequenzieren sind, konnten

Endsequenzen im Hochdurchsatz bestimmt werden. Dabei erzielte das Verfahren eine mehr

als 10fache Kostenreduktion gegenüber kommerziell erhältlichen Systemen (23, 25).

1Mb 2Mb 3Mb 4Mb 5Mb 6Mb 7Mb 8Mb 9Mb 10Mb

Page 107: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Ausblick 93

sequenzierte 384 well MTPs pro Jahr

0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

2003 (geschätztauf Basis von 4

mon)

2004 2005 2006 2007 (geschätzt)

Jahr

Anz

ahl

Abb. 48: Entwicklung des Sequenzierungsdurchsatzes am MPI f. Molekulare Genetik. Die Umstellung der Template-Präparation von PCR zu Plasmid-Aufreinigung erfolgte Ende 2004.

Der Probendurchsatz des installierten Systems ist mittlerweile mit dem von bekannten

Anlagen an großen Sequenzierungszentren vergleichbar (21, 24). So konnte die Anzahl

sequenzierter Templates am MPI f. Molekulare Genetik seit Einführung der Methode

kontinuierlich gesteigert werden. Ende des Jahres 2007 wird sich der erzielte

Sequenzierungsdurchsatz gegenüber 2004 mehr als vervierfacht haben, wobei eine weitere

Steigerung möglich ist (siehe Abb. 48).

Neben Kostenreduktion und Durchsatzsteigerung war die Möglichkeit der Endsequenzierung

von BAC- und Fosmid-Klonen im Hochdurchsatz eine wichtige Innovation für die

Sequenzierungsgruppe des MPI f. Molekulare Genetik. Auch in Zukunft, wenn ein Großteil

der Sequenzdatenproduktion über Technologien wie Pyrosequencing oder Sequencing by

Synthesis bereitgestellt werden wird, werden Fosmid- und BAC-Endsequenzen benötigt, um

qualitativ hochwertige Genomassemblys zu ermöglichen. Obwohl die Daten paariger

Endsequenzen nur ein Bruchteil der in einem solchen Genomprojekt verarbeiteten Sequenz-

informationen ausmachen werden, werden sie einen großen Anteil an den Projektkosten

haben (85). Aus diesem Grunde ist eine kostengünstige Methode für BAC- und Fosmid-

Endsequenzierung ein Wettbewerbsvorteil im hart umkämpften Feld der Genom-

sequenzierung.

Die neuen Sequenzierungstechnologien verringern die Kosten für Sequenzierungsprojekte

u.a. dadurch, dass keine Klon-Bibliotheken mehr konstruiert und gelagert werden müssen

(13, 15). Sie haben dadurch allerdings auch den Nachteil, dass nach der Sequenzierung

nicht auf charakterisierte Klone zurückgegriffen werden kann, was für viele Anwendungen

notwendig ist. Charakterisierte Klone, als wichtige Ressource in der Genomforschung, sind

deshalb ein weiteres Argument für die Sequenzierung nach Sanger. Gleichzeitig werden

Page 108: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Diskussion: Ausblick 94

damit auch automatisierte Aufreinigungssysteme für Plasmid, Fosmid und BAC-DNA in

Zukunft weiterhin benötigt.

In unserer Arbeitgruppe ermöglichte die BAC-Endsequenzierung im Hochdurchsatz die

komparative Genomkartierung von D. labrax ohne aufwendige Methoden wie BAC-

Filterhybridisierung oder BAC-Fingerprinting. Das Ergebnis von 808 BAC-Contigs und

Informationen über deren Lage, ist den Resultaten von zuvor genannten Methoden, welche

zur Kartierung anderer Fischgenome eingesetzt wurden, mindestens ebenbürtig (39, 41). Die

komparative Karte erlaubt Wissenschaftlern einen schnellen Zugriff auf große Regionen des

Genoms von D. labrax anhand von charakterisierten BAC-Klonen und wird die Forschung an

dieser und verwandten Species weiter beschleunigen.

Wie gezeigt wurde, bot die Kombination von Sequenzierungstechnologien der zweiten

Generation, Sanger-Sequenzierung und Kartierung des D. labrax-Genoms anhand von BAC-

Klonen die Möglichkeit, die Sequenzierung großer Teile eines D. labrax-Chromosoms

durchzuführen. Diese Strategie soll in naher Zukunft die Sequenzierung des gesamten

Genoms ermöglichen. Im Rahmen dieser Arbeit wurde am MPI f. Molekulare Genetik bereits

mit einer low coverage WGS-Sanger-Sequenzierung des Genoms von D. labrax begonnen

(Stand 11/2007: 500 Mb Sequenzdaten).

Mit der komparativen Genomkarte, einem WGS-Sanger-Datensatz und der Möglichkeit durch

BAC-Pools gerichtet Chromosomen auf neuer Sequenzierungstechnologie zu analysieren,

sind die Grundbedingungen für ein D. labrax Genomprojekt geschaffen worden.

Page 109: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Zusammenfassung: 95

5. Zusammenfassung

Ein limitierender Faktor des Probendurchsatzes und der Kosten von DNA-Sequenzierung

mittels der Sanger-Methode ist die zuverlässige Herstellung qualitativ hochwertiger DNA als

Template für die Sequenzierungsreaktion. Durch größenselektive Präzipitation in PEG / Salz-

Gemischen ist es möglich ein weites Spektrum von DNA-Templates für die Sequenzierung

aufzubereiten.

Die genauere Betrachtung der Einflussgrößen PEG- und Salz-Konzentration auf die

größenselektive Fällung ermöglichte es, die problematischen rheologischen Eigenschaften

von PEG / Salz-Gemischen durch Zusatz von 2-Propanol zu verbessern und ein

automatisiertes Verfahren für die Aufreinigung von Plasmid-, Fosmid- und BAC-DNA im

384er Format zu entwickeln. Die konzipierte Anlage bewältigt bis zu 36.834 Proben pro Tag,

wobei die Kosten pro Probe unter 0,01 Euro betragen.

Mehrere Millionen DNA-Templates für zahlreiche Sequenzierungsprojekte wurden mit Hilfe

der Anlage aufgereinigt. Besonders profitierte die Endsequenzierung von Fosmid- und BAC-

Banken von dem System.

So konnten 102.282 Endsequenzen einer BAC-Bank von Dicentrarchus labrax (Wolfsbarsch)

bestimmt werden. Durch den Vergleich der Endsequenzen mit dem nahe verwandten Fisch

G. aculeatus (Stichling) war es möglich BAC-Klone anzuordnen und eine hochauflösende

komparative Genomkarte zu erstellen. Der Abgleich der Karte mit der genetischen

Kopplungskartierung von D. labrax und Kartierungen anderer Fischgenome zeigte, dass die

komparative Kartierung einer physikalischen Karte des Genoms nahe kommt.

Indem 109 überlappende BAC-Klone anhand der Kartierung ausgewählt wurden, konnten

durch Nutzung von Sequenzierungstechniken der zweiten Generation (GS20, Roche / 454)

in Kombination mit Sanger-Sequenzierung große Bereiche eines D. labrax-Chromosoms

sequenziert werden (> 80%). Die komparative Kartierung des Genoms erweist sich somit als

sinnvoller Schritt für eine zukünftige Sequenzierung von D. labrax anhand neuer

Sequenzierungstechniken.

Page 110: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 96

6. Quellen

(1) Watson JD & Crick FH (1953).

Molecular structure of nucleic acids. A structure for deoxyribose nucleic acid. Nature. 171:737-738.

(2) Nirenberg MW & Matthaei JH (1961).

The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides. Proc Natl Acad Sci U S A. 47:1588-1602.

(3) Sanger F, Nicklen S, Coulson AR (1977).

DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74:5463-5467.

(4) Maxam A & Gilbert W (1977).

A new method of sequencing DNA. Proc Natl Acad Sci U S A. 74:560-564.

(5) Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N (1985).

Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia. Science. 230:1350-1354.

(6) Mullis K, Faloona F, Scharf S, Saiki R, Horn G, Erlich H (1986).

Specific enzymatic amplification of DNA in vitro: the polymerase chain reaction. Cold Spring Harb. 51:263–273.

(7) Anderson S (1981).

Shotgun DNA sequencing using cloned DNase I-generated fragments. Nucleic Acids Res. 9:3015-3027.

(8) Blattner FR, Plunkett G 3rd, Bloch CA, Perna NT, Burland V, Riley M, Collado-Vides J, Glasner JD,

Rode CK, Mayhew GF, Gregor J, Davis NW, Kirkpatrick HA, Goeden MA, Rose DJ, Mau B,

Shao Y (1997).

The complete genome sequence of Escherichia coli K-12. Science. 277:1453-1474.

(9) Zhang J, Voss KO, Shaw DF, Roos KP, Lewis DF, Yan J, Jiang R, Ren H, Hou JY, Fang Y,

Puyang X, Ahmadzadeh H, Dovichi NJ (1999).

A multiple-capillary electrophoresis system for small-scale DNA sequencing and analysis. Nucleic Acids Res. 27:e36.

Page 111: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 97

(10) International Human Genome Sequencing Consortium (2001).

Initial sequencing and analysis of the human genome. Nature. 409:860-921.

(11) Venter JC, et al. (2001).

The sequence of the human genome. Science. 291:1304-1581.

(12) Bennett ST, Barnes C, Cox A, Davies L, Brown C (2004).

Toward the 1,000 dollars human genome. Pharmacogenomics. 6:373-382. Review. (13) Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang

K, Mitra RD, Church GM (2005).

Accurate multiplex polony sequencing of an evolved bacterial genome. Science. 309:1728-1732.

(14) Matsumura H, Ito A, Saitoh H, Winter P, Kahl G, Reuter M, Kruger DH, Terauchi R (2005).

SuperSAGE. Cell Microbiol. 7:11-18. Review.

(15) Margulies M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, Berka J, Braverman MS,

Chen YJ, Chen Z, Dewell SB, Du L, Fierro JM, Gomes XV, Godwin BC, He W, Helgesen S,

Ho CH, Irzyk GP, Jando SC, Alenquer ML, Jarvie TP, Jirage KB, Kim JB, Knight JR, Lanza

JR, Leamon JH, Lefkowitz SM, Lei M, Li J, Lohman KL, Lu H, Makhijani VB, McDade KE,

McKenna MP, Myers EW, Nickerson E, Nobile JR, Plant R, Puc BP, Ronan MT, Roth GT,

Sarkis GJ, Simons JF, Simpson JW, Srinivasan M, Tartaro KR, Tomasz A, Vogt KA, Volkmer

GA, Wang SH, Wang Y, Weiner MP, Yu P, Begley RF, Rothberg JM (2005).

Genome sequencing in microfabricated high-density picolitre reactors. Nature. 437:376-380.

(16) Hofmann MA, Brian DA (1991).

Sequencing PCR DNA amplified directly from a bacterial colony. Biotechniques. 11:30-31.

(17) Rauth H (1997).

Verfahrenstechnik und Automatisierung nicht radioaktiver Highthroughput DNA-Sequenzierung. Diplomarbeit. TFH-Berlin.

(18) Dean FB, Nelson JR, Giesler TL, Lasken RS (2001).

Rapid amplification of plasmid and phage DNA using Phi 29 DNA polymerase and multiply-primed rolling circle amplification. Genome Res. 11:1095-1099.

Page 112: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 98

(19) Kuhl H (2003).

Anwendung der rolling circle DNA Amplifikation im 384er Mikrotiterplattenformat zur Bestimmung von BAC Endsequenzen im Hochdurchsatz. Diplomarbeit. TU-Berlin.

(20) Dean FB, Hosono S, Fang L, Wu X, Faruqi AF, Bray-Ward P, Sun Z, Zong Q, Du Y, Du J, Driscoll

M, Song W, Kingsmore SF, Egholm M, Lasken RS (2002).

Comprehensive human genome amplification using multiple displacement amplification. Proc Natl Acad Sci USA. 99:5261-5266.

(21) Elkin CJ, Richardson PM, Fourcade HM, Hammon NM, Pollard MJ, Predki PF, Glavina T,

Hawkins TL (2001).

High-throughput plasmid purification for capillary sequencing. Genome Res. 11:1269-1274.

(22) DeAngelis MM, Wang DG, Hawkins TL. (1995).

Solid-phase reversible immobilization for the isolation of PCR products. Nucleic Acids Res. 23:4742-4743.

(23) http://www.agencourt.com/products/SPRIsolutions/SPRI/ (Stand Juni 2007)

(24) Itoh M, Kitsunai T, Akiyama J, Shibata K, Izawa M, Kawai J, Tomaru Y, Carninci P, Shibata Y,

Ozawa Y, Muramatsu M, Okazaki Y, Hayashizaki Y (1999).

Automated filtration-based high-throughput plasmid preparation system. Genome Res. 9:463-470.

(25) http://www.brinkmann.com/utilities/download_pdf.asp?DR=downloads%2Fpdf%2Fmanuals%

2Feppendorf&FN=Perfectprep_Plasmid384_0302.pdf (Stand Juni 2007)

(26) Dederich DA, Okwuonu G, Garner T, Denn A, Sutton A, Escotto M, Martindale A, Delgado O,

Muzny DM, Gibbs RA, Metzker ML. (2002).

Glass bead purification of plasmid Template DNA for high throughput sequencing of mammalian genomes. Nucleic Acids Res. 30:e32.

(27) http://www.genome.ou.edu/Zymark_384_well_isolation.html (Stand Juni 2007)

(28) Birnboim HC, Doly J. (1979).

A rapid alkaline extraction procedure for screening recombinant plasmid DNA.

Nucleic Acids Res. 7:1513-1523.

(29) http://www.corning.com/Lifesciences/technical_information/techDocs/protocol_

filtrexplasmidprep.pdf (Stand Juni 2007)

(30) Marra MA, Kucaba TA, Hillier LW, Waterston RH (1999).

High-throughput plasmid DNA purification for 3 cents per sample. Nucleic Acids Res. 27:e37.

(31) http://docs.appliedbiosystems.com/pebiodocs/00113199.pdf

Page 113: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 99

(32) Lis JT, Schleif R (1975).

Size fractionation of double-stranded DNA by precipitation with polyethylene glycol. Nucleic Acids Res. 2:383-389.

(33) Atha DH, Ingham KC (1982).

Mechanism of precipitation of proteins by polyethylene glycols. Analysis in terms of excluded volume. J Biol Chem. 256:12108-12117.

(34) Pulleyblank D, Michalak M, Daisley SL, Glick R (1983).

A method for the purification of E. coli plasmid DNA by homogeneous lysis and polyethylene glycol precipitation. Mol Biol Rep. 9:191-195.

(35) Nicoletti VG, Condorelli DF (1993).

Optimized PEG method for rapid plasmid DNA purification: high yield from "midi-prep". Biotechniques. 14:532-534, 536.

(36) Schmitz A, Riesner D (2006).

Purification of nucleic acids by selective precipitation with polyethylene glycol 6000. Anal Biochem. 354:311-3.

(37) Shizuya H, Birren B, Kim UJ, Mancino V, Slepak T, Tachiiri Y, Simon M (1992).

Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector. Proc Natl Acad Sci USA. 89:8794-8797.

(38) Wild J, Hradecna Z, Szybalski W (2002).

Conditionally amplifiable BACs: switching from single-copy to high-copy vectors and genomic clones. Genome Res. 12:1434-1444.

(39) Khorasani MZ, Hajizadeh S, Fathollahi Y, Semnanian S (2004).

A first generation physical map of the medaka genome in BACs essential for positional cloning and clone-by-clone based genomic sequencing. Mech Dev. 121:903-913.

(40) Tao Q, Chang YL, Wang J, Chen H, Islam-Faridi MN, Scheuring C, Wang B, Stelly DM, Zhang

HB (2001).

Bacterial artificial chromosome-based physical map of the rice genome constructed by restriction fingerprint analysis. Genetics. 158:1711-1724.

(41) Katagiri T, Kidd C, Tomasino E, Davis JT, Wishon C, Stern JE, Carleton KL, Howe AE, Kocher

TD (2005).

A BAC-based physical map of the Nile tilapia genome. BMC Genomics. 6:89.

Page 114: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 100

(42) Luo M-C, Thomas C, You FM, Hsiao J, Ouyang S, Buell CR, Malandro M, McGuire PE, Anderson

OD, Dvorak J (2003).

High-throughput fingerprinting of bacterial artificial chromosomes using the SNaP-shot labeling kit and sizing of restriction fragments by capillary electrophoresis. Genomics. 82:378-389.

(43) Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990).

Basic local alignment search tool. J Mol Biol. 215:403-410.

(44) Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (1997).

Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402. Review.

(45) Fujiyama A, Watanabe H, Toyoda A, Taylor TD, Itoh T, Tsai SF, Park HS, Yaspo ML, Lehrach H,

Chen Z, Fu G, Saitou N, Osoegawa K, de Jong PJ, Suto Y, Hattori M, Sakaki Y (2002).

Construction and analysis of a human-chimpanzee comparative clone map. Science. 295:131-134.

(46) Larkin DM, Everts-van der Wind A, Rebeiz M, Schweitzer PA, Bachman S, Green C, Wright CL,

Campos EJ, Benson LD, Edwards J, Liu L, Osoegawa K, Womack JE, de Jong PJ, Lewin HA

(2003).

A cattle-human comparative map built with cattle BAC-ends and human genome sequence. Genome Res. 13:1966-1972.

(47) http://www.fishbase.org (Stand Nov 2007)

(48) Nebel C, Romestand B, Negre-Sadargues G, Grousset E, Aujoulat F, Bacal J, Bonhomme F,

Charmantier G (2005).

Differential freshwater adaptation in juvenile sea-bass Dicentrarchus labrax: involvement of gills and urinary system. J Exp Biol. 208:3859-3871.

(49) Kaushik SJ, Coves D, Dutto G, Blanc D (2004).

Almost total replacement of fish meal by plant protein sources in the diet of a marine teleost, the European seabass, Dicentrarchus labrax. Aquaculture. 230:391-404.

(50) Pifferer F, Blazquez M, Navarro L, Gonzales A (2005).

Genetic, endocrine, and enviromental components of sex determination and differentiation in the European sea bass (Dicentrarchus labrax L.). Gen Comp Endocrinol. 142:102-110.

(51) Jekosch K (2004).

The zebrafish genome project: sequence analysis and annotation. Methods Cell Biol. 77:225-239.

Page 115: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 101

(52) Kasahara M, Naruse K, Sasaki S, Nakatani Y, Qu W, Ahsan B, Yamada T, Nagayasu Y, Doi K,

Kasai Y, Jindo T, Kobayashi D, Shimada A, Toyoda A, Kuroki Y, Fujiyama A, Sasaki T,

Shimizu A, Asakawa S, Shimizu N, Hashimoto S, Yang J, Lee Y, Matsushima K, Sugano S,

Sakaizumi M, Narita T, Ohishi K, Haga S, Ohta F, Nomoto H, Nogata K, Morishita T, Endo T,

Shin-I T, Takeda H, Morishita S, Kohara Y (2007).

The medaka draft genome and insights into vertebrate genome evolution. Nature. 447:714-719.

(53) http://www.ensembl.org/Gasterosteus_aculeatus/index.html (Dezember 2006)

(54) Jaillon O, Aury JM, Brunet F, Petit JL, Stange-Thomann N, Mauceli E, Bouneau L, Fischer C,

Ozouf-Costaz C, Bernot A, Nicaud S, Jaffe D, Fisher S, Lutfalla G, Dossat C, Segurens B,

Dasilva C, Salanoubat M, Levy M, Boudet N, Castellano S, Anthouard V, Jubin C, Castelli V,

Katinka M, Vacherie B, Biémont C, Skalli Z, Cattolico L, Poulain J, De Berardinis V, Cruaud C,

Duprat S, Brottier P, Coutanceau JP, Gouzy J, Parra G, Lardier G, Chapple C, McKernan KJ,

McEwan P, Bosak S, Kellis M, Volff JN, Guigó R, Zody MC, Mesirov J, Lindblad-Toh K, Birren

B, Nusbaum C, Kahn D, Robinson-Rechavi M, Laudet V, Schachter V, Quétier F, Saurin W,

Scarpelli C, Wincker P, Lander ES, Weissenbach J, Roest Crollius H (2004).

Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype. Nature. 431:946-957.

(55) Aparicio S, Chapman J, Stupka E, Putnam N, Chia JM, Dehal P, Christoffels A, Rash S, Hoon S,

Smit A, Gelpke MD, Roach J, Oh T, Ho IY, Wong M, Detter C, Verhoef F, Predki P, Tay A,

Lucas S, Richardson P, Smith SF, Clark MS, Edwards YJ, Doggett N, Zharkikh A, Tavtigian

SV, Pruss D, Barnstead M, Evans C, Baden H, Powell J, Glusman G, Rowen L, Hood L, Tan

YH, Elgar G, Hawkins T, Venkatesh B, Rokhsar D, Brenner S (2002).

Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes. Science. 297:1301-1310.

(56) Miya M, Kawaguchi A, Nishida M (2001).

Mitogenomic exploration of higher teleostean phylogenies: a case study for moderate-scale evolutionary genomics with 38 newly determined complete mitochondrial DNA sequences. Mol Biol Evol. 18:1993-2009.

(57) Rabus R, Wilkes H, Schramm A, Harms G, Behrends A, Amann R, Widdel F (1999).

Anaerobic utilization of alkylbenzenes and n-alkanes from crude oil in an enrichment culture of denitrifying bacteria affiliating with the beta-subclass of Proteobacteria. Environ Microbiol. 1:145-157.

(58) Ewing B, Green P (1998).

Basecalling of automated sequencer traces using phred. II. Error probabilities.

Genome Res. 8:186-194.

Page 116: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 102

(59) H.-H. Chou and M.H. Holmes (2001).

DNA sequence quality trimming and vector removal. Bioinformatics. 17:1093-1104.

(60) Zhang Z, Schwartz S, Wagner L, Miller W (2000).

A greedy algorithm for aligning DNA sequences. J Comput Biol. 7:203-214.

(61) http://www.phrap.org (Stand Juli 2007)

(62) Gordon D, Abajian C, Green P (2002).

Consed: a graphical tool for sequence finishing. Genome Res. 8:195-202.

(63) Hornef N, Olbrich H, Horvath J, Zariwala MA, Fliegauf M, Loges NT, Wildhaber J, Noone PG,

Kennedy M, Antonarakis SE, Blouin JL, Bartoloni L, Nüsslein T, Ahrens P, Griese M, Kuhl H,

Sudbrak R, Knowles MR, Reinhardt R, Omran H (2006).

DNAH5 mutations are a common cause of primary ciliary dyskinesia with outer dynein arm defects.

Am J Respir Crit Care Med. 174:120-126.

(64) Hecht J, Kuhl H, Haas SA, Bauer S, Poustka AJ, Lienau J, Schell H, Stiege AC, Seitz V,

Reinhardt, Duda GN, Mundlos S, Robinson PN (2006).

Gene identification and analysis of transcripts differentially regulated in fracture healing by EST sequencing in the domestic sheep. BMC Genomics. 7:172.

(65) Bauer M, Kube M, Teeling H, Richter M, Lombardot T, Allers E, Wurdemann CA, Quast C, Kuhl

H, Knaust F, Woebken D, Bischof K, Mussmann M, Choudhuri JV, Meyer F, Reinhardt R,

Amann RI, Glockner FO (2006).

Whole genome analysis of the marine Bacteroidetes'Gramella forsetii' reveals adaptations to degradation of polymeric organic matter. Environ Microbiol. 8:2201-2213.

(66) Erkel C, Kube M, Reinhardt R, Liesack W (2006).

Genome of Rice Cluster I archaea--the key methane producers in the rice rhizosphere. Science. 313:370-372.

(67) Chromosome 21 mapping and sequencing consortium (2000).

The DNA sequence of human chromosome 21. Nature. 405:311-319.

(68) Paithankar KR, Prasad KS (1991).

Precipitation of DNA by polyethylene glycol and ethanol. Nucleic Acids Res. 19:1346.

(69) Hegen PN (1994).

Recovering DNA from agarose gels. Trends Biochem Sci. 19:388-389.

Page 117: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 103

(70) Kasai K (1993).

Size-dependent chromatographic separation of nucleic acids. J Chromatogr. 618:203-221. Review.

(71) Rauth H, Reinhardt R, Nordhoff E (2001).

Method for binding nucleic acids to a solid phase. European Patent EP1214406.

(72) Kim UJ, Shizuya H, de Jong PJ, Birren B, Simon MI (1992).

Stable propagation of cosmid sized human DNA inserts in an F factor based vector. Nucleic Acids Res. 20:1083-1085.

(73) http://www.epicentre.com (Stand Juli 2007)

(74) Whitaker HA, McAndrew BJ, Taggart JB (2006).

Construction and characterization of a BAC library for the European sea bass Dicentrarchus labrax. Anim Genet. 37:526.

(75) Peruzzi S., Chatain B., Menu B (2005).

Flow cytometric determination of genome size in European seabass (Dicentrarchus labrax), gilthead seabream (Sparus aurata), thinlip mullet (Liza ramada), and European eel (Anguilla anguilla) Aquat. Living Resour. 18:77-81.

(76) Gotea V, Veeramachaneni V, Makałowski W (2003).

Mastering seeds for genomic size nucleotide BLAST searches. Nucleic Acids Res. 31:6935-6941.

(77) Hollich V, Johnson E, Furlong EE, Beckmann B, Carlson J, Celniker SE, Hoheisel JD (2004).

Creation of a minimal tiling path of genomic clones for Drosophila: provision of a common resource. Biotechniques. 37:282-284.

(78) Sun X, Le HD, Wahlstrom JM, Karpen GH (2003).

Sequence analysis of a functional Drosophila centromere. Genome Res. 13:182-194.

(79) Chistiakov DA, Hellemans B, Haley CS, Law AS, Tsigenopoulos CS, Kotoulas G, Bertotto D,

Libertini A, Volckaert FA (2005).

A microsatellite linkage map of the European sea bass Dicentrarchus labrax L. Genetics. 170:1821-1826.

(80) Sarropoulou E, Franch R, Louro B, Power DM, Bargelloni L, Magoulas A, Senger F, Tsalavouta

M, Patarnello T, Galibert F, Kotoulas G, Geisler R (2007).

A gene-based radiation hybrid map of the gilthead sea bream Sparus aurata refines and exploits conserved synteny with Tetraodon nigroviridis. BMC Genomics. 8:44.

Page 118: Ein Verfahren für BAC-DNA-Aufreinigung€¦ · Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz zur Genomkartierung von Dicentrarchus labrax vorgelegt von Diplom-Ingenieur

Quellen: 104

(81) Blazquez M, Piferrer F (2004).

Cloning, sequence analysis, tissue distribution, and sex-specific expression of the neural form of P450 aromatase in juvenile sea bass (Dicentrarchus labrax). Mol Cell Endocrinol. 219:83-94.

(82) Galay-Burgos M, Gealy C, Navarro-Martín L, Piferrer F, Zanuy S, Sweeney GE (2006).

Cloning of the promoter from the gonadal aromatase gene of the European sea bass and identification of single nucleotide polymorphisms. Comp Biochem Physiol A Mol Integr Physiol. 145:47-53.

(83) http://genome.lbl.gov/vista/index.shtml (Stand Juli 2007)

(84) Imai S, Sasaki T, Shimizu A, Asakawa S, Hori H, Shimizu N (2007).

The genome size evolution of medaka (Oryzias latipes) and fugu (Takifugu rubripes). Genes Genet Syst. 82:135-144.

(85) Goldberg SM, Johnson J, Busam D, Feldblyum T, Ferriera S, Friedman R, Halpern A, Khouri H,

Kravitz SA, Lauro FM, Li K, Rogers YH, Strausberg R, Sutton G, Tallon L, Thomas T, Venter

E, Frazier M, Venter JC (2006).

A Sanger/pyrosequencing hybrid approach for the generation of high-quality draft assemblies of marine microbial genomes. Proc Natl Acad Sci U S A. 103:11240-11245.