6
Seite 1 Next-Generation Sequencing (NGS) Technologien erlauben neue Einblicke in die Zusammensetzung von mikrobi- ellen Gemeinschaften, da sowohl (i) kultivierbare & nicht-kultivierbare Taxa als auch (ii) seltene Taxa nachgewie- sen werden können. Die Auswahl der Amplifikationsprimer ist für die Analyse von entscheidender Bedeutung Alles aus einer Hand: Microsynth bietet für Prokaryonten und Pilze einen umfassenden Service für die Analyse von mikrobiellen Gemeinschaften an - vom Projekt-Design bis zur bioinformatischen Auswertung der NGS Daten. Highlights Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig? Microsynth AG | Schützenstrasse 15 | 9436 Balgach | Switzerland E-mail: [email protected] | Web: www.microsynth.ch Microbiota und NGS - ein Traumpaar Mikroorganismen bilden sehr diverse Gemeinschaften (Microbiota). Ein Charakteristikum dieser Gemeinschaften ist, dass einige wenige Taxa die Gemeinschaften dominieren und eine sehr große Anzahl Taxa mit geringerer Häufigkeit auftreten [1]. Daneben können auch Taxa vorkommen, welche nicht kultivierbar sind und daher mit klassischen Methoden nicht nachweisbar sind. Next-Generation Sequencing (NGS) Technologien bieten nun eine beispiellose Möglichkeit, um mikrobielle Gemein- schaften zu untersuchen. Die große Menge an Sequenzierdaten ermöglicht es, sowohl seltene als auch nicht-kulti- vierbare Taxa nachzuweisen [2]. Somit können bedeutende Fragestellungen, wie zum Beispiel der Einfluss der menschlichen Darmflora auf die Gesundheit, viel zielgerichteter untersucht werden. Die Klassifikation der verschiedenen Taxa basiert dabei auf der Analyse von geeigneten DNA Abschnitten. Während dies für Prokaryonten zumeist die 16S rDNA ist, werden bei Pilzen häufig die ITS Sequenzen verwendet (internal transcribed spacers der rDNA). Im Prinzip ist die Sequenzierung eines Teils der rDNA eine Standardmethode und wurde bereits 1977 vorgeschlagen [3]. Neu ist, dass durch die NGS Technologien nicht nur einzelne oder häufige Taxa in einer Gemeinschaft bestimmt werden können, sondern man sich zu tragbaren Kosten einen guten Überblick über ganze Gemeinschaften verschaffen kann. White Paper

Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Embed Size (px)

DESCRIPTION

Mikroorganismen bilden sehr diverse Gemeinschaften (Microbiota). Ein Charakteristikum dieser Gemeinschaften ist, dass einige wenige Taxa die Gemeinschaften dominieren und eine sehr große Anzahl Taxa mit geringerer Häufigkeit auftreten [1]. Daneben können auch Taxa vorkommen, welche nicht kultivierbar sind und daher mit klassischen Methoden nicht nachweisbar sind. Next-Generation Sequencing (NGS) Technologien bieten nun eine beispiellose Möglichkeit, um mikrobielle Gemeinschaften zu untersuchen. Die große Menge an Sequenzierdaten ermöglicht es, sowohl seltene als auch nicht-kultivierbare Taxa nachzuweisen. Somit können bedeutende Fragestellungen, wie zum Beispiel der Einfluss der menschlichen Darmflora auf die Gesundheit, viel zielgerichteter untersucht werden.

Citation preview

Page 1: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 1

Next-Generation Sequencing (NGS) Technologien erlauben neue Einblicke in die Zusammensetzung von mikrobi-ellen Gemeinschaften, da sowohl (i) kultivierbare & nicht-kultivierbare Taxa als auch (ii) seltene Taxa nachgewie-sen werden können.

Die Auswahl der Amplifikationsprimer ist für die Analyse von entscheidender Bedeutung

Alles aus einer Hand: Microsynth bietet für Prokaryonten und Pilze einen umfassenden Service für die Analyse von mikrobiellen Gemeinschaften an - vom Projekt-Design bis zur bioinformatischen Auswertung der NGS Daten.

Highlights

Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Microsynth AG | Schützenstrasse 15 | 9436 Balgach | SwitzerlandE-mail: [email protected] | Web: www.microsynth.ch

Microbiota und NGS - ein Traumpaar

Mikroorganismen bilden sehr diverse Gemeinschaften (Microbiota). Ein Charakteristikum dieser Gemeinschaften ist, dass einige wenige Taxa die Gemeinschaften dominieren und eine sehr große Anzahl Taxa mit geringerer Häufigkeit auftreten [1]. Daneben können auch Taxa vorkommen, welche nicht kultivierbar sind und daher mit klassischen Methoden nicht nachweisbar sind.

Next-Generation Sequencing (NGS) Technologien bieten nun eine beispiellose Möglichkeit, um mikrobielle Gemein-schaften zu untersuchen. Die große Menge an Sequenzierdaten ermöglicht es, sowohl seltene als auch nicht-kulti-vierbare Taxa nachzuweisen [2]. Somit können bedeutende Fragestellungen, wie zum Beispiel der Einfluss der menschlichen Darmflora auf die Gesundheit, viel zielgerichteter untersucht werden.

Die Klassifikation der verschiedenen Taxa basiert dabei auf der Analyse von geeigneten DNA Abschnitten. Während dies für Prokaryonten zumeist die 16S rDNA ist, werden bei Pilzen häufig die ITS Sequenzen verwendet (internal transcribed spacers der rDNA). Im Prinzip ist die Sequenzierung eines Teils der rDNA eine Standardmethode und wurde bereits 1977 vorgeschlagen [3]. Neu ist, dass durch die NGS Technologien nicht nur einzelne oder häufige Taxa in einer Gemeinschaft bestimmt werden können, sondern man sich zu tragbaren Kosten einen guten Überblick über ganze Gemeinschaften verschaffen kann.

White Paper

Page 2: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 2

Abbildung 1. Struktur der 16S rRNA von Escherichia coli nach Tung et al. [7]. Die variablen Regionen in der 16S rRNA sind in grün dargestellt. A, 3D Strukturmodel der 16S rRNA mit variablen Regionen in grün. B, Sekundäre Struktur der 16S rRNA. C, Lage der zwei Standard Primersets für die Analyse von prokaryontischen Gemeinschaften.

Typische Barcoding Loci bei Bakterien und Pilzen

Bei Bakterien ist die 16S rDNA Sequenz grundsätzlich sehr stark konserviert. Jedoch liegen zwischen den stark konservierten Regionen variable DNA Abschnitte, welche auch noch zwischen nah verwandten Arten Unterschiede aufweisen (siehe Abbildung 1). Die Variation in diesen Abschnitten erlaubt es eine Bestimmung auf Gattungs- oder häufig auch auf Art-Niveau vorzunehmen. Da es mittels NGS nicht praktikabel ist, die vollständige 16S rDNA zu sequenzieren, wird nur ein Teil der variablen Regionen sequenziert.

Zur Zeit bietet Microsynth zwei verschiedene Standard Primersets an, welche basierend auf den Empfehlungen des Human Microbiome Project Consortium entwickelt wurden [4]. Die beiden Primersets eignen sich für einen Großteil der Projekte und haben sich in mehreren Studien bewährt. Während das erste Primerset die variablen Regionen V123 einschließt, umfasst das zweite Primerset die variablen Regionen V345 (Abbildung 1). Je nach Anforderung des Projekts können aber auch kunden-spezifische Primersets entwickelt und validiert werden.

16S rDNA als Barcoding Locus bei Prokaryonten

ITS Regionen als Barcoding Locus bei PilzenDie ITS Region hat sich im Laufe der Jahre als Goldstandard für die Klassifizierung von Pilzen entwickelt [5]. Dieser Locus eignet sich mit wenigen Ausnahmen [6], Pilze bis zum Artniveau zu unterscheiden. Neben den ITS Regionen sind auch andere Loci für das Barcoding von Pilzen verwendet worden, wobei die Datengrundlage allerdings deutlich kleiner ist.

Seite 2

V1 V2 V3 V4 V5 V6 V7 V8 V9

100 bp

Primer-Set V123

Primer-Set V345

A

C

B

Page 3: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 3

In diesem Abschnitt soll anhand einer 16S rDNA Analyse exemplarisch aufgezeigt werden, wie wichtig es ist, der Wahl der Primer eine hohe Priorität beizumessen. Wie in Abbildung 2 sehr schön zu sehen ist, kann ein einzelnes Primerset (in diesem Fall V123) geeignet sein, die Mehrheit der Taxa in einer Probe gut zu charakterisieren. Dennoch können zwei Phänomene auftreten, welche berücksichtigt werden müssen. Einerseits gibt es Unterschiede in der Amplifikationseffizienz für einzelne Taxa zwischen den Standard Primersets, so dass einzelne Taxa im Extremfall ganz ausfallen können (Abbildung 2). Anderseits kann die taxonomische Auflösung, d.h. die Genauigkeit mit welcher einzelne Taxa erkannt werden, je nach Primerset und variabler Region verschieden sein [8]. Diese Effekte wurden in ähnlicher Weise auch in der Literatur beschrieben [4, 9]. Es ist also essentiell, je nach Forschungsfrage und je nach mikrobieller Gemeinschaft, die es zu analysieren gilt, möglichst das optimale bzw. die optimalen Primerset(s) zu verwenden. Aus diesem Grunde empfehlen wir auch, in einer Pilotstudie die Primersets vorab auf ihre Eignung zu überprüfen. Zudem sollten bei Metagenom-Analysen immer nur Gemeinschaften miteinander verglichen werden, welche mit identischen Primersets generiert wurden.

Abgesehen von der Wahl der Primer spielen noch viele zusätzliche Faktoren eine Rolle. Insbesondere die Isolation von qualitativ hochwertiger DNA aus Umweltproben kann bei Unerfahrenheit eine Herausforderung sein. Auch im Bereich der DNA Isolation kann Microsynth auf jahrelange Erfahrung zurückblicken und kann entweder beratend oder helfend zur Seite stehen.

Abbildung 2. Analyse einer identischen Umweltprobe mit unterschiedlichen Standard Primersets. Je nach verwendetem Primerset wurden für einzelne Taxa Unterschiede in der Amplifikationseffizienz festgestellt. So konnte zum Beispiel mit dem Set V123 die Spirochaetes amplifiziert werden, nicht aber mit dem Set V345. Genau umgekehrt war das Verhalten der beiden Sets bei den Archaea. Zudem sind auch kleinere Unterschiede in der Amplifikationseffizienz zwischen den beiden Primersets zu beobachten, wie dies am Beispiel der Clostridia ersichtlich wird.

Kingdom Phylum Class V123 V345Total Reads 8523 7922Archaea 0 386L Euryarchaeota 0 386 L Methanobacteria 0 62 L Methanomicrobia 0 324Bacteria 8523 7536

L Bacteroidetes 88 24

L Bacteroidia 42 7 L Sphingobacteria 6 1

L Anaerolineae 19 2

L Cyanobacteria 1 0L Deferribacteres 22 11 L Deferribacteres 22 11L Firmicutes 4212 2854

L Bacilli 3367 2591 L Clostridia 816 233L MVP-15 17 6L OP9 5 2 L JS1 4 2L Planctomycetes 2 0 L Phycisphaerae 2 0L Proteobacteria 2572 3651

L Alphaproteobacteria 7 4 L Betaproteobacteria 17 3 L Deltaproteobacteria 2339 3114 L Epsilonproteobacteria 37 19 L Gammaproteobacteria 170 509L Spirochaetes 16 0 L Spirochaetes 10 0 L WWE1 5 0L Synergistetes 72 179

L Tenericutes 8 1 L Mollicutes 7 1L Thermotogae 36 3 L Thermotogae 36 3

Archaea werdenvom V123 Set

nicht ampli�ziert

Spirochaetes werdenvom V345 Systemnicht ampli�ziert

Class Order Family V123 V345ClostridiaL Clostridiales 799 212 L Clostridiaceae 429 36 L Clostridiales_XI.IncertaeSedis 64 0 L Clostridiales_XII.IncertaeSedis 154 63 L Clostridiales_XIII.IncertaeSedis 7 0

L unclassid�ed 93 20L Actinobacteria 1357 779 L Actinobacteria 1357 779

L unclassi�ed 40 16

L Chloro�exi 21 2

L Chloro�exi 2 0

L unclassi�ed 29 30

L unclassi�ed 2 2

L Synergistia 72 179

Ampli�kations-Biasin den Clostridiales

Die Wahl des geeigneten Primersets – Schlüssel zum Erfolg!

Seite 3

Page 4: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 4

In einem ersten Schritt muss entschieden werden, welches Primerset am erfolgversprechendsten ist. Ob mit einem Microsynth Standard Primerset gearbeitet werden soll oder ob ein kunden-spezifisches Primerset entwickelt werden soll, wird mit dem Kunden eingehend diskutiert. Zudem muss definiert werden, ob der Kunde die DNA Isolation im eigenen Labor durchführt, oder ob diese durch Microsynth gemacht werden soll (Abbildung 3). Danach erfolgt die Amplifikation der DNA mittels PCR. Microsynth verwendet bei der Amplifikation der PCR Produkte ein „two-step“ Protokoll. Dabei wird in einem ersten Schritt der Locus mit kurzen Templat-spezifischen Primern amplifiziert. In einer zweiten Runde werden dann die langen NGS Fusionsprimer eingesetzt [10]. Unsere internen Tests haben gezeigt, dass es nur so möglich ist qualitativ hochwertige Multiplex Amplicon Libraries zu generieren und eine hohe Repro-duzierbarkeit sicherzustellen.

Nach dem äquimolaren Pooling der PCR Produkte wird die NGS Sequenzierung auf dem 454/Roche FLX durchge-führt. Im letzten und vielleicht wichtigsten Schritt erfolgt die bioinformatische Analyse. Hierzu haben wir diverse Software Tools und Auswertealgorithmen etabliert, welche es erlauben aus den generierten Datenmengen mög-lichst viele wertvolle Informationen herauszulesen und sichtbar zu machen. Im folgenden Abschnitt soll detaillierter dargestellt werden, wie eine bioinformatische Analyse sowie deren Output bei Metagenom-Projekten aussehen kann.

DNA Isolation

PCR Amplifikation mit Standard

Primersets

PCR Amplifikation mit kunden-spez.

Primersets

PCR Aufreinigung & äquimolares Pooling

454 Sequenzierung

Analyse der NGS Daten

Umweltproben (Boden, Gewebe, Stuhl, Wasser, ...)

Auswahl der Primersets

Projekt Input:Option1: Kunde sendet Umwelt-

probeOption 2: Kunde sendet

isolierte DNAEntwicklung von

kunden-spezifischenPrimersets

Projekt Output:Benutzerfreundlicher Report mit OTU Listen, Taxonomie Listen, Rarefaction Analysen und Heatmaps für weiterge-hende Analysen.

Abbildung 3. Schematische Darstellung eines Projektablaufs zur Metagenom-Analyse von mikrobiellen Gemeinschaften. Je nach Ausgangslage und Fragestellung wird in einem ersten Schritt das geeignete Primerset bestimmt oder auf Wunsch des Kunden auch ein neues Primerset entwickelt. Zudem kann entweder der gesamte Prozess inklusive DNA Isolation an Microsynth ausgelagert werden oder die DNA wird durch den Kunden isoliert. Am Ende wird dem Kunden ein benutzerfreundlicher Report geliefert, welcher auch für weitergehende Analysen verwendet werden kann.

Wie sieht ein typischer Projektablauf aus?

Seite 4

Page 5: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 5

Abbildung 4. Exemplarische Darstellung einiger Analyseresultate. A, Ausschnitt aus einer taxonomischen Klassifizierung von Reads in einer phylogenetisch gegliederten Tabelle. Als Referenz dient dabei eine kurierte Datenbank (Greengenes). B, Vergleich verschiedener Gemeinschaften mittels einer Heatmap. Die entsprechende Analyse wird auf verschiedenen taxonomischen Ebenen durchgeführt und hilft Unterschiede in der Zusammensetzung der Gemeinschaften schnell zu erkennen. C, Beispiel eines Vergleichs der Diversität innerhalb und zwischen Proben für verschieden OTU Distanzen. Für die Diversitäts-Analysen werden die gebräuchlichsten Schätzer wie Chao, Shannon oder Simpson berechnet.

State of the Art – die Bioinformatik-Analysepipeline von Microsynth

Nach einer eingehenden Qualitätsprüfung der Sequenzdaten werden bei der parallelen Sequenzierung von mehreren Proben diese anhand ihres Multiplex-Identifier‘s sortiert. Danach werden die einzelnen Sequenzen (= Reads) mit Hilfe eines Bayesian Algorithmus und einer Referenzdatenbank klassifiziert. Daraus resultiert eine Auflistung der Anzahl Reads, welche den verschiedenen Taxa zugeordnet werden können (Abbildung 4A). Die Klassifizierung in Tabellenform als phylogenetischer Baum erlaubt einen schnellen Überblick über die Zusammen-setzung innerhalb einer Gemeinschaft sowie zwischen verschiedenen Gemeinschaften.

Zudem werden die Resultate auch als Heatmap für verschiedene taxonomische Hierarchiestufen visualisiert (Abbil-dung 4B). Diese Art der Darstellung hat den Vorteil, dass die wichtigsten Taxa, welche in einer Probe vorkommen, auf einen Blick zu sehen sind.

Daneben werden auch die häufig verwendeten operational taxonomic units (OTUs) ermittelt, welche dazu dienen verschiedene Diversität-Indizes zu berechnen und die Diversität von Gemeinschaften zwischen verschiedenen Proben zu vergleichen (Abbildung 4C). Ebenso können die OTU Definitionen verwendet werden, um Distanzen zwischen den Gemeinschaften zu berechnen oder aber um komplexe Analysen basierend auf multivariater Statistik durchzuführen [11].

Seite 5

A

C

B

Page 6: Metagenom-Analysen von mikrobiellen Gemeinschaften – aber wie richtig?

Seite 6

Literatur1. McGill, B.J., Etienne, R.S., Gray, J.S., Alonso, D., Anderson, M.J., Benecha, H.K., Dornelas, M., Enquist, B.J., Green, J.L., He, F.L., Hurlbert, A.H.,

Magurran, A.E., Marquet, P.A., Maurer, B.A., Ostling, A., Soykan, C.U., Ugland, K.I. & White, E.P. (2007) Species abundance distributions: moving beyond single prediction theories to integration within an ecological framework. Ecology Letters, 10: 995–1015.

2. Hugenholtz, P. (2002) Exploring prokaryotic diversity in the genomic era. Genome Biology 3: reviews0003.1–reviews0003.8.3. Woese, C.R. & Fox, G.E. (1977) Phylogenetic structure of the prokaryotic domain: the primary kingdoms. Proc. Natl. Acad. Sci. USA, 74: 5088-90.4. The Human Microbiome Project Consortium (2012) A framework for human microbiome research. Nature, 486: 215-221.5. Horton, T.R. & Bruns, T.D. (2001) The molecular revolution in ectomycorrhizal ecology: peeking into the black-box. Molecular Ecology, 10:

1855-1871.6. Grünig, C.R.; Brunner, P. C.; Duo, A. & Sieber, T. N. (2007) Suitability of methods for species recognition in the Phialocephala fortinii - Acephala

applanata species complex using DNA analysis. Fungal Genetics and Biology, 44: 773-788.7. Tung, C.-S., Joseph, S. & Sanbonmatsu, K.Y. (2003) All-atom homology model of the Escherichia coli 30S ribosomal subunit. Nature Structural

Biology, 9: 750-7558. Chakravorty, S., Danica Helb, Burday, M., Connell, N. & Alland, D (2007) A detailed analysis of 16S ribosomal RNA gene segments for the

diagnosis of pathogenic bacteria. Journal of Microbiological Methods, 69: 330–339.9. Baker, G.C., Smith, J.J. & Cowan, D.A. (2003) Review and re-analysis of domain-specific 16S primers. Journal of Microbiological Methods, 55:

541-555.10. Berry, D., Mahfoudh, K.B., Wagner, M. & Loy, A. (2011) Barcoded primers used in multiplex amplicon pyrosequencing bias amplification,

Applied and Environmental Microbiology, 77: 7846- 7849.11. Jari Oksanen, J., Guillaume Blanchet, F., Kindt, Legendre, R.P., Minchin, P.R., O’Hara, R.B., Simpson, G.L., Solymos, P., Henry, M., Stevens, H. &

Wagner, H. (2011). vegan: Community Ecology Package. R package version 2.0-2. http://CRAN.R-project.org/package=vegan.

Schlussfolgerungen

Noch bis vor kurzem war es nicht möglich mikrobielle Lebensgemeinschaften genau zu charakterisieren. Technolo-gische Fortschritte im Bereich der NGS Technologien sowie im Bereich der Bioinformatik haben den Bereich der Metagenom-Analysen jedoch entscheidend vorangebracht. Allerdings ist mit dem technologischen Fortschritt auch die Komplexität der Metagenom-Analysen gewachsen. Um aussagekräftige Metagenom-Analysen durchzuführen, ist es unserer Erfahrung nach wichtig, folgenden Erfolgskriterien Bedeutung beizumessen:

• Es muss überlegt werden, welcher variable DNA Bereich (z.B. auf dem 16S rDNA oder ITS Regionen) für die vorgesehene Studie am besten geeignet ist. Ausgehend von diesen Überlegungen wird das optimale Primerset ermittelt (und falls möglich in einer Pilotstudie vorab überprüft).

• Um die verschiedenen Taxa repräsentativ amplifizieren und danach sequenzieren zu können, muss einerseits ein robustes und funktionelles DNA Isolationsverfahren vorhanden sein. Andererseits empfehlen wir möglichst ein „two-step“ Protokoll zu wählen, um für die nachfolgende Sequenzierung qualitative hochwertige Amplicon Libraries einsetzen zu können.

• Durchführung der Datenanalyse unter richtiger Anwendung von wenigen, dafür aber aussagekräftigen bioin-formatischen Tools.

• Bei Unerfahrenheit in einem oder mehreren der genannten Kriterien, empfiehlt es sich die Studie an einen erfahrenen Serviceanbieter outzusourcen.

Seite 6

KontaktinformationenMicrosynth AGSchützenstrasse 15CH-9436 BalgachSchweizTelefon: +41-71-722 83 33Web: www.microsynth.chE-Mail: [email protected]