Upload
lyquynh
View
218
Download
0
Embed Size (px)
Citation preview
I
Inhalt
Inhalt .............................................................................................................................................. I
Abbildungsverzeichnis.................................................................................................................. III
1 Motivation .................................................................................................................................. 1
1.1 Aufgabenstellung ................................................................................................................. 2
1.2 Verwendete Software.......................................................................................................... 2
2 Grundlagen ................................................................................................................................. 3
2.1 Mechanisch relevante Eigenschaften des Fadens ............................................................... 3
2.2 Verschiedene Drüsen und produzierende Fadentypen einer Webspinne .......................... 8
2.3 Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals ............................ 12
2.4 Spinnenseidenproteine ..................................................................................................... 14
3 Material .................................................................................................................................... 17
3. 1 Datendanken .................................................................................................................... 17
3.1.1 National Center for Biotechnology Information ......................................................... 17
3.1.2 Universal Protein Resource ......................................................................................... 17
3.1.3 Swiss Institute of Bioinformatics ................................................................................ 18
3.1.4 Protein Data Bank ....................................................................................................... 18
3.1.5 Conserved Domain Database ...................................................................................... 18
3.2 Tools für Sequenzanalyse .................................................................................................. 18
3.2.1 Hydrophobizitätsplot .................................................................................................. 18
3.2.2 Sequenzalignment ...................................................................................................... 19
3.2.3 Dotplot ........................................................................................................................ 20
3.2.4 BLAST .......................................................................................................................... 21
3.2.5 ClustalW ...................................................................................................................... 21
3.2.6 LALIGN ......................................................................................................................... 22
3.3 Strukturvorhersage-Tools .................................................................................................. 23
3.3.1 Chou-Fasman .............................................................................................................. 23
3.3.2 GOR ............................................................................................................................. 23
3.3.3 Simple Modular Architecture Research Tool .............................................................. 23
3.3.4 PROPKA ....................................................................................................................... 24
3.3.5 SWISS-MODEL ............................................................................................................. 24
3.3.6 3D-Position-Specific Score Matrices ........................................................................... 24
3.3.7 Prediction of TransMembrane Beta-Barrel Proteins .................................................. 25
II
4 Methoden und Ergebnisse ....................................................................................................... 27
4.1 Methodenkomplex 1 ......................................................................................................... 27
4.2 Methodenkomplex 2 ......................................................................................................... 31
4.3 Methodenkomplex 3 ......................................................................................................... 41
5 Zusammenfassung und Auswertung ........................................................................................ 51
5.1 Methoden .......................................................................................................................... 51
5.2 Strukturbildung der Spinnenseidenproteine ..................................................................... 54
8 Quellen ..................................................................................................................................... 60
9 Erklärung zur selbständigen Anfertigung der Arbeit ................................................................ 65
10 Anhang ................................................................................................................................... 66
III
Abbildungsverzeichnis
Abbildung 1: Gartenkreuzspinne Araneus diadematus ................................................................ 2
Abbildung 2: Spannungs-Dehnungs-Diagramm des Abseilfadens der Spinne Nephila edulis. ..... 4
Abbildung 3: Bruchspannungs-Bruchdehnungs-Diagramm verschiedenener gesponnener Fäden
des Seidenspinners Bombyx mori sowie eines Nephila edulis Spinnenfaden. ........ 6
Abbildung 4: Abhängigkeit der Bruchspannung von der Spinngeschwindigkeit und der
Körpertemperatur der Spinne Nephila edulis. ........................................................ 7
Abbildung 5: Die Gartenspinne Araneus diadematus mit ihren Drüsen und zugehörigen
Fadentypen sowie Funktionen einiger Fäden. ........................................................ 9
Abbildung 6: Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen
netzbauenden Spinnen. ......................................................................................... 11
Abbildung 7: Der natürliche Spinnprozess des „major ampullate spidroins“. ............................ 12
Abbildung 8: Querschnitt durch einen "major ampullate" Spinnenfaden. ................................. 14
Abbildung 9: Primärstruktur von "major ampullate spidroin". .................................................. 15
Abbildung 10: Hydrophobizitätsplot nach Kyte und Doolittle der N-terminalen Region der
Sequenz von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus. . 19
Abbildung 11: Ein Dotplot, eine einfache Art des paarweisen Alignments. ............................... 21
Abbildung 12: Ein einfaches Beispiel eines multiplen Alignments. ............................................ 22
Abbildung 13: Struktur von Bacteriorhodopsin innerhalb einer Doppellipidschicht,
vorhergesagt mittels PRED TMBB. ...................................................................... 26
Abbildung 14: Workflow des Arbeitsplans. ................................................................................. 27
Abbildung 15: Stabilität der terminalen Domänen des Spinnenseidenproteins in Abhängigkeit
vom pH-Wert. ..................................................................................................... 29
Abbildung 16: Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne
Latrodectus hesperus mittels GOR und Chou-Fasman. ...................................... 31
Abbildung 17: Hydrophobizitätsplot nach Kyte und Doolittle von MaSp1 sowie MaSp2 der
Spinne Latrodectus hesperus. ............................................................................. 34
Abbildung 18: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von
MaSp1. ................................................................................................................ 37
Abbildung 19: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von
MaSp2. ................................................................................................................ 38
Abbildung 20: Identifikation der terminalen Domänen von MaSp1 sowie MaSp2 der Spinne
Latrodectus hesperus mittels SMART. ................................................................ 39
Abbildung 21: CDD-Suche an MaSp1 sowie MaSp2 von L. hesperus. ......................................... 40
IV
Abbildung 22: Sequenz (N-terminal) des MaSp1 von L. hesperus im Programm Dotlet. .......... 43
Abbildung 23: Sequenz (N-terminal) des MaSp2 von L. hesperus im Programm Dotlet. .......... 44
Abbildung 24: Sequenz (Mittelteil) des MaSp1 von L. hesperus im Programm Dotlet. ............. 45
Abbildung 25: Sequenz (Mittelteil) des MaSp2 von L. hesperus im Programm Dotlet. ............. 45
Abbildung 26: Betrachtung von Proteinstrukturen mittels Rasmol 2.6. ..................................... 47
Abbildung 27: Vorhersage der Topologie von MaSp1 mittels Viterbi-Algorithmus des
PRED TMBB. ......................................................................................................... 49
Abbildung 28: Vorhersage der Topologie von MaSp2 mittels Viterbi-Algorithmus des
PRED TMBB. ......................................................................................................... 50
Abbildung 29: Workflow der durchgeführten Methoden. .......................................................... 51
Abbildung 30: Ergebnis der Identifizierung der Proteinfaltung von MaSp1 mittels 3D-PSSM. .. 66
1
1 Motivation
Spinnen existieren seit 400 Mio. Jahren, lange Zeit bevor die ersten Menschen die Erde
bevölkerten. [7, S. 7] Im Laufe der Evolution entwickelten sie verschiedene Techniken im
Kampf um das Überleben. Eine besondere Eigenschaft ist die Fähigkeit, Netze aus
Spinnenseide zu konstruieren, um Beutetiere zu fangen. Die Netze sind wahre Meisterwerke
der Natur. In kürzester Zeit geschaffen, stellen sie häufig eine erfolgreiche Beutefangmethode
dar.
Wie ist es möglich, dass ein Material trotz seines geringen Durchmessers und seiner geringen
Masse so stabil ist, um Beutetiere wie Insekten in voller Fluggeschwindigkeit abzufangen? Es
wird behauptet, dass ein Spinnenfaden, welcher den Durchmesser eines Bleistiftes besitzt,
eine Boeing 747 im Flug abfangen könnte. [25] Welche Eigenschaften sind überhaupt relevant,
wenn von einem stabilen Spinnennetz gesprochen wird?
Bereits im Mittelalter faszinierte Spinnenseide den Menschen. In dieser Zeit wurden kleine
Textilien aus Seide von Spinnen gewoben, welche jedoch sehr teuer waren. Neben der
Anwendung in Fadenkreuzen von U-Booten und Flugzeugen bis zum 2. Weltkrieg, werden
Spinnenfäden bis heute in Polynesien für den Fischfang benutzt. [31, S. 308]
In der heutigen Zeit der Rohstoffknappheit ist es nötig, andere Ressourcen zu erschließen oder
die Gewinnung bereits bestehender Ressourcen zu optimieren. Eine Hauptanwendung der
Spinnenseide könnte in der Medizin liegen, beispielsweise zum Vernähen von Wunden und
Zusammennähen von Nervenfasern oder als Arzneikapseln. Außerdem könnte Spinnenseide in
der Oberflächenveredelung sowie in der Kosmetik- und Lebensmittelindustrie Anwendung
finden. [31, S. 313]
Als Vorarbeit für die Bachelorarbeit galt die im 5. Semester geschriebene Projektarbeit, sowie
anschließendes Praxismodul. In der Projektarbeit wurde die Thematik zunächst aus dem
biologischen Blickwinkel betrachtet. Inhalte waren zum Beispiel der Netzbau, die Soziologie
der Gemeinschaft der Spinnen und einzelner Individuen, sowie die Anatomie der Spinne.
Anschließend wurde der strukturelle Aufbau und die Eigenschaften der Spinnenseide
untersucht und ein Blick in die Proteinzusammensetzung geworfen. Im Praxismodul wurde die
Arbeit weiter fortgesetzt. Die Aufgabe des Praxismoduls bestand darin, ein Modell zu
entwickeln, welches den Spinnenfaden auf molekularer Ebene beschreibt. Um dieses Ziel zu
erreichen, wurden möglichst viele vorhandene Daten gesammelt. Der Fokus lag auf der
2
Proteinzusammensetzung und dem strukturellen Aufbau des Spinnenfadens, genauer: eines
bestimmten Fadens. Der Faden, welcher in Bezug auf Festigkeit und Elastizität die besten
Eigenschaften aufweist, wurde detailliert untersucht. Betrachtete Organismen waren zum
Beispiel die Gartenkreuzspinne Araneus diadematus (siehe Abbildung 1) sowie die Goldene
Seidenspinne Nephila clavipes, an deren Fäden bereits verschiedene Experimente wie X-Ray,
Raman-Spektroskopie und Gelelektrophorese durchgeführt worden waren.
Abbildung 1: Gartenkreuzspinne Araneus diadematus
Die Gartenkreuzspinne Araneus diadematus ist eine typische, in Deutschland beheimatete Spinnenart.
1.1 Aufgabenstellung
Das Ziel der Bachelorarbeit ist das Abbilden von physiologischen Bedingungen auf die Sequenz
und das Verständnis der biologischen Prozesse. Es gilt, die β-Faltblatt-Bildung zu verstehen und
vor allem direkt nachzuweisen, in Abhängigkeit vom pH-Wert. Mit dem Wissen sollten dann,
insofern möglich, diese Strukturbildungen simuliert werden. (Was passiert, wenn der pH-Wert
verändert wird?)
1.2 Verwendete Software
Neben den Daten aus den Experimenten wurde verschiedene bioinformatische Software
verwendet, um jene Daten zu untermauern oder gar zu widerlegen. Hierzu mehr im Kapitel 3
Material.
3
2 Grundlagen
2.1 Mechanisch relevante Eigenschaften des Fadens
Spinnenseide variiert je nach Typ des Fadens stark in Aufbau und mechanischen Eigenschaften.
Der sogenannte „major ampullate“ Faden, benannt nach der sekretierenden Drüse, weist die
größte Festigkeit aller Spinnenseidenarten vor. [8, S. 3639] Dieser Faden bildet die
Grundstruktur eines Spinnennetzes. Die Spinne zieht stets einen Faden dieser Art hinter sich
her. Daher wird der „major ampullate“ Faden auch als Abseilfaden bezeichnet. [48, S. 2339]
Mehr zu den verschiedenen Fadentypen sowie den zugehörigen Drüsen siehe Kapitel 2.2. Zwei
mechanische Eigenschaften sind bei Betrachtung des Spinnenfadens von Belangen. Diese sind
die Festigkeit sowie die Bruchdehnung. Als Festigkeit bezeichnet man die Eigenschaft von
Materialien, mechanische Spannungen zu ertragen bzw. gegen Bruch und größere
Verformungen zu widerstehen. [50, S. 519] Die Bruchdehnung gibt den Grad der Verlängerung
eines Materials beim Bruch an, bezogen auf die Ausgangslänge. [50, S. 519] Mechanische
Eigenschaften eines Fadens bzw. einer Faser lassen sich am besten beschreiben durch eine
Reaktionskurve, wenn das Material gedehnt wird. Das dabei entstehende Diagramm
bezeichnet man als sogenanntes Bruchspannungs-Bruchdehnungs-Diagramm. [47, S. 542] In
jenem Diagramm ist an der Abszisse die Bruchdehnung in Prozent (0,1 = 10 %) abgetragen,
während an der Ordinate die Bruchspannung in GPa (Gigapascal) abgetragen wird, siehe
Abbildung 2. Der Begriff Bruchspannung wird verwendet, da die Deformation eines Materials
(Festigkeit) nicht nur von der einwirkenden Kraft abhängt, sondern auch von der Größe der
Fläche, in diesem Falle der Querschnitt des Fadens. [12, S. 160] Laut Diagramm in Abbildung 2
verhalten sich die Spannung und die resultierenden Dehnung bei einer Spannung von 0 bis ca.
0,02 GPa direkt proportional zueinander. Wenn die Spannung ab – bzw. zunimmt, nimmt die
Dehnung des Materials in gleichem Maße ab bzw. zu. [12, S. 161; 16, S. 121] Dieses Verhalten
gilt bis zur Proportionalitätsgrenze. Ab diesem Punkt wächst die Dehnung stärker bei
zunehmender Belastung als bisher. [12, S. 161] Viele Materialien nehmen selbst nach der
Proportionalitätsgrenze ihre Ausgangslänge bei nachlassender Spannung langsam wieder ein.
[12, S. 161; 16, S. 121] Erst ab der Elastizitätsgrenze geht die Eigenschaft der Elastizität
verloren. Dies bedeutet, dass das Material eine dauernde Formänderung beibehält, auch wenn
keine Spannung mehr einwirkt. [12, S. 162; 16, S. 121] Nimmt die Spannung weiter zu, reißt
das Material. Es kommt zum Bruch. Diesen Punkt kennzeichnet die Belastungsgrenze. [16, S.
121] Die unter der Kurve entstandene Fläche gibt die Belastbarkeit an; die Energie, die auf das
gesamte Volumen des Fadens wirkt bis dieser bricht bzw. zerreißt. [35, S. 741]
4
Abbildung 2: Spannungs-Dehnungs-Diagramm des Abseilfadens der Spinne Nephila edulis.
An der Abszisse ist die Bruchdehnung in Prozent (0,1 = 10 %) abgetragen, während an der Ordinate die
Bruchspannung in GPa (Gigapascal) abgetragen wird. Die Bruchdehnung gibt den Grad der Verlängerung eines
Materials beim Bruch an, bezogen auf die Ausgangslänge. [50, S. 519] Die Bruchspannung ist ein Begriff für die
Festigkeit eines Materials. Als Festigkeit bezeichnet man die Eigenschaft von Materialien, mechanische Spannungen
zu ertragen bzw. gegen Bruch und größere Verformungen zu widerstehen. [50, S. 519] Der Begriff Bruchspannung
wird verwendet, da die Deformation eines Materials nicht nur von der einwirkenden Kraft abhängt, sondern auch
von der Größe der Fläche, in diesem Falle der Querschnitt des Fadens. [12, S. 160] Im Diagramm erkennbar ist, dass
sich ein Seidenfaden der Spinne Nephila edulis bis zu knapp 40 % seiner Länge dehnen lässt und einer
Bruchspannung von 1,3 Gigapascal standhält, ehe es zum Bruch kommt. Aus: 2001; Vollrath, Fritz; Knight, David. P.:
Liquid crystalline spinning of spider silk
Wie bereits erwähnt, unterscheiden sich die verschiedenen Typen von Spinnenfäden stark in
ihren mechanischen Eigenschaften. Außerdem sind die Eigenschaften eines Fadens abhängig
von den Prozessbedingungen sowie von den Umweltbedingungen. Verschiedene Versuche an
der Seide des Seidenspinners Bombyx mori ergaben, dass die mechanischen Eigenschaften des
Fadens abhängig von der Spinngeschwindigkeit sind. Höhere Spinngeschwindigkeiten bewirken
festere, brüchigere Fasern, während geringere Spinngeschwindigkeiten für schwächere,
dehnbarere Fasern sorgen. [35, S. 741] Handelsübliche Seide des Seidenspinners besitzt eine
Festigkeit von 0,5 GPa, eine Bruchdehnung von 15 %, sowie eine Belastbarkeit von 6 x 104 J/kg.
[35, S. 741] Zum Vergleich: Nephila edulis Spinnenseide besitzt eine Festigkeit von 1,3 GPa,
eine Bruchdehnung von 40 % und eine Belastbarkeit von 16 x 104 J/kg. [48, S. 2342] Im
Diagramm in Abbildung 3 sind die Bruchspannungs-Bruchdehnungs-Kurven von Seidenfasern,
welche bei unterschiedlichen Spinngeschwindigkeiten produziert worden, dargestellt. Die
aufgeführten Werte wurden von gewaschenen, entschleimten Einzelfasern der Bombyx mori
Seide, von Nephila edulis Abseilfaden sowie von handelsüblicher entschleimter Bombyx mori
5
Kokonseide unter verschiedenen Bedingungen ermittelt. Handelsübliche Kokonseide wird bei
Geschwindigkeiten zwischen 4 und 15 mm/s und einer Temperatur von 20 °C gesponnen,
während die „major ampullate“ Spinnenseide von Nephila edulis bei einer Geschwindigkeit
von 20 mm/s und einer Temperatur von 25 °C gesponnen wird. Die entschleimten Einzelfasern
der Bombyx mori Seide wurden bei einer Temperatur von 25 °C und bei verschiedenen
Spinngeschwindigkeiten von 4 - 27 mm/s (siehe Diagramm) produziert. Erkennbar ist, dass ein
Bombyx mori Seidenfaden, welcher bei 4 mm/s gesponnen wurde, eine vergleichbare
Bruchdehnung wie der Nephila edulis Spinnenfaden besitzt (37 % zu 34 %, siehe Diagramm).
Wird die Spinngeschwindigkeit auf 13 mm/s erhöht, besitzt die Seide des Seidenspinners eine
ähnlich große Belastbarkeit wie die Nephila edulis Spinnenseide: Die Spinnenseide besitzt eine
Belastbarkeit von 16 x 104 J/kg, während der Bombyx mori Faden, gesponnen bei einer
Geschwindigkeit von 13 mm/s, eine Belastbarkeit von 12 x 104 J/kg besitzt, obwohl die
Festigkeit des Bombyx mori Seidenfaden nicht merklich zunimmt. Eine Festigkeit von 0,7 GPa
eines bei 13 mm/s gesponnenen Seidenfaden (die Festigkeit von Kokonseide beträgt 0,5 GPa)
ist im Vergleich zur Festigkeit von Nephila edulis Spinnenseide , welche 1,3 GPa beträgt, ein
geringer Anstieg. Wird die Spinngeschwindigkeit weiter erhöht, sinkt jedoch die Belastbarkeit
des Bombyx mori Seidenfaden. Dies resultiert aus der abnehmenden Dehnbarkeit: Ein
Seidenfaden, gesponnen bei einer Geschwindigkeit von 13 mm/s, besitzt eine Bruchdehnung
von 34 %, während ein Seidenfaden, welcher bei einer Geschwindigkeit von 27 mm/s
gesponnen wurde, eine Bruchdehnung von 17 % besitzt. Abhängig von der
Spinngeschwindigkeit ist Bombyx mori Seide entweder fest oder dehnbar; Spinnenseide
hingegen kombiniert beide Eigenschaften, bei Spinngeschwindigkeiten, die für die
Konstruktion des Spinnennetzes charakteristisch sind (10-20 mm/s). [35, S. 741]
6
Abbildung 3: Bruchspannungs-Bruchdehnungs-Diagramm verschiedenener gesponnener Fäden des
Seidenspinners Bombyx mori sowie eines Nephila edulis Spinnenfaden (pink).
Die unterschiedlichen Graphen der Bombyx mori Seidenfaden resultieren aus den jeweils verschiedenen
Spinngeschwindigkeiten (in mm/s) der produzierten Fäden. Erkennbar ist, dass ein Bombyx mori Seidenfaden,
welcher bei 4 mm/s gesponnenen wurde, eine vergleichbare Bruchdehnung wie der Nephila edulis Spinnenfaden
besitzt (37 % zu 34 %). Aus: 2002; Zhengzhong, Shao; Vollrath, Fritz: Surprising strength of silkworm silk.
Spinnenseide ist sehr robust und gleichzeitig sehr leicht. Die Festigkeit eines Spinnenfadens ist
bemerkenswert und mit der von Nylon vergleichbar. Der Lauffaden von Araneus diadematus
besitzt eine Festigkeit von 7,8 g/denier. Dies bedeutet, dass der Spinnenfaden von 9
Kilometern Länge 7,8 g wiegt. Zum Vergleich: Ein Nylonfaden hat den Wert 8,7 g/denier. Somit
ist der Spinnenfaden dehnbarer als ein Nylonfaden (31 % vs. 16 %). Ein Lauffaden von Araneus
diadematus kann demnach 80 Kilometer lang sein, ehe er aufgrund seines Eigengewichtes
reißt. [26] Die Festigkeit von industriellem Stahl beträgt 1,5 GPa. [17, S. 3296] Da die
Spinnenseide eine geringere Dichte als Stahl besitzt, ist Spinnenseide in Bezug auf das Gewicht
das stärkere Material. [47, S. 542] Kevlar, ein künstlich hergestelltes Fasermaterial, ist 3x fester
als Spinnenseide. Doch aufgrund der Tatsache, dass Spinnenseide 8x dehnbarer ist, ist
Spinnenseide 5x belastbarer als Kevlar. [47, S. 542]
7
Abbildung 4: Abhängigkeit der Bruchspannung von der Spinngeschwindigkeit und der
Körpertemperatur der Spinne Nephila edulis.
Die schwarzen Kreise zeigen die Abhängigkeit der Bruchspannung (GPa) von der Spinngeschwindigkeit (mm/s), die
weißen Kreise die Abhängigkeit von der Körpertemperatur (° C). Erkennbar ist, dass mit zunehmender
Körpertemperatur die Bruchspannung zunimmt, während bei steigender Spinngeschwindigkeit ab ca. 13-19 mm/s
die Bruchspannung abnimmt. Aus: 2001; Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk
Allein die Tatsache, dass natürlich gesponnene Seide ihre Eigenschaften in Abhängigkeit von
der Spinngeschwindigkeit ändert, erschwert die Analyse und Untersuchungen der Seide. Wie
kommt es, dass sich die mechanischen Eigenschaften so stark verändern, wenn die
Spinngeschwindigkeit variiert? Das Geheimnis muss im Inneren des Seidenfadens liegen, in der
Struktur der Proteine. Die Abhängigkeit der mechanischen Eigenschaften von den
Spinnbedingungen wird in Abbildung 4 verdeutlicht. Dargestellt ist die Abhängigkeit der
Bruchspannung (in GPa) von der Spinngeschwindigkeit (in mm/s) sowie von der
Körpertemperatur (in ° C) der produzierenden Spinne Nephila edulis. Erkennbar ist, dass mit
zunehmender Körpertemperatur die Bruchspannung zunimmt, während bei steigender
Spinngeschwindigkeit ab ca. 13-19 mm/s die Bruchspannung abnimmt.
8
2.2 Verschiedene Drüsen und produzierende Fadentypen einer
Webspinne
Die Webspinnen (Araneae) gehören der Klasse der Spinnentiere (Arachnida) an, welche zum
Stamm der Gliederfüßer (Arthropoda) gehört. Zu den Spinnentieren gehören die „klassischen“
Spinnen, aber auch Weberknechte, Skorpione, Pseudoskorpione und Milben. Dabei umfasst
die Familie der Araneae die, nach den Milben, artenreichste Ordnung der Arachnida. [7, S. 22]
Die Webspinnen gelten oft als Vorzeigebeispiel für eine Spinne, da Spinnen üblicherweise wie
folgt vorgestellt werden: Eine Spinne besitzt 8 Beine, Kieferklauen am Kopf, Warzen am
Hinterleib und baut Netze. Doch neben den netzbauenden Spinnen umfasst die Ordnung der
Araneae auch einige Arten, die ihre Beute im Lauf oder Sprung überfallen. [5, S. 18, S. 20] Die
meisten Vertreter der Familie der Wolfsspinnen (Lycosidae) bauen keine Fangnetze und sind
daher in dieser Bachelorarbeit von geringem Interesse. [5, S. 144] Da die Eigenschaften von
Spinnenseide stark von den Prozessbedingungen wie Spinngeschwindigkeit, Körpertemperatur
und anderen Faktoren abhängig sind, ist eine einheitliche Analyse der Seide nur schwer
möglich. Erschwerend kommt hinzu, dass eine Spinne viele verschiedene Arten von Seide
produzieren kann. [49, S. 68] In Abbildung 5 ist die Gartenspinne Araneus diadematus samt
ihren Seidendrüsen sowie produzierende Fadentypen dargestellt. Anhand dieser Abbildung
wird deutlich, wie komplex eine Spinne in Bezug auf die Fadenproduktion ist. Je nach Zweck
werden unterschiedliche Fäden gebildet. Jede Drüse stellt einen anderen Fadentyp oder
anderen Bestandteil des Fadens her. Eine männliche Spinne der Art Araneus diadematus kann
bis zu 5 verschiedene Fadentypen produzieren, eine weibliche Spinne sogar bis zu 7
verschiedene. Die weibliche Spinne kann mit Hilfe der zylinderförmigen Drüse (Cylindrical) und
der traubenförmigen Drüse (Aciniforme) die Seidenfäden herstellen, welche die Hülle für die
Eier bilden. Der Faden aus der traubenförmigen Drüse kann außerdem noch als Faden zur
Umwicklung der Beute dienen. [13, S. 80] Die nachfolgend genannten Drüsen existieren in
weiblichen sowie in männlichen Spinnen. Die „Minor Ampullate“ bzw. kleine ampullenförmige
Drüse sekretiert den Faden für die Hilfsspirale. Die Hilfsspirale wird nur bei der
Netzkonstruktion benötigt und später durch die Fangspirale ersetzt, da die Herstellung der
Hilfsspirale enorm viele körpereigene Proteine benötigt. Die flagellenförmige Drüse
(Flagelliforme) sekretiert den Seidenfaden für die Fangspirale, welche als Beutefangmethode
dient. Die Fäden der Fangspirale sind mit kleinen klebrigen Tröpfchen besetzt und hindern so
die Beute zu fliehen. Diese Tröpfchen werden von der haufenförmigen Drüse (Aggregate)
hergestellt. Der Befestigungsklebstoff, welcher die einzelnen Fäden während der
Netzkonstruktion miteinander verknüpft, wird in der birnenförmigen Drüse (Piriforme)
9
sekretiert. Die „Major Ampullate“ oder große ampullenförmige Drüse produziert den Faden,
der für die Grundstruktur des Netzes benötigt wird, sowie der Spinne als Abseilfaden dient.
[49, S. 68-71] Der Faden aus der großen ampullenförmigen Drüse ist für die Forschung von
besonderem Interesse, da er eine enorme Stabilität aufweist. Außerdem kombiniert er die
Eigenschaft der Festigkeit mit der Eigenschaft der Elastizität in beachtlichem Maße. [13, S. 80]
Aus diesem Grund wurden die meisten Experimente und Untersuchungen am „major
ampullate“ Faden durchgeführt.
Abbildung 5: Die Gartenspinne Araneus diadematus mit ihren Drüsen und zugehörigen Fadentypen sowie
Funktionen einiger Fäden.
Die Drüsen sind nach ihren Lateinischen Namen benannt. Die Fadentypen sind entsprechend nach ihrem
Entstehungsort, der sekretierenden Drüse, benannt. Jede Drüse stellt einen anderen Fadentyp oder anderen
Bestandteil des Fadens her. Eine männliche Spinne der Art Araneus diadematus kann bis zu 5 verschiedene
Fadentypen produzieren, eine weibliche Spinne sogar bis zu 7 verschiedene. Die weibliche Spinne kann mit Hilfe der
zylinderförmigen Drüse (Cylindrical) und der traubenförmigen Drüse (Aciniforme) die Seidenfäden herstellen,
welche die Hülle für die Eier bilden. Der Faden aus der traubenförmigen Drüse kann außerdem noch als Faden zur
Umwicklung der Beute dienen. [13, S. 80] Die nachfolgend genannten Drüsen existieren in weiblichen sowie in
männlichen Spinnen. Die „Minor Ampullate“ bzw. kleine ampullenförmige Drüse sekretiert den Faden für die
Hilfsspirale. Die Hilfsspirale wird nur bei der Netzkonstruktion benötigt und später durch die Fangspirale ersetzt, da
die Herstellung der Hilfsspirale viele körpereigene Proteine benötigt. Die flagellenförmige Drüse (Flagelliforme)
sekretiert den Seidenfaden für die Fangspirale, welche als Beutefangmethode dient. Die Fäden der Fangspirale sind
mit kleinen klebrigen Tröpfchen besetzt und hindern so die Beute zu fliehen. Diese Tröpfchen werden von der
haufenförmigen Drüse (Aggregate) hergestellt. Der Befestigungsklebstoff, welcher die einzelnen Fäden während der
Netzkonstruktion miteinander verknüpft, wird in der birnenförmigen Drüse (Piriforme) sekretiert. Die „Major
Ampullate“ oder große ampullenförmige Drüse produziert den Faden, der für die Grundstruktur des Netzes
benötigt wird sowie der Spinne als Abseilfaden dient. [49, S. 68-71] Aus: 2000; Vollrath, Fritz: Strength and structure
of spiders' silks.
10
Wie bereits erwähnt variieren die Eigenschaften ein und desselben Fadentyps innerhalb
verschiedener Spinnenarten stark. Aus diesem Grund wurden verschiedene netzbauende
Spinnen bezüglich ihrer produzierenden Abseilfäden untersucht. Abbildung 6 zeigt ein
Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen netzbauenden Spinnen.
Darin sind die Abseilfäden der Spinnen Euprosthenops sp. (1), Cyrtophora citricola (2),
Latrodectus mactans (3), Araneus diadematus (4), Nephila edulis (5) dargestellt. Anhand des
Diagramms ist erkennbar, dass die Seide von Euprosthenops sp. fester (benötigt mehr Kraft um
zu brechen) aber weniger elastisch als die Seide von Nephila edulis ist. (Außerdem existieren
Unterschiede in den Elastizitätsbereichen bis zur Elastizitätsgrenze. Das heißt bei gleicher
Belastung weisen die Fäden ein unterschiedliches Verhalten im Elastizitätsbereich auf. Ein
ähnliches Verhalten zeigt sich beim Vergleich eines Plastikstabes gegenüber einem Streifen
Klebeband. Der Plastikstab bricht bei einer hohen Belastung ohne sichtbare
Dehnungserscheinung durch, wobei das Klebeband bei einer hohen Belastung eine sichtbare
Dehnung aufweist, welche jedoch irreversibel ist. Der Faden von Euprosthenops sp. verhält sich
ungefähr wie der Plastikstab, während der Faden von Nephila edulis das Verhalten eines
Klebebands zeigt. Der Faden von Euprosthenops sp. bricht bei einer Bruchspannung von 1,5
GPa, kann aber nur bis zu ca. 15 % seiner Ausgangslänge gedehnt werden. Der Faden von
Nephila edulis reißt bei einer Bruchspannung von ca. 0,9 GPa, kann jedoch bis zu knapp 40 %
seiner Ausgangslänge gedehnt werden.
Der optimale Spinnenfaden in Bezug auf beide Eigenschaften ist ein Spinnenfaden, welcher
einen guten Kompromiss beider Eigenschaften herstellt. Laut dem Diagramm in Abbildung 6 ist
dies der Spinnenfaden von Latrodectus mactans. [47, S. 542]
Es liegen daher nicht nur große Unterschiede zwischen den jeweiligen Fadentypen ein und
derselben Spinne vor, sondern auch zwischen den gleichen Fadentypen von verschiedenen
Spinnenarten. Jede Spinnenart sekretiert andere Proteine in den jeweiligen Drüsen. Dadurch
entstehen die artspezifischen Eiweißfäden. Doch die Primärstruktur allein beeinflusst nicht die
Eigenschaften eines Spinnfadens. [13, S. 83] Die Unterschiede zwischen den Arten entstehen
unter anderem durch Unterschiede in der chemischen Zusammensetzung der Spinnlösung und
durch verschiedene Umweltbedingungen. Die Eigenschaften des Fadens sind durch die Spinne
in vielerlei Hinsicht kontrollierbar. Die Spinnbedingungen können von der Spinne selbst
beeinflusst werden, indem die Geschwindigkeit, mit der der Faden mit den Beinen heraus
gezogen wird, geändert wird. Indem die Spinne das Netz zu verschiedenen Tageszeiten
11
konstruiert, liegen unterschiedliche Temperaturen vor, welche die Eigenschaften des Fadens
ebenfalls beeinflussen können. [47, S. 542]
Abbildung 6: Spannungs-Dehnungs-Diagramm der Abseilfäden von 5 verschiedenen netzbauenden Spinnen.
Euprosthenops sp. (1), Cyrtophora citricola (2), Latrodectus mactans (3), Araneus diadematus (4), Nephila edulis (5)
Anhand des Diagrammes ist erkennbar, dass die Seide von Euprosthenops sp. fester (benötigt mehr Kraft um zu
brechen) aber weniger elastisch als die Seide von Nephila edulis ist. Außerdem existieren Unterschiede in den
Elastizitätsbereichen bis zur Elastizitätsgrenze. Das heißt bei gleicher Belastung weisen die Fäden ein
unterschiedliches Verhalten im Elastizitätsbereich auf. Der Faden von Euprosthenops sp. bricht bei einer
Bruchspannung von 1,5 GPa, kann aber nur bis zu ca. 15 % seiner Ausgangslänge gedehnt werden. Der Faden von
Nephila edulis reißt bei einer Bruchspannung von ca. 0,9 GPa, kann jedoch bis zu knapp 40 % seiner Ausgangslänge
gedehnt werden. Der optimale Spinnenfaden in Bezug auf beide Eigenschaften ist ein Spinnenfaden, welcher einen
guten Kompromiss beider Eigenschaften herstellt. In diesem Diagramm ist dies der Spinnenfaden von Latrodectus
mactans. Aus: 2001; Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk
12
2.3 Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals
Die Seidenproteine werden in den Epithelzellen der jeweiligen Spinnendrüse synthetisiert. Als
Epithel bezeichnet man die oberste Zellschicht des Haut- und Schleimhautgewebes von
Eukaryonten (dazu zählen: Tiere, Pilze, Pflanzen, Mensch). [23, S. „2-10“] Das genaue
Geheimnis der Struktur der Seidenproteine ist bis heute gänzlich ungeklärt, es existieren
lediglich verschiedene Theorien. Es wird davon ausgegangen, dass die Proteine keine definierte
Sekundärstruktur, sondern eine Art Vorstruktur einnehmen. [8, S. 3645; 14, S. 999] Nach der
Synthese werden die Proteine innerhalb der Drüse im sogenannten Lumen gespeichert. [10, S.
239] Das Lumen ist eine cytologische Bezeichnung für den Innenraum von Zellen. [23, S. „8-
74“, S. „10-17“] Dort liegen die Proteine in einer wässrigen Natriumchlorid-Lösung in sehr
hoher Konzentration vor, bis zu 50 % w/v (weight/volume = 50 Gramm Protein in 100 ml
Lösung). [36, S. 999] Trotz der enorm hohen Konzentration kristallisieren oder verklumpen die
Proteine nicht, sondern liegen innerhalb der Lösung flüssig vor. [13, S. 83] Während der
Speicherung der Proteine in der Drüse, auch Sack oder Ampulle genannt, sorgt Natriumchlorid
für die nötige Konservierung der Stabilität der Proteine. Aufgrund der „einsalzenden“ Wirkung
von Natriumchlorid können die Seidenproteine trotz der hohen Konzentration den flüssigen
Zustand beibehalten. [8, S. 3645; 13, S. 83; 54] Die Proteine müssen daher zur Lösung hin eine
enorm stabile Struktur aufweisen. Außerdem werden durch Natriumchlorid die
Wechselwirkungen zwischen den Seidenproteinen unterbunden. [13, S. 83; 54]
Abbildung 7: Der natürliche Spinnprozess des „major ampullate spidroins“.
Der Prozess lässt sich in 5 Teilbereiche unterteilen: i) die Proteinsekretion im Epithel ii) die Speicherung der Protein
innerhalb des Lumen (Innenraum) der Drüse in sehr hoher Konzentration (50 % w/v) iii) die Umstrukturierung der
Proteine innerhalb des Spinnkanals durch Ionenaustausch, Ansäuerung, Wasserentzug, Scherkräfte und
Dehnungskräfte in eine Proteinfaser iv) die Streckung der Proteinfaser durch eine Art Ventil v) endgültige
Formgebung durch Ziehen und Strecken der Seidenfaser mit Hilfe der Gliedmaßen der Spinne. Aus: 2011; Eisoldt,
Lukas; Smith, Andrew; Scheibel, Thomas: Decoding the secrets of spider silk.
13
Abbildung 7 zeigt den typischen Weg der Spinnenseidenproteine von der Synthese bis zum
fertigen Faden. Das Schema beschreibt den Assemblierungsprozess des Proteins, welches in
der großen ampullenförmigen Drüse produziert wird, dem sogenannten „major ampullate
spidroin“ (MaSp oder MAS). Im Spinnkanal sorgen Veränderungen der chemischen und
physikalischen Bedingungen für eine Umstrukturierung der Seidenproteine. [8, S. 3644-3645;
13, S. 83] Natriumchlorid wird gegen Kaliumphosphat ausgetauscht, der pH-Wert nimmt von
7,0 auf ca. 6,2 ab, Wasser wird entzogen, Scher – und Dehnkräfte treten auf. [31, S. 312; 14, S.
999] Solange Natriumchlorid in der Lösung vorkommt, wird ein Zusammenbau und
Aggregation der spidroins verhindert. Erst wenn Kaliumphosphat das Natriumchlorid ersetzt,
beginnen die Seidenproteine eine komplexe Struktur anzunehmen. [8, S. 3645] Die pH-
Abnahme sowie der Wasserentzug verstärken diese Strukturbildung. [36, S. 999] Die
endgültige Struktur wird aufgrund von auftretenden Scher – und Dehnkräften gebildet. All die
genannten Faktoren bewirken, dass das hoch konzentrierte Seidenproteingemisch eine
Faserform annimmt. [8, S. 3645] Letztendlich tritt die flüssige Faser durch die Spinnenwarze
aus. Mit den Gliedmaßen zieht die Spinne die Faser heraus, welche sich durch diesen
Zugmechanismus endgültig verfestigt. [31, S. 312; 8, S. 3647]
14
2.4 Spinnenseidenproteine
Spinnenseide besteht im Wesentlichen aus zwei Proteinen. Im Falle eines „major ampullate“
Spinnenfadens werden die Proteine entsprechend als „major ampullate spidroin“ 1 und 2
(MaSp1, MaSp2) bezeichnet. [14, S. 159; 16, S. 8] Im fertigen Faden befindet sich im Inneren
des Seidenkerns überwiegend das Protein MaSp2. Dies sorgt aufgrund seines vorwiegend
amorphen, unstrukturierten Charakters für die Elastizität des Spinnfadens. MaSp2 ist in MaSp1
eingebaut. Anders als MaSp2 besteht MaSp1 hauptsächlich aus β-Faltblatt-Kristallen, welche
für die hohe Festigkeit des Fadens sorgen. Der Seidenkern ist umgeben von einer
Glycoproteinschicht und einer Lipidschicht. Die Glycoproteinschicht sorgt für die Klebrigkeit
des Fadens, wobei die Lipidschicht den Faden vor Mikroorganismen schützt und außerdem als
sexuelles Pheromon fungiert. [14, S. 163] Zusätzlich, wenn es sich um den Faden der
Hilfsspirale handelt, befindet sich zwischen dem MaSp1 und der Glycoproteinschicht eine
Außenhaut, die der Hilfsspirale eine besondere Stabilität verleiht. [14, S. 160; 15, S. 23; 16, S.
8] In Abbildung 8 ist der Querschnitt durch einen „major ampullate“ Spinnenfaden dargestellt.
Darin ist der eben beschriebene Aufbau eines Abseilfadens gut zu erkennen.
Abbildung 8: Querschnitt durch einen "major ampullate" Spinnenfaden.
Im Innersten des Seidenkerns befindet sich überwiegend „major ampullate spidroin“ 2 (MaSp2), welches in „major
ampullate spidroin“ 1 (MaSp1) eingebaut ist. MaSp2 sorgt aufgrund seines amorphen, unstrukturierten Charakters
für die Elastizität des Spinnfadens, während MaSp1 hauptsächlich aus β-sheet-Kristallen besteht, welche dem Faden
die hohe Festigkeit verleihen. Zusätzlich, wenn es sich um den Faden der Hilfsspirale handelt, befindet sich zwischen
dem MaSp1 und der Glycoproteinschicht eine Außenhaut, die der Hilfsspirale eine besondere Stabilität verleiht. Im
Innersten des Seidenkerns entsteht ein sogenanntes 3-Phasen-Modell. Dies besteht aus überwiegend amorphen
Regionen des MaSp2 und aus wenigen amorphen Regionen des MaSp1 sowie aus überwiegend β-Faltblatt-Kristallen
des MaSp1 und aus wenigen β-Faltblatt-Kristallen des MaSp2. Aus: 2009; Heim, Markus; Römer, Lin; Scheibel,
Thomas: Hierarchical structures made of proteins. The complex architecture of spider webs and their constituent
silk proteins
MaSp1 besitzt neben den in hoher Anzahl vorhandenen β-Faltblatt-Kristallen einige amorphe
Regionen, welche keine β-Faltblätter enthalten. MaSp2 dagegen besitzt neben den in hoher
15
Anzahl vorhandenen amorphen, unstrukturierten Regionen einige kristalline Regionen, welche
β-Faltblätter enthalten. Im Innersten des Seidenkerns sind einige β-Faltblatt-Kristalle in den
amorphen Regionen eingebaut. Dabei stammt der größte Anteil amorpher Regionen aus dem
MaSp2, während ein kleiner Anteil dem MaSp1 entstammt. Durch diese Anordnung der
Strukturen im Innersten des Seidenkerns, entsteht ein sogenanntes 3-Phasen-Modell. Dies
besteht aus überwiegend amorphen Regionen des MaSp2 und aus wenigen amorphen
Regionen des MaSp1, sowie aus überwiegend β-Faltblatt-Kristallen des MaSp1 und aus
wenigen β-Faltblatt-Kristallen des MaSp2. [13, S. 82, 84; 18, S. 161]
Wie kommt der große Unterschied in der Struktur der beiden Seidenproteine zu Stande?
Aufschluss darüber gibt die Betrachtung der Primärstruktur. Die Sequenz beider Proteine lässt
sich in 3 Teilbereiche untergliedern: Der hoch konservierten N-terminalen Region, der
repetitiven Kernsequenz und der hoch konservierten C-terminalen Region. [14, S. 160; 15, S.
23; 16, S. 8] Die hoch repetitive Kerndomäne besteht aus iterativen Wiederholungen (bis zu
100-mal) von Aminosäuremotiven. [31, S. 309] Die Motive bestehen überwiegend aus Alanin
und Glycin, MaSp2 besitzt zusätzlich noch Pentapeptidabschnitte, welche Prolin enthalten. Die
Kernsequenz ist umgeben von evolutionär hoch konservierten kleinen terminalen Regionen,
welche nicht repetitiv sind. [14, S. 160; 15, S. 23] Abbildung 9 zeigt die Primärstruktur von
„major ampullate spidroin“. Grün hervorgehoben sind die beiden terminalen Regionen, welche
nicht repetitiv sind (NR). Zwischen den terminalen Regionen befindet sich die große
Kernsequenz mit ihren iterativen Wiederholungen von Aminosäuremotiven (X, Y).
Abbildung 9: Primärstruktur von "major ampullate spidroin".
Die Sequenz besteht aus einer repetitiven Kernsequenz sowie aus einer hoch konservierten N-terminalen Region
und einer hoch konservierten C-terminalen Region. Beide terminale Regionen sind nicht repetitiv (NR). Die
Kernsequenz besteht aus iterativen Wiederholungen (bis zu 100-mal) von Aminosäuremotiven (X, Y). Aus: 2007;
Römer, Lin; Scheibel, Thomas: Spinnenseidenproteine. Grundlage für neue Materialien.
Beide spidroins, MaSp1 und MaSp2, enthalten Poly-Alanin-Muster. Außerdem enthalten beide
Sequenzen glycinreiche Bereiche. MaSp2 besitzt deutlich mehr sowie deutlich größere
glycinreiche Regionen und weniger Poly-Alanin-Bereiche als MaSp1. [27, S. 8] Ein weiterer
16
Unterschied ist, dass die Kernsequenz von MaSp2 überwiegend aus GPGXX-Motiven aufgebaut
ist, anders als die Kernsequenz von MaSp1, welche aus GGX-Motiven in zwei – bis vierfacher
Wiederholung besteht. Das X steht hierbei für eine beliebige Aminosäure. Die Besonderheit an
MaSp2 ist das enthaltene Motiv QQ (Q=Glutamin), jedoch ist die Funktion dieses Motivs noch
unklar. Beide Proteinsequenzen enthalten außerdem die Aminosäure Cystein, welche vor
allem in den C-terminalen Regionen vorkommt. [27, S. 8, 9] Die Daten über die Sequenzmotive
wurden während der Arbeit im Praxismodul ermittelt und zusammen getragen, mit Hilfe des
National Center for Biotechnology Information. Cystein ermöglicht die Bildung von
Disulfidbrücken. Disulfidbrücken sind kovalente Bindungen zwischen jeweils zwei Cysteinen.
Diese Bindungen entstehen aber nicht bei allen Cysteinen, sondern sind sehr spezifisch. [23, S.
„5-19“]
Mittels verschiedener durchgeführter Experimente war es möglich, auf die Sekundärstruktur
(und Tertiärstruktur) der spidroins zu schließen. Anhand von Röntgenbeugungsanalyse (X-ray)
und Kernmagnetresonanz (NMR-nuclear magnetic resonance) wurden Nanokristalle (2 x 5 x 7
nm), welche aus β-Faltblättern bestehen, identifiziert. [47, S. 545; 13, S. 82; 18, S. 162; 20, S.
6517] Mittels Rasterelektronenmikroskopie (SEM-scanning electron microscopy) und
Atomkraftmikroskopie (AFM-atomic force microscopy) wurden kleine mizellenartige
Unterstrukturen der sich in einer wässrigen Lösung befindenden spidroins entdeckt. [18, S.
1058] Transmissionselektronmikroskopie-Versuche belegen ebenfalls eine Bildung von
mizellenartigen Strukturen. [20, S. 8908] Die Poly-Alanin-Motive der „major ampullate
spidroins“ bilden β-Faltblätter aus. [47, S. 545; 13, S. 82; 20, S. 6515] Diese Faltblätter können
miteinander wechselwirken, indem je ein Faltblatt über Wasserstoffbrücken mit dem Faltblatt
eines benachbarten Proteins verbunden wird. [23, S. „5-17“] Die GGX-Motive (in zwei – bis
vierfacher Wiederholung) des MaSp1 bilden eine 310-Helix-Struktur aus. [3, S. 1; 16, S. 9; 20, S.
6516] Durch diese Struktur können keine Querverbindungen zu benachbarten Proteinen
hergestellt werden, wodurch eine gewisse Beweglichkeit entsteht, die dem Faden die
Elastizität verleiht. [3, S. 1-2; 16, S. 9] Anstelle der GGX-Motive des MaSp1 bilden die GPGXX-
Motive des MaSp2 eine β-turn-Struktur (β-turn = β-Schleife) aus. Diese sorgt ebenso wie die
310-Helix für die Elastizität des Spinnfadens. [3, S. 1-2; 16, S. 9; 20, S. 6516] All die
beschriebenen Strukturmerkmale der jeweiligen Motive der Kernsequenz charakterisieren den
fertigen Spinnfaden, existieren jedoch nicht zu Beginn, während der Speicherung der
Seidenproteine in der Drüse. Erst im Spinnkanal entstehen die beschriebenen Strukturen der
Kernsequenz beider spidroins. [13, S. 83] Die terminalen Regionen der Sequenz beider
Spinnenseidenproteine verhalten sich anders. Sie falten sich direkt nach der Synthese des
17
Seidenproteins in eine stabile Form. Daher werden die terminalen Regionen auch als terminale
Domänen bezeichnet. Eine Proteindomäne ist eine Untereinheit eines Proteins, welche eine
eigene Struktur und/oder eine eigene Funktion besitzt. [23, S. „5-18“] Außerdem wird davon
ausgegangen, dass die terminalen Domänen einen großen Einfluss auf den
Strukturbildungsprozess der repetitiven Bereiche während der Umstrukturierung im
Spinnkanal haben. [20, S. 8908; 22, S. 236, 237; 23, S. 239-240]
3 Material
Nachfolgend werden thematisch die einzelnen Programme und Tools sowie diverse
bioinformatische Datenbanken bzw. Suchmaschinen, welche in dieser Bachelorarbeit
angewandt worden sind, aufgelistet.
3. 1 Datenbanken
3.1.1 National Center for Biotechnology Information
Das National Center for Biotechnology Information (NCBI) wurde 1988 an der National Library
of Medicine der USA gegründet. Ziel und Aufgabe des NCBI ist es, mittels mathematischer
Werkzeuge bzw. Computertools die molekularen Grundlagen von Krankheiten zu untersuchen.
Im Groben umfasst dieses Ziel drei Hauptaufgaben: Die Analyse der Sequenz eines Gens oder
Genproduktes; analysierte Gene verstehen; Strukturvorhersagen von analysierten Molekülen
treffen. [29, S. 34, 35] Das NCBI beinhaltet verschiedene Software bzw. Suchmaschinen, die
über die NCBI-Website frei zugänglich sind. In der Bachelorarbeit angewandte Tools des NCBI
waren BLAST sowie Entrez. BLAST (Basic Local Alignment Search Tool) besteht aus einer Reihe
bioinformatischer Programme, welche zum Auffinden ähnlicher und homologer Sequenzen
einer Eingabesequenz dienen. [29, S. 38] Entrez ist eine Suchmaschine, die nach Eingabe eines
Suchbegriffes die verschiedenen Datenbanken des NCBI auf Literaturzitate und biologische
Daten hin durchsucht und entsprechende Treffer ausgibt. [29, S. 38]
3.1.2 Universal Protein Resource
Die Universal Protein Resource (UniProt) ist ein Konsortium aus drei verschiedenen
Datenbanken. Es trägt Proteindaten des European Bioinformatics Institute (EBI), des Swiss
Institute of Bioinformatics (SIB) und der Protein Information Resource (PIR) zusammen. [37, S.
D142]
18
3.1.3 Swiss Institute of Bioinformatics
Das Swiss Institute of Bioinformatics (SIB) ist eine freie akademische Stiftung, welche 1998
gegründet wurde. [38] Es enthält eine ausführliche Sammlung von Tools, welche der
Untersuchung von Proteinen, Genomen, Phylogenetischen Ansätzen und anderen biologischen
Daten dient. [38] Diese Sammlung wird als ExPASy bezeichnet und ist per Internetportal frei
zugänglich. ExPASy enthält Verweise zu verschiedenen bioinformatischen Werkzeugen. In der
Bachelorarbeit angewandte Tools waren zum Beispiel: SWISS-MODEL, SMART (Simple Modular
Architecture Research Tool), ProtScale, GOR, CFSSP (Chou-Fasman Secondary Structure
Prediction Server), Dotlet, sowie der Protein-3D-Viewer Rasmol.
3.1.4 Protein Data Bank
Die Protein Data Bank (PDB) ist eine Sammlung über experimentell bestimmter Strukturen von
Proteinen, Nukleinsäuren und Proteinkomplexen. [29, S. 48] Diese Strukturen wurden mittels
Kernmagnetresonanz und/oder mittels Röntgenstrukturanalysen ermittelt. Ein PDB-Datensatz
enthält Koordinaten der enthaltenen Atome, Literaturzitate, Daten über die durchgeführten
Experimente sowie Informationen zur Primär- und Sekundärstruktur des Proteins bzw. der
Nukleinsäure. [29, S. 48-49]
3.1.5 Conserved Domain Database
Die Conserved Domain Database (CDD) wird vom NCBI unterhalten und ist über selbige frei
zugänglich. Die CDD beinhaltet eine Sammlung von Sequenzalignments und Steckbriefen,
welche für verschiedene, durch molekulare Evolution konservierte Proteindomänen
repräsentativ sind. Außerdem sind Alignments von Domänen bekannter dreidimensionaler
Proteinstrukturen aus anderen Datenbanken enthalten. Dadurch kommt es zur teilweisen
Redundanz der enthaltenen Daten. [21, S. 225] Die CDD wurde während der Bachelorarbeit
genutzt, um eine ähnliche Proteindomäne des eingegeben Spinnenseidenprotein zu finden und
daraufhin eine Struktur der Domäne des Spinnenseidenproteins abzuleiten.
3.2 Tools für Sequenzanalyse
3.2.1 Hydrophobizitätsplot
Mit Hilfe eines Hydrophobizitätsplots ist es möglich, eine Proteinsequenz bezüglich der
hydrophoben bzw. hydrophilen Eigenschaften ihrer enthaltenen Aminosäuren zu untersuchen.
Dabei existiert für jede einzelne Aminosäure ein bestimmter Zahlenwert, der die
Hydrophobizität angibt. Je höher dieser Wert ist, desto hydrophober ist eine Aminosäure. [29,
19
S. 19] Entsprechend werden diese Daten in einem Plot dargestellt. Ein Beispiel für einen
Hydrophobizitätsplot ist der Hydrophobizitätsplot nach Kyte und Doolittle, siehe Abbildung 10.
Der Hydrophobizitätsplot nach Kyte und Doolittle ist beispielsweise über das Tool ProtScale
des SIB (ExPASy) verfügbar. In Abbildung 10 ist der Hydrophobizitätsplot der N-terminalen
Region der Sequenz von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus
dargestellt. An der Abszisse sind die Positionen der enthaltenen Aminosäuren abgetragen,
während an der Ordinate die jeweiligen Zahlenwerte der Hydrophobizität angegeben sind.
Eine Aminosäure ist hydrophob, wenn der Zahlenwert größer Null ist. [29, S. 19] Ist der
Zahlenwert kleiner Null, ist die Aminosäure bzw. der Proteinabschnitt hydrophil. Der größte
Wert der Hydrophobizität beträgt 2,889, der kleinste Wert beträgt -1,700. Gut zu erkennen ist,
dass der Großteil der Aminosäuren hydrophobe Werte aufweist. Somit ist die N-terminale
Domäne von „major ampullate spidroin 1“ der Spinne Latrodectus hesperus hydrophob.
Abbildung 10: Hydrophobizitätsplot nach Kyte und Doolittle der N-terminalen Region der Sequenz von „major
ampullate spidroin 1“ der Spinne Latrodectus hesperus.
An der Abszisse sind die Positionen der enthaltenen Aminosäuren abgetragen, während an der Ordinate die
jeweiligen Zahlenwerte der Hydrophobizität angegeben sind. Eine Aminosäure ist hydrophob, wenn der Zahlenwert
größer Null ist. Ist der Zahlenwert kleiner Null, ist die Aminosäure bzw. der Proteinabschnitt hydrophil. Der größte
Wert der Hydrophobizität beträgt 2,889, der kleinste Wert beträgt -1,700. Gut zu erkennen ist, dass der Großteil der
Aminosäuren hydrophobe Werte aufweist.
3.2.2 Sequenzalignment
Ein (paarweises) Sequenzalignment dient der quantitativen Erfassung von zwei ähnlichen
Sequenzen. Dabei werden Entsprechungen zwischen einzelnen Bausteinen beider Sequenzen
festgestellt. Je ähnlicher sich zwei Sequenzen sind, desto höher ist die Wahrscheinlichkeit, dass
sie eine ähnliche Raumstruktur ausbilden bzw. eine ähnliche Funktion besitzen. Zwei zu 30%
identische Sequenzen bilden mit hoher Wahrscheinlichkeit eine ähnliche Raumstruktur aus
und besitzen ähnliche Funktionen. [22, S. 153-154] Es existieren verschiedene Möglichkeiten
20
ein Alignment durchzuführen. Alignment-Tools sind beispielsweise der Dotplot
(Punktdiagramm), BLAST (Basic Local Alignment Search Tool) und ClustalW.
3.2.3 Dotplot
Ein Dotplot (Punktdiagramm) ist eine sehr einfache Methode, ein paarweises
Sequenzalignment durchzuführen. In einer Matrix werden beide Sequenzen graphisch
dargestellt. Eine Sequenz wird an der Abszisse abgetragen, während die andere Sequenz an
der Ordinate abgetragen wird. Das Programm setzt überall dort, wo identische Positionen
beider Sequenzen gefunden werden, einen Punkt. Liegen viele identische Positionen eng
beieinander, summieren sich die Punkte zu Linien. Wenn sich beide Sequenzen sehr ähnlich
sind, entsteht eine Diagonale quer durch die Matrix bzw. den Dotplot. Dies ist der Idealfall. [22,
S. 155-156] Ein Dotplot kann auch genutzt werden, um repetitive Bereiche innerhalb ein und
derselben Sequenz zu finden. Dabei wird an beiden Achsen der Matrix dieselbe Sequenz
abgetragen. Quer durch den Dotplot ist eine durchgängige Diagonale zu erkennen, da an den
gleichen Positionen die gleichen Aminosäuren vorkommen. Um sich das Ganze besser
vorstellen zu können, ist die Zuhilfenahme der Abbildung 11 hilfreich. In Abbildung 11 wurde
die Kernsequenz von „major ampullate spidroin“ 2 der Spinne Latrodectus hesperus in das
Programm Dotlet eingefügt. Dotlet wurde von Marco Pagni und Thomas Junier, zwei
Mitarbeiter des SIB, entwickelt und 2000 veröffentlicht. Es ist frei zugänglich und über den
Webbrowser ausführbar. Per Optionsfeld können verschiedene Einstellungen getroffen
werden, welche die Suche nach identischen und/oder ähnlichen Positionen präzisieren bzw.
anpassen. [24, S. 178] In Abbildung 11 ist die Diagonale durch die Matrix gut zu erkennen, ein
Nachweis für die Identität der Eingabesequenzen. Weiterhin sind rechts und links neben der
Diagonale mehrere Striche erkennbar. Überall dort sind ebenfalls identische Positionen zu
finden. Je mehr Striche vorkommen, desto mehr identische bzw. ähnliche Regionen existieren
innerhalb ein und derselben Sequenz. Die Striche kennzeichnen so die repetitiven Bereiche in
der Sequenz. Dadurch ist klar erkennbar, dass die Sequenz von „major ampullate spidroin“ 2
sehr viele repetitive Bereiche enthält.
21
Abbildung 11: Ein Dotplot, eine einfache Art des paarweisen Alignments.
In das Programm Dotlet wurde die Kernsequenz von „major ampullate spidroin“ 2 der Spinne Latrodectus hesperus
eingefügt. Die Diagonale durch die Matrix ist gut zu erkennen, ein Nachweis für die Identität der Eingabesequenzen.
Weiterhin sind rechts und links neben der Diagonale mehrere Striche erkennbar. Überall dort sind ebenfalls
identische Positionen zu finden. Je mehr Striche vorkommen, desto mehr identische bzw. ähnliche Regionen
existieren innerhalb ein und derselben Sequenz. Die Striche kennzeichnen so die repetitiven Bereiche in der
Sequenz. Dadurch ist klar erkennbar, dass die Sequenz von „major ampullate spidroin“ 2 sehr viele repetitive
Bereiche enthält.
3.2.4 BLAST
BLAST (Basic Local Alignment Search Tool) umfasst eine Reihe ähnlicher Programme. Das
gemeinsame Ziel jedes BLAST-Programms ist das Finden von ähnlichen und/oder homologen
Sequenzen zu einer eingegebenen Suchsequenz. [29, S. 38] Die ausgegebenen Treffer können
der Vorhersage möglicher Funktionen dienen oder bei der Erstellung einer 3D-Struktur zu Hilfe
genommen werden. Bei einem BLAST-Lauf werden die Datenbanken des NCBI nach ähnlichen
Sequenzen durchsucht. [29, S. 64] Die Einteilung der BLAST-Programme erfolgt nach
verschiedenen Kriterien, je nachdem ob es sich bei der Eingabesequenz um eine Aminosäure-
oder eine DNA-Sequenz handelt. Da während der Bachelorarbeit in den Proteindatenbanken
des NCBI nach der jeweiligen eingegebenen Aminosäuresequenz gesucht wurde, handelte es
sich hierbei um das Programm BLASTp (protein blast). [29, S. 64; 32]
3.2.5 ClustalW
ClustalW ist ein über den Webbrowser ausführbares Programm, welches multiple Alignments
erstellt. Multiple Sequenzalignments sind die konsequente Ausweitung paarweiser Alignments
auf n-viele Sequenzen. Über ein Eingabefenster werden die zu alignierenden Sequenzen
eingefügt. Der Vorteil gegenüber BLAST ist, dass mehrere Sequenzen miteinander verglichen
22
werden. [29, S. 53-54; 30, S. 243] Oftmals werden bei einer BLAST-Suche sehr viele Treffer zur
Eingabesequenz ausgegeben. Um diese Treffer miteinander vergleichen zu können, eignet sich
ClustalW. Außerdem gibt ClustalW zu den alignierten Sequenzen eine Konsensus-Sequenz aus.
In Abbildung 12 ist ein einfaches Beispiel eines multiplen Alignments dargestellt. Es wurden
drei Sequenzen auf Ähnlichkeit mit einer Zielsequenz überprüft. Ein Maß für die Ähnlichkeit ist
die Anzahl molekularer Austausche (Aminosäurereste). Unterhalb wurde als Ergebnis die
„Konsensus-Sequenz“ ausgegeben. Eine Konsensus-Sequenz ist eine Sequenz, welche die
höchste Übereinstimmung der verglichenen Sequenzen darstellt.
Abbildung 12: Ein einfaches Beispiel eines multiplen Alignments.
Die oberste Sequenz (NK1-kringle) ist die Zielsequenz. Die 3 Sequenzen darunter sind die Sequenzen (1PKR, 1PK4,
2PF1), welche auf Übereinstimmung mit der Zielsequenz überprüft wurden. Die Farbe der markierten
Aminosäurereste entspricht dem Grad der Konservierung. (weiß-keine, grün-gering, blau-mittel, rosa-hoch). Pfeile
kennzeichnen die Cystein-Reste. Unterhalb ist die Konsensus-Sequenz angegeben. [51]
ClustalW eignet sich gut, um schnell mehrere Sequenzen auf Ähnlichkeit sowie Homologie zu
überprüfen. Analog zu den in Abbildung 12 verglichenen Sequenzen wurden die
Seidenproteine in ClustalW eingefügt und auf Ähnlichkeit, sowie Homologie überprüft.
3.2.6 LALIGN
LALIGN ist ein Programm, welches multiple Ähnlichkeiten von Teilbereichen innerhalb zweier
Sequenzen findet. Folglich müssen stets zwei Sequenzen in das Inputfenster eingegeben
werden. [39] Mittels LALIGN sollten einzelne Repeats innerhalb der Sequenzen von MASp1
sowie MaSp2 gefunden werden.
23
3.3 Strukturvorhersage-Tools
3.3.1 Chou-Fasman
Dieses Tool ermöglicht eine schnelle Vorhersage der Sekundärstruktur eines Proteins auf Basis
der Sequenz. Der Algorithmus, welcher in dem Tool angewandt wird, wurde von Chou und
Fasman 1974 entwickelt. [22, S. 392] Er basiert auf der Annahme der Proteinfaltung entlang
der Sekundärstrukturelemente, beruhend auf Präferenzen. Eine Präferenz gibt die
Wahrscheinlichkeit an, mit der sich eine Aminosäure in einer bestimmten Sekundärstruktur
(Helix, β-Faltblatt, β-Schleife) aufhält. [22, S. 392] Je höher der Wert der Präferenz ist, desto
wahrscheinlicher bildet eine bestimmte Aminosäure eine bestimmte Sekundärstruktur aus.
Der große Nachteil dieses Algorithmus‘ liegt in der geringen Vorhersagegenauigkeit, welche ca.
50-55 % beträgt. Ursache hierfür ist, dass bei der Berechnung der Präferenzen die Information
der Umgebung einer Aminosäure nicht berücksichtigt wird. [22, S. 392-394]
3.3.2 GOR
Der GOR-Algorithmus wurde 1978 von Garnier, Osguthorpe und Robson entwickelt. [15a, 15b,
15c] Im Laufe der Zeit wurde der Algorithmus verbessert und so existieren heute verschiedene
Varianten (GOR I-IV) dieser Vorhersage-Methode. GOR beruht auf einem statistischen Modell,
welches die Information der Umgebung einer Aminosäure miteinberechnet. Für die
Berechnung werden drei Matrizen (für jedes Sekundärstrukturelement eine Matrix: Helix,
Faltblatt, Schleife) aufgestellt, welche die Häufigkeit des Auftretens einer bestimmten
Aminosäure an einer definierten Position für ein Sekundärstrukturelement angeben. Er stellt
sozusagen eine Verbesserung des Chou-Fasman-Algorithmus‘ dar, da er genauer ist. Jedoch
hat der GOR-Algorithmus den Nachteil, dass für eine statistische Analyse sehr viele Daten
benötigt werden. Außerdem entstehen Mehrdeutigkeiten vor allem an den Enden der
Sekundärstrukturelemente. [15a, 15b, 15c]
3.3.3 Simple Modular Architecture Research Tool
Das Simple Modular Architecture Research Tool (SMART) ist ein über den zugehörigen
Internetserver freizugängliches Tool. Es ermöglicht die Identifikation von sich genetisch
verändernden Domänen sowie die Analyse derselben. [33, S. 231] SMART vergleicht die
Eingabesequenz mit den Domänensequenzen und multiplen Alignments der Datenbanken. Die
Sammlung der SMART-Alignments umfasst mehr als 250 Signal- und Extrazelluläre Domänen.
In der Sammlung enthaltene Domänen werden mit verschiedenen Daten annotiert. Die Daten
24
beinhalten Informationen der Domänen über den zellulären Standort, der Verteilung in Arten,
der Funktionsklasse, der Tertiärstruktur und über funktionelle Reste. [28, S. 226]
3.3.4 PROPKA
PROPKA ist ein bioinformatisches Tool, welches die pH-Wert-abhängigen Eigenschaften eines
Proteins wie Ladung und Stabilisationsenergie untersucht. [32, S. 1] Als Eingabeformat wird ein
PDB-File benötigt (siehe Kapitel Protein Data Bank). Das Programm gibt anschließend für jede
enthaltene Aminosäure verschiedene Daten aus, wie zum Beispiel den pKa-Wert. Der pKa-
Wert (oder pKs-Wert) eines Proteins bzw. einer Aminosäure beschreibt das Bestreben eines
Protons, durch Reaktion mit einer Base entfernt zu werden. [6, S. 17] Je niedriger der pKs-Wert
eines Moleküls ist, desto leichter gibt das Molekül ein Proton ab. [6, S. 2] Das Tool PROPKA gibt
außerdem den pI-Wert des Proteins aus. Der pI-Wert gibt den pH-Wert am Isoelektrischen
Punkt an. Bei diesem pH-Wert liegt das Protein in der Zwitterionform vor. Das Zwitterion ist
eine Struktur, bei der ein Molekül zwei entgegengesetzt geladene Gruppen besitzt. Im Falle
des Proteins handelt es sich um eine positiv geladene Carboxylgruppe (protoniert) sowie um
eine negativ geladene Aminogruppe (dissoziiert). [23, S „3-13“; 41, S. 29] Des Weiteren
zeichnet das Programm PROPKA für das jeweilige Protein ein Diagramm, in welchem die
Stabilität des Proteins in Abhängigkeit vom pH-Wert dargestellt ist.
3.3.5 SWISS-MODEL
SWISS-MODEL wurde unter anderem von Mitarbeitern des SIB entwickelt und bietet einen
Server zur Modellierung von Proteinstrukturen an. Frei über den Webbrowser zugänglich
erstellt SWISS-MODEL die Homologiemodelle von Proteinstrukturen. [1, S. 195] Außerdem
beinhaltet der SWISS-MODEL-Server noch weitere Tools, sowie einen integrierten Workspace.
Nach einer Registrierung ist der Workspace jederzeit zugänglich und ermöglicht eine
Speicherung der bisherigen Modellierungsprojekte, jedoch ist SWISS-MODEL auch ohne
Registrierung zu benutzen. Während der Bachelorarbeit wurde das Tool „ Secondary
Structure Prediction and Domain Assignment” des SWISS-MODEL-Servers an den
Spinnenseidenproteinen angewandt.
3.3.6 3D-Position-Specific Score Matrices
3D-Position-Specific Score Matrices (3D-PSSM) stellt eine internetbasierte Methode zur
Erkennung der Proteinfaltung dar. Dabei werden Primär- und Tertiärstrukturinformationen mit
Sekundärstruktur- und Löslichkeitsdaten verknüpft. So können die 3D-Strukturen von
Proteinen mittels homologer Sequenzen vorhergesagt werden. Nach den neuesten Angaben
25
auf der Homepage von 3D-PSSM wird empfohlen, anstelle des 3D-PSSM-Servers die neue
verbesserte „Protein Homology/analogY Recognition Engine“ (Phyre) zu benutzen. [19]
Während der Bachelorarbeit wurde jedoch durchgängig mit dem Server von 3D-PSSM
gearbeitet.
3.3.7 Prediction of TransMembrane Beta-Barrel Proteins
Prediction of TransMembrane Beta-Barrel Proteins (PRED TMBB) ist ein Tool, welches in der
Lage ist, die Topologie von Transmembransträngen und β-Barrel in äußeren
Membranproteinen vorherzusagen. [40, S. W400] Ein β-Barrel (β-Fass) ist eine bestimmte
Anordnung der Polypeptidkette innerhalb einer Membran. Es besteht aus
Transmembransträngen, welche eine β-Faltblattstruktur besitzen und eine fassförmige
Struktur annehmen. Das Besondere ist, dass die Primärstruktur solcher Membranproteine der
Struktur von löslichen Proteinen stark ähnelt. Nichts innerhalb der Sequenz deutet zunächst
auf die endgültige Struktur hin. β-Barrels können daher nicht anhand der Primärstruktur
vorhergesagt werden. [23, S. „9-21“] Hier besteht eine große Ähnlichkeit zu den
Spinnenseidenproteinen, welche zunächst löslich sind und deren Struktur ebenfalls nicht
anhand der Sequenz vorhersagbar ist. Das Tool PRED TMBB beruht auf einem Hidden Markov
Modell, welches mittlerweile 16 nicht-homologe äußere Membranproteine enthält, von denen
die Strukturen in atomarer Auflösung bekannt sind. [40, S. W400] Detaillierte Informationen
zu Hidden Markov Modellen im Buch: Gernot A. Fink: Mustererkennung mit Markov-
Modellen: Theorie, Praxis, Anwendungsgebiete. Teubner, 2003, ISBN 3-519-00453-4.
Der Benutzer kann über den Webserver des PRED TMBB zur Strukturvorhersage eine von drei
verschiedenen Erkennungsmethoden (Algorithmen) auswählen. Entsprechend gibt der Server
die vorhergesagte Topologie, einen Score für die Wahrscheinlichkeit, dass das eingegebene
Protein ein äußeres Membranprotein ist, sowie die Wahrscheinlichkeit für die Vorhersage von
Transmembransträngen, aus. Außerdem werden die errechneten Daten der
Transmembranstränge graphisch dargestellt. [40, S. W400] In Abbildung 13 ist ein Beispiel für
ein Ergebnis der Strukturvorhersage mittels PRED TMBB aufgeführt. Es wurde die Struktur von
Bacteriorhodopsin (PBD-Identifikationsnummer „3NS0“) innerhalb einer Doppellipidschicht
vorhergesagt. Entsprechend der Abbildung befindet sich die Aminogruppe sowie die
Carboxylgruppe im Inneren, während sich ein kleiner Teil des Proteins außerhalb der
Membran, im umgebenden Medium, befindet.
26
Abbildung 13: Struktur von Bacteriorhodopsin (PDD-ID „3NS0“) innerhalb einer Doppellipidschicht, vorhergesagt
mittels PRED TMBB.
Farblich hervorgehoben sind die Aminosäuren nach ihrer Hydrophobizität. Eine blaue bis grüne Farbe kennzeichnet
eine hydrophile Aminosäure, eine gelbe Farbe eine hydrophobe Aminosäure. Erkennbar ist, dass sich die
Aminogruppe im Inneren befindet, während sich ein kleiner Teil des Proteins außerhalb der Membran, im
umgebenden Medium befindet. Auf der Abbildung nicht eingezeichnet ist die Carboxylgruppe, welche sich analog
zur Aminogruppe im Inneren befindet. Die Skala der Hydrophobizität stammt aus dem Handbuch zum Tool, aus:
Spyropoulos, Ioannis C.; Liakopoulos, Theodore D.; Bagos, Pantelis G.; Hamodrakas, Stavros J.: TMRPres2D – High
quality visual representation of transmembrane protein models.
27
4 Methoden und Ergebnisse
Zu Beginn der Bachelorarbeit galt es, bisherigen Arbeiten, darunter die Belegarbeit im 4.
Semester sowie das Praxismodul im 5. Semester, zusammenzufassen. Es wurde ein Überblick
geschaffen, wie der Wissenstand zum Thema „Der Spinnenfaden auf molekularer Ebene –
untersucht mit bioinformatischen Tools“ war und was bisher erreicht wurde. Ferner wurde ein
erster grober Plan erstellt, was in der Zeit der Bachelorarbeit stofflich bearbeitet werden
sollte. Der grobe Plan wurde in einzelne kleinere Aufgaben geteilt, die es pro Woche zu
erledigen galt. Daher erweist es sich als sinnvoll, den Inhalt sowie die Ergebnisse der einzelnen
Wochenaufgaben chronologisch zu berichten. In Abbildung 14 ist ein Schema des groben
Arbeitsplans dargestellt.
Abbildung 14: Workflow des Arbeitsplans.
Hier ist der Ablaufplan der Bachelorarbeit grob dargestellt. Der grobe Plan wurde in 3 einzelne Methodenkomplexe
unterteilt. Im Plan aufgeführt sind lediglich die Inhalte, welche bearbeitet werden sollten. Nicht enthalten sind die
Ergebnisse sowie die tatsächlich durchgeführten Arbeiten. Der eigentliche Plan wurde im Laufe der Arbeit verändert
und angepasst, da einige Inhalte nicht bearbeitet werden konnten. (z. B. LALIGN).
4.1 Methodenkomplex 1
Das Hauptziel des ersten Methodenkomplexes war die Suche nach Programmen, welche in der
Lage sind, pH-Wert-abhängige Strukturen vorherzusagen. Die Literatur sollte nach
28
Informationen über Proteine durchsucht werden, von denen bekannt ist, dass sie bei zwei
unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden. Anschließend
sollten Abbildungen generiert werden, welche die Sekundär- bzw. Tertiärstrukturen der fertig
gefalteten Proteine in Abhängigkeit vom pH-Wert darstellen. Außerdem sollten mit Hilfe der
Protein Data Bank die 3D-Strukturen der Spinnenseidenproteine verglichen werden und so
viele Daten wie möglich zu den terminalen Domänen herausgefunden werden.
Es wurde mittels verschiedener Suchanfragen im Internet (Suchmaschinen) ein
bioinformatisches Tool gefunden, welches in der Lage ist, pH-Wert-abhängige Eigenschaften
von Proteinen wie Ladung und Stabilisationsenergie zu untersuchen. Das Tool trägt den Namen
PROPKA. Der Nachteil dieses Tools ist, dass als Eingabeformat eine alleinige Sequenz eines
Proteins nicht ausreicht. Es wird ein PDB-File benötigt, in welchem die Informationen über die
Topologie der Atome innerhalb eines Proteins enthalten sind (siehe Kapitel 3.1.4). Daher
wurde das „major ampullate spidroin“ 1 der Spinne Euprosthenops australis (E. australis),
welches die PDB-Identifikationsnummer „3LR2“ besitzt, mittels PROPKA auf pH-Wert-
abhängige Eigenschaften von Proteinen, wie Ladung und Stabilisationsenergie untersucht. Es
handelt sich hierbei jedoch nicht um die Sequenz des kompletten Proteins, sondern lediglich
um die Sequenz der N-terminale Domäne des MaSp1 von E. australis. Mittels PROPKA 2.0
wurde herausgefunden, dass die Stabilität der N-terminalen Domäne bei einem neutralen pH-
Wert geringer ist als bei einem sauren pH-Wert. Im Diagramm in Abbildung 15 ist die Stabilität
der N-terminalen Domäne des MaSp1 von E. australis in Abhängigkeit vom pH-Wert
dargestellt. Erkennbar ist, dass bei einem neutralen pH-Wert von 7, welcher während der
Speicherung des Seidenproteins innerhalb der Drüse vorliegt, die Stabilität der N-terminalen
Domäne geringer ist als bei einem sauren pH-Wert. Ein saurer pH-Wert (ca. 6) liegt während
der Umstrukturierung der Seidenproteine innerhalb des Spinnkanals vor. (siehe Kapitel 2.3).
Nach der Untersuchung der Eigenschaften der N-terminalen Domäne, folgte die Untersuchung
der C-terminalen Domäne. Da keine genaueren atomaren Daten der C-terminalen Domäne von
MaSp1 der Spinne E. australis existieren, wurden die Daten der C-terminalen Domäne eines
anderen Proteins untersucht. Als „Ersatz“ wurde die C-terminale Domäne des Fibroins 3 der
Spinne Araneus diadematus (ADF-3) untersucht, welches sich hinter der PDB-
Identifikationsnummer „2KHM“ verbirgt. Mit Hilfe des bioinformatischen Tools PROPKA 2.0
stellte sich heraus, dass die Stabilität der C-terminalen Domäne von ADF-3 bei einem neutralen
pH-Wert größer ist als die Stabilität bei einem sauren pH-Wert. Die Stabilität der C-terminalen
Domäne von ADF-3 verhält sich genau umgekehrt wie die Stabilität der N-terminalen Domäne
29
von MaSp1 von E. australis in Abhängigkeit vom pH-Wert. Die Art der Stabilität beider
terminaler Domänen variiert ebenfalls. Die N-terminale Domäne des MaSp1 von E. australis
weist überwiegend negative Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4
positive Werte auf. Dagegen besitzt die C-terminale Domäne von ADF-3 durchgängig positive
Werte der Stabilität. Die Stabilität der C-terminale Domäne von ADF-3 in Abhängigkeit vom pH-
Wert ist in Abbildung 15 graphisch dargestellt.
Abbildung 15: Stabilität der terminalen Domänen des Spinnenseidenproteins in Abhängigkeit vom pH-Wert.
Im linken Diagramm ist die Stabilität der N-terminalen Domäne von MaSp1 der Spinne Euprosthenops australis
dargestellt, im rechten Diagramm die Stabilität der C-terminalen Domäne von Fibroin 3 der Spinne Araneus
diadematus (ADF-3). Erkennbar ist, dass bei einem neutralen pH-Wert von 7 die Stabilität der N-terminalen Domäne
(links) geringer ist als bei einem sauren pH-Wert. Die Stabilität der C-terminalen Domäne (rechts) von ADF-3 verhält
sich genau umgekehrt. Die N-terminale Domäne (links) des MaSp1 von E. australis weist überwiegend negative
Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4 positive Werte auf. Dagegen besitzt die C-terminale
Domäne (rechts) von ADF-3 durchgängig positive Werte der Stabilität.
Die Suche nach Informationen über Proteine, von denen bekannt ist, dass sie bei zwei
unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden, blieb erfolglos.
Demnach konnten auch keine Abbildungen generiert werden, welche die Sekundär- bzw.
Tertiärstrukturen der jeweiligen fertig gefalteten Proteine in Abhängigkeit vom pH-Wert
darstellen. Die 3D-Strukturen der Spinnenseidenproteine konnten nur teilweise verglichen
werden. Die praktischen Experimente und Untersuchungen wurden nur an den terminalen
Domänen der Spinnenseidenproteine durchgeführt, somit konnten nur deren Strukturen
verglichen werden. Das eigentliche Ziel war es, die β-Faltblatt-Bildung zu verstehen. Da sich an
den terminalen Domänen ohnehin keine β-Faltblätter bilden, konnte das Ziel nicht allein durch
die Analyse terminaler Domänen erreicht werden. Während der Recherchen über
Informationen von 3D-Strukturen der Spinnenseidenproteine konnte eine komplette Sequenz
der Proteine MaSp1 sowie MaSp2 von Latrodectus hesperus in der Universal Protein Resource
(UniProt) gefunden werden. [42; 43] Bisherige Arbeiten wurden nur anhand von Segmenten
der Seidenproteinsequenzen von Araneus diadematus und Euprosthenops australis
durchgeführt. Daher galt der Fund der kompletten Sequenz von L. hesperus als erfreulicher
30
Fortschritt und erleichterte nachfolgende Arbeiten. Außerdem konnten alle weiteren Aufgaben
anhand einer Sequenz durchgeführt werden, ohne eine komplette Sequenz mittels
verschiedener Datenbanken „zusammensetzen“ zu müssen. Hierbei wird ein Nachteil der
großen Datenbanken wie zum Beispiel der NCBI deutlich: Viele Daten liegen mehrmals vor, so
dass es Dopplungen und Überschneidungen der enthaltenen Informationen gibt. Die
Sekundärstruktur der Proteine MaSp1 und MaSp2 von L. hesperus wurde mit Hilfe der Tools
GOR und Chou-Fasman vorhergesagt. Beide Tools sagten eine Helix-Struktur-Bildung der Poly-
Alanin-Muster vorher. Diese Daten sind als „falsch“ bzw. als nicht aussagekräftig zu werten.
Kernmagnetresonanzexperimente, sowie Röntgenbeugungsanalyse, welche am Abseilfaden
von Nephila clavipes durchgeführt worden waren, belegen die Bildung von β-Faltblättern der
Poly-Alanin-Muster. [47, S. 545; 13, S. 82] In Abbildung 16 sind die Ergebnisse der
Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne Latrodectus hesperus
dargestellt. Beide Sequenzen bestehen aus über 3000 Aminosäuren. Daher ist nur ein
Ausschnitt der Sekundärstrukturelemente der jeweiligen Sequenzen aufgeführt. Die
Farbgebung der Sekundärstrukturelemente beider Tools variieren. Bei GOR (linker Teil der
Abbildung) sind die Helices blau, die Faltblätter rot und die Schleifen grün hervorgehoben. Bei
Chou-Fasman hingegen sind die Helices rot, die Faltblätter grün und die Schleifen blau
markiert. Die Zufallsknäul (coil) sind bei beiden Tools gelb dargestellt. Deutlich erkennbar ist,
dass beide Tools Helix-Strukturen der Poly-Alanin-Muster vorhersagen. Die vollständigen
Ergebnisse von GOR und Chou-Fasman sind in einer gleichnamigen Datei gespeichert und mit
Hilfe eines Computers abrufbar. [40; 41]
31
Abbildung 16: Sekundärstrukturvorhersage von MaSp1 und MaSp2 der Spinne Latrodectus hesperus mittels GOR
und Chou-Fasman.
Beide Sequenzen bestehen aus über 3000 Aminosäuren. Daher ist nur ein Ausschnitt der Sekundärstrukturelemente
der jeweiligen Sequenzen aufgeführt. Die Farbgebung der Sekundärstrukturelemente beider Tools variieren. Bei
GOR (linker Teil der Abbildung) sind die Helices blau, die Faltblätter rot und die Schleifen grün hervorgehoben. Bei
Chou-Fasman (rechts) hingegen sind die Helices rot, die Faltblätter grün und die Schleifen blau markiert. Die
Zufallsknäul (coil) sind bei beiden Tools gelb dargestellt. Deutlich erkennbar ist, dass beide Tools Helix-Strukturen
der Poly-Alanin-Muster hervorsagen. Die vollständigen Ergebnisse von GOR und Chou-Fasman sind in einer
gleichnamigen Datei gespeichert und mit Hilfe eines Computers abrufbar. [40; 41]
4.2 Methodenkomplex 2
Nachdem die bioinformatischen Vorhersagetools GOR und Chou-Fasman keine
aussagekräftigen Ergebnisse über die Sequenzen beider „major ampullate spidroins“ von
Latrodectus hesperus lieferten, sollten andere Vorhersagetools angewandt werden. Das
Hauptziel des zweiten Methodenkomplexes war die Erstellung von Homologiemodellen aus
der kompletten Spidroinsequenz von Latrodectus hesperus. Hauptsächlich sollte nur der Teil
der Sequenz benutzt werden, welcher β-Faltblätter bildet. Es sollte von den beiden β-Faltblatt-
Abschnitten, genauer den repetitiven Kernsequenzen beider Spidroins, je ein PDB-File erstellt
werden. Zu diesem Zweck sollten die kompletten Sequenzen von MaSp1 und MaSp2 in die
einzelnen drei Sequenzabschnitte unterteilt werden. Es galt, die N-terminale Domäne, die C-
terminale Domäne sowie den repetitiven Mittelteil in der kompletten Sequenz zuzuordnen.
32
Unter Zuhilfenahme der Domänensequenz der „major ampullate spidroins“ einer anderen
Spinne und des Programms LALIGN sollten so die einzelnen terminalen Domänen in der
gesamten Sequenz des MaSp1 bzw. MaSp2 von L. hesperus gefunden werden. Anschließend
sollte der repetitive Mittelteil des MaSp1/MaSp2 in das Tool SWISS-MODEL Template
Identification eingefügt werden, um ein Template zu finden. Ein Template ist eine Vorlage.
Template Identification von SWISS-MODEL ist ein Tool, welches zu einer eingegeben Sequenz
mit Hilfe verschiedener Datenbanken und Programmen ähnliche Sequenzen sucht, um eine
Vorlage einer ähnlichen Struktur zu liefern. [34] Anhand dieser Vorlage sollte ein
Strukturmodell erstellt werden, falls möglich. Dieses Strukturmodell sollte ein PDB-File liefern,
welches anschließend auf die pH-Wert-abhängigen Eigenschaften wie Ladung und
Stabilisationsenergie mittels PROPKA untersucht werden sollte. Ferner sollte eine
Bestandsaufnahme angefertigt werden, die das gesamte bisherig gesammelte Wissen über die
terminalen Domänen der Spinnenseidenproteine enthielt. Eine weitere Aufgabe bestand darin,
mit Hilfe des Tools SMART die terminalen Domänen innerhalb der „major ampullate spidroins“
von L. hesperus zu identifizieren. Außerdem sollte die CDD-Suche an den Seidenproteinen von
L. hesperus durchgeführt werden, um ähnliche Proteindomänen zu den eingegebenen
Seidenproteinen zu finden. Parallel zu den genannten Aufgaben sollte die Suche nach
Programmen fortgesetzt werden, welche pH-Wert-abhängige Sekundär- bzw. Tertiärstrukturen
von Proteinen vorhersagen können.
Der Grundidee der Benutzung von LALIGN erwies sich als nicht umsetzbar, da von den anderen
Spinnenseidenproteinen nur einzelne Fragmente in den Datenbanken existierten. Die
jeweiligen terminalen Domänen konnten aus den existierenden Fragmenten nicht vollständig
herausgefiltert werden. Mit anderen Worten, es konnte nicht zugeordnet werden, ob
vorliegende Sequenzfragmente eine komplette terminale Domäne charakterisierten.
Glücklicherweise waren in der zu den UniProt-Einträgen beider „major ampullate spidroins“
von L. hesperus gehörenden wissenschaftlichen Veröffentlichung die kompletten Sequenzen
aufgeführt. Anhand dieser Veröffentlichung konnten die N-terminalen Domänen, die C-
terminalen Domänen, sowie die repetitiven Kernsequenzen beider kompletter Sequenzen
identifiziert werden. Die N-terminale Domäne von MaSp1 erstreckt sich von der ersten
Aminosäure (MTW…) bis einschließlich zur Aminosäure 202 (…PVS). Die C-terminale Domäne
von MaSp1 beginnt bei der Aminosäure 3011 (SGP…) und erstreckt sich bis zum Ende der
Sequenz (…AFA). Zwischen N-und C-terminaler Domäne befindet sich der repetitive Mittelteil
von Aminosäure 203 (YGQ…) bis 3010 (…AAA). MaSp1 besteht insgesamt aus 3129
Aminosäuren. [3, S. 2-3; 45] MaSp2 dagegen besteht aus insgesamt 3779 Aminosäuren. Die N-
33
terminale Domäne von MaSp2 beginnt bei der ersten Aminosäure (MTT…) und endet
einschließlich bei der Aminosäure 217 (…AAA). Es folgt der repetitive Mittelteil ab Aminosäure
218 (GSG…) bis zur Aminosäure 3657 (…AAA). Schließlich erstreckt sich die C-terminale
Domäne von Aminosäure 3658 (SGS…) bis zur letzten Aminosäure der Sequenz (…AMG). [3, S.
3-4; 46]
Die Bestandsaufnahme, die das gesamte bisherig gesammelte Wissen über die terminalen
Domänen der Spinnenseidenproteine enthielt, wurde angefertigt. Wissenschaftliche
Experimente und zugehörige Veröffentlichungen besagen, dass sowohl die C-terminale als
auch die N-terminale Domäne einen hohen Anteil an α-Helices, sowie eine hohe thermische
Stabilität besitzen. [11, S. 310; 23, S. 239-240] Beide terminale Domänen weisen hydrophobere
Eigenschaften als der repetitive Mittelteil auf. [10, S. 239; 19, S. 3] Die hydrophobste Stelle in
MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne, wie in Abbildung 17
erkennbar ist. [3, S. 6; 48] Diese Abbildung dient dem bioinformatischen Nachweis der
hydrophoben Eigenschaften der verschiedenen Sequenzabschnitte.
34
Abbildung 17: Hydrophobizitätsplot nach Kyte und Doolittle von MaSp1 sowie MaSp2 der Spinne Latrodectus
hesperus.
Die Hydrophobizitätsplots wurden pro Sequenzabschnitt, siehe Beschriftung, bei einer Fensterlänge von 7
durchgeführt. Anhand der Hydrophobizitätsskala ist erkennbar, dass die N-terminale Domäne von MaSp1 (links
unten) der hydrophobste aller verglichenen Sequenzabschnitte ist. Die repetitiven Kernsequenzen (oben rechts und
oben links) beider spidroins bestehen aus abwechselnd hydrophoben und hydrophilen Bereichen. Diese Eigenschaft
wird auch als Amphiphilie bezeichnet. Erkennbar ist auch, dass die terminalen Domänen (mitte rechts, mitte links,
unten rechts, unten links) hydrophober als die repetitiven Kernsequenzen (oben links, oben rechts) sind. Die
hydrophobste Stelle in MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne (unten rechts, unten
links). Die vollständigen Ergebnisse der Hydrophobizitätsplots sind in einer gleichnamigen Datei gespeichert und mit
Hilfe eines Computers abrufbar. [44]
35
Experimente, welche an den Spinnenproteinen unter verschiedenen Bedingungen
durchgeführt worden waren, belegen, dass sowohl die C-terminale als auch die N-terminale
Domäne eine große Rolle für die korrekte Assemblierung der Seidenfaser spielen. [2, S. 236;
23, S. 240-241] Die C-terminale Domäne wird für die Aggregation der Spinnenproteine
während der abnehmenden Natriumchloridkonzentration innerhalb des Spinnkanals benötigt
(siehe Kapitel „Der natürliche Spinnprozess – Aufbau der Drüse und des Spinnkanals“). [3, S. 9;
23, S. 241] Außerdem sorgt die C-terminale Domäne für die Bildung kristalliner Strukturen. [3,
S. 9] Die N-terminale Domäne unterstützt diese Faserassemblierung, indem sie für die nötige
Stabilität des Proteins verantwortlich ist. [3, S. 10; 47, S. 312] Einer N-Terminalen Domäne ist
es möglich mit einer anderen N-terminalen Domäne ein Dimer auszubilden. Diese
Dimerisierung ist stark von der umgebenden Salzkonzentration sowie vom pH-Wert abhängig.
[10, S. 238; 47, S. 312] Durch die Bildung der kristallinen Strukturen, initiiert durch die C-
terminale Domäne, sowie die Dimerisierung der N-terminalen Domänen entstehen
kontrollierte Wechselwirkungen zwischen den Seidenproteinen und ermöglichen so ein
Verlängerung der Proteinketten. [10, S. 238; 47, S. 312] Das Resultat ist die Entstehung der
charakteristischen Faserstrukturen. Kernmagnetresonanzexperimente zeigten, dass die N-
terminale Domäne bei einem pH-Wert von 6 ein stabiles Dimer mit einer anderen N-
terminalen Domäne ausbildet, unabhängig von der umgebenden Salzkonzentration. [11, S.
311] Während der Speicherung der Seidenproteine innerhalb der Spinndrüse, bei einem pH-
Wert von 7, sorgt Natriumchlorid für eine Stabilisierung der Monomerstruktur der N-
terminalen Domäne. Gleichzeitig wird die Dimerisierung unterbunden. [10, S. 239; 47, S. 311-
312] So ist es möglich, dass selbst bei einer sehr hohen Proteinkonzentration die
Seidenproteine innerhalb der Drüse weder eine Faserstruktur einnehmen noch verklumpen.
[10, S. 239] Wie kommt diese enorm hohe Stabilität der Seidenproteine während der
Speicherung in der Spinndrüse zu Stande? Diese Frage kann mit einer von zwei Theorien
beantwortet werden, welche von unterschiedlichen Forschungsgruppen postuliert worden
sind. Doch um sich nicht ohne eigens durchgeführte Experimente auf diese beiden Theorien zu
beziehen, wurden MaSp1 sowie MaSp2 der Spinne Latrodectus hesperus mit Hilfe anderer
bioinformatischer Strukturvorhersagetools untersucht.
Der repetitive Mittelteil des MaSp1/MaSp2 wurde in das Tool SWISS-MODEL Template
Identification eingefügt, um ein Template zu finden. Anhand dieses Template sollte ein
Strukturmodell erstellt werden, falls möglich. Dieses Strukturmodell sollte ein PDB-File liefern,
welches anschließend auf die pH-Wert-abhängigen Eigenschaften wie Ladung und
Stabilisationsenergie mittels PROPKA untersucht werden sollte. Die Suche nach einem
36
Template blieb erfolglos. Es existierten keine homologen Daten zu der repetitiven Kernsequenz
des MaSp1 bzw. MaSp2 von L. hesperus, weder ähnliche Sequenzen noch ähnliche Strukturen.
Ohne das Template konnte somit kein Strukturmodell erzeugt werden. Ein Modell des
repetitiven Mittelteils des MaSp1 von L. hesperus konnte daher mittels SWISS-MODEL nicht
erstellt werden. Lediglich die Informationen der N-terminalen Domäne sind vorhanden. Der
Automated Mode von SWISS-MODEL lieferte ebenfalls kein Ergebnis. Der Automated Mode
sucht mit automatisch konfigurierten Parametern nach Templates und erstellt anschließend
ein Homologiemodell falls möglich, ebenfalls automatisch. Mit Hilfe des Tools „Secondary
Structure Prediction and Domain Assignment” von SWISS-MODEL konnten die terminalen
Domänen beider „major ampullate spidroins“ identifiziert werden. Zur Identifikation von
Sekundärstrukturen und zur Lokalisation von Proteindomänen verwendet das Tool Programme
von verschiedenen Datenbanken wie z. B. Hidden Markov Modelle der Pfam, des SMART, der
PIR und andere. [34] Pfam ist eine Datenbank, welche konservierte Proteinfamilien sowie
Proteindomänen enthält. [9, S. „D211“] In Abbildung 18 (MaSp1) und 19 (MaSp2) ist ein
Ausschnitt des Ergebnisses von „Secondary Structure Prediction and Domain Assignment“
dargestellt. Die Vorhersage der Helixstrukturen am Anfang und Ende beider spidroin-
Sequenzen stimmt mit den Ergebnissen aus den Röntgenanalysen-Experimenten der
Forschungsgruppen überein. [2, S. 237; 23, S. 239-240] Diese Bereiche kennzeichnen die
terminalen Domänen des Seidenproteins. Der repetitive Mittelteil der Sequenz bildet laut
diesem Tool Coil-Strukturen aus, da noch keine genaueren Informationen zu diesen
Sekundärstrukturen existieren. Das Ergebnis der „Secondary Structure Prediction and Domain
Assignment” stellt somit eine gute Zusammenfassung der bisherigen Informationen über die
Strukturen der Seidenproteine MaSp1 und MaSp2 dar. Die experimentell gewonnenen Daten
über die Strukturen der terminalen Domänen wurden so bioinformatisch nachgewiesen.
37
Abbildung 18: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von MaSp1.
Die Sequenz besteht aus 3129 Aminosäuren (oben im Bild zu erkennen). Die Darstellung enthält daher nur 2
zusammengefügte Teilabschnitte des Ergebnisses (Abschnitt 1 von Aminosäure 1 bis 362 und Abschnitt 2 von
Aminosäure 2881 bis 3129). Die laut diesem Tool vorhergesagten Sekundärstrukturen sind über der Sequenz
abgebildet. Die Sekundärstrukturen werden in Abhängigkeit von der Wahrscheinlichkeit in einer Art Diagramm
dargestellt. Je höher die Wahrscheinlichkeit der Ausbildung einer bestimmten Sekundärstruktur ist, desto höher ist
der jeweilige Graph im Diagramm. Unterhalb des Wahrscheinlichkeitsplots ist der Typ des
Sekundärstrukturelementes aufgeführt, welcher farblich mit dem Graphen der Wahrscheinlichkeit übereinstimmt:
rot-H-Helix; grün-C-Coil; gelb-E-Strand. blau-sonstiges. Erkennbar ist, dass sich am Anfang (N-terminale Domäne)
und Ende der Sequenz (C-terminale Domäne) Helixstrukturen bilden. Dazwischen (repetitiver Mittelteil) bilden sich
ausschließlich Coil-Strukturen. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und
mit Hilfe eines Computers abrufbar.
38
Abbildung 19: „SWISS-MODEL Secondary Structure Prediction and Domain Assignment” von MaSp2.
Die Sequenz besteht aus 3779 Aminosäuren (oben im Bild zu erkennen). Die Darstellung enthält daher nur 2
zusammengefügte Teilabschnitte des Ergebnisses (Abschnitt 1 von Aminosäure 1 bis 362 und Abschnitt 2 von
Aminosäure 3481 bis 3779). Die laut diesem Tool vorhergesagten Sekundärstrukturen sind über der Sequenz
abgebildet. Die Sekundärstrukturen werden in Abhängigkeit von der Wahrscheinlichkeit in einer Art Diagramm
dargestellt. Je höher die Wahrscheinlichkeit der Ausbildung einer bestimmten Sekundärstruktur ist, desto höher ist
der jeweilige Graph im Diagramm. Unterhalb des Wahrscheinlichkeitsplots ist der Typ des
Sekundärstrukturelementes aufgeführt, welcher farblich mit dem Graphen der Wahrscheinlichkeit übereinstimmt:
rot-H-Helix; grün-C-Coil; gelb-E-Strand. blau-sonstiges. Erkennbar ist, dass sich am Anfang (N-terminale Domäne)
und Ende der Sequenz (C-terminale Domäne) überwiegend Helixstrukturen bilden. Dazwischen (repetitiver
Mittelteil) bilden sich ausschließlich Coil-Strukturen. Das vollständige Ergebnis des Tools ist in einer gleichnamigen
Datei gespeichert und mit Hilfe eines Computers abrufbar.
39
Des Weiteren wurden keine bioinformatischen Programme oder Tools gefunden, welche eine
pH-abhängige Struktur vorhersagen können. Mit Hilfe des Tools SMART konnten die
terminalen Domänen innerhalb der „major ampullate spidroins“ von L. hesperus nicht
identifiziert werden. In Abbildung 20 ist ein Ausschnitt des Ergebnisses von SMART abgebildet.
Beide kompletten Sequenzen von MaSp1 und MaSp2 wurden eingefügt. Unabhängig von der
Wahl der SMART-Modi (Genome oder Normal) wurden die gleichen Ergebnisse ausgegeben.
[45]
Abbildung 20: Identifikation der terminalen Domänen von MaSp1 (oben) sowie MaSp2 (unten) der Spinne
Latrodectus hesperus mittels SMART.
Es handelt sich hierbei um einen Ausschnitt des gesamten Ergebnisses, da beide Sequenzen zu groß sind, um
komplett in der Abbildung dargestellt zu werden. Unabhängig vom gewählten SMART-Modus (Genome oder
Normal) werden die gleichen Ergebnisse ausgegeben. Die pink hervorgehobenen Sequenzbereiche kennzeichnen
Regionen von geringer Komplexität. Die grauen Bereiche markieren Regionen, über die keine Informationen
vorliegen. Die vollständigen Ergebnisse der SMART-Anwendung sind in einer gleichnamigen Datei gespeichert und
mit Hilfe eines Computers abrufbar. [45]
Außerdem wurde die CDD-Suche des MaSp1, sowie MaSp2 von L. hesperus durchgeführt, um
ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden. Die Suchanfrage
beider Proteine gab jeweils ein und denselben Treffer aus. Es wurde eine Übereinstimmung
mit dem Pfam-Eintrag 11260 gefunden. Der Pfam-Eintrag 11260 enthält Informationen über
sowohl MaSp1 als auch MaSp2, zusammengetragen aus verschiedenen Datenbanken des NCBI.
Aus diesen Daten geht die Ähnlichkeit der Strukturen der C-terminalen Domänen einher. So
ähnelt die C-terminale Domäne der Proteine MaSp1/MaSp2 von L. hesperus stark der C-
terminalen Domäne des Fibroins von Araneus diadematus. Dadurch wird die in vorherigen
Kapiteln erwähnte Konservierung der C-terminalen Regionen bioinformatisch bestätigt.
Abbildung 21 zeigt das Ergebnis der Suche mittels CDD. Die Übereinstimmung der
40
eingegebenen Sequenzen mit den Sequenzen des Pfam-Eintrags 11260 ist durch einen roten
Rahmen gekennzeichnet. Beide Suchergebnisse sind lokal gespeichert und können über einen
Computer abgerufen werden. [46]
Abbildung 21: CDD-Suche an MaSp1 (oben) sowie MaSp2 (unten) von L. hesperus.
Die CDD-Suche wurde durchgeführt, um ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden.
Die Suchanfrage beider Proteine gab jeweils ein und denselben Treffer aus. Es wurde eine Übereinstimmung mit
dem Pfam-Eintrag 11260 gefunden, durch den roten Rahmen gekennzeichnet. Aus diesen Daten geht die
Ähnlichkeit der Strukturen der C-terminalen Domänen einher. So ähnelt die C-terminale Domäne der Proteine
MaSp1/MaSp2 von L. hesperus stark der C-terminalen Domäne von Araneus diadematus. Dadurch wird die in
vorherigen Kapiteln erwähnte Konservierung der C-terminalen Regionen bioinformatisch bestätigt. Beide
Suchergebnisse sind lokal gespeichert und können über einen Computer abgerufen werden. [46]
41
4.3 Methodenkomplex 3
Anhand der Anwendung der bioinformatischen Tools SWISS-MODEL, SMART und CDD ist
auffällig, wie wenig strukturelle Informationen über die Proteine des Spinnenfadens bekannt
sind. Es existierten weder Templates einer homologen Sequenz (SWISS-MODEL), noch konnten
bestimmte Domänen innerhalb der Seidenproteine identifiziert werden (SMART). Lediglich die
Suche in der CDD des NCBI nach ähnlichen Sequenzen war erfolgreich. Es konnte die
Ähnlichkeit der C-terminalen Domänen innerhalb verschiedener Spinnenarten festgestellt
werden. Wieso sind weder Sekundärstrukturvorhersagetools noch Tools, die
Homologiemodelle erstellen erfolgreich? Trotz der einfachen, stark repetitiven Primärstruktur
der Seidenproteine, konnten bisher keine 3D-Strukturen modelliert bzw. simuliert werden. Die
Strukturbildung scheint zu komplex zu sein, um sie mit bioinformatischen Programmen
nachzuweisen oder zu verstehen. Aus diesem Grund sollte der nächste Aufgabenbereich den
praktischen Experimenten gewidmet werden. Die Ergebnisse der Kernmagnetresonanz,
Röntgenbeugungsanalyse und weitere an den Proteinen des Spinnenfadens durchgeführte
Experimente sollten noch genauer analysiert werden. Außerdem sollte das Programm 3D-
PSSM genutzt werden, um die Faltung der Spinnenseidenproteine vorherzusagen.
Mittels Rasterelektronenmikroskopie (SEM-scanning electron microscopy) und
Atomkraftmikroskopie (AFM-atomic force microscopy) wurden kleine mizellenartige
Unterstrukturen der sich in einer wässrigen Lösung befindenden spidroins entdeckt. [18, S.
1058] Transmissionselektronmikroskopie-Versuche belegen ebenfalls eine Bildung von
mizellenartigen Strukturen. [20, S. 8908] Die Forschungsgruppe um Fritz Vollrath entdeckte
eine andere Strukturbildung. Entgegen der Mizellentheorie wird von einer Flüssigkristalltheorie
ausgegangen, bei der die neusynthetisierten Seidenproteine zunächst eine flüssigkristalline
Phase innerhalb der Spinnlösung annehmen. [8, S 3644] Beide Theorien scheinen auf den
ersten Blick sehr gegensätzlich zu sein, jedoch schließt die Mizellentheorie von Jin und Kaplan
die Flüssigkristallinität nicht aus. [8, S. 3646] Im weiteren Verlauf der Arbeit galt es, diese
beiden Theorien zu untersuchen, zu vergleichen und durch das Einbringen eigener
Erkenntnisse zu verstehen. Außerdem wurde ein weiteres bioinformatisches Tool namens 3D-
PSSM benutzt, um homologe Strukturen bzw. Sequenzen zu finden. Das Problem war hierbei,
dass die Eingabesequenz nur aus 30 bis 800 Aminosäuren bestehen durfte. Um eine gezielte
Suche nach homologen Sequenzen zu ermöglichen, mussten die einzelnen Muster, genauer die
einzelnen Repeats der Proteine MaSp1 und MaSp2 in das Programm eingefügt werden. Zu
diesem Zweck wurde die Analysemethode Dotplot angewandt, um die einzelnen Repeats
42
innerhalb der Sequenzen beider spidroins zu identifizieren. Ein einfaches Programm, Dotlet
genannt, wurde an den Seidenproteinen angewandt, um die enthaltenen Repeats zu
erkennen. Anhand des paarweisen Alignments mittels Dotlet konnte der repetitive Mittelteil
des MaSp1 und des MaSp2 eindeutig identifiziert werden. Die terminalen Domänen heben sich
deutlich von dem Mittelteil ab. In Abbildung 22 ist die Sequenz des MaSp1 von L. hesperus im
Programm Dotlet dargestellt, in Abbildung 23 die Sequenz von MaSp2. Beide Sequenzen
wurden jeweils gegen sich selbst paarweise aligniert, um identische Bereiche innerhalb ein und
derselben Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats, die es galt
herauszufinden, um sie anschließend in das Programm 3D-PSSM einzufügen. Die eingestellten
Parameter (Fenstergröße 15; Gray Scale 100%-12%) sind bei beiden Proteinsequenzen
identisch, um einen einheitlichen Vergleich zu ermöglichen. Im oberen Teil der Abbildungen
(grün gekennzeichnet) befinden sich der Eingabebutton, sowie die Auswahlfenster, um
verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich
der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor
durch den Benutzer innerhalb des Sequenzalignments gesteuert werden. Die Markierung
mittels Cursor ist durch den Schnittpunkt der beiden blauen Geraden gekennzeichnet.
Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert wurden. Je nachdem,
welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der
Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots.
Unterhalb des Dotplots ist erkennbar, dass beide Eingabesequenzen an dieser Position
identisch sind (da es sich um ein und dieselbe Sequenz handelt). Ebenfalls gut erkennbar ist die
Diagonale durch die Matrix, ein zweiter Nachweis für die Identität der Eingabesequenzen.
Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)
konfiguriert werden.
In Abbildung 24 gut erkennbar ist, dass zu Beginn der Sequenz keine Repeats existieren. Erst ab
ca. 200 Aminosäuren sind Repeats erkennbar. Repeats sind im Dotplot mit schwarzen Linien
gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto
häufiger und desto größer sind die Repeats. Erstaunlich ist, dass die Kernsequenzen der
Seidenproteine MaSp1 und MaSp2 enorm viele Repeats enthalten. Außerdem sind die Repeats
ineinander geschachtelt, das bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats.
Die Sequenz besteht aus immer wiederkehrenden Mustern. Gut erkennbar ist dies in
Abbildung 24 und 25. In Abbildung 24 ist der Mittelteil des MaSp1 von L. hesperus im Dotplot
dargestellt, in Abbildung 25 der Mittelteil des MaSp2. Deutlich zu sehen sind die repetitiven
Muster. Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-
43
identischen Bereichen umgeben sind, entstehen quadratähnliche Formen im Dotplot. Die
Dotplots beider „major ampullate spidroins“ zeigen regelmäßige Quadrate innerhalb der
Sequenzen. Die Quadrate von MaSp1 sind größer als die Quadrate von MaSp2. Außerdem
ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren
Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot
gescrollt wird.
Abbildung 22: Sequenz (N-terminal) des MaSp1 von L. hesperus im Programm Dotlet.
Die komplette Sequenz von MaSp1 wurde gegen sich selbst paarweise aligniert, um identische Bereiche in der
Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats. Die eingestellten Parameter
(Fenstergröße 15; Gray Scale 100%-12%) sind mit denen in Abbildung 23 identisch, um einen einheitlichen Vergleich
zu ermöglichen. Im oberen Teil der Abbildung (grün gekennzeichnet) befinden sich der Eingabebutton sowie die
Auswahlfenster, um verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich
der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor durch den Benutzer
innerhalb des Sequenzalignments gesteuert werden. Die Markierung mittels Cursor ist durch den Schnittpunkt der
beiden blauen Geraden gekennzeichnet. Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert
wurden. Je nachdem, welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der
Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots. Unterhalb des Dotplots
ist erkennbar, dass beide Eingabesequenzen an dieser Position identisch sind (da es sich um ein und dieselbe
Sequenz handelt). Ebenfalls gut erkennbar ist die Diagonale durch die Matrix, ein zweiter Nachweis für die Identität
der Eingabesequenzen. Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)
konfiguriert werden. Weiße Stellen im Dotplot kennzeichnen nicht-identische Bereiche. Repeats sind im Dotplot mit
schwarzen Linien gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto häufiger
und desto größer sind die Repeats. Zu Beginn der Sequenz existieren keine Repeats. Erst ab ca. 200 Aminosäuren
sind Repeats erkennbar.
44
Abbildung 23: Sequenz (N-terminal) des MaSp2 von L. hesperus im Programm Dotlet.
Die komplette Sequenz von MaSp2 wurde gegen sich selbst paarweise aligniert, um identische Bereiche in der
Sequenz zu finden. Diese identischen Bereiche kennzeichnen die Repeats. Die eingestellten Parameter
(Fenstergröße 15; Gray Scale 100%-12%) sind mit denen in Abbildung 22 identisch, um einen einheitlichen Vergleich
zu ermöglichen. Im oberen Teil der Abbildung (grün gekennzeichnet) befinden sich der Eingabebutton sowie die
Auswahlfenster, um verschiedene Einstellungen (Fenstergröße, Zoom, u.a.) anzupassen. Im linken Teil befindet sich
der Dotplot, der das Ergebnis des paarweisen Alignments zeigt. Im Dotplot kann der Cursor durch den Benutzer
innerhalb des Sequenzalignments gesteuert werden. Die Markierung mittels Cursor ist durch den Schnittpunkt der
beiden blauen Geraden gekennzeichnet. Unterhalb des Dotplots befinden sich beide Sequenzen, die aligniert
wurden. Je nachdem, welchen Teil der Cursor im Dotplot markiert hat, wird unterhalb des Dotplots dieser Teil in der
Sequenz gezeigt. In der Abbildung befindet sich der Cursor genau in der Mitte des Dotplots. Unterhalb des Dotplots
ist erkennbar, dass beide Eingabesequenzen an dieser Position identisch sind (da es sich um ein und dieselbe
Sequenz handelt). Ebenfalls gut erkennbar ist die Diagonale durch die Matrix, ein zweiter Nachweis für die Identität
der Eingabesequenzen. Rechts neben dem Dotplot kann die Grauskala (Kontrast- bzw. Helligkeitseinstellung)
konfiguriert werden. Weiße Stellen im Dotplot kennzeichnen nicht-identische Bereiche. Repeats sind im Dotplot mit
schwarzen Linien gekennzeichnet. Je mehr Linien es sind und je dichter diese Linien aneinander sind, desto häufiger
und desto größer sind die Repeats. Zu Beginn der Sequenz existieren keine Repeats. Erst ab ca. 200 Aminosäuren
sind Repeats erkennbar.
45
Abbildung 24: Sequenz (Mittelteil) des MaSp1 von L. hesperus im Programm Dotlet.
Die Sequenz besteht aus immer wiederkehrenden Mustern. Erstaunlich ist, dass die Kernsequenz des
Seidenproteins MaSp1 enorm viele Repeats enthält. Außerdem sind die Repeats ineinander geschachtelt, das
bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats. Deutlich zu sehen sind die repetitiven Muster.
Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-identischen Bereichen umgeben
sind, entstehen quadratähnliche Formen im Dotplot. Der Dotplot zeigt regelmäßige Quadrate innerhalb der
Sequenz. Außerdem ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren
Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot gescrollt wird.
Abbildung 25: Sequenz (Mittelteil) des MaSp2 von L. hesperus im Programm Dotlet.
Die Sequenz besteht aus immer wiederkehrenden Mustern. Erstaunlich ist, dass die Kernsequenz des
Seidenproteins MaSp1 enorm viele Repeats enthält. Außerdem sind die Repeats ineinander geschachtelt, das
bedeutet, (kleinere) Repeats befinden sich in (größeren) Repeats. Deutlich zu sehen sind die repetitiven Muster.
Aufgrund der hohen Anzahl an identischen Bereichen, welche von wenigen nicht-identischen Bereichen umgeben
sind, entstehen quadratähnliche Formen im Dotplot. Der Dotplot zeigt regelmäßige Quadrate innerhalb der
Sequenz. Außerdem ordnen sich kleinere Quadrate so an, dass ein größeres Quadrat entsteht. Diese größeren
Quadrate sind besonders gut zu erkennen, wenn im Programm Dotlet durch den Dotplot gescrollt wird.
46
Mit Hilfe des Cursors im Dotplot und der darunterliegenden Markierung des
Sequenzabschnittes wurden einige Repeats in der Sequenz identifiziert und gekennzeichnet.
Beide Sequenzen enthalten zu viele Repeats, welche nicht alle identifiziert werden konnten
(siehe Abbildungen 22-25).
Anschließend konnten die einzelnen Repeats von MaSp1 und MaSp2 in das Programm 3D-
PSSM eingefügt werden. Die vollständigen Ergebnisse von 3D-PSSM sind lokal gespeichert und
mit Hilfe eines Computers abrufbar. In den Ergebnissen von 3D-PSSM befinden sich ebenfalls
die einzelnen Eingabesequenzen, welche die im Dotplot ausgewählten Repeats darstellen. Im
Anhang ist in Abbildung 30 ein Screenshot des Ergebnisses von 3D-PSSM aufgeführt.
Nachfolgend werden die Ergebnisse grob zusammengefasst. Die Sequenzen beider spidroins
ähneln sich ziemlich, unterscheiden sich aber auch in gewissen Dingen. (siehe Kapitel 2.4) Aus
diesem Grund werden einige ähnliche Ergebnisse, sowie einige unterschiedliche Ergebnisse der
Strukturhomologie ausgegeben. Bis zu einer Übereinstimmung von 50 Prozent wird die
Strukturähnlichkeit der Repeats von MaSp1 mit jeweiligen Treffern vorhergesagt. Die
Übereinstimmung der Strukturähnlichkeit der Repeats von MaSp2 beträgt sogar bis zu 58
Prozent. Im Wesentlichen wurden für die Repeats von MaSp1 drei homologe Strukturen
ausgegeben. Die Repeats von MaSp1 stimmen zu 50 Prozent mit der Sequenz von „major prion
protein“ (PDB-ID: 1oei), zu 39-43 Prozent mit der Sequenz von Collagen (PDB-ID: 1bkv) und zu
38 Prozent mit der Sequenz des Models von einer „Collagen-Mikrofibrille“ (PDB-ID: 2clg)
überein. Die Repeats von MaSp2 stimmen zu 38-58 Prozent mit dem Model einer „Collagen-
Mikrofibrille“ (PDB-ID: 2clg; 4clg) überein. Außerdem stimmt ein Repeat zu 61 Prozent mit der
Sequenz von Collagen (PDB-ID: 1bkv) überein. Ein Unterschied zu MaSp1 ist die
Übereinstimmung (34-41 %) der Struktur der Repeats von MaSp2 mit der „Collagen Triple
Helix“ (PDB-ID: 1k6f). Collagen (verschiedene PDB-ID’s) ist bei beiden spidroins der häufigste
ausgegebene Treffer. [19]
Mittels Rasmol 2.6 wurden die Strukturen der Proteine (PDB-ID’s: 1bkv, 2clg, 4clg, 1k6f)
betrachtet. Der Treffer des „major prion proteins“ wurde vernachlässigt. In Abbildung 26 sind
die mittels Rasmol betrachteten Strukturen dargestellt. Darin ist die Ähnlichkeit der 4
Strukturen von Collagen deutlich zu erkennen. Die „Collagen-Mikrofibrille“ (PDB-ID: 4clg)
besteht aus mehreren Proteinketten, welche sich parallel zueinander anordnen. Die anderen
Strukturen von Collagen bestehen aus weniger Proteinketten (drei) als die größere Collagen-
Mikrofibrille. Wahrscheinlich ordnen sich die einzelnen Proteinketten so an, dass eine größere
fibrillenartige Struktur entsteht, welche dem Modell der PDB-ID „4clg“ ähnelt.
47
Da die Sequenzen der Repeats der Spinnenseidenproteine den Sequenzen von Collagen
ähneln, (zusammengefasst 34-58 Prozent), ähneln sich vermutlich auch ihre Strukturen. Die
Besonderheit an Collagen ist der enorm hohe Anteil an Glycin. Eine weitere, im Collagen häufig
vorkommende Aminosäure ist Prolin. Mehr Informationen zu den Besonderheiten der Struktur
von Collagen im Buch Grundstudium Biologie 1. Aufl. - Heidelberg u.a.: Spektrum
Akademischer Verlag GmbH, 2000 [23, S. „5-15“].
Abbildung 26: Betrachtung von Proteinstrukturen mittels Rasmol 2.6.
Mittels Rasmol 2.6 wurden die Strukturen der Proteine, deren Primärstrukturen den Sequenzen der Repeats von
MaSp1/MaSp2 ähneln, betrachtet. Die Ähnlichkeit der Sequenzen wurde mittels 3D-PSSM herausgefunden.
Abbildung 26 zeigt vier 3D-Strukturen von Collagen (PDB-ID’s: 1bkv, 2clg, 4clg, 1k6f). Oben links im Bild ist die
Längsstruktur von Collagen der PDB-ID 1bkv, Mitte links die Längsstruktur von Collagen der PDB-ID 1k6f, oben
rechts die Längsstruktur von dem Modell „Collagen-Mikrofibrille“ der PDB-ID 4clg, Mitte rechts die Längsstruktur
von dem Modell „Collagen-Mikrofibrille“ der PDB-ID 2clg und unten die Querstruktur von dem Modell „Collagen-
Mikrofibrille“ der PDB-ID 4clg dargestellt. Die Ähnlichkeit der 4 Strukturen von Collagen ist deutlich zu erkennen.
Die „Collagen-Mikrofibrille“ (PDB-ID: 4clg) besteht aus mehreren Proteinketten, welche sich parallel zueinander
anordnen (oben rechts und unten). Die anderen Strukturen von Collagen bestehen aus weniger Proteinketten als
die größere Collagen-Mikrofibrille. Wahrscheinlich können sich die einzelnen Proteinketten so anordnen, dass eine
größere fibrillenartige Struktur entsteht, welche dem Modell der PDB-ID „4clg“ ähnelt.
48
Ein weiteres angewandtes Tool ist das Tool „Prediction of TransMembrane Beta-Barrel
Proteins (PRED TMBB)“. Als Input wurden die kompletten Sequenzen von MaSp1 sowie MaSp2
eingefügt. Das Tool berechnete auf Grundlage dreier verschiedener Algorithmen (Viterbi, N-
best, Posterior decoding) die Topologie von Transmembransträngen und β-Barrels in den
Eingabeproteinen. Weitere Informationen in der wissenschaftlichen Ausarbeitung [4]. Die
ermittelten Daten können in einer Grafik dargestellt werden, siehe Abbildung 27 und 28. In
Abbildung 27 ist das Ergebnis der Vorhersage der Topologie von MaSp1 mittels Viterbi-
Algorithmus erkennbar, in Abbildung 28 das Ergebnis der Vorhersage der Topologie von MaSp2
mittels Viterbi-Algorithmus. In beiden Abbildungen wird deutlich, dass sich der Großteil der
Proteine im Inneren befindet. Ein kleiner Teil befindet sich außerhalb (im umgebenden
Medium) der Doppellipidschicht. Zu erwähnen ist, dass sich MaSp1 sowie MaSp2 eigentlich
nicht in einer Doppellipidschicht befinden. Das Tool PRED TMBB wurde genutzt, um das
Strukturverhalten der Seidenproteine in Lösung zu ermitteln. Wie bereits erwähnt, können sich
die Eiweißketten von MaSp1 bzw. MaSp2 so anordnen, dass eine mizellenartige Struktur
entsteht. Entsprechend der Ergebnisse aus PRED TMBB befindet sich der Großteil der
Seidenproteine im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung,
ragt. Ein Teil der N-terminalen Domäne befindet sich im Inneren nahe der Doppellipidschicht.
Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der
Doppellipidschicht. Der Großteil sowie die C-terminale Domäne der „major ampullate
spidroins“ befinden sich innerhalb der Doppellipidschicht bzw. der mizellenartigen Struktur.
Mittels PRED TMBB wurde nachgewiesen, dass sich die N-terminalen Domänen nach außen
anordnen bzw. die äußere Wand der mizellenartigen Strukturen der Seidenproteine, während
der Speicherung innerhalb der Spinndrüsen, bilden.
49
Abbildung 27: Vorhersage der Topologie von MaSp1 mittels Viterbi-Algorithmus des PRED TMBB.
Das Ergebnis zeigt das Strukturverhalten von MaSp1 in einer Doppellipidschicht. Farblich gekennzeichnet ist das
hydrophobe Potential jeweiliger Aminosäuren (gelb=hydrophob, blau=hydrophil). Ein kleiner Teil (Aminosäure 13-
30) befindet sich außerhalb (im umgebenden Medium) der Doppellipidschicht. Eigentlich befindet sich MaSp1 nicht
in einer Doppellipidschicht. Das Tool PRED TMBB wurde genutzt, um das Strukturverhalten des Seidenproteins in
Lösung zu ermitteln. Wie bereits erwähnt, können sich die Eiweißketten von MaSp1 so anordnen, dass eine
mizellenartige Struktur entsteht. Die in PRED TMBB verwendete Doppellipidschicht entspricht der „Membran“ der
mizellartigen Struktur. Entsprechend des Ergebnisses aus PRED TMBB befindet sich der Großteil des Seidenproteins
im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung, ragt. Die N-terminale Domäne von
MaSp1 erstreckt sich von Aminosäure 1-202. Ein Teil der N-terminale Domäne befindet sich im Inneren nahe der
Doppellipidschicht. Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der
Doppellipidschicht. Der Großteil sowie die C-terminale Domäne des MaSp1 befinden sich innerhalb der
Doppellipidschicht bzw. der mizellenartigen Struktur, was jedoch nicht in der Grafik des Ergebnisses aus PRED TMBB
dargestellt ist. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und mit Hilfe eines
Computers abrufbar.
50
Abbildung 28: Vorhersage der Topologie von MaSp2 mittels Viterbi-Algorithmus des PRED TMBB.
Das Ergebnis zeigt das Strukturverhalten von MaSp2 in einer Doppellipidschicht. Farblich gekennzeichnet ist das
hydrophobe Potential jeweiliger Aminosäuren (gelb=hydrophob, blau=hydrophil). Ein kleiner Teil (Aminosäure 16-
39) befindet sich außerhalb (im umgebenden Medium) der Doppellipidschicht. Eigentlich befindet sich MaSp2 nicht
in einer Doppellipidschicht. Das Tool PRED TMBB wurde genutzt, um das Strukturverhalten des Seidenproteins in
Lösung zu ermitteln. Wie bereits erwähnt, können sich die Eiweißketten von MaSp2 so anordnen, dass eine
mizellenartige Struktur entsteht. Die in PRED TMBB verwendete Doppellipidschicht entspricht der „Membran“ der
mizellartigen Struktur. Entsprechend des Ergebnisses aus PRED TMBB befindet sich der Großteil des Seidenproteins
im Inneren, während ein kleiner Teil nach außen, in die umgebene Lösung, ragt. Die N-terminale Domäne von
MaSp2 erstreckt sich von Aminosäure 1-217. Ein Teil der N-terminale Domäne befindet sich im Inneren nahe der
Doppellipidschicht. Ein anderer Teil der N-terminalen Domäne befindet sich innerhalb bzw. außerhalb der
Doppellipidschicht. Der Großteil sowie die C-terminale Domäne des MaSp2 befinden sich innerhalb der
Doppellipidschicht bzw. der mizellenartigen Struktur, was jedoch nicht in der Grafik des Ergebnisses aus PRED TMBB
dargestellt ist. Das vollständige Ergebnis des Tools ist in einer gleichnamigen Datei gespeichert und mit Hilfe eines
Computers abrufbar.
51
5 Zusammenfassung und Auswertung
5.1 Methoden
In Abbildung 29 ist ein Schema der durchgeführten Methoden dargestellt. Nachfolgend sind
die Ergebnisse, sowie die Interpretation derselben zusammenfassend aufgeführt.
Abbildung 29: Workflow der durchgeführten Methoden.
Hier sind die durchgeführten Methoden grob zusammengefasst. Entsprechend des Arbeitsplans wurden die
Aufgaben in 3 einzelne Methodenkomplexe unterteilt. Im Schema aufgeführt sind lediglich die Inhalte, welche
bearbeitet wurden sowie die erhaltenen Ergebnisse (kurz). Nicht enthalten sind die Auswertung und die
Interpretation der Ergebnisse. Der vollständige Inhalt ist den einzelnen Methodenkomplexen aufgeführt, während
die Interpretation und Bewertung der Ergebnisse im Kapitel Zusammenfassung und Auswertung zu finden ist.
Mittels PROPKA 2.0 wurde nachgewiesen, dass die Stabilität der N-terminalen Domäne bei
einem neutralen pH-Wert von 7, welcher während der Speicherung des Seidenproteins
innerhalb der Drüse vorliegt, geringer ist als bei einem sauren pH-Wert (siehe Abbildung 15).
52
Ein saurer pH-Wert (ca. 6) liegt während der Umstrukturierung der Seidenproteine innerhalb
des Spinnkanals vor. (siehe Kapitel 2.3). Das bedeutet, dass die N-terminale Domäne durch
einen sauren pH-Wert stabilisiert wird. Dies würde auch mit den Informationen aus [2]
übereinstimmen. Kontrovers sind die Ergebnisse, die die Untersuchung der C-terminalen
Domäne (Fibroins 3 von Araneus diadematus) mittels PROPKA, lieferte. Es stellte sich heraus,
dass die Stabilität der C-terminalen Domäne von ADF-3 bei einem neutralen pH-Wert größer
ist als die Stabilität bei einem sauren pH-Wert. Die Stabilität der C-terminalen Domäne von
ADF-3 verhält sich demnach genau umgekehrt wie die Stabilität der N-terminalen Domäne von
MaSp1 von E. australis in Abhängigkeit vom pH-Wert. Die Art der Stabilität beider terminaler
Domänen variiert ebenfalls. Die N-terminale Domäne des MaSp1 von E. australis weist
überwiegend negative Werte der Stabilität und erst ab einem pH-Wert kleiner gleich 4 positive
Werte auf. Dagegen besitzt die C-terminale Domäne von ADF-3 durchgängig positive Werte
der Stabilität. Bisher gingen Forschungsgruppen stets davon aus, dass sowohl die N-terminale
Domäne als auch die C-terminale Domäne nach der Proteinsynthese schnell eine stabile Form
annehmen. Die mittels PROPKA gewonnenen Daten sind daher nur unter Vorbehalt zu
verwenden.
Die Recherche nach Informationen über Proteine, von denen bekannt ist, dass sie bei zwei
unterschiedlichen pH-Werten zwei unterschiedliche Strukturen ausbilden, blieb erfolglos.
Demnach konnten auch keine Abbildungen generiert werden, welche die Sekundär- bzw.
Tertiärstrukturen der jeweiligen fertig gefalteten Proteine in Abhängigkeit vom pH-Wert
darstellen. Während der Recherchen über Informationen von 3D-Strukturen der
Spinnenseidenproteine konnte eine komplette Sequenz der Proteine MaSp1 sowie MaSp2 von
Latrodectus hesperus in der Universal Protein Resource (UniProt) gefunden werden, welche für
nachfolgende Arbeiten verwendet wurde.
Die Sekundärstruktur der Proteine MaSp1 und MaSp2 von L. hesperus wurde mit Hilfe der
Tools GOR und Chou-Fasman vorhergesagt. Beide Tools sagten eine Helix-Struktur-Bildung der
Poly-Alanin-Muster vorher (siehe Abbildung 16). Diese Daten sind als „falsch“ bzw. als nicht
aussagekräftig zu werten. Kernmagnetresonanzexperimente, sowie Röntgenbeugungsanalyse,
welche am Abseilfaden von Nephila clavipes durchgeführt worden waren, belegen die Bildung
von β-Faltblättern der Poly-Alanin-Muster. [47, S. 545; 13, S. 82] Da die bioinformatischen
Vorhersagetools GOR und Chou-Fasman keine aussagekräftigen Ergebnisse über die
Sequenzen beider „major ampullate spidroins“ von Latrodectus hesperus lieferten, sollten
andere Vorhersagetools angewandt werden.
53
Es galt, mittels SWISS-MODEL Homologiemodelle aus der kompletten Spidroinsequenz von
Latrodectus hesperus zu erstellen. Hauptsächlich sollten nur die repetitiven Kernsequenzen
beider Spidroins benutzt werden, da diese Bereiche β-Faltblätter bilden. Unter Zuhilfenahme
des Tools LALIGN sollten die einzelnen terminalen Domänen, sowie der repetitive Mittelteil
innerhalb der gesamten Sequenz des MaSp1 bzw. MaSp2 von L. hesperus identifiziert werden.
Die Grundidee der Benutzung von LALIGN erwies sich als nicht umsetzbar, da von den anderen
Spinnenseidenproteinen nur einzelne Fragmente in den Datenbanken existierten. Die
jeweiligen terminalen Domänen konnten aus den existierenden Fragmenten nicht vollständig
herausgefiltert werden. Mit anderen Worten, es konnte nicht zugeordnet werden, ob
vorliegende Sequenzfragmente eine komplette terminale Domäne charakterisierten. Anhand
der Veröffentlichung zu den UniProt-Einträgen beider „major ampullate spidroins“ von L.
hesperus konnten die N-terminalen Domänen, die C-terminalen Domänen, sowie die
repetitiven Kernsequenzen beider Sequenzen identifiziert werden. Anschließend wurde der
repetitive Mittelteil in das Tool SWISS-MODEL Template Identification eingefügt, um ein
Template zu finden. Die Suche nach einem Template blieb erfolglos. Es existierten keine
homologen Daten zu der repetitiven Kernsequenz des MaSp1 bzw. MaSp2 von L. hesperus,
weder ähnliche Sequenzen noch ähnliche Strukturen. Ohne das Template konnte somit kein
Strukturmodell erzeugt werden. Ein Modell des repetitiven Mittelteils des MaSp1 von L.
hesperus konnte daher mittels SWISS-MODEL nicht erstellt werden. Der Automated Mode von
SWISS-MODEL lieferte ebenfalls kein Ergebnis.
Lediglich mit Hilfe des Tools „Secondary Structure Prediction and Domain Assignment” von
SWISS-MODEL konnten die terminalen Domänen beider „major ampullate spidroins“
identifiziert werden (siehe Abbildung 18 und 19). Die Vorhersage der Helixstrukturen am
Anfang und Ende beider spidroin-Sequenzen stimmt mit den Ergebnissen aus den
Röntgenanalysen-Experimenten der Forschungsgruppen überein. [2, S. 237; 23, S. 239-240]
Diese Bereiche kennzeichnen die terminalen Domänen des Seidenproteins. Der repetitive
Mittelteil der Sequenz bildet laut diesem Tool Coil-Strukturen aus, da noch keine genaueren
Informationen zu diesen Sekundärstrukturen existieren. Das Ergebnis der „Secondary Structure
Prediction and Domain Assignment” stellt somit eine gute Zusammenfassung der bisherigen
Informationen über die Strukturen der Seidenproteine MaSp1 und MaSp2 dar. Die
experimentell gewonnenen Informationen über die Strukturen der terminalen Domänen
wurden so bioinformatisch nachgewiesen. Mit Hilfe des Tools SMART konnten die terminalen
Domänen innerhalb der „major ampullate spidroins“ von L. hesperus nicht identifiziert werden
(siehe Abbildung 20).
54
Außerdem wurde die CDD-Suche des MaSp1, sowie des MaSp2 von L. hesperus durchgeführt,
um ähnliche Proteindomänen zu den eingegebenen Seidenproteinen zu finden. Es wurde eine
Übereinstimmung mit dem Pfam-Eintrag 11260 gefunden. Aus diesen Daten geht die in
vorherigen Kapiteln erwähnte Konservierung der C-terminalen Regionen hervor und wird
somit bioinformatisch bestätigt. (Abbildung 21) [46].
Wissenschaftliche Experimente und zugehörige Veröffentlichungen besagen, dass sowohl die
C-terminale als auch die N-terminale Domäne einen hohen Anteil an α-Helices, sowie eine
hohe thermische Stabilität besitzen. [11, S. 310; 23, S. 239-240] Beide terminale Domänen
weisen hydrophobere Eigenschaften als der repetitive Mittelteil auf. [10, S. 239; 19, S. 3] Die
hydrophobste Stelle in MaSp1 und MaSp2 befindet sich am Beginn der N-terminalen Domäne,
wie in Abbildung 17 erkennbar ist. [3, S. 6; 48]
Außerdem wurde das Tool 3D-PSSM benutzt, um homologe Strukturen bzw. Sequenzen zu
finden. Um die einzelnen Repeats innerhalb der Sequenzen beider spidroins zu identifizieren
(und diese anschließend in das Programm 3D-PSSM einzufügen), wurde die Analysemethode
Dotplot angewandt (siehe Abbildung 22-25). Nachfolgend werden die Ergebnisse von 3D-PSSM
grob zusammengefasst. (Abbildung 30 im Anhang zeigt ein Screenshot des Ergebnisses von 3D-
PSSM). Collagen (verschiedene PDB-ID’s) ist bei beiden spidroins der häufigste ausgegebene
Treffer. [19] Mittels Rasmol 2.6 wurden die Strukturen der 4 Proteine (PDB-ID’s: 1bkv, 2clg,
4clg, 1k6f) betrachtet und eine hohe Ähnlichkeit der 4 Proteinstrukturen festgestellt
(Abbildung 26). Wahrscheinlich ordnen sich die einzelnen Proteinketten so an, dass eine
größere fibrillenartige Struktur entsteht (PDB-ID: 4clg). Da die Sequenzen der Repeats der
Spinnenseidenproteine den Sequenzen von Collagen ähneln, ähneln sich vermutlich auch ihre
Strukturen. Die Besonderheit an Collagen ist der enorm hohe Anteil an Glycin. Eine weitere, im
Collagen häufig vorkommende Aminosäure ist Prolin. (Mehr Informationen zu den
Besonderheiten der Struktur von Collagen im Buch Grundstudium Biologie 1. Aufl. - Heidelberg
u.a.: Spektrum Akademischer Verlag GmbH, 2000 [23, S. „5-15“]). Im Kapitel 5.2 wird näher
auf die Strukturbildung der Spinnenseidenproteine eingegangen.
5.2 Strukturbildung der Spinnenseidenproteine
Während der Speicherung der Seidenproteine innerhalb der Spinndrüse, bei einem pH-Wert
von 7, sorgt Natriumchlorid für eine Stabilisierung der Monomerstruktur der N-terminalen
Domäne. Gleichzeitig wird die Dimerisierung unterbunden. [10, S. 239; 47, S. 311-312] So ist es
möglich, dass selbst bei einer sehr hohen Proteinkonzentration die Seidenproteine innerhalb
55
der Drüse keine Faserstruktur einnehmen. [10, S. 239] Doch wieso verklumpen bzw.
kristallisieren die Proteine in solch einer hohen Konzentration (bis zu 50 % w/v) nicht?
Mit Hilfe der gesammelten Daten aus den praktischen Experimenten und den
bioinformatischen Versuchen wurden zwei Theorien der Faserassemblierung aufgestellt. Eine
Theorie ist die Flüssigkristalltheorie, die andere Theorie wird als Mizellentheorie bezeichnet.
Verschiedene Forschungsgruppen postulierten diese Theorien anhand von praktischer
Experimente (siehe Methodenkomplex 3) [18, S. 1058; 21, S. 8908; 8, S 3644].
Laut der Flüssigkristalltheorie nehmen die neusynthetisierten Seidenproteine zunächst eine
flüssigkristalline Phase innerhalb der Spinnlösung an. In dieser Phase ordnen sich die Proteine
so an, dass die Längsachsen der Moleküle parallel zueinander und senkrecht zum Epithel
angeordnet sind. Beim Fluss durch die Drüse ordnen sich die Proteinketten immer enger
nebeneinander und bilden scheibenartige Komplexe. Die im Spinnkanal auftretende
Dehnströmung sorgt für die Verlängerung der scheibenartigen Komplexe. In diesem Schritt
bilden sich aus den Coil-Strukturen des repetitiven Mittelteil β-Faltblattstrukturen. Die
Strukturänderung wird durch die Absenkung des pH-Werts begünstigt. Der anschließende
Wasserentzug sorgt für die endgültige Bildung der Faserstrukturen. [8, S. 3644]
Die andere Theorie ist die Theorie der Mizellenbildung. Bei dieser Theorie wird davon
ausgegangen, dass die terminalen Domänen der neusynthetisierten Seidenproteine sehr
schnell eine stabile Form bilden. Beide terminale Domänen spielen eine große Rolle für die
korrekte Assemblierung der Seidenfaser (siehe Methodenkomplex 2). [3, S. 9-10; 23, S. 241;
22, S. 236; 23, S. 240-241; 47, S. 312] Aufgrund der hohen Konzentration in der Spinnlösung
würden die stabilen Strukturen sehr schnell miteinander wechselwirken, was zu einer
Verklumpung bzw. Kristallisation der Proteine führen würde. Damit dies nicht geschieht,
müssen die Moleküle eine zur Lösung hin stabile, sowie energetisch günstige Struktur
annehmen. Aus diesem Grund nehmen die Seidenproteine in Lösung eine mizellenartige
Struktur an, bei der die terminalen Domänen eine stabile Oberfläche bilden. Da die Lösung
nicht nur die Seidenproteine und Wasser, sondern auch Natriumchlorid enthält, handelt es
sich um keine hydrophile Lösung im eigentlichen Sinne. Natriumchlorid spielt eine
entscheidende Rolle, indem es die die Wechselwirkungen der Mizellen untereinander
unterbindet (siehe Methodenkomplex 2) und sich sozusagen zwischen die mizellenartigen
Strukturen drängt. [30] Aufgrund dieser Tatsache können sich die hydrophoben terminalen
Domänen der Seidenproteine an der Oberfläche der mizellenartigen Strukturen befinden,
56
während sich die hydrophileren repetitiven Kernsequenzen im Inneren der Mizellen befinden.
Dabei nehmen die repetitiven Bereiche keine bestimmte Struktur ein, sondern besitzen eine
zufällige Coil-Struktur. Die Bildung dieser Mizellen wäre in reinem Wasser aus energetischen
Gründen nicht möglich. [30]
Beide Theorien scheinen auf den ersten Blick sehr gegensätzlich zu sein, jedoch schließt die
Mizellentheorie die Flüssigkristalltheorie nicht aus. [8, S. 3646] Vielleicht zeigen die
Seidenproteine der Spinne sowohl ein flüssigkristallines als auch ein mizellenartiges Verhalten.
Die mizellenartigen Strukturen werden im Spinnkanal durch eine erhöhte Dehnströmung und
auftretender Scherkräfte umstrukturiert. Die Mizellen lagern sich zu größeren
Makrostrukturen zusammen. Der Austausch von Natriumchlorid gegen Kaliumphosphat, die
pH-Wert-Abnahme von 7,0 auf 6,2 und der Wasserentzug ermöglichen diese Anhäufung, sowie
diese Umstrukturierung. [8, S. 3645; 14, S. 999] Außerdem werden die mizellenartigen
Strukturen „geöffnet“ und es kommt zur Bildung von β-Faltblattstrukturen der repetitiven
Kernsequenzen. Aufgrund der Dimerisierung je zweier N-terminaler Domänen entsteht ein aus
zwei Seidenproteinen bestehendes Molekül. Außerdem können je zwei C-terminale Domänen
mittels Disulfidbindung verknüpft werden. Durch die Dimerisierung, sowie die verknüpfende
Wirkung der Disulfidbindungen entstehen sehr lange Eiweißketten, wodurch die typische
Faserform resultiert. Letztendlich tritt die flüssige Faser durch die Spinnenwarze aus. Mit den
Gliedmaßen zieht die Spinne die Faser heraus, welche sich durch diesen Zugmechanismus
endgültig verfestigt.
Ob die repetitiven Kernsequenzen während der Umstrukturierung im Spinnkanal tatsächlich β-
Faltblattstrukturen bilden, ist zweifelhaft. Ergebnisse des 3D-PSSM zeigten, dass Collagen den
Repeats der Spinnenseidenproteine sehr ähnlich ist. Collagen besteht aus mehreren Helices,
die sich ineinander winden. Drei Helices ineinander gewickelt werden als Tripelhelix
bezeichnet. Aufgrund der hohen Sequenzähnlichkeit ist es möglich, dass die Repeats der
Spinnenseidenproteine anstelle der β-Faltblattstrukturen Tripelhelices bilden. Dies wird durch
die Ergebnisse von 3D-PSSM verlautet. Doch auch dieses Ergebnis ist wie alle
Strukturvorhersagetools nur unter Vorbehalt zu verwenden. Die komplizierten Strukturen
lassen sich oftmals nicht mittels bioinformatischer Software vorhersagen, eben weil die Natur
nicht ausnahmslos allen Gesetzen oder Regelmäßigkeiten folgt. Hierbei wird die
anspruchsvolle Aufgabe der Bioinformatik sichtbar. Das Ziel der Bioinformatik ist unter
anderem die Vorhersage der Faltung von Proteinen. Proteine wie die Spinnenseidenproteine
57
und Collagen zeigen, dass die Simulation der Proteinfaltung nicht immer möglich ist. Nichts in
der Sequenz dieser Proteine deutet zunächst auf deren endgültige Struktur hin. Erst durch
verschiedene biologische, chemische und physikalische Faktoren entstehen die tatsächlichen
Strukturen.
58
6 Ausblick
Das Geheimnis des Spinnenfadens konnte in dieser Bachelorarbeit nicht gelöst werden.
Bekanntes Wissen aus praktischen Experimenten wurde mit Daten aus bioinformatischen
Programmen verglichen. Die bioinformatischen Untersuchungen am Spinnenfaden zeigten,
dass die Strukturvorhersage auf Basis der Sequenzinformation nicht immer möglich ist. Die
Strukturbildung der Spinnenseidenproteine konnte nicht simuliert oder modelliert werden. Die
Bioinformatik kommt bei solch komplizierten Strukturbildungen der spidroins oder der von
Collagen an ihre Grenzen. Hier wird deutlich, in welchen Bereichen die Bioinformatik noch
weiterzuentwickeln ist. Daher müssen bei Strukturvorhersagen die biologischen, chemischen
und physikalischen Bedingungen beachtet werden. Dies würde einen enormen
Rechenaufwand seitens der Informatik erfordern.
Um das Geheimnis des Spinnenfadens zu lüften, werden genauere Informationen über die
repetitiven Kernsequenzen der spidroins benötigt. Diese Informationen sind derzeit mit
bioinformatischen Programmen nicht zu beschaffen. Aus diesem Grund würde die Analyse der
Kernsequenzen der Spinnenseidenproteine weitere praktische Experimente erfordern.
Vielleicht bleibt das Geheimnis des Spinnenfadens dem Menschen noch eine lange Zeit
verborgen. Vielleicht lassen sich nicht ausnahmslos alle Aspekte der Natur nachbilden.
Nichtsdestotrotz ist der Spinnenfaden als biologisches Objekt äußerst interessant und
demnach ein sehr begehrtes Forschungsobjekt.
59
7 Danksagung
Besonderer Dank gilt meinem Betreuer Prof. Dr. rer. nat. Dirk Labudde, der mir überhaupt erst
die Bearbeitung dieses Themas in der Zeit des Praxismoduls und der Bachelorarbeit ermöglicht
hat. Dieses Thema interessierte mich bereits vor dem Studium. Deshalb danke ich Professor
Labudde, welcher mein Interesse gefördert hat. Während den Arbeiten gab es Zeiten, in denen
ich sprichwörtlich den Wald vor lauter Bäume nicht gesehen habe. Ohne Herrn Labudde wäre
ich vermutlich ewig in diesem Wald des inhaltlichen Durcheinanders herum geirrt.
Herzlicher Dank gilt auch allen „sonstigen“ Helfern, die mir während der Arbeit entweder Mut
zugesprochen oder mir den nötigen Ansporn gegeben haben. Außerdem möchte ich mich bei
allen bedanken, die diese Arbeit zur Korrektur gelesen haben. An dieser Stelle möchte ich
Michael Thiele namentlich erwähnen.
Außerdem möchte ich mich bei Alex Demba bedanken, welcher mich bei den physikalischen
Grundlagen des Spinnenfadens inhaltlich unterstützt hat.
Weiterer Dank gilt allen Freunden in meinem Umfeld, die mich während der Zeit der
Bachelorarbeit moralisch unterstützten. Ohne sie hätte ich wahrscheinlich früher oder später
das Handtuch geworfen.
60
8 Quellen
[1] Arnold, Konstantin; Bordoli, Lorenza; Kopp, Jürgen; Schwede, Torsten: The SWISS-
MODEL workspace: a web-based environment for protein structure homology
modeling. In: Bioinformatics - Oxford: Oxford University Press. - (2006) vol. 22, no. 2, S.
195-201
[2] Askarieh, Glareh; Hedhammar, My; Nordling, Kerstin; Saenz, Alejandra; Casals, Cristina;
Rising, Anna; Johansson, Jan; Knight, Stefan D.: Self-assembly of spider silk proteins is
controlled by a pH-sensitive relay. In: Nature - London: Macmillan Magazines Limited. -
(2010)465, S. 236-238
[3] Ayoub, Nadia A.; Garb, Jessica E.; Tinghitella, Robin M.; Collin, Matthew A.; Hayashi
Cheryl Y.: Blueprint for a high-performance biomaterial: full-length spider dragline silk
genes. In: PLoS ONE. - Riverside, California: PLoS ONE - 2(2007)6:e514, S. 1-13
[4] Bagos, Pantelis G.; Liakopoulos, Theodore D.; Spyropoulos, Ioannis C.; Hamodrakas,
Stavros J.: PRED-TMBB: a web server for predicting the topology of β-barrel outer
membrane proteins. In: Nucleic Acids Research - Oxford: Oxford University Press. -
(2004) vol. 32, Web Server issue, S. W400-404
[5] Bellmann, Heiko: Kosmos Atlas Spinnentiere Europas. - 3. Aufl. - Stuttgart: Franckh-
Kosmos Verlags-GmbH & Co. KG, 2006
[6] Berg, Jeremy M.; Tymoczko, John L.; Stryer, Lubert: Biochemie. - 6. Aufl. - Heidelberg,
u.a.: Elsevier GmbH, Spektrum Akademischer Verlag, 2007
[7] Dalton, Stephen: Spinnen: Die erfolgreichen Jäger. - 1. Aufl. - Bern: Haupt Verlag,
2009
[8] Eisoldt, Lukas; Smith, Andrew; Scheibel, Thomas: Decoding the secrets of spider silk. In:
Materials Today. - Oxford: Elsevier Ltd. - (2011) Volume 14, Issue 3, S. 80-86
[9] Finn, Robert D.; Mistry, Jaina; Tate, John; Coggill, Penny; Heger, Andreas; Pollington,
Joanne E.; Gavin, O. Luke; Gunasekaran, Prasad; Ceric, Goran; Forslund, Kristoffer;
Holm, Liisa; Sonnhammer, Erik L. L.; Eddy, Sean R.; Bateman, Alex: The Pfam protein
families database. In: Nucleic Acids Research - Oxford: Oxford University Press. - (2010)
vol. 38, Database issue, S. D211-222
[10] Hagn, Franz; Eisoldt, Lukas; Hardy, John G.; Vendrely, Charlotte; Coles, Murray;
Scheibel, Thomas; Kessler, Horst: A conserved spider silk domain acts as a molecular
switch that controls fibre assembly. In: Nature - London: Macmillan Magazines Limited.
- (2010)465, S. 239-242
61
[11] Hagn, Franz; Thamm, Christopher; Scheibel, Thomas; Kessler, Horst: pH-Dependent
Dimerization and Salt-Dependent Stabilization of the N-terminal Domain of Spider
Dragline Silk – Implications for Fiber Formation. In: Angew. Chem. Int. Ed. - Weinheim:
Wiley VCH Verlag GmbH & Co KGaA. - (2011)50, S.310-313
[12] Hänsel, Horst; Neumann, Werner: Physik: Mechanik und Wärmelehre. - 1. Aufl. -
Heidelberg u.a.: Spektrum Akademischer Verlag GmbH, 1993
[13] Heim, Markus; Keerl, David; Scheibel, Thomas: Spinnenseide: vom löslichen Protein
zur außergewöhnlichen Faser. In: Angew. Chem. - Weinheim: Wiley VCH Verlag
GmbH & Co KGaA. - (2009)121, S. 3638-3650
[14] Heim, Markus; Römer, Lin; Scheibel, Thomas: Hierarchical structures made of proteins.
The complex architecture of spider webs and their constituent silk proteins. In: Chem.
Soc. Rev. - London: The Royal Society of Chemistry. - (2009)39, S. 156-164
[15a] Garnier J.; Osguthorpe, D. J.; Robson, B.: Analysis of the accuracy and implications of
simple methods for predicting the secondary structure of globular proteins. In: Journal
of Molecular Biology - Amsterdam: Elsevier Ltd. - (1978) vol. 120, issue 1, S. 97-120
[15b] Gibrat, J. F.; Garnier, J.; Robson, B.: Further developments of protein secondary
structure prediction using information theory: New parameters and consideration of
residue pairs. In: Journal of Molecular Biology - Amsterdam: Elsevier Ltd. - (1987) vol.
198, issue 3, S. 425-443
[15c] Garnier, J.; Gibrat, J. F.; Robson, B.: GOR secondary structure prediction method
version IV. In: R.F. Doolittle Ed. - Methods in Enzymology. - (1996) vol. 266, S. 540-553
[16] Gerthsen, Christian; Kneser, Hans O.; Vogel, Helmut: Physik: ein Lehrbuch zum
Gebrauch neben Vorlesungen. - 16. Aufl. - Berlin u.a.: Springer-Verlag, 1989
[17] Gosline, J. M.; Guerette, P. A.; Ortlepp, C. S.; Savage, K. N.: The mechanical design of
spider silks: from fibroin sequence to mechanical function. In: The Journal of
Experimental Biology. - Cambridge: The Company of Biologists Limited. - (1999)202, S.
3295-3303
[18] Jin, Hyoung-Joon; Kaplan, David L.: Mechanism of silk processing insects and spiders.
In: Nature - London: Nature Publishing Group. - (2003)424, S. 1057-1061
[19] Kelley, Lawrence: < [email protected]> : Welcome to the 3D-PSSM Web Server V
2.6.0. URL: <http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html>, verfügbar am:
09.08.2011
62
[20] Lin, Zhi ; Huang, Weidong; Zhang, Jingfeng; Fan, Jing-Song; Yang, Daiwen: Solution
structure of eggcase silk protein and its implications for silk fiber formation. In: Proc.
Natl. Acad. Sci. - Washington D. C.: Proc. Natl. Acad. Sci. - (2009) vol. 106, no. 22,
S. 8906-8911
[21] Marchler-Bauer, Aron; Lu, Shennan; Anderson, John B.; Chitsaz, Farideh; Derbyshire,
Myra K.; DeWeese-Scott, Carol; Fong, Jessica H.; Geer, Lewis Y.; Geer, Renata C.;
Gonzales, Noreen R.; Gwadz, Marc; Hurwitz, David I.; Jackson, John D.; Ke, Zhaoxi;
Lanczycki, Christopher J.; Lu, Fu; Marchler, Gabriele H.; Mullokandov, Mikhail;
Omelchenko, Marina V.; Robertson, Cynthia L.; Song, James S.; Thanki, Narmada;
Yamashita, Roxanne A.; Zhang, Dachuan; Zhang, Naigong; Zheng, Chanjuan; Bryant,
Stephen H.:
CDD: a Conserved Domain Database for the functional annotation of proteins. In:
Nucleic Acids Research - Oxford: Oxford University Press. - (2010) vol. 39, Database
issue, S. 225-229
[22] Merkl, Rainer; Waack, Stephan: Bioinformatik Interaktiv. - 2. Auflage. - Weinheim:
Wiley VCH Verlag GmbH & Co KGaA., 2009
[23] Munk, Katharina: Grundstudium Biologie. - 1. Aufl. - Heidelberg u.a.: Spektrum
Akademischer Verlag GmbH, 2000
[24] Pagni, Marco; Junier, Thomas: Dotlet: diagonal plots in a Web browser.
In: Bioinformatics - Oxford: Oxford University Press. - (2000) vol. 16, no. 2, S. 178-179
[25] Nieuwenhuys, Ed: Spider Silk.
URL: <http://ednieuw.home.xs4all.nl/Spiders/Info/spindraad.htm>,
verfügbar am: 16.06.2011
[26] Petzold, Tony: Projekt Biotechnologie/Bioinformatik. Thema: Das Geheimnis der
Spinnenseide. - 2011. - 31 S.; Mittweida, Hochschule Mittweida (FH),
Mathematik/Naturwissenschaften/Informatik, Belegarbeit, 2011
[27] Petzold, Tony: Praxisbericht. Thema: Der Spinnenfaden auf molekularer Ebene-
untersucht mit bioinformatischen Tools-. - 2011. - 13. S.; Mittweida, Hochschule
Mittweida (FH), Mathematik/Naturwissenschaften/Informatik, Praxismodulbeleg, 2011
[28] Ponting, Chris P.; Schultz, Jörg; Milpetz, Frank; Bork, Peer: SMART: identification and
annotation of domains from signalling and extracellular protein sequences. In: Nucleic
Acids Research - Oxford: Oxford University Press. - (1999) vol. 27, no. 1, S. 226-229
[29] Rashidi, Hooman H.; Bühler, Lukas K.: Grundriss der Bioinformatik: Anwendungen in
den Biowissenschaften und der Medizin. - 1. Aufl. - Heidelberg u.a.: Spektrum
Akademischer Verlag GmbH, 2001
63
[30] Richter, Falk: persönliche Mitteilung, 2011
[31] Römer, Lin; Scheibel, Thomas: Spinnenseidenproteine. Grundlage für neue Materialien.
In: Chem. Unserer Zeit. - Weinheim: Wiley VCH Verlag GmbH & Co KGaA. - (2007)41, S.
306-314
[32] Rostkowski, Michał; Olsson, Mats H. M.; Søndergaard, Chresten R.; Jensen, Jan H.:
Graphical analysis of pH-dependent properties of proteins predicted using PROPKA. In:
BMC Structural Biology - London: BioMed Central. - (2011)11, S. 1-6
[33] Schultz, Jörg; Copley, Richard R.; Doerks, Tobias; Ponting, Chris P.; Bork, Peer: SMART:
a web-based tool for the study of genetically mobile domains. In: Nucleic Acids
Research - Oxford: Oxford University Press. - (2000) vol. 28, no. 1, S. 231-234
[34] Schwede, Torsten: <[email protected]> : SWISS-MODEL Template Library.
URL: <http://swissmodel.expasy.org/workspace/index.php?func=special_help>,
verfügbar am: 09.08.2011
[35] Shao, Zhengzhong; Vollrath, Fritz: Surprising strength of silkworm silk. In: Nature -
London: Nature Publishing Group. - (2002)418, S. 741
[36] Spiess, Kristina; Lammel, Andreas; Scheibel, Thomas: Recombinant Spider Silk Proteins
for Applications in Biomaterials. In: Macromol. Biosci. - Weinheim: Wiley VCH Verlag
GmbH & Co KGaA. - (2010)10, S. 998-1007
[37] The UniProt Consortium <[email protected]> : The Universal Protein Resource
(UniProt) 2009. In: Nucleic Acids Research - Oxford: Oxford University Press. - (2008)
vol. 37, Database issue, S. D142-D148
[38] Verfasser unbekannt: About SIB. URL: <http://www.isb-sib.ch/aboutsib.html>,
verfügbar am: 09.08.2011
[39] Verfasser unbekannt <[email protected]> : LALIGN - find multiple
matching subsegments in two sequences. URL:
<http://www.ch.embnet.org/software/LALIGN_form.html>, verfügbar am 17.08.2011
[40] Verfasser unbekannt <[email protected]> : GOR IV SECONDARY STRUCTURE
PREDICTION METHOD. URL: <http://npsa-pbil.ibcp.fr/cgi-
bin/npsa_automat.pl?page=npsa_gor4.html>, verfügbar am: 01.08.2011
[41] Verfasser unbekannt <[email protected]> : CFSSP: Chou & Fasman
Secondary Structure Prediction Server. URL: <http://www.biogem.org/tool/chou-
fasman/>, verfügbar am 01.08.2011
[42] Verfasser unbekannt <[email protected]> : UniProtKB Entry A6YIY1. URL:
<http://www.uniprot.org/uniprot/A6YIY1>, verfügbar am: 02.08.2011
64
[43] Verfasser unbekannt <[email protected]> : UniProtKB Entry A6YIY0. URL:
<http://www.uniprot.org/uniprot/A6YIY0>, verfügbar am: 02.08.2011
[44] Verfasser unbekannt: ProtScale. URL: <http://web.expasy.org/protscale/>, verfügbar
am: 02.08.2011
[45] Verfasser unbekannt: SMART. URL: < http://smart.embl-heidelberg.de/>, verfügbar
am: 03.08.2011
[46] Verfasser unbekannt <[email protected]> : Conserved Domains and Protein
Classification. URL: <http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml>,
verfügbar am: 03.08.2011
[47] Vollrath, Fritz; Knight, David. P.: Liquid crystalline spinning of spider silk. In: Nature -
London: Macmillan Magazines Limited. - (2001)410, S. 541-548
[48] Vollrath, Fritz; Madsen, Bo; Shao, Zhengzhong: The effect of spinning conditions on the
mechanics of a spider's dragline silk. In: Proc. Roy. Soc. - London: The Royal Society. -
B(2001)268, S. 2339-2346
[49] Vollrath, Fritz: Strength and structure of spiders' silks. In: Rev. Molec. Biotech. -
Amsterdam: Elsevier Science B.V. - (2000)74, S. 67-83
[50] von Ardenne, Manfred; Musiol, Gerhard; Klemradt, Uwe: Effekte der Physik und ihre
Anwendungen. - 3. Aufl. - Frankfurt am Main: Wissenschaftlicher Verlag Harri
Deutsch GmbH, 2005
[51] Multiples Sequenzalignment. (Bild)
URL: <http://www.xray.bioc.cam.ac.uk/xray_resources/whitepapers/mr-in-
action/img129.gif>, verfügbar am: 09.08.2011
65
9 Erklärung zur selbständigen Anfertigung der Arbeit
Erklärung
Ich erkläre, dass ich die vorliegende Arbeit selbständig und nur unter Verwendung
der angegebenen Literatur und Hilfsmittel angefertigt habe.
Bearbeitungsort, Datum
66
10 Anhang
Abbildung 30: Ergebnis der Identifizierung der Proteinfaltung von MaSp1 mittels 3D-PSSM.
Das Bild zeigt den Screenshot des Ergebnisses, welches anhand eines Repeats (Aminosäure 1448-1496) von MaSp1
ermittelt wurde. Oben im Bild sind eine kleine Beschreibung des Inhalts, verschiedene Links sowie die
Eingabeparameter aufgeführt. Darunter befindet sich eine Skala, die ein Maß für die Aussagekräftigkeit der
ausgegebenen Treffer (E-Wert) ist. Es folgt eine Auflistung aller gefunden Treffer in einer Tabelle. Die Treffer stellen
die zur Eingabesequenz ähnlichen Sequenzen dar. Hierbei handelt sich um eine Zusammenstellung, da die Liste der
Treffer insgesamt weitaus länger ist. Die Tabelle gibt Informationen über einen Treffer wie z. B. Ähnlichkeit (in %)
Sequenzlänge, Strukturmodell, E-Wert, PDB-ID, Name, Proteinfamilie u.a. aus. Je ähnlicher eine gefundene Sequenz
ist, desto besser. Ab einem gewissen Prozentsatz wird der Treffer rot markiert (siehe Abbildung). In der Abbildung
rot markiert ist der Treffer mit dem Titel Collagen (PDB-ID: 1bkv), welcher zu 41 Prozent mit der Eingabesequenz
übereinstimmt. Unterhalb der Tabelle befinden sich die Primärstruktur sowie die Sekundärstruktur (einschließlich
das Maß der Aussagekräftigkeit) der Eingabesequenz. Je höher der Zahlenwert unterhalb der vorhergesagten
Sekundärstruktur ist, desto wahrscheinlicher ist es, dass das Protein dieses Sekundärstrukturelement bildet. Laut
der Abbildung 30 bildet die Sequenz sehr unwahrscheinlich (Zahlenwert 0-2) Helices (H) aus, wohingegen die
Bildung von einer Coil-Struktur (C) sehr wahrscheinlich (Zahlenwert bis 9) ist. [19]