1 / 54

Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems:

V13 Proteinfaltung. Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems: 1 Was sind die treibenden Kräfte ( driving forces ), aufgrund derer sich ein Protein faltet? Physikalische/bioinformatische Sicht des Problems.

lise
Download Presentation

Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems:

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. V13 Proteinfaltung Es gibt zwei grundsätzliche Sichtweisen des Proteinfaltungsproblems: 1 Was sind die treibenden Kräfte (driving forces), aufgrund derer sich ein Protein faltet? Physikalische/bioinformatische Sicht des Problems. 2 Zu welcher dreidimensionalen Struktur faltet sich (m)ein bestimmtes Protein? Biologische Sicht des Problems. Computational Chemistry

  2. Modellproblem: Kollision von H mit H2 Reaktion kann durch eine Reaktionskoordinate komplett beschrieben werden. Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) Computational Chemistry

  3. experimentell beobachtbare Variablen • Die komplette Beschreibung der Protein-faltungsreaktion erfordert eine Vielzahl an • Reaktionskoordinaten: • - Wie ändert sich die Größe (der radius of • gyration) mit der Zeit? • (Exp. Kleinwinkelstreuung) • Wann bilden sich Elemente der Sekundärstruktur? • (Exp. FTIR, CD) • Wann bildet sich der hydrophobe Kern? • (Exp. Fluoreszenz) • Wann werden die Wassermoleküle aus • dem Proteininneren verdrängt? • (Fluoreszenz-Quenching) • Wann sind welche tertiären Kontakte • gebildet? (siehe -value analysis, NMR) • Was ist die Rolle von Dynamik • (H/D-Austausch-Experimente) • - Gibt es Intermediate? Dobson, Karplus, Angew. Chemie Int. Ed. 37, 868 (1998) Computational Chemistry

  4. Proteinfaltung: Kombination von Simulation mit Experiment notwendig Experimente zeigen die Faltung stets entlang einiger weniger Reaktionskoordinaten. Es ist schwierig, dadurch den Mechanismus der Proteinfaltung zu verstehen. Das Fazit dieser Stunde wird lauten: Reichen Simulationen allein aus um Proteinfaltung zu verstehen? Nein! Kombination von Simulation mit Experiment. Ja! Computational Chemistry

  5. driving forces für Proteinfaltung 1 Typen von Wechselwirkungen hydrophob elektrostatisch 2 Wechselwirkungspartner Protein-Protein Protein-Solvens Solvens-Solvens 3 Freie Enthalpie (G) des Gesamtsystems reduzieren, nicht z.B. nur die innere Energie des Proteins alleine  dynamische Simulationen notwendig Computational Chemistry

  6. Nicht betrachtete Spezialfälle • 1 Proteine mit Di-Sulphidbrücken (z.B. BPTI) • Faltungskinetik wird komplett durch Bildung von Disulfidbrücken dominiert. • 2 Proteine mit cis-Prolinen • in entfalteten Peptide sind Proline zu 10 – 20 % in cis-Konformation;gefaltete Proteine haben fast nur trans-Proline; cis/trans-Isomerisierung dauert jedoch Minuten; es gibt jedoch spezielle cis/trans-Isomerasen wie Cyclophilin • 3 Mehr-Domänenproteine • ... • Was bleibt dann noch übrig? • kleine “Standard” Ein-Domänen-Proteine Computational Chemistry

  7. Warum ist die Energetik der Proteinfaltung ein schwieriges Problem? * “Problem der Proteinfaltung” beinhaltet zwei Aspekte: (a) Sequenz  Struktur ist weitgehend ungelöst (b) Verständnis der treibenden Kräfte/Dynamik/ Mechanismen. Diese sind mittlerweile vergleichsweise gut bekannt. * warum ist (a) so schwierig? Beispiel: Lysozym bei 25 C H UF = – 2245 kJ/mol davon sind – 1881 kJ/mol von den nichtpolaren Gruppen und – 364 kJ/mol von den polaren Gruppen - T S UF = + 2186 kJ/mol UF = – 59 kJ/mol d.h. nur ca. 0.4 kJ/mol pro Residue ! Die Differenz zweier sehr großer Terme ist selbst sehr klein. Computational Chemistry

  8. Levinthal-Paradox 1968 C. Levinthal, J. Chim. Phys. 65, 44-45 (1968): Falls man eine Kette von 100 Aminosäuren betrachtet und annimmt, dass jede Aminosäure in einer von 3 Konformationen existieren kann – ausgestreckt, Helix oder Schleife - dann gibt es 3100 mögliche Weise, die Kette anzuordnen. Das sind etwa 1048 Konformationen.  Die Rotation um Bindungen geschieht höchstens 1014 mal pro Sekunde. Daher dauert eine Zufallssuche nach der richtigen Konformation etwa 1034s = 1026Jahre, viel länger als das Alter des Universums! Die kritische Annahme dabei ist, dass alle möglichen Konformationen mit der gleichen Wahrscheinlichkeit gesampelt werden. Der Faltungstrichter sieht also wie ein Loch auf einem flachen Golfplatz aus. Daher wurde vermutet, dass bestimmte Faltungspfade existieren, die zur gefalteten Struktur führen. Computational Chemistry

  9. Golfkurs-Beispiel 1-D Energielandschaft. Im Fall extremer Frustration gibt es keine Korrelation zwischen struktureller Ähnlichkeit mit dem Grundzustand und der Energie. Einzige Möglichkeit:Zufallssuche. Computational Chemistry

  10. Lösung für Levinthal-Paradoxon: Folding Funnel Energielandschaft eines minimal frustrierten Heteropolymers. Die Trichterform ermöglicht, dass der gefaltete Zustand in kurzer Zeit erreicht wird. Computational Chemistry

  11. Modelle um Proteinfaltung zu beschreiben Nucleation-condensation-Modell Wetlaufer, D.B. (1973) PNAS 70, 697 Es werden einige kritische kinetische Nuklei geformt, um die herum der Rest der Struktur wächst. Framework Modell Ptitsyn, O.B. & Rashin, A.A. (1975) Biophys. Chem. 3, 1 Zunächst falten sich die Sekundärstrukturelemente. Diese docken dann im ratenlimitierenden Schritt zur 3D-Struktur. Modell des hydrophoben Kollapses Dill, K.A. (1985) Biochemistry 24, 1501 Treibende Kraft ist der hydrophobe Effekt. Wasser wird unspezifisch verdrängt. Die abschliessende Umordnung des kollabierten Zustands ist ratenlimitierend. Computational Chemistry

  12. Nucleation-condensation Modell Die ersten Schritte der Proteinfaltung sind entropisch ungünstig, durch den Verlust an Entropie aufgrund der reduzierten Beweglichkeit der Seitenketten. Der enthalpische Gewinn durch entstehende native Wechselwirkungen kann dies nicht ganz kompensieren. Erst im Übergangszustand (transition state) werden die beiden Beiträge gleichgroß. Danach geht die Faltung downhill. Computational Chemistry

  13. Framework-Modell gewann an Bedeutung als man kleine Sekundärstrukturelemente-Fragmente von Proteinen identifizieren konnte, die bereits in Lösung gefaltet sind. (Munoz, Serrano 1994-1997). Computational Chemistry

  14. Auch native Kontakte passen zum Framework-Modell native Kontakte * native Kontakte sind essentiell  Hypothese, daß es kleine Peptidstücke gibt, unabhängig faltende Einheiten, sogennante Foldons Beispiele: -hairpins (Munoz&Eaton), die sich in ca. 6 s falten kleine Fragmente aus BPTI (SYPFDV) * Langevin-Simulationen zeigen: -Helices falten sich in ca. 10-100 ns -hairpins brauchen ca. 10 s a: Ar(i)-HN(i) Wechselwirkung zwischen Phe517 und der Amidgruppe des Rückgrats von Tyr518 in Phosphoinoitide-Specific Phospholipase C (1DJX). b: Ar(i)-HN(i) Wechselwirkung in Ascorbate Oxidase (1AOZ). Tóth et al. Proteins 43, 373 (2001) Computational Chemistry

  15. Molten Globule Modell des hydrophoben Kollapses sagt ein Faltungs-Intermediat voraus, den sogenannten Molten Globule, den man kinetisch und im Gleichgewicht als eine expandierte Form des gefalteten, nativen Zustands charakterisiert hat. Computational Chemistry

  16. Neue Methoden Hydrogen-Exchange: H/D-Austausch der Backbone HN-Atome gegen D/H-Atome der Lösung. Gibt Information über Faltungs-Intermediate: ist diese Gruppe solvenszugänglich? Konsolidierung des Protein-Rückgrats. Protein Engineering (Mutagenese): sensitiv für Seitenketten-Wechselwirkungen. Entdeckung von kleinen Proteinen mit lediglich zwei Zuständen (gefaltet  entfaltet) CI-2 spectrin SH3 cold shock protein CspB Bisher wurden etwa 30 Proteine mit dieser Methode untersucht. Computational Chemistry

  17. Mechanismus der Proteinfaltung (Fersht) (a) zwei extreme Szenarien: „Framework“ bedeutet, dass sich die 2nd-Strukturelemente zuerst falten. „Nucleation condensation“ ist ein Kompromiss zwischen den beiden Extremfällen. (b) Proteine, die man einer oder der anderen Kategorie zuordnen kann. Bisher wurde kein Protein gefunden, das einen reinen Hydrophoben Kollaps zeigt, also während des Kollapses keine 2nd-Struktur formt. Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  18. Faltung kleiner Proteine Nucleation-condensation wird heute als Standardmechanismus für die Faltung kleiner Proteine angesehen (Serrano und Mitarbeiter, PNAS 99, 15846 (2002)). Manche Proteine falten jedoch auf eine polarisierte Weise, wobei sich ein Teil der Struktur sehr früh bildet und andere Abschnitte bis zuletzt unstrukturiert bleiben. CI-2 2-Zustand global diffus:alle Residuen falten sich gleichzeitig SH3 2-Zustand im Übergangszustand ist eine Region des Proteins fast vollständig gefaltet, eine andere jedoch nur kaum. Barnase zwei Faltungsmodule falten sich unabhängig voneinander zu Intermediat gemäss NC-Mechanismus Dann docken diese beiden Module gemäss Framework-Modell. Computational Chemistry

  19. „New view of Protein folding“: Faltung auf rauhen, trichterförmigen Energielandschften Bryngelson, Wolynes, PNAS (1987) gradient  roughness macht Faltung macht Faltung schneller langsamer “Frustration” Brooks, Gruebele, Onuchic, Wolynes, PNAS 95, 11037 (1998) Computational Chemistry

  20. Energielandschaft mit unterschiedlicher Frustration Links: hoch frustrierte Landschaft mit Tg > Tf. Rechts: geringe Frustration; Tg < Tf; Ähnlichkeit mit Trichterform Computational Chemistry

  21. Theorie der Energielandschaften für Proteinfaltung • nach Onuchic, Nymeyer, Garcia, Chahine, Socci, Adv. Prot. Chem. 53, 87 (2000) • http://guara.ucsd.edu/group/Folding-papers.html • „Holy grail“: Proteinsequenz  Proteinstruktur • Entwicklung von theoretischen Konzepten, mit denen man sich faltende von sich nicht faltenden Sequenzen unterscheiden kann. • P.S. Kim & R.L. Baldwin (Annu Rev BioChem 59, 631 [1990]): • Faltung geschieht entlang von Pfaden mit wohldefinierten Intermediaten. • Diese Sichtweise wurde seit Beginn der ´90er Jahre durch das Bild der Faltung eines Proteins in einem Faltungstrichter der Energie ersetzt. • Faltung ist ein kollektiver (d.h. die Faltung der Aminosäurenkette beginnt an vielen Positionen gleichzeitig) und selbst-organisierter Prozeß • Faltung geschieht entlang einer Vielzahl von Routen bis auf den Boden des Faltungstrichters. Computational Chemistry

  22. Rolle der Topologie D. Baker, Nature 405, 39 (2000) Für viele Proteine ist die Faltungsgeschwindigkeit durch das Verhältnis von lokalen zu nicht-lokalen Kontakten bestimmt. a bis d. rot: grosser Einfluss auf Faltungsrate, blau: kleiner Einfluss. e: Kontakt-Ordnung: mittlerer Sequenz-Abstand räumlich benachbarter Amino-säuren; normiert über die Gesamtlänge des Proteins. f: überraschend deutlicher Zusammenhang zwischen der Faltungsgeschwindigkeit von Proteinen und ihrer Kontakt-Ordnung. Computational Chemistry

  23. -value Analyse Studiere den Effekt von Mutationen auf die Kinetik und Stabilität der Proteinfaltung. Die grüne Residue hat im Übergangszustand (TS) fast die gleiche Umgebung wie im gefalteten Protein (N). Daher wird TS um den gleichen Betrag destabilisiert wie N. Umgekehrtes gilt für die blaue Residue. ´ kennzeichnet Daten für eine Mutante Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  24. Proteinfaltung mit Simulationen • Faltung von -Helices und -Faltblättern dauert 100 ns bis 10 s. • MD-Simulation auf einem Prozessor mit 2 fs Zeitschritt würde Jahre dauern. • verschiedene Auswege aus diesem Dilemma • Vereinfachung der Proteindarstellung (HP- oder • Go-Modelle) • 0 steered Molecular Dynamics – Entfaltung unter Zwangskraft. • Problem: Freies Energieprofil ist pfadabhängig (wird nicht behandelt). • 1 Simulation der Entfaltung bei erhöhter Temperatur • 2 systematische Variation entlang eines Faltungsparameters liefert die • Hyperfläche der Freien Enthalpie • 3 “distributed computing” – Faltungskinetik aus zahlreichen kurzen Simulationen Computational Chemistry

  25. Entfaltungssimulationen bei erhöhter Temperatur Faltung von CI2 • Kristallstruktur. (b) Entfaltungssimulation bei 100 K. Umgekehrte Reihen- • folge der Schnappschüsse. „S“ – Werte: charaktisiert Packungswech-selwirkungen der Residue und ihrer lokalen 2nd-Struktur. Gute Korrelation mit experimentel-len -Werten. Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  26. Faltung von Barnase (a) NMR-Struktur von Barnase. (b) MD-Schnappschüsse von 225°C Simulation. (c) Korrelation von S und . Gute Übereinstimmung bis auf grüne Boxen (2-Helix). Ihr helikaler Anteil im TS, aber auch im entfalteten Zustand ist in MD-Simulation grösser. Eventuell bedeutet dies, dass die -Analyse solch autonom faltende Einheiten nicht gut beschreiben kann. Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  27. MD erlaubt detaillierte Einblicke in Faltungsprozess Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  28. Faltung der engrailed homeodomain (a) Übergangszustände bei 100°C und 225°C sind sehr ähnlich. Erhöhung der Temperatur bewirkt also vermutlich keine Veränderung des allgemeinen Faltungs- pfades, sondern beschleunigt lediglich die Faltung/Entfaltung. (b) Helices sind selbst im denaturierten Zustand stabil. Die engrailed homeodomain ist also ein Beispiel für ein Protein, das gemäss dem Framework-Modell faltet. Daggett, Fersht, TIBS 28, 18 (2003) Computational Chemistry

  29. Rolle der Topologie Proteine mit SH3-ähnlicher Struktur. Die Farbkodierung folgt den -Werten: blau für kleine -Werte, rot für grosse -Werte. Je grösser der -Wert, desto mehr gefaltet ist die entsprechende Region in der Region des Übergangszustands. „Topologie ist nicht alles“ Die Unterschiede in dem Faltungsverhalten dieser 3 Proteine lassen sich nur durch spezifische Wechselwirkungen erklären. Schymkowitz et al. PNAS 99, 15846 (2002) Computational Chemistry

  30. Faltungssimulation entlang Reaktionskoordinate: src-SH3 Domäne Kristallstruktur 1SRL (a) 6.5 Å contact map zwischen nicht-benach- barten Residuen für die Kristallstruktur. (b) contact maps aus MD-Simulationen für =0.2 (über Diagonale) =0.4 (unter Diagonale) (c) =0.6 (über Diagonale) =0.8 (unter Diagonale)  entspricht der Anzahl an nativen Kontakten. Shea, Onuchic, Brooks, PNAS 99, 16064 (2002) Computational Chemistry

  31. Faltung der src-SH3 Domäne (a) pmf bei 298 K als Funktion der Anzahl nativer Kontakte: Profil zeigt klar downhill. (b) und (c) Erweiterung von (a) um den Gyrations-Radius bzw. die Anzahl an Wassermolekülen im Kern. (d) Überlagerung von 3 Entfaltungssimulationen bei 400 K. Profile wurde mit einem Zwangs- potential entlang von  erzeugt. Shea, Onuchic, Brooks, PNAS 99, 16064 (2002) Computational Chemistry

  32. Faltungssimulation mit Distributed Computing für BBA5, ein Designer-Protein • Das Design des 23-Residuen langen BBA5-Motifs • (-Hairpin / turn / -Helix) wurde von der Faltung • von Zinkfinger inspiriert. • NMR-Struktur von BBA5 • Doppelmutante (2.2 Å) • Doppelmutante (2.4 Å) • Einzelmutante (2.5 Å) • BBA5 besitzt starke Tendenz, Sekundärstruktur- • elemente zu formen und kleinen hydrophoben Kern. • Daher ist der Effekt von Ungenauigkeiten des • Kraftfelds vielleicht eher klein. Computational Chemistry

  33. Folding@Home Faltungssimulation von 10 s Länge auf einem Prozessor würde Jahrzehnte dauern, selbst mit implizitem Solvens. Distributed computing (Folding@home): simuliere 10.000 Simulation von jeweils 5 - 20 ns Länge mit implizitem Solvensmodell. Für ein kleines Protein mit einer Faltungszeit von 10 s sollten etwa 10 von 10.000 Simulation innerhalb von 10 ns gefaltet sein. Folding@home: 30.000 Heimbenutzer stellten ihre PCs über Monate zur Verfügung um MD-Simulationen während idle-Zeit laufen zu lassen. Die akkumulierte CPU-Zeit entspricht ca. 1 Millionen CPU-Tage! Es wurden über 100 unabhängige Faltungsvorgänge beobachtet. Computational Chemistry

  34. Faltungstrajektorien für Doppelmutante Cα backbone (blau 1-3 und 6-8, rot 11-21) und ausgewählte Seiten-ketten (Y1 Y3 Y6 W8 E13 L14 L17 L18) für Faltungstrajektorien, die nahe der nativen BBA5- Struktur enden (unten). a, 2.2 Å b, 2.4 Å c, 2.6 Å d, 3.0 Å e, Natives BBA5 f, Natives BBA1 mit artifizieller Aminosäure Fen in Orange g, Homologie-Model für Doppelmutante h, anderes Homologie-Modell. Computational Chemistry

  35. Energie-Landschaft der Faltung Logarithmierte Population von verschiedenen Kombinationen aus RMSDca und Gyrations-Radius für a, 9000 sich faltende Trajektorien nach 1 ns, die aus einem gestreckten Zustand gestartet wurden. b, dieselben Trajektorien nach 20ns c, 2500 Simulationen des nativen Zustands nach 10 ns. Nach 20 ns ist das entfaltete Ensemble so kompakt wie das gefaltete Ensemble (Radius of Gyration, y-Achse). Es gibt aber nur einen kleinen Überlapp zwischen b und c: Ein kleiner Teil des gefalteten Ensembles (c) ist nach 10 ns teilweise entfaltet, und ein kleiner Teil des entfalteten Ensembles ist nach 20 ns gefaltet (b). Computational Chemistry

  36. Zunahme an Sekundärstruktur in Doppelmutante (a) Helikale Strukturen (278K). b, Hairpin-Structuren (278K). c, Präsenz von mindestens 4 α-helikalen Residuen. d, Population eines richtigen β-Hairpins um Residuen 4-5. Native Ensembles sind gezeigt bei 278, 378, und 478 K ( □, +, und ). Faltende Ensembles bei 278 und 338 K sind mit ▪ und ∆ markiert. Der entfaltete Zustand ist zu ~40% α-helikal. Computational Chemistry

  37. Exp. Faltungs-Thermodynamik und –kinetik von BBA5 • CD-Spektra. Die isodichroischen Punkte (rot) deuten auf Zwei-Zustands-Modell hin. • Normalisierte Fluoreszenzspektren. • Temperatur-Sprung durch 10 ns Laserpuls induziert teilweise Entfaltung. • Zeitaufgelöste Beobachtung der um 11 nm rotverschobenen Fluoreszenz. • Exp. Faltungszeit 7.5 ± 3.5s • Simulation: 6 s • Quantitative Übereinstimmung! Snow et al. Nature 420, 102 (2002) Computational Chemistry

  38. Zunahme der gefalteten Zustände Faltung in den Simulationen. Bei höherer Temperatur geschieht Zunahme ca. 2 mal so schnell. Snow et al. Nature 420, 102 (2002) Computational Chemistry

  39. Unfolded states and transition states • Understanding protein folding not only involves predicting the folded structures of foldable sequences. • In order to characterize the stability of a protein • need free energy difference between folded and unfolded structure  what is the structural ensemble of „the unfolded state“? • In order to understand kinetics of folding process • need structure of transition state Difficult to characterize these structures by experiments. Simulations are ideal tools. Computational Chemistry

  40. The protein folding network Transition states for protein folding have native topologies despite structural variability, Kindorff-Larsen, Vendrusculo, Paci & Dobson, Nat. Struct. Biol. 11, 443 (2004) Michele Vendrusculo Chris Dobson Emanuele Paci Computational Chemistry

  41. Structure and sequences of SH3 domains used • Native state structure of the src SH3 domain colored from its N (red) to C terminus (blue). • Sequence alignment of the three SH3 domains from src, Fyn and -spectrin. Residues in -strands are green and those in 310 -helices are blue. The nine boxed positions (I–IX) are the major hydrophobic core residues. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  42. Representations of the transition state ensemble (TSE) (a) Three members of the TSE traced within an atomic density map20 calculated from the backbone atoms of 20 representative structures from the TSE. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  43. Structure and sequences of SH3 domains used (b) The red ( = 500 K) and green ( = 640 K) points show the spread in radius of gyration and structural diversity in the TSE. The black points represent the comparable data from the native state ensemble. Four structures representative of different regions of the plot are colored according to the conformational variability (blue: RMS  1Å, red: RMS > 8Å Conformations of central 3-stranded sheet (2 - 4) are much less variable than those of 1 and 5. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  44. Energy maps of native state and TSE of src SH3 • (c) Ensemble-averaged pairwise interaction energies between residues in the native state (above diagonal) and in the TSE (below diagonal). • Many features found in the native state are also found in the TSE: • interactions between (2 - 4), in particular between 3 and 4. • part of the RT loop packs on to 4. • Surprising: although strands 1 and 5 are relatively disordered (previous slide) the interactions formed are very similar to those in the native state. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  45. TSEs of SH3 domains from -spectrin and Fyn • (a,b) TSEs of (a) -spectrin SH3 domains and (b ) Fyn SH3 domains. • Color coding according to the conformational variability as before. • Overall similarity to src-SH3 • differences • - e.g. that RT loop does not pack onto to the rest of the protein (Fyn). • conformational variability of -spectrin SH3 (RMSD of C 3.0 Å) smaller than of src (5.4 Å) and Fyn (6.0 Å) two TSE structures energy maps of the native state (above diagonal) and transition state (below diagonal). Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  46. Native topology in the transition state? • Either direct examination of 3D structures, • or interaction energy maps • suggest that TSE is characterized by overall native-like topology. • Quantify the topological similarity between TSE and native state Here use DALI server; alignment of matrices of pairwise C distances. to generate a representative set of structures of small proteins: extract 311 domains of length 40-70 residues from SCOP domain database. 179 can be meaningful aligned to src SH3. 11 domains have Z-score > 9.0. All of them are SH3 domains. 168 have Z < 4.3. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  47. Native topology in the transition state? align 500 TSE structures to these 311 domains. In 479/500 cases, the best-matching SCOP-domain is an SH3 domain!  despite their local variability, a large majority of the calculated TSE structures have the fold characteristic of an SH3 domain. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  48. DALI alignment of TSE structures against SCOP domains Z-score > 5 indicates high structural similarity. Therefore, the structural similarity between the TSE and the best-matching SCOP is in fact quite low. • the large majority of TSE structures are located in the outer periphery of the region of conformational space that corresponds to the SH3 fold. • The rate-limiting step in folding seems the formation of a conformation with the global topology of the native state, see lecture 7. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  49. Solvent accessibility and secondary structure Relative solvent accessible surface area in the native state (black) and transition state (red) of src SH3. Arrows, the five native -strands. Many portions of the protein are only partially desolvated in the TSE! Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

  50. Solvent accessibility and secondary structure Does secondary structure formation have a primary role in protein folding? DSSPcont  most highly formed elements are strands 3 and 4 (formed in > 60% TSE structures of src and Fyn and in > 45% for spectrin). Diverging turn preceding 2 also substantially populated. Experimentally, no isolated hairpin has structure. Hairpin between 3 and 4 must be stabilized by tertiary interactions. However, peptide corresponding to diverging loop adopts turn in solution. Lindorff-Larsen, Vendrusculo, Paci, Dobson, Nat Struct Biol 11, 443 (2004) Computational Chemistry

More Related