modélisation moléculaire : dynamique...
TRANSCRIPT
Modélisation Moléculaire :
Dynamique Moléculaire Compte-rendu de TP
Maryvonne MERLET-BILLON
11 Février 2013 GB5 BIMB
i
Table des matières
I- Introduction ........................................................................................................................... 1
II- TP1 : Evaluation de l’énergie d’interaction ligan/récepteur par
simulations de dynamique moléculaires en phase solvant implicite ...... 2
A- Matériel et Méthodes ........................................................................................................... 2
B- Résultats et Discussion ....................................................................................................... 3
1- Préparation des fichiers ......................................................................................................... 3
2- Minimisation, thermalisation et équilibration .................................................................. 4
3- Production .............................................................................................................................. 11
C- Conclusion ............................................................................................................................... 12
III- TP2 : Simulations de dynamique moléculaires en phase solvant
implicite et explicite. Analyse de trajectoire. ......................................................... 13
A- Matériel et Méthodes ......................................................................................................... 13
B- Résultats et Discussion ..................................................................................................... 13
1- réparation du fichier ............................................................................................................. 13
2- Minimisation, thermalisation, équilibration et production ......................................... 13
3- Analyse des trajectoires ....................................................................................................... 16
C- Conclusion ............................................................................................................................... 21
ii
Table des figures
Figure 1………………………………………………………………………………………...5
Figure 2………………………………………………………………………………………...6
Figure 3………………………………………………………………………………………...7
Figure 4………………………………………………………………………………………...8
Figure 5………………………………………………………………………………………...9
Figure 6……………………………………………………………………………………….10
Figure 7……………………………………………………………………………………….14
Figure 8……………………………………………………………………………………….15
Figure 9……………………………………………………………………………………….17
Figure 10……………………………………………………………………………………...18
Tableau 1……………………………………………………………………………………...11
Tableau 2……………………………………………………………………………………...19
Tableau 3……………………………………………………………………………………...20
Merlet-Billon GB5 BIMB Page 1
I- Introduction
La modélisation moléculaire a pour but de prédire la structure et certaines propriétés
chimiques de molécules ou de systèmes de molécules. Il existe plusieurs techniques pour
modéliser. Au cours de ce compte-rendu nous nous intéresserons plus particulièrement à la
dynamique moléculaire.
Très souvent la dynamique moléculaire est utilisée en association avec la modélisation par
homologie. Cette seconde technique permet de prédire la structure tridimensionnelle et des
caractéristiques physico-chimiques d’une molécule en se basant sur les données connues de
molécules homologues.
La modélisation moléculaire permet d’obtenir une structure minimisée et validée via
différentes vérifications au niveau des angles, des liaisons, de la stéréochimie…
Cependant, bien que cette modélisation soit physiquement et/ou biologiquement plausible il
n’est pas certain que la forme native de la molécule soit modélisée. C’est ici qu’intervient la
dynamique moléculaire.
Grâce à cette technique, le comportement du modèle est vérifié au cours du temps : la
modélisation est lancée dans des conditions précises de température avec un pas de
modélisation inférieur au mouvement moléculaire le plus rapide (ceci dans le but de
correctement observer toutes les étapes de modifications de la molécule).
Les molécules sont modélisées au sein de leur solvant, mais il existe deux types de simulation
du solvant : Le solvant explicite où la présence du solvant est modélisée très précisément et
dans tout l’espace de modélisation. Le solvant implicite où ne sont représentées que les
molécules de solvant en interaction directe et relativement directe avec la molécule à
modéliser.
Ces deux techniques de modélisation ont chacune leurs avantages et inconvénient en temps de
calcul et en précision. Au cours de ce compte-rendu nous étudierons la dynamique
moléculaire en solvant implicite et en solvant explicite.
Merlet-Billon GB5 BIMB Page 2
II- TP1 : Evaluation de l’énergie d’interaction ligan/récepteur
par simulations de dynamique moléculaires en phase solvant
implicite
A- Matériel et Méthodes
Pour réaliser ce TP nous avons utilisé le logiciel Amber9 sous environnement Linux.
Amber est un logiciel libre de modélisation moléculaire développé à San Francisco. Il est
composé d’une série de champs de forces moléculaires pour la simulation de biomolécules.
Ces champs de forces sont issus du domaine public et utilisés dans de très nombreux
programmes. D’autre part, Amber comprend différents programmes de simulation
moléculaire.
Pour réaliser les modélisations par dynamique moléculaire plusieurs étapes sont nécessaires :
- Préparer les fichiers pour la simulation
- Minimiser les structures
- Thermaliser c’est-à-dire que nous allons simuler la structure de la molécule en
augmentant petit à petit la température de l’espace de modélisation
- Equilibrer : une simulation est faite à la température la plus haute de la thermalisation
(à partir du modèle obtenu en thermalisation) pour vérifier la stabilité du système à
cette température
- Produire : une deuxième simulation est effectuée.
Après cette dernière étape de production il est possible de visualiser la trajectoire de la
molécule par exemple via le logiciel Chimera.
Au cours de ce tp nous utiliserons la Yes-Associated Protein 65. C’est une protéine humaine
qui possède de multiples domaines d’interaction protéine-protéine. Elle agit en tant que
protéine chaperone ou co-activateur transcriptionnel. Dans notre cas cette protéine est mutée
au niveau de la Leucine 30 (en Lysine) ce qui permet de stabiliser la formation du complexe.
Le ligand que nous utiliserons est un peptide synthétique basé sur le motif PPPPY
(GTPPPPYTVG). Ce motif est le plus petit identifié comme ayant la meilleure affinité
(Kd=60). Le fichier 1JMQ.pdb décrit l’interaction entre YAP-65 et ce peptide synthétique.
Merlet-Billon GB5 BIMB Page 3
Nous simulerons l’état de cette protéine complexée à un peptide, ainsi que l’état de cette
protéine seule et de son peptide ligand seul.
B- Résultats et Discussion
1- Préparation des fichiers
Dans ce TP nous travaillerons en solvant implicite.
Nous disposons de trois fichiers
- Le fichier protein.pdb qui décrit le domaine WW de la protéine Yap.
- Le fichier peptide.pdb qui décrit le peptide d'intérêt
- Le fichier complex.pdb qui décrit l'ensemble du domaine WW et du peptide en
interaction.
Ces fichiers sont préparés via TLEaP qui est un programme permettant de traiter des fichiers
afin que ces derniers soient utilisables par Amber.
TLEaP analyse également la charge des protéines :
- -1 pour le complexe
- -1 pour la protéine
- 0 pour le peptide
Différentes données sont ensuite sauvegardées :
- La topologie des molécules
- Les paramètres des atomes, des liaisons, des angles de liaison et de torsion,
- …..
Ces données seront utilisées lors de la simulation. Deux fichiers en particuliers seront utilisés :
les « .top » qui comprennent les données topologiques et les « .crd » qui comprennent les
coordonnées des atomes.
Merlet-Billon GB5 BIMB Page 4
2- Minimisation, thermalisation et équilibration
Trois principales étapes sont réalisées lors de la simulation :
La première est la minimisation et consiste à faire évoluer la molécule de manière à trouver
une conformation qui soit la plus faible possible en énergie.
La seconde est la thermalisation. A partir de la configuration trouvée lors de la minimisation
la molécule est modélisée sous contrainte de température croissante. Dans notre cas la
thermalisation se déroule entre 0 et 300°K.
La troisième étape est l’équilibration. La molécule est de nouveaux modélisée aux alentours
de 300K afin de trouver la conformation la plus stable à cette température.
Les Figures 1, 2 et 3 résument l’évolution de différentes énergies au cours de la
thermalisation.
Les Figures 4, 5 et 6 résument l’évolution de différentes énergies au cours de la
thermalisation
Merlet-Billon GB5 BIMB Page 5
Figure 1 : Evolution des énergies totale, cinétique et potentielle de la protéine en
fonction de la température lors de la thermalisation
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 6
Figure 2 : Evolution des énergies totale, cinétique et potentielle du complexe en
fonction de la température lors de la thermalisation
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 7
Figure 3 : Evolution des énergies totale, cinétique et potentielle du peptide en
fonction de la température lors de la thermalisation
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 8
Figure 4 : Evolution des énergies totale, cinétique et potentielle de la protéine en
fonction de la température lors de l’équilibration
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 9
Figure 5 : Evolution des énergies totale, cinétique et potentielle du peptide en
fonction de la température lors de l’équilibration
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 10
Figure 6 : Evolution des énergies totale, cinétique et potentielle du complexe en
fonction de la température lors de l’équilibration
Haut : Température par ordre croissant
Bas : Evolution de la température lors de la simulation
Merlet-Billon GB5 BIMB Page 11
Nous pouvons observer que les trois énergies ont tendance à rapidement augmenter dès le
début de la simulation. Cependant cette augmentation diminue au cours du temps, laissant la
place à un plateau. Ce phénomène est cohérent avec une augmentation de la température qui
correspond à une agitation moléculaire.
Jusqu’à 150°K les énergies augmentent rapidement puis à partir de 200°K elles ont tendance à
se stabiliser. Ceci indique qu’il existe des conformations stables entre 200 et 300°K.
Lors de la phase d’équilibration la température est maintenue à peu près constante. (Figure 4,
5 et 6). En particulier nous pouvons noter que l’énergie potentielle du peptide à légèrement
diminuée passant de -127 Kcal/mol à -130Kcal/mol. Ceci indique que le peptide n’était pas
dans une conformation optimale au niveau énergétique.
D’une manière générale nous pouvons noter que l’énergie cinétique augmente de manière très
régulière avec la température. Cependant ce n’est pas le cas de l’énergie potentielle (et donc
de l’énergie totale). Ceci nous montre que la stabilité énergétique de la molécule est très
fortement dépendante de la température de son environnement.
3- Production
Une dernière étape est réalisée : la phase de production. Elle reprend les paramètres et les
données de l’étape d’équilibration mais la simulation est plus longue.
Energie totale Energie
cinétique
Energie
Potentiel
Complexe -472,0852 647,6916 -1119,7768
Protéine -413,6799 540,8779 -954,5578
Peptide -21,1637 104,7925 -125,9562
Tableau 1 : Récapitulatif des énergies des différentes protéines après la phase de
production
Merlet-Billon GB5 BIMB Page 12
Nous pouvons alors calculer l’énergie d’interaction du complexe selon la formule suivante :
E_interaction= Etot_cpx – (Etot_prot + Etot_pept)
E_interaction = -472,0852 – (-413,6799 + (-21,1637))= -37,2416 Kcal/mol
C- Conclusion
La dynamique moléculaire est une technique de modélisation très intéressante. Cependant lors
de telles modélisation il faut faire attention aux résultats obtenus : l’un des dangers est de se
retrouver (au niveau moléculaire) dans un minimum local d’énergie. Certes, cette
conformation est alors favorable énergétiquement mais en fonction de la problématique posée
elle peut ne pas être adaptée. Il faut alors faire plusieurs simulations ou utiliser d’autres
techniques de dynamique moléculaire afin de mieux parcourir le paysage énergétique de la
molécule étudiée.
Merlet-Billon GB5 BIMB Page 13
III- TP2 : Simulations de dynamique moléculaires en phase
solvant implicite et explicite. Analyse de trajectoire.
A- Matériel et Méthodes
Comme pour le TP précédent nous allons utiliser le logiciel Amber9. Nous utiliserons
également la même protéine YAP-65 et nous travaillerons uniquement sur le complexe formé
par cette protéine et le ligand synthétique (Voir Matériel et Méthode TP1)
L’objectif de ce TP est d’analyser l’influence de la solvatation et d’analyser la trajectoire
B- Résultats et Discussion
1- réparation du fichier
Comme dans le TP précédent nous utilisons le logiciel TLEaP pour préparer le fichier
complex.pdb.
Cette fois-ci pour simuler la présence du solvant une « boite » de 10 Angström est créée. Le
complexe étant de charge négative il est également nécessaire de le neutraliser. Pour ce faire
des ions Na+ sont ajoutés. Cette « boîte » va servir de cadre et d’espace pour simuler toutes les
molécules de solvant qui interagiront avec le complexe.
2- Minimisation, thermalisation, équilibration et production
Entre les deux types de simulations (solvant implicite/explicite) les paramètres de l’étape de
minimisation sont différents : pour la simulation en solvant explicite nous avons rajouté des
paramètres de contraintes, notamment sur le nombre d’atomes à considérer.
En effet, en solvant explicite le temps et le cout de calcul sont bien plus importants qu’en
solvant implicite. Il est donc parfois préférable lorsque l’on possède les connaissances
nécessaires sur la molécule, d’exclure certains atomes de la simulation.
Merlet-Billon GB5 BIMB Page 14
La minimisation est en réalité effectuée trois fois : deux fois sous certaines contraintes et une
troisième fois sans contraintes (comme lors de la simulation en solvant implicite).
Ensuite les étapes de thermalisation et d’équilibration sont réalisées (Figure 7 et 8)
Figure 7 : Evolution des énergies totale, cinétique et potentielle du complexe en
fonction de la température lors de la thermalisation
Haut : Simulation en solvant implicite
Bas : Simulation en solvant explicite
Merlet-Billon GB5 BIMB Page 15
Figure 8 : Evolution des énergies totale, cinétique et potentielle du complexe en
fonction de la température lors de l’équilibration
Haut : Simulation en solvant implicite
Bas : Simulation en solvant explicite
Merlet-Billon GB5 BIMB Page 16
L’une des premières observations que nous pouvons faire est l’ordre de grandeur des énergies
relevées. En solvant explicite les énergies sont environ 20 fois plus importantes qu’en solvant
implicite. Cette observation est tout à fait logique compte tenu du nombre d’atome analysés
lors de la simulation.
Proportionnellement, les variations observées lors des phases de thermalisation et
d’équilibration sont plus faible en solvant explicite qu’en solvant implicite. La simulation en
solvant explicite semble proposer un système plus stable dès la minimisation par rapport à la
simulation en solvant implicite.
Il est intéressant de noter que pour l’équilibration de notre complexe en solvant explicite nous
observons une chute soudaine de l’énergie cinétique (et donc totale) au début de la simulation.
Le complexe se trouvait donc dans une conformation qui ne lui était pas si favorable que cela
à la fin de la thermalisation.
3- Analyse des trajectoires
Afin d’analyser les trajectoires plusieurs paramètres sont calculés :
- Le RMSD : déviation de la structure par rapport à la configuration initiale
- Le RMSf : fluctuation des différents résidus
- La structure 3D de la protéine (hélices, feuillets ….)
Merlet-Billon GB5 BIMB Page 17
Que ce soit en solvant implicite ou en solvant explicite le RMSD continue à augmenter au
cours du temps. Ceci indique que la structure de départ n’était pas optimale et que la
simulation était trop courte. Le système n’a pas atteint de configuration stable et les atomes
continuent de s’éloigner les uns des autres.
Figure 9 : Evolution du RMSD en fonction du temps en solvant implicite et
explicite
Merlet-Billon GB5 BIMB Page 18
Les deux profils de RMSf sont très similaires. D’une manière générale certains résidus ont
tendance à être plus mobiles que d’autres, notamment aux alentours des résidus 11, 21, 31 et
45.
Grâce à l’analyse de la structure secondaire (Tableaux 2 et 3) nous pouvons associer ces
fluctuations à des structures secondaires particulières
Figure 10 : Evolution du RMSf en fonction du temps en solvant implicite et
explicite
Merlet-Billon GB5 BIMB Page 19
N°résidu Hélice 3-10 Hélice alpha
Hélice PI Feuillet parallèle
Feuillet anti-
parallèle Tour
2 0 0 0 0 0 0,8
3 0 0 0 0 0 0,8
4 0 0 0 0 0 99,2
5 0 0 0 0 0 100
6 0 0 0 0 0 100
7 0 0 0 0 0 99,2
11 0 0 0 0 0 90,4
12 0 0 0 0 0 90,4
13 0 0 0 0 98,8 0
14 0 0 0 0 99,6 0
15 0 0 0 0 100 0
16 0 0 0 0 100 0
17 0 0 0 0 99,6 0
23 0 0 0 0 99,6 0
24 0 0 0 0 100 0
25 0 0 0 0 100 0
26 0 0 0 0 100 0
27 0 0 0 0 99,6 0
28 0 0 0 0 0 60,8
29 0 0 0 0 0 60,8
30 0 0 0 0 0 60,8
31 0 0 0 0 0 4,8
32 0 0 0 0 4,8 0
33 0 0 0 0 100 0
34 0 0 0 0 100 0
38 0 0 0 0 0 100
39 0 0 0 0 0 100
40 0 0 0 0 0 100
43 77,6 0 0 0 0 6
44 77,6 0 0 0 0 20
45 77,6 0 0 0 0 14
Tableau 2 : Observation des structures tridimensionnelles en fonction des résidus en
solvant implicite
Merlet-Billon GB5 BIMB Page 20
N° résidu Hélice 3-10 Hélice
alpha
Hélice PI Feuillet
parallèle
Feuillet
anti-
parallèle
Tour
6 0 0 0 0 0 40
7 0 0 0 0 0 40
11 0 0 0 0 0 90
12 0 0 0 0 0 90
13 0 0 0 0 100 0
14 0 0 0 0 100 0
15 0 0 0 0 100 0
16 0 0 0 0 98 0
17 0 0 0 0 97,2 0
23 0 0 0 0 97.2 0
24 0 0 0 0 98 0
25 0 0 0 0 100 0
26 0 0 0 0 100 0
27 0 0 0 0 100 0
28 0 0 0 0 0 99,6
29 0 0 0 0 0 99,6
30 0 0 0 0 0 99,6
31 0 0 0 0 0 77,6
32 0 0 0 0 77,6 0
33 0 0 0 0 100 0
34 0 0 0 0 100 0
38 0 0 0 0 0 100
39 0 0 0 0 0 100
40 0 0 0 0 0 99,6
41 0 0 0 0 0 28,4
Tableau 3 : Observation des structures tridimensionnelles en fonction des résidus en
solvant explicite
Merlet-Billon GB5 BIMB Page 21
Nous pouvons par exemple noter qu’aux alentours des résidus 11 que nous voyons fluctuer
sur la Figure 10 nous sommes dans des tours (11-12) puis au niveau de feuillet β anti-
parallèle (13 à 27). Ce schéma se retrouve également au niveau des résidus 28 à 41.
L’une des particularités que nous pouvons noter est l’apparition d’hélices α en solvant
implicite au niveau des résidus 42 à 45 ; Ces hélices ne sont pas observée en solvant explicite.
L’une des explications possible est que la modélisation explicite du solvant et de ses
interactions avec le complexe contraint la modélisation tridimensionnelle du complexe.
C- Conclusion
Au cours de ce TP nous avons pu observer que la modélisation de dynamique moléculaire en
solvant explicite demande des paramétrages différents de la modélisation de dynamique
moléculaire en solvant implicite.
Ces deux techniques ont leurs avantages et inconvénients, notamment
- Faible temps de calcul mais précision plus faible en solvant implicite
- Précision important mais temps de calcul plus important en solvant explicite.
Il est également important de prendre en compte la durée de la simulation : comme nous
avons pu le voir dans notre cas, l’étape de production a été trop courte pour permettre la
stabilisation du complexe (RMSD en augmentation).
De plus en fonction de la simulation du solvant des différences de structure tridimensionnelle
peuvent apparaitre (comme l’apparition d’hélice α en solvant implicite, non observée en
solvant explicite).
Il est donc important de compléter ce type de simulation par d’autres expériences et
connaissances.
Ce TP m’a donné un aperçu de la pratique de la dynamique moléculaire, des connaissances
qu’elle demande ainsi que des précautions à prendre quant à l’analyse des résultats.