bioinformatique structurale

31
Bioinformatique structurale Bioinformatique structurale Eric Westhof Institut de biologie moléculaire et cellulaire, UPR9002, CNRS Université Louis Pasteur 15 rue René Descartes F-67084 Strasbourg Cedex France Tel + 33 (0) 3 88 417046 FAX + 33 (0) 3 88 417066 or + 33 (0) 3 60 22 18 (long faxes) E.Westhof@ ibmc .u- strasbg . fr http://www- ibmc .u- strasbg . fr /upr9002/ westhof /

Upload: trinhnhu

Post on 05-Jan-2017

236 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Bioinformatique structurale

Bioinformatique structuraleBioinformatique structurale

Eric Westhof Institut de biologie moléculaire et cellulaire, UPR9002, CNRS Université Louis Pasteur 15 rue René Descartes F-67084 Strasbourg Cedex France

Tel + 33 (0) 3 88 417046 FAX + 33 (0) 3 88 417066 or + 33 (0) 3 60 22 18 (long faxes)

[email protected] http://www-ibmc.u-strasbg.fr/upr9002/westhof/

Page 2: Bioinformatique structurale

LL’’histoire dehistoire de@@

‘‘arobasearobase’’

Le Monde (Le Monde (ClClééoo, Canal+), Canal+)

Les êtres vivants sont en fait

des structures historiques.F.Jacob.

Page 3: Bioinformatique structurale

ßß Origines le latin mOrigines le latin méédidiééval, raccourcival, raccourcisignifiant signifiant ‘‘adad’’;;

ßß Habitude conservHabitude conservéée par lese par lescommercommerççants amants amééricains du XIX ricains du XIX èèmemesisièècle pour indiquer les prix;cle pour indiquer les prix;

ßß CaractCaractèère exigre exigéé par les comptables sur par les comptables surles claviers des premiles claviers des premièères machines res machines ààéécrire;crire;

ßß RRééemploi car caractemploi car caractèère ayant perdu sare ayant perdu sasignification et non usitsignification et non usitéé dans les noms dans les nomspropres (Ray propres (Ray TomlinsonTomlinson).).

Page 4: Bioinformatique structurale

Toute sToute sééquence est un mquence est un méélange delange decontraintes structurales, dcontraintes structurales, d’’adaptation, deadaptation, deddéérive grive géénnéétique et de contingencestique et de contingenceshistoriques.historiques.

La La ddééconvolution convolution de ces influences impliquede ces influences impliquede nombreuses comparaisons de sde nombreuses comparaisons de sééquencesquences(1D) et de structures (3D).(1D) et de structures (3D).

Page 5: Bioinformatique structurale

Les structures tridimensionnellesLes structures tridimensionnellesdivergent beaucoup plus lentement quedivergent beaucoup plus lentement que

les sles sééquences.quences.Elles sont dictElles sont dictéées des d’’abordabord

par le repliement et ensuitepar le repliement et ensuitepar la fonction.par la fonction.

La fonction captures lastructure (A. Danchin)

Page 6: Bioinformatique structurale
Page 7: Bioinformatique structurale

All science All science is either physics is either physics ororstamp collectingstamp collecting..

Rutherford.

Page 8: Bioinformatique structurale

Is there Is there a danger, ina danger, inmolecular biologymolecular biology,, that the that theaccumulation of dataaccumulation of data will willget so get so farfar ahead ahead ofof its itsassimilationassimilation into into aaconceptual framework thatconceptual framework thatthe the datadata will eventually will eventuallyprove prove anan encumbrance encumbrance ??

John MADDOX, 1988.John MADDOX, 1988.

Page 9: Bioinformatique structurale

Le ribosome bactLe ribosome bactéérien:rien:

270 000 atomes (C,N, O, P)270 000 atomes (C,N, O, P)55 prot55 protééinesines3 ARN (4600 nucl3 ARN (4600 nuclééotides)otides)

Page 10: Bioinformatique structurale

DiffDifféérentrentniveauxniveauxdd’’organisationorganisationstructurstructuréés s hihiéérarchiquementrarchiquement

Page 11: Bioinformatique structurale

Nos concepts sont-ils pertinents ?Nos concepts sont-ils pertinents ?

Page 12: Bioinformatique structurale

Comment aller au-delComment aller au-delààde lde l’’organisation deorganisation debanques de donnbanques de donnééesesde sde sééquences, dequences, destructures, destructures, demotifs,de gmotifs,de géénomes ?nomes ?

Page 13: Bioinformatique structurale

Importance de la modularitImportance de la modularitééet de la penset de la penséée hie hiéérarchique:rarchique:dd’’une biologie une biologie ‘‘molmolééculaireculaire’’ ààune biologie une biologie ‘‘modulairemodulaire’’ ? ?

Page 14: Bioinformatique structurale

A.L. A.L. BarabasiBarabasi

a proposa proposééune organisation basune organisation baséée sur une sur unrrééseau hiseau hiéérarchique avec unerarchique avec unetopologie topologie ‘‘scalescale-free-free’’et une modularitet une modularitéé incorpor incorporééee

(Science 297, 1551, 2002)(Science 297, 1551, 2002)

Page 15: Bioinformatique structurale

PropriPropriééttéés des modules:s des modules:

•• interfaces identifiables;interfaces identifiables;•• qui interagissent parqui interagissent parll’’interminterméédiaire de protocoles;diaire de protocoles;•• modifiables et modifiables et éévoluablesvoluablesindindéépendamment.pendamment.

Page 16: Bioinformatique structurale

PropriPropriéétes tes des Protocoles:des Protocoles:

•• RRèègles dgles d’’associations entreassociations entremodules;modules;•• Sont robustes et facilitentSont robustes et facilitentll’é’évolution.volution.

Page 17: Bioinformatique structurale

RNA Motif:

An Ordered Assembly of Non-Watson-An Ordered Assembly of Non-Watson-Crick Crick basepairs basepairs embedded within embedded within a a helixhelix

Motifs Motifs should fold autonomouslyshould fold autonomously

Motifs areMotifs are recurrent and limited recurrent and limited inin number number

Page 18: Bioinformatique structurale

•Chemistry and geometry of base pairsconstrain the evolution of motifs(> structural convergence)

•Motifs are spread across the Tree ofLife and are used for diverse functions

•Motifs cannot be used to infer homology

Do motifs evolve ?

Page 19: Bioinformatique structurale

GNRA - hGNRA - héélice/rlice/réécepteurscepteurs

U AC G

Y GG o A

5' 3'

3' 5'

C GC G

Y AG o A

5' 3'

3' 5'G o UAU o AC GC G

A AG o A

5' 3'

3' 5'

11nt-receptormotif

GYAAGYGA

U

A

C = G5’ 3!’

AG

NR

C = GC = G or U-A

Page 20: Bioinformatique structurale
Page 21: Bioinformatique structurale

GNRAGNRA

Bulle interneBulle interneriche en Ariche en A

Page 22: Bioinformatique structurale

G

GC

CA

AY

G

3' 5'

5' 3'

Type IIType IISugarSugar--Sugar Sugar CisCis

Type IType ISugarSugar--Sugar TransSugar Trans

Page 23: Bioinformatique structurale

tRNAmRNA

C1054

G530

S12

A1492

A1493 A site

mRNA mRNAtRNA tRNA

5’

3’

Page 24: Bioinformatique structurale

Origins of the limited numberof RNA motifs ?

Do Do geometric isostericity and thermodynamicgeometric isostericity and thermodynamicstability reduce the number stability reduce the number of RNA motifs ?of RNA motifs ?

L’exploration de l’espace des séquences a-t-elle été contrainte par le succès des premiers motifs (W. Gilbert) ?L’évolution favorise-t-elle les séquences entourées par le plus grand nombre possible de séquences mutantes viables (M.Eigen) ?

Page 25: Bioinformatique structurale

FranFranççois MAJORois MAJOR

Daniel GAUTHERETDaniel GAUTHERET

Olivier LICHTARGEOlivier LICHTARGE

Matteo Matteo PELLEGRINIPELLEGRINI

Page 26: Bioinformatique structurale

Structural EcologyStrong H-bonds,

Polar & ionic bonds(O-H…O, N-H…O, …)

Weak Interactions(C-H…O, C-H…N, …)

ElectrostaticForces

Hydration Forces

InteractionsWith water and ions

DG

Page 27: Bioinformatique structurale

Molecular dynamics simulationsRNA duplexes

1 C-G 2 G-C 3 C-G 4 G-C 5 C-G 6 G-C 7 C-G 8 G-C 9 C-G10 G-C11 C-G12 G-C13 C-G14 G-C15 C-G16 G-C17 C-G18 G-C19 C-G20 G-C21 C-G22 G-C23 C-G24 G-C

• 24 base pairs

• ≈ 0.25 M KCL 72 K+ 26 Cl-(blue) (green)

• ≈ 5600 H2O

• 4.4 ns length

• EWALDsummation

AMBER - MDPeter Kollman -UCSF

Page 28: Bioinformatique structurale

Even with the knowledge Even with the knowledge ofof the the quantumquantum physics physics ofof water moleculeswater molecules,, it would be it would be impossible toimpossible to deduce deduce the laws the laws of formation ofof formation of waves waves inin the sea the sea. Ken WILSON.. Ken WILSON.

Page 29: Bioinformatique structurale

Should we searchShould we searchonly only forfor phenomena phenomenasufficiently generalsufficiently generalto surviveto survive the very the verystrong coarsestrong coarsegraininggrainingof simpleof simple physical physicalmodels ?models ?

Page 30: Bioinformatique structurale

Michael LEVITTMichael LEVITT

Steve HARVEYSteve HARVEY

Marc DELARUEMarc DELARUE

Page 31: Bioinformatique structurale

Quelques references

Ban N, Nissen P, Hansen J, Moore PB, Steitz TA. 2000. The complete atomic structure of thelarge ribosomal subunit at 2.4 A resolution [see comments]. Science 289: 905-920

Batey RT, Rambo RP, Doudna JA. 1999. Tertiary Motifs in RNA Structure and Folding.Angew Chem Int Ed Engl 38: 2326-2343

Carter AP, Clemons WM, Brodersen DE, Morgan-Warren RJ, Wimberly BT, RamakrishnanV. 2000. Functional insights from the structure of the 30S ribosomal subunit and itsinteractions with antibiotics [see comments]. Nature 407: 340-348.

Costa, M. and F. Michel (1995). "Frequent use of the same tertiary motif by self-foldingRNAs." Embo J 14(6): 1276-85.

Costa, M. and F. Michel (1997). "Rules for RNA recognition of GNRA tetraloops deduced byin vitro selection: comparison with in vivo evolution." Embo J 16(11): 3289-302.

Harms J, Schluenzen F, Zarivach R, et al. 2001. High resolution structure of the largeribosomal subunit from a mesophilic eubacterium. Cell 107: 679-688.

Leontis NB, Stombaugh J, Westhof E. 2002. The non-Watson-Crick base pairs and theirassociated isostericity matrices. Nucleic Acids Res 30: 3497-3531

Leontis NB, Westhof E. 2001. Geometric nomenclature and classification of RNA base pairs.RNA 7: 499-512.

Michel F, Jacquier A, Dujon B. 1982. Comparison of fungal mitochondrial introns revealsextensive homologies in RNA secondary structure. Biochimie 64: 867-881

Westhof E, Fritsch V. 2000. RNA folding: beyond Watson-Crick pairs. Structure Fold Des 8:R55-65