bioinformatique structurale

Post on 05-Jan-2017

236 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Bioinformatique structuraleBioinformatique structurale

Eric Westhof Institut de biologie moléculaire et cellulaire, UPR9002, CNRS Université Louis Pasteur 15 rue René Descartes F-67084 Strasbourg Cedex France

Tel + 33 (0) 3 88 417046 FAX + 33 (0) 3 88 417066 or + 33 (0) 3 60 22 18 (long faxes)

E.Westhof@ibmc.u-strasbg.fr http://www-ibmc.u-strasbg.fr/upr9002/westhof/

LL’’histoire dehistoire de@@

‘‘arobasearobase’’

Le Monde (Le Monde (ClClééoo, Canal+), Canal+)

Les êtres vivants sont en fait

des structures historiques.F.Jacob.

ßß Origines le latin mOrigines le latin méédidiééval, raccourcival, raccourcisignifiant signifiant ‘‘adad’’;;

ßß Habitude conservHabitude conservéée par lese par lescommercommerççants amants amééricains du XIX ricains du XIX èèmemesisièècle pour indiquer les prix;cle pour indiquer les prix;

ßß CaractCaractèère exigre exigéé par les comptables sur par les comptables surles claviers des premiles claviers des premièères machines res machines ààéécrire;crire;

ßß RRééemploi car caractemploi car caractèère ayant perdu sare ayant perdu sasignification et non usitsignification et non usitéé dans les noms dans les nomspropres (Ray propres (Ray TomlinsonTomlinson).).

Toute sToute sééquence est un mquence est un méélange delange decontraintes structurales, dcontraintes structurales, d’’adaptation, deadaptation, deddéérive grive géénnéétique et de contingencestique et de contingenceshistoriques.historiques.

La La ddééconvolution convolution de ces influences impliquede ces influences impliquede nombreuses comparaisons de sde nombreuses comparaisons de sééquencesquences(1D) et de structures (3D).(1D) et de structures (3D).

Les structures tridimensionnellesLes structures tridimensionnellesdivergent beaucoup plus lentement quedivergent beaucoup plus lentement que

les sles sééquences.quences.Elles sont dictElles sont dictéées des d’’abordabord

par le repliement et ensuitepar le repliement et ensuitepar la fonction.par la fonction.

La fonction captures lastructure (A. Danchin)

All science All science is either physics is either physics ororstamp collectingstamp collecting..

Rutherford.

Is there Is there a danger, ina danger, inmolecular biologymolecular biology,, that the that theaccumulation of dataaccumulation of data will willget so get so farfar ahead ahead ofof its itsassimilationassimilation into into aaconceptual framework thatconceptual framework thatthe the datadata will eventually will eventuallyprove prove anan encumbrance encumbrance ??

John MADDOX, 1988.John MADDOX, 1988.

Le ribosome bactLe ribosome bactéérien:rien:

270 000 atomes (C,N, O, P)270 000 atomes (C,N, O, P)55 prot55 protééinesines3 ARN (4600 nucl3 ARN (4600 nuclééotides)otides)

DiffDifféérentrentniveauxniveauxdd’’organisationorganisationstructurstructuréés s hihiéérarchiquementrarchiquement

Nos concepts sont-ils pertinents ?Nos concepts sont-ils pertinents ?

Comment aller au-delComment aller au-delààde lde l’’organisation deorganisation debanques de donnbanques de donnééesesde sde sééquences, dequences, destructures, destructures, demotifs,de gmotifs,de géénomes ?nomes ?

Importance de la modularitImportance de la modularitééet de la penset de la penséée hie hiéérarchique:rarchique:dd’’une biologie une biologie ‘‘molmolééculaireculaire’’ ààune biologie une biologie ‘‘modulairemodulaire’’ ? ?

A.L. A.L. BarabasiBarabasi

a proposa proposééune organisation basune organisation baséée sur une sur unrrééseau hiseau hiéérarchique avec unerarchique avec unetopologie topologie ‘‘scalescale-free-free’’et une modularitet une modularitéé incorpor incorporééee

(Science 297, 1551, 2002)(Science 297, 1551, 2002)

PropriPropriééttéés des modules:s des modules:

•• interfaces identifiables;interfaces identifiables;•• qui interagissent parqui interagissent parll’’interminterméédiaire de protocoles;diaire de protocoles;•• modifiables et modifiables et éévoluablesvoluablesindindéépendamment.pendamment.

PropriPropriéétes tes des Protocoles:des Protocoles:

•• RRèègles dgles d’’associations entreassociations entremodules;modules;•• Sont robustes et facilitentSont robustes et facilitentll’é’évolution.volution.

RNA Motif:

An Ordered Assembly of Non-Watson-An Ordered Assembly of Non-Watson-Crick Crick basepairs basepairs embedded within embedded within a a helixhelix

Motifs Motifs should fold autonomouslyshould fold autonomously

Motifs areMotifs are recurrent and limited recurrent and limited inin number number

•Chemistry and geometry of base pairsconstrain the evolution of motifs(> structural convergence)

•Motifs are spread across the Tree ofLife and are used for diverse functions

•Motifs cannot be used to infer homology

Do motifs evolve ?

GNRA - hGNRA - héélice/rlice/réécepteurscepteurs

U AC G

Y GG o A

5' 3'

3' 5'

C GC G

Y AG o A

5' 3'

3' 5'G o UAU o AC GC G

A AG o A

5' 3'

3' 5'

11nt-receptormotif

GYAAGYGA

U

A

C = G5’ 3!’

AG

NR

C = GC = G or U-A

GNRAGNRA

Bulle interneBulle interneriche en Ariche en A

G

GC

CA

AY

G

3' 5'

5' 3'

Type IIType IISugarSugar--Sugar Sugar CisCis

Type IType ISugarSugar--Sugar TransSugar Trans

tRNAmRNA

C1054

G530

S12

A1492

A1493 A site

mRNA mRNAtRNA tRNA

5’

3’

Origins of the limited numberof RNA motifs ?

Do Do geometric isostericity and thermodynamicgeometric isostericity and thermodynamicstability reduce the number stability reduce the number of RNA motifs ?of RNA motifs ?

L’exploration de l’espace des séquences a-t-elle été contrainte par le succès des premiers motifs (W. Gilbert) ?L’évolution favorise-t-elle les séquences entourées par le plus grand nombre possible de séquences mutantes viables (M.Eigen) ?

FranFranççois MAJORois MAJOR

Daniel GAUTHERETDaniel GAUTHERET

Olivier LICHTARGEOlivier LICHTARGE

Matteo Matteo PELLEGRINIPELLEGRINI

Structural EcologyStrong H-bonds,

Polar & ionic bonds(O-H…O, N-H…O, …)

Weak Interactions(C-H…O, C-H…N, …)

ElectrostaticForces

Hydration Forces

InteractionsWith water and ions

DG

Molecular dynamics simulationsRNA duplexes

1 C-G 2 G-C 3 C-G 4 G-C 5 C-G 6 G-C 7 C-G 8 G-C 9 C-G10 G-C11 C-G12 G-C13 C-G14 G-C15 C-G16 G-C17 C-G18 G-C19 C-G20 G-C21 C-G22 G-C23 C-G24 G-C

• 24 base pairs

• ≈ 0.25 M KCL 72 K+ 26 Cl-(blue) (green)

• ≈ 5600 H2O

• 4.4 ns length

• EWALDsummation

AMBER - MDPeter Kollman -UCSF

Even with the knowledge Even with the knowledge ofof the the quantumquantum physics physics ofof water moleculeswater molecules,, it would be it would be impossible toimpossible to deduce deduce the laws the laws of formation ofof formation of waves waves inin the sea the sea. Ken WILSON.. Ken WILSON.

Should we searchShould we searchonly only forfor phenomena phenomenasufficiently generalsufficiently generalto surviveto survive the very the verystrong coarsestrong coarsegraininggrainingof simpleof simple physical physicalmodels ?models ?

Michael LEVITTMichael LEVITT

Steve HARVEYSteve HARVEY

Marc DELARUEMarc DELARUE

Quelques references

Ban N, Nissen P, Hansen J, Moore PB, Steitz TA. 2000. The complete atomic structure of thelarge ribosomal subunit at 2.4 A resolution [see comments]. Science 289: 905-920

Batey RT, Rambo RP, Doudna JA. 1999. Tertiary Motifs in RNA Structure and Folding.Angew Chem Int Ed Engl 38: 2326-2343

Carter AP, Clemons WM, Brodersen DE, Morgan-Warren RJ, Wimberly BT, RamakrishnanV. 2000. Functional insights from the structure of the 30S ribosomal subunit and itsinteractions with antibiotics [see comments]. Nature 407: 340-348.

Costa, M. and F. Michel (1995). "Frequent use of the same tertiary motif by self-foldingRNAs." Embo J 14(6): 1276-85.

Costa, M. and F. Michel (1997). "Rules for RNA recognition of GNRA tetraloops deduced byin vitro selection: comparison with in vivo evolution." Embo J 16(11): 3289-302.

Harms J, Schluenzen F, Zarivach R, et al. 2001. High resolution structure of the largeribosomal subunit from a mesophilic eubacterium. Cell 107: 679-688.

Leontis NB, Stombaugh J, Westhof E. 2002. The non-Watson-Crick base pairs and theirassociated isostericity matrices. Nucleic Acids Res 30: 3497-3531

Leontis NB, Westhof E. 2001. Geometric nomenclature and classification of RNA base pairs.RNA 7: 499-512.

Michel F, Jacquier A, Dujon B. 1982. Comparison of fungal mitochondrial introns revealsextensive homologies in RNA secondary structure. Biochimie 64: 867-881

Westhof E, Fritsch V. 2000. RNA folding: beyond Watson-Crick pairs. Structure Fold Des 8:R55-65

top related