14. estructura de proteínas, 1
DESCRIPTION
14. Estructura de proteínas, 1. Niveles estructurales en las proteínas. Estructura primaria : Secuencia de aminoácidos Estructura secundaria : Plegamiento básico de la cadena debido a enlaces de hidrógeno entre grupos -CO- y -NH- de la unión peptídica: hélices, láminas y giros - PowerPoint PPT PresentationTRANSCRIPT
14. Estructura deproteínas, 1
Niveles estructurales en las proteínas
Estructura primaria: Secuencia de aminoácidos
Estructura secundaria: Plegamiento básico de la cadenadebido a enlaces de hidrógeno entre grupos -CO- y -NH-de la unión peptídica: hélices, láminas y giros
Estructura terciaria: Estructura tridimensional de la proteína
Estructura cuaternaria: Asociación de distintas subunidades,siendo cada una un polipéptido.
5’-AAGGGTACCCAACATTTAGTT-3’3’-TTCCCATGGGTTGTAAATCAA-5’
5’-AAGGGUACCCAACAUUUAGUU-3’
N Lys.Gly.Ser.Gln.His.Leu.Val C
DNA
RNA
Proteína
Estructura primaria
FVNQHLCGSHLVEALYLVCGERGFFYTPKA
S
S
GIVEQCCASVCSLYQLENYCN
S S
S
S
Estructura primaria de la insulina
CC
CH2
S
S
CH2
CCN
N
OH
H O
H
H
CC
CH2
N
OH
SO3H
H
H
CH2
CCN
H O
SO3H
HCO3H
Oxidación de puentes disulfuro
CC
CH2
S
S
CH2
CCN
N
OH
H O
H
H
CC
CH2
N
OH
SH
H
H
CH2
CCN
H O
SH
DTT ICH2 COOH
CC
CH2
N
OH
S
CH2
COO-
H
H
CH2
CCN
H O
S
CH2
COO-
Reducción y alquilación de puentes disulfuro
O2N
NO2
F + H2N CN C
N
R1
O
H
R2
O
H
R3
O
O2N
NO2
HN CN C
N
R1
O
H
R2
O
H
R3
O
O2N
NO2
HN
R1
COOH
H2N COOH
R2 COOH
R3
H2N+ +
Determinación del N-término por la reacción de Sanger
---.---.---.Lys.---.---.---
Tripsina
---.---.---.Arg.---.---.---
---.---.---.Phe.---.---.------.---.---.Tyr.---.---.------.---.---.Trp.---.---.------.---.---.Leu.---.---.---
Quimotripsina
Rotura enzimáticade polipéptidos
N CN C
N CN
CH2
O
H
R
O
H
R
O
C CN C
NCN
H
O
R
H
O
R
H
H
R
O
H
R
O
CH2
S
CH3
NCN
CN
H
O
R
H
O
R
H
O
O
CN C
N
R
O
H
R
O
CN C
H
R
O
H
R
O
H2N
BrCN
Rotura de un péptido por bromuro de cianógeno
N CN C
O
H
R4
O
CNC
H
O
R2
H
O
R1 R3
H2NN C S +
N C
S
N CN C
O
H
R4
O
CNC
H
O
R2
H
O
R1 R3
N
H
N CN C
O
H
R4
O
CH2N
H
O
R2
R3
NNH
S
O
R1H
+
Degradación secuencial de Edman
Ácido diluído
Feniltioisocianato
PTC-péptido
PTH-aminoácido
Péptido (n)
Péptido (n-1)
Hoy día, la mayor parte de estructuras primarias de proteínasse determina a partir de la secuencia de nucleótidos en el genoma.
Técnicamente la secuenciación de ácidos nucleicos (en particular,la de DNA) es mucho más sencilla y barata que la de proteínas, estando al alcance de cualquier laboratorio.
10 20 30 40 50 60 | | | | | | PYQYPALTPE QKKELSDIAH RIVAPGKGIL AADESTGSIA KRLQSIGTEN TEENRRFYRQ
70 80 90 100 110 120 | | | | | | LLLTADDRVN PCIGGVILFH ETLYQKADDG RPFPQVIKSK GGVVGIKVDK GVVPLAGTNG
130 140 150 160 170 180 | | | | | | ETTTQGLDGL SERCAQYKKD GADFAKWRCV LKIGEHTPSA LAIMENANVL ARYASICQQN
190 200 210 220 230 240 | | | | | | GIVPIVEPEI LPDGDHDLKR CQYVTEKVLA AVYKALSDHH IYLEGTLLKP NMVTPGHACT
250 260 270 280 290 300 | | | | | | QKFSHEEIAM ATVTALRRTV PPAVTGITFL SGGQSEEEAS INLNAINKCP LLKPWALTFS
310 320 330 340 350 360 | | | | | | YGRALQASAL KAWGGKKENL KAAQEEYVKR ALANSLACQG KYTPSGQAGA AASESLFVSN
HAY Estructura primaria de la aldolasa A humanaSWISS-PROT http://www.expasy.ch
Cálculos a partir de estructura primaria
- Número, porcentaje y fracción molar de aminoácidos
- Fórmula molecular y peso molecular
- pI (punto isoeléctrico) teórico
- Absorbancia molar teórica
- Vida media teórica
- Índices de inestabilidad e hidrofobicidad
Amino acid composition:
Ala (A) 42 11.6%Arg (R) 15 4.1%Asn (N) 14 3.9%Asp (D) 14 3.9%Cys (C) 8 2.2%Gln (Q) 17 4.7%Glu (E) 24 6.6%Gly (G) 30 8.3%His (H) 9 2.5%Ile (I) 20 5.5%Leu (L) 34 9.4%Lys (K) 26 7.2%Met (M) 3 0.8%Phe (F) 8 2.2%Pro (P) 19 5.2%Ser (S) 20 5.5%Thr (T) 22 6.1%Trp (W) 3 0.8%Tyr (Y) 13 3.6%Val (V) 22 6.1%
Asx (B) 0 0.0%Glx (Z) 0 0.0%Xaa (X) 0 0.0%
Atomic composition:
Carbon C 1741Hydrogen H 2780Nitrogen N 486Oxygen O 526Sulfur S 11
Formula: C1741H2780N486O526S11Total number of atoms: 5544
Molecular weight: 39288.8
ProtParam, 1http://www.expasy.ch
Total number of negatively charged residues (Asp + Glu): 38Total number of positively charged residues (Arg + Lys): 41
Theoretical pI: 8.39
Extinction coefficients:
Conditions: 6.0 M guanidium hydrochloride 0.02 M phosphate buffer pH 6.5
Extinction coefficients are in units of M-1 cm-1 .
The first table lists values computed assuming ALL Cys residues appear as half cystines, whereas the second table assumes that NONE do.
276 278 279 280 282 nm nm nm nm nmExt. coefficient 35630 35508 34945 34190 32880Abs 0.1% (=1 g/l) 0.907 0.904 0.889 0.870 0.837
276 278 279 280 282 nm nm nm nm nmExt. coefficient 35050 35000 34465 33710 32400Abs 0.1% (=1 g/l) 0.892 0.891 0.877 0.858 0.825
ProtParam, 2http://www.expasy.ch
Estimated half-life:
The N-terminal of the sequence considered is P (Pro).
The estimated half-life is: >20 hours (mammalian reticulocytes, in vitro). >20 hours (yeast, in vivo). ? (Escherichia coli, in vivo).
Instability index:
The instability index (II) is computed to be 34.82This classifies the protein as stable.
Aliphatic index: 87.16
Grand average of hydropathicity (GRAVY): -0.268
ProtParam, 3http://www.expasy.ch
Predicciones a partir de estructura primaria, 1
- Hidrofobicidad
- Estructura secundaria
- Retención cromatográfica en HPLC
- Residuos accesibles y ocultos
- Mutabilidad
Ala: 1.800Arg: -4.500Asn: -3.500Asp: -3.500Cys: 2.500Gln: -3.500Glu: -3.500 Gly: -0.400His: -3.200Ile: 4.500Leu: 3.800Lys: -3.900Met: 1.900Phe: 2.800Pro: -1.600Ser: -0.800Thr: -0.700Trp: -0.900Tyr: -1.300Val: 4.200
PYQYPALTPEQKKELSDIAH
Valor de hidrofobicidad para laposición n (en este caso, 8):
i = n-4
n+4
bi = -10.5
Escala de hidrofobicidad(según Kyte y Doolittle)
Cálculo predictivo de hidrofobicidad (Kyte & Doolittle)
(CG5432)CG5432 PROTEIN. [Drosophila melanogaster] 376 AA Score = 398 bits (1011), Expect = e-110 Identities = 197/355 (55%), Positives = 245/355 (68%), Gaps = 2/355 (0%) Query: 2 YQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQL 61 + YP E ++EL I+ +VAPGKGILAADES+ + KR Q IG ENTEENRR YRQ+ Sbjct: 5 FYYP--NKELQEELICISKALVAPGKGILAADESSAVMGKRFQLIGVENTEENRRLYRQM 62
Query: 62 LLTADDRVNPCIGGVILFHETLYQKADDGRPFPQXXXXXXXXXXXXXXXXXXPLAGTNGE 121 L T D ++ I GVI +HETL+Q+ DDG PF + PL G+ E Sbjct: 63 LFTTDPKIAENISGVIFYHETLHQRTDDGLPFVEALRKKGILTGIKVDKHFSPLFGSEDE 122
Query: 122 TTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNG 181 TTQGLD L+ RCAQYKK+G FAKWRC+LKI ++TPS AI+ENANV+ARYA+ICQ Sbjct: 123 FTTQGLDDLANRCAQYKKEGCSFAKWRCILKITKNTPSPQAILENANVMARYAAICQSQR 182
Query: 182 IVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQ 241 +VPI+ PE+L GDHDL RCQ V E +LA VYKALSDHH++LEGTLL+P+MV PG + Sbjct: 183 LVPIISPEVLATGDHDLDRCQKVNEILLAGVYKALSDHHVFLEGTLLQPSMVMPGLQSNK 242
Query: 242 KFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSY 301 +I +ATV A+RR+VPPAV G+ F G QSEEEA+++LNAIN PL KPWA+TF++ Sbjct: 243 NHPPADIGVATVLAIRRSVPPAVMGVLFCGGAQSEEEATVHLNAINNVPLCKPWAMTFAF 302
Query: 302 GRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESL 356 RALQ S L+ WGGKKE + AQ E +KR AN LA GKY +AA+E L Sbjct: 303 DRALQTSILRTWGGKKEQISHAQNELIKRCRANGLASIGKYVIGSVESSAATERL 357
Predicciones a partir de estructura primaria, 2: Homologías
Dependiendo del grado de homología en su estructuraprimaria, las proteínas se agrupan en:
- Superfamilias: homología en torno a 30 %
- Familias: homología superior a un 50 % y la misma función, por lo general.
Además, hay pequeños tractos de secuencias comunesa proteínas muy diversas, y que corresponden a ciertosaspectos funcionales (como p.e. modificación postraduccional): son los motivos secuenciales
Algunos motivos secuenciales en las proteínas
N-Glicosilación N-{P}-[ST]-{P}Unión a glicosaminoglicano S-G-x-GFosforilación dependiente de cAMP [RK]-(2)-[ST]Fosforilación, protein kinasa C [ST]-x(2)-[RK]Fosforilación, tirosin kinasa [RK]-x(2)-[DE]-x(3)-YN-miristilación G- {EDRKHPFYW}-x(2)-[STAGCN]-{P}Amidación C-terminal x-G- [RK]-[RK]-carboxilación de ácido glutámico x(12)-E-x(3)-E-x-C-x(6)-[DEN]-x-[LIVMFY]Prenilación C-{DENQ}-[LIVM]
-8 1 10___.___.___.___.___.___.___.___.Gly.___.___.___.___.Gly.___.___.___.Phe.
20___.___.___.Cys.___.___.Cys.His.___.___.___.___.___.___.___.___.Lys.___.
30 40Gly.Pro.___.Leu.___.Gly.___.___.___.Arg.___.___.Gly.___.___.___.Gly.___.
50 60___.Tyr.___.___.Ala.Asn.___.___.___.___.___.___.Trp.___.___.___.___.___.
70 80___.___.Tyr.Leu.___.Asn.Pro.Lys.Lys.Tyr.Ile.Pro.Gly.Thr.Lys.Met.___.Phe.
90 100___.Gly.___.___.Lys.___.___.___.Arg.___.___.___.___.___.___.___.___.___.
104___.___.___.___. Invariantes en citocromo c
Predicciones a partir de estructura primaria, 3: Filogenia y Taxonomía
Posición Aminoácidos
13 Arg, Lys
40 Ser, Thr
46 Phe, Tyr
49 Ser, Thr
81 Val, Leu, Ile
85 Leu, Ile
90 Asp, Glu
94 Leu, Ile
95 Ile, Val
97 Phe, Tyr
Sustituciones conservadoras en citocromo c
Posición Aminoácidos
33 His, Ser, Trp, Tyr, Asn
44 Ala, Pro, Asp, Gln, Val, Glu
54 Asn, Ala, Ser, Gln, Arg, Lys
60 Glu, Gly, Asp, Ala, Gln, Lys, Asn
65 Tyr, Phe, Ser, Met, Arg
83 Pro, Ala, Val, Gly, Thr
88 Pro, Ala, Asp, Glu, Lys, Thr
89 Gln, Lys, Asn, Glu, Thr, Gly, Asp, Ala, Ser
92 Ana, Asn, Asp, Gly, Glu, Val, Thr, Lys, Gln
Sustituciones radicales en citocromo c
1 2 3 4 5 6 7 8 9__________________________________________________________________________
1. Homo sapiens -
2. Maccaca mulata 1 -
3. Sus scrofa 10 9 -
4. Gallus domesticus 13 12 9 -
5. Rana pipiens 18 17 11 11 -
6. Musca domestica 27 26 22 23 22 -
7. Bombyx mori 31 30 27 28 29 14 -
8. Triticum vulgare 43 43 45 46 48 45 45 -
9. Neurospora crassa 48 47 46 47 49 41 47 54 -
Distancias filogenéticas en citocromo c
Ángulos deconformación
Representación de Ramachandran
-Hélice
= -57º= -47º
Paso de rosca: 0.54 nmTraslación por residuo: 0.15 nmResiduos por vuelta: 3.6Enlaces H: n a n+3
Hélice 310
= -49º = -26º
Paso de rosca: 0.59 nmTraslación por residuo: 0.19Residuos por vuelta: 3
N
C
Mioglobina
Proteína globular con alto contenido en
-hélice
Fibrinógeno
Proteína fibrosacon alto contenido
en -hélice
Propensión estructural hacia -hélices (Chou y Fasman)
Estabilizan
Ala: 1.420 Gln: 1.110 Glu: 1.510 Leu: 1.210 Lys: 1.160 Met: 1.450 Phe: 1.130
Indiferentes
Arg: 0.980 Asp:1.010 His: 1.000 Ile: 1.080 Trp: 1.080 Val: 1.060
Desestabilizan
Asn: 0.670 Cys: 0.700 Gly: 0.570 Pro: 0.570 Ser: 0.770 Thr: 0.830 Tyr: 0.690
Prolina y-hélices
Hélice de poliprolina
Colágeno
Estructura
= -119 = 113
CN C
N
H O
CN C
N
HO
OH
CN C
N
H O
CN C
N
HO
HO
CN C
N
H O
CN C
N
HO
H O
CN C
N
H O
CN C
N
HO
O H
CN C
N
H O
CN C
N
HO
H O
CN C
N
H O
CN C
N
HO
O H
N C
C
C
C
N
N
N
Lámina paralela
Lámina paralela
Barril paralelo
CN C
N CN C
N CN C
N
H O H O H
OHOHOH
O
NC N
C NC N
C NC N
C
O H O H OH
O H O H O H
CN C
N CN C
N CN C
N
H O H O H
OHOHOH
O
N C
N
N
C
C
Lámina antiparalela
Lámina antiparalela
Lámina antiparalela
Estabilizan
Ile: 1.600 Cys: 1.190 Gln: 1.100 Leu: 1.300 Phe: 1.380 Thr: 1.190 Trp: 1.370 Tyr: 1.470 Val: 1.700
Indiferentes
Arg: 0.930 Met: 1.050
Desestabilizan
Ala: 0.830 Asn: 0.890 Asp: 0.540 Glu: 0.370 Gly: 0.750 His: 0.870 Lys: 0.740 Pro: 0.550 Ser: 0.750
Propensión estructural hacia estructuras (Chou y Fasman)
Proteína fibrosa conestructura : Fibroína
Proteína globularcon estructura :Concanavalina A
Giro
Propensión estructural hacia giros
Estabilizan
Asn: 1.560 Asp: 1.460 Cys: 1.190 Gly: 1.560 Pro: 1.520 Ser: 1.430
Indiferentes
Arg: 0.950 Gln: 0.980 His: 0.950 Lys: 1.010 Thr: 0.960 Trp: 0.960 Tyr: 1.140
Desestabilizan
Ala: 0.660 Glu: 0.740 Ile: 0.470 Leu: 0.590 Met: 0.600 Phe: 0.600 Val: 0.500
1ntr
Proteínaregulatoria
Estructuras suprasecundarias
- Hélice-vuelta-hélice- Siete hélices transmembrana y hélice anfipática- Cremallera de leucina- Unidad - Meandro - Dedo de Zn- Mano EF
N
C
Hélice-vuelta-hélice
Siete hélices transmembrana(bacteriorrodopsina)
-héliceanfipática
Ladohidrofóbico
Lado polar
Cremallera de leucina
Motivo
Meandro
Dedo de Zn
Mano EF
Determinación experimental de la estructura secundaria
1. Métodos físicos:
Cristalografía Rayos X, Resonancia Magnética Nuclear(RMN, NMR) en tanto en cuanto resuelven la estructuraterciariaOtras técnicas: dicroísmo circular
2. Métodos predictivos a partir de la estructura primaria
Propensión de un aminoácido hacia una estructura dada
1. A partir de un conjunto de proteínas de estructura 3D conocida, se forma la siguiente tabla:
Total -hélice Estr. Giro
Glutamato 282 132 29 43Aminoácidos 5507 1715 1555 1121
(Se ha puesto el Glutamato como ejemplo; esta tabla se prepara para todos los aminoácidos)
2. A partir de la tabla anterior, se calculan las frecuencias relativas de aparición de dicho aminoácido en las tres estructuras:
-hélice Estr. Giro
Glutamato 0.470 0.104 0.151Aminoácidos 0.311 0.282 0.204
3. Se calcula entonces la propensión de cada aminoácido hacia unaestructura dada por el cociente de dividir la frecuencia relativa de cada estructura por la frecuencia relativa media de todos los amino-ácidos. En el caso del glutamato,
P = 0.470/0.311 = 1.511 P = 0.104/0.282 = 0.370 Pg = 0.151/0.202 = 0.748
Ala: 1.420 Arg: 0.980 Asn: 0.670 Asp: 1.010 Cys: 0.700 Gln: 1.110 Glu: 1.510 Gly: 0.570 His: 1.000 Ile: 1.080 Leu: 1.210 Lys: 1.160 Met: 1.450 Phe: 1.130 Pro: 0.570 Ser: 0.770 Thr: 0.830 Trp: 1.080 Tyr: 0.690 Val: 1.060
PYQYPALTPEQKKELSDIAH
Valor de propensión hacia-hélice para la posición n
(en este caso, 8):
i = n-4
n+4
bi = 9.07
Escala de propensiones hacia -hélice(según Chou y Fasman)
Ala: 0.830 Arg: 0.930 Asn: 0.890 Asp: 0.540 Cys: 1.190 Gln: 1.100 Glu: 0.370 Gly: 0.750 His: 0.870 Ile: 1.600 Leu: 1.300 Lys: 0.740 Met: 1.050 Phe: 1.380 Pro: 0.550 Ser: 0.750 Thr: 1.190 Trp: 1.370 Tyr: 1.470 Val: 1.700
PYQYPALTPEQKKELSDIAH
Valor de propensión haciaestructura para la posición n
(en este caso, 8):
i = n-4
n+4
bi = 8.1
Escala de propensiones hacia estructura(según Chou y Fasman)
Ala: 0.660 Arg: 0.950 Asn: 1.560 Asp: 1.460 Cys: 1.190 Gln: 0.980 Glu: 0.740 Gly: 1.560 His: 0.950 Ile: 0.470 Leu: 0.590 Lys: 1.010 Met: 0.600 Phe: 0.600 Pro: 1.520 Ser: 1.430 Thr: 0.960 Trp: 0.960 Tyr: 1.140 Val: 0.500
PYQYPALTPEQKKELSDIAH
Valor de propensión haciagiro para la posición n
(en este caso, 8):
i = n-4
n+4
bi = 9.12
Escala de propensiones hacia giro(según Chou y Fasman)