aula teorica minicurso modelagem de proteinas por homologia
TRANSCRIPT
Introdução à Modelagem de Proteínas por Homologia
Belém-PANovembro de 2012
MSc. Ronaldo Correia
Genética e Biologia Molecular - Bioinformática
Laboratório de Planejamento e Desenvolvimento de Fármacos – LPDF - UFPa
Objetivos
Oferecer noções básicas sobre Proteínas;
Apresentar técnicas de modelagem de Proteínas;
Discutir a importância dessas técnicas para o proteoma e planejamento de fármacos.
Introdução
Bioinformática
Proteínas
Métodos experimentai
s
Métodos Teóricos
Seres protéicos
A vida está intimamente ligada às proteínas. Estas moléculas especiais realizam as mais variadas funções no nosso organismo tais como:
Transporte de nutrientes e metabólitos, catálise de reações biológicas;
Apesar da complexidade de suas funções, as proteínas são relativamente simples;
Repetições de 20 unidades básicas, os aminoácidos.
Proteínas x Meio Ambiente
Metano: 25 x maior potencial efeito estufa que CO2
As arqueias metanogênicas são responsáveis por 74% do metano liberado em nossa atmosfera.
Metil coenzima redutase (MCR): catálise da metanogênese.
LIMA, 2012
LIMA, 2012
Proteínas x Meio Ambiente
AminoácidoUm aminoácido consiste em um caborno
“central” com uma ligação a grupo amino (-NH2), outra a um grupo carboxila (-COOH), a terceira a um átomo de hidrogênio e a quarta a uma cadeia lateral variável
Carbono α
Asparagina Ácido Aspartico
Tirosina Fenilalanina
Aminoácidos Single- & three-letter amino acid codes
G Glycine Gly P Proline ProA Alanine Ala V Valine ValL Leucine Leu I Isoleucine IleM Methionine Met C Cysteine CysF Phenylalanine Phe Y Tyrosine TyrW Tryptophan Trp H Histidine HisK Lysine Lys R Arginine ArgQ Glutamine Gln N Asparagine AsnE Glutamic Acid Glu D Aspartic Acid AspS Serine Ser T Threonine Thr
Classificação dos aminoácidosOs aminoácidos podem ser classificados de
acordo com o grupo R como:
Alifáticos (não polares) – sem polos,sem carga;
Não carregados, polares – mas com eminência;
Carregados positivamente;
Carregados Negativamente.
Sem O2 para fazer ligações.
O2 presente (possui pólos) para fazer ligações com carbono e hidrogênio.
Ligação PeptídicaOs peptídeos são biomoléculas formadas
pela ligação de dois ou mais aminoácidos através de ligações do tipo amida. Os peptídeos são resultantes do processamento de proteínas e podem variar de 2 ou mais aminoácidos.
2 aminoácidos: Dipeptídeo3 aminoácidos: Tripeptídeo4 a 10 aminoácidos: Oligopeptídeo10 a 100 aminoácidos: Polipeptídeomais de 100 aminoácidos: Proteína
Insulina
51 amino ácidos
Glucagon
29 amino ácidos
oxitocina ou ocitocina.9 aminoácidos
Vasopressina (ADH)9 aminoácidos
Conformação do Esqueleto
Interações não covalentesLigação de Hidrogênio
Ponte de H formada entre duas moléculas de água
Eletronegatividade
Low Barrier Hydrogen Bond (LBHB)Ligação de Hidrogênio
Interações de van der Waals
Interação Hidrofóbica
Gotas de óleo na água
Resíduo %Cysteine 17.5Serine 11.7
Glutamic acid 11.1Threonine 6.9
Glycine 6.5Leucine 6.1Valine 5.9
Arginine 5.6Aspartic acid 5.0
Alanine 4.8Proline 3.6
Isoleucine 2.7Tyrosine 1.9
Phenylalanine 1.4Histidine 0.8
Covalent Bond ~ 50 - 100kcal/molIonic Bond ~ 5 - 80kcal/molHydrogen Bond ~ 3 - 6kcal/molHydrophobic Interaction ~ 0.5 -
3kcal/mol (not a bond per se)Van der Waals Interaction ~ 1kcal/mol
ProteínasDefinição: são macromoléculas
complexas, compostas de aminoácidos, e necessárias para os processos químicos que ocorrem nos organismos vivos
Nos animais, as proteínas correspondem a cerca de 80% do peso dos músculos desidratados, cerca de 70% da pele e 90% do sangue seco.
Estrutura Primária
amino terminal ou "N-terminal" (NH3+)
carboxi terminal ("C-terminal") (COO-)
>2ANL:A|PDBID|CHAIN|SEQUENCESENDVIELDDVANLMFYGEGEVGDNHQKFMLIFDTGSANLWVPS KCNSIGCSTKHLYDSSKSKSYEKDGTKVEITYGSGVRGFFSKDLVTLGYLSLPYKFIEVTDTDDLEPLYTAAEFDGILGLGWKDLSIGSIDPIVVELKNQNKIDQALFTFYLPVHDKHSGYLTIGGIEEKFYEGELTYEKLNHDLFWQVDLDVNFGKTSMEKANVIVDSGTSTITAPTSFINKFFKDLNVIKVPFLPFYITTCNNKDMPTLEFKSANNTYTLEPEYYMEPLLDIDDTLCMLYILPVDIDKNTFILGDPFMRKYFTVFDYDKESIGFAVAKN
FASTA
Estrutura Secundária
A estrutura secundária é uma função dos ângulos formados pelas ligações peptídicas que ligam os aminoácidos
A conformação espacial é mantida graças as interações intermoleculares (ligação hidrogênio) entre os hidrogênios dos grupos amino e os átomos de oxigênio dos outros amino ácidos.
-Hélice
É a forma mais comum de estrutura secundária regular;
Caracteriza-se por uma hélice em espiral formada por volta de 3 a 6 aminoácidos;
As cadeias laterais dos aminoácidos se distribuem para fora da hélice
A principal força de estabilização da a - Hélice é a ponte de hidrogênio.
-Folhas Envolve 2 ou mais segmentos
polipeptídicos da mesma molécula ou de moléculas diferentes, arranjados em paralelo ou no sentido anti-paralelo
Os segmentos em folha da proteína adquirem um aspecto de uma folha de papel dobrada em pregas.
As pontes de hidrogênio mais uma vez são a força de estabilização principal desta estrutura
Qual seria Beta Folha?
Estrutura Terciária A estrutura terciária relaciona-se com os
loopings e dobraduras da cadeia protéica sobre ela mesma.
É a conformação espacial da proteína, como um todo, e não de determinados segmentos particulares da cadeia protéica.
A forma das proteínas está relacionada com sua estrutura terciária.
Estrutura Terciária
2CBJ
-Hélice
-Folhas
Loop
Estrutura Quaternária
Hemoglobina
Previsão de Estrutura de Proteínas
Experimental
Raios X
RMN
Cerca de 10 a 14 mil estruturas em repositórios públicos
Teórico
102.000 mil estruturas primárias
Homologia
Ab initio
Por que modelar proteínas?
Dificuldade em se obter estruturas experimentais;
Custo elevado
Por que modelar proteínas?
Informações Obtidas Através da Estrutura 3DOrganização estrutural
Estudos sobre o comportamento dos resíduos
Propriedades eletrostáticas dos sítios ativos de enzimas
Informações Obtidas Através da Estrutura 3DInformações funcionais
Estudos sobre a natureza da ligação
Localização da região de ligação
Seleção de alvos moleculares para o desenvolvimento de drogas e vacinas
Modelagem por HomologiaA ferramenta mais bem sucedida de predição de
estruturas tridimensionais de proteínas é a modelagem por homologia, também conhecida como modelagem comparativa.
As proteínas agrupam-se em um número limitado de famílias tridimensionais. Estima-se que existam cerca de 5.000 famílias protéicas.
Conseqüentemente, quando se conhece a estrutura de pelo menos um representante de uma família, é geralmente possível modelar, por homologia, os demais membros da família.
Mioglobina
Em função do número de mutações envolvidas, as seqüências de aminoácidos de proteínas homólogas podem ser, idênticas, semelhantes ou dissemelhantes.
Modelagem por Homologia Esta abordagem baseia-se em alguns padrões gerais que
têm sido observados, em nível molecular, no processo de evolução biológica:
Homologia entre seqüências de aminoácidos implica em semelhança estrutural e funcional;
Proteínas homólogas apresentam regiões internas conservadas (principalmente constituídas de elementos de estrutura secundária: -Hélice e -Folhas;
As principais diferenças estruturais entre proteínas homólogas ocorrem nas regiões externas, constituídas principalmente por alças ("loops"), que ligam os elementos de estruturas secundárias.
Modelagem por HomologiaA modelagem de uma proteína (proteína-
problema) pelo método da homologia baseia-se no conceito de evolução molecular.
Isto é, parte-se do princípio de que a semelhança entre as estruturas primárias desta proteína e de proteínas homólogas de estruturas tridimensionais conhecidas (proteínas-molde) implica em similaridade estrutural entre elas.
MODELAGEM MOLECULAR POR HOMOLOGIA ESTRUTURAL
• Geralmente, o processo de obtenção de um modelo protéico virtual através da execução da estratégia da modelagem molecular por homologia estrutural envolve quatro etapas principais.
Identificação dos moldes
Alinhamento de sequências
Construção da cadeia principal das regiões conservada
Modelagem das alças
Modelo primitivo
Otimização e validação
OK? FIMsimnão
Alinhamento das seqüências
Construção dos modelos
Validação dos Modelos
Busca por proteínas Homólogas
Identificação e seleção de proteínas-molde
(a) conhece-se a família protéica a que pertence a proteína-problema;
(b) não se sabe a que família a proteína-problema pertence.
Se o grau de identidade entre as estruturas primárias das proteínas-molde e da proteína–problema for igual ou superior a cerca de
25%, quando o número de resíduos é superior a 80, existe grande probabilidade de que estas proteínas tenham estruturas tridimensionais semelhantes.
Alinhamento das seqüências de resíduos de aminoácidos
Construção do modeloModelagem das regiões estruturalmente
conservadas;
Modelagem das regiões de alças (loop);
Modelagem das cadeias laterais;
Otimização do modelo gerado.
Validação do modeloA qualidade estereoquímica do modelo é de
importância fundamental. O programa mais utilizado na avaliação dos parâmetros estereoquímicos, o PROCHECK.
O gráfico de Ramachandran é particularmente útil porque ele define os resíduos que se encontram nas regiões energicamente mais favoráveis e desfavoráveis e orienta a avaliação da qualidade de modelos teóricos ou experimentais de proteínas.
Ramachandran
RMSDO parâmetro mais comum que expressa a diferença entre duas estruturas protéicas é o RMSD, ou desvio médio quadrático, em posições atômicas entre as duas estruturas.
Isoformas (classificação):
Calpaínas
Isoforma Domínios EF-Hand
Tecido Doença
Calpaína 1 e 2 (µ,m)
+ Ubíquas AVE, IAM
Calpaína 3 + Músculo-esquelético
Distrofia muscular
Calpaína 6 - Útero e placenta
SOP
Calpaína 9 + Aparelho digestivo
Câncer
Calpaína 10 - Ubíqua Diabetes
SILVA, 2012
SILVA, 2012
SILVA, 2012
www.bioinform
Alpha Helix for Linus Pauling (2004)Escultura de Julian Voss-Andreae3 m de altura, revestida de aço.
Portland, EUA
Fonte: http://en.wikipedia.org
OBRIGADO
B. Rost (2001) Protein secondary structure prediction continues to rise. Journal of Structural Biology, 134, pp. 204-218 (Columbia University).
Bystroff, C., Thorsson, V. & Baker, D. (2000). HMMSTR: a hidden Markov model for local sequence-structure correlations in proteins. J. Mol. Biol., 301, 173-190 (University of Washington)
Cuff, J. A., Clamp, M. E., Siddiqui, A. S., Finlay, M. & Barton, G. J. (1998). JPred: a consensus secondary structure prediction server. Bioinformatics, 14, 892-893 (JPred – Oxford/Cambridge)
Cuff, J. A. & Barton, G. J. (2000). Application of multiple sequence alignment profiles to improve protein secondary structure prediction. Proteins, 40, 502-511 (JPred2)
Rost, B. (1996). PHD: predicting one-dimensional protein structure by profile based neural networks. Meth. Enzymol., 266, 525-539. (PHD – Heidelberg – Germany)
Referências
Referências Donald Voet; Judith G. Voet; Charlotte W. Pratt, Funadmentos de
BIOQUÌMICA A vida em nível molecular 2ª ed., 2006. Lehninger Principles of Biochemistry Princípios de Bioquímica ( Lehninger ) - 4ª edição - LEHNINGER,
ALBERT L. , COX, NELSON, KAY YARBOROUGH. Przybylski, D. & Rost, B. (2000). PSI-BLAST for structure prediction: plug-in
and win. Columbia University (PHDPsi) Rost WWW, B. (2000). Better secondary structure prediction through more
data. Columbia University, WWW document (http://cubic.bioc.columbia.edu/predictprotein) (PROF)
Altschul, S., Madden, T., Shaffer, A., Zhang, J., Zhang, Z. et al. (1997). Gapped Blast and PSI-Blast: a new generation of protein database search programs. Nucl. Acids Res., 25, 3389-3402. (PSI-BLAST – USA)
Jones, D. T. (1999). Protein secondary structure prediction based on position-specific scoring matrices. J. Mol. Biol., 292, 195-202 (PSIPRED – Warwick)