antônio augusto fonseca júnior - perse.com.br€¦ · o formato digital é vendido na...
TRANSCRIPT
2
Sobre o autor
Antônio Augusto Fonseca Júnior é farmacêutico formado pela Universidade Federal
de Minas Gerais, especialista em Bioética e Biotecnologia pela Universidade Federal de
Lavras, Mestre em Ciência Animal e Doutor em Ciência Animal pela Universidade Federal
de Minas Gerais. Já trabalhou como professor lecionando em disciplinas de
Microbiologia, Biologia Molecular, Bioinformática, Farmacologia e Genética. Atualmente
é responsável pelo Laboratório De Biologia Molecular do Laboratório Nacional
Agropecuário de Minas Gerais (Lanagro/MG) do Ministério da Agricultura, Pecuária e
Abastecimento.
3
Edições Edição 1
Implementação de dados básicos para projeto de primers, Blast e Filogenia
Edição 2
Dados se sequenciamento
Edição 3
Erros de sequenciamento
Edição 4
Melhoria dos protocolos para filogenia
Edição 5
Análise por Restrição enzimática
Edição 6
Noções de PCR e desenho de primers e sondas para PCR em tempo real
Edição 7
Análise de pressão seletiva e protocolo para Mr. Bayes
4
Formatos O Guia Rápido de Bioinformática existe em dois formatos:
O formato digital é vendido na Amazon.com.br. Caso encontre esse livro pirateado,
ajude o autor e adquira por um precinho camarada. Todas as atualizações do formato
digital são gratuitas. Para permitir uma atualização, simplesmente configure sua conta
na Amazon para permitir isso. Vá em Sua Conta → Gerencie seu dispositivo e conteúdo
→ Configurações → Atualização automática de ebooks.
O formato impresso pode ser encontrado em www.perse.com.br. Infelizmente ele é
atualizado com menor frequência e, por razões óbvias, as atualizações não são gratuitas.
Mantenho suas versões disponíveis apenas devido aos pedidos de vários professores de
bioinformática e algumas pessoas que preferem ter roteiros impressos.
5
Sumário Capítulo 1: A PCR ............................................................................................................ 7
Extração de Ácidos Nucleicos ...................................................................................... 8 Extração por Fenol/Clorofórmio/Álcool Isoamílico ................................................. 9
Extração por coluna de sílica .................................................................................. 13 A Teoria da PCR ......................................................................................................... 15
Eletroforese ............................................................................................................. 17 Capítulo 2: Sequenciamento de Sanger .......................................................................... 23
Introdução ................................................................................................................... 23 Resolução de Problemas ............................................................................................. 27
Análise do Scan ...................................................................................................... 27 Presença de Artefatos ............................................................................................. 28
Presença de picos sobrepostos ................................................................................ 30
Picos sobrepostos após homopolímeros ................................................................. 31 Sequência menor do que a esperada ....................................................................... 31
Sinal Fraco .............................................................................................................. 32 Falha no Sequenciamento ....................................................................................... 33
Capítulo 3: Análise de Eletroferogramas ........................................................................ 34
Introdução ................................................................................................................... 34 Roteiro ........................................................................................................................ 35
Capítulo 4: Bioedit .......................................................................................................... 39 Introdução ................................................................................................................... 39 Inserindo sequências ................................................................................................... 40
Criando os Arquivos em FASTA ........................................................................... 41
Atalhos de teclado interessantes ............................................................................. 41 Alinhamento no BioEdit ......................................................................................... 42 Outras opções .......................................................................................................... 45
Capítulo 5: Desenho de Primers ..................................................................................... 50
Introdução ................................................................................................................... 50
Parâmetros .................................................................................................................. 50 Alinhamento ........................................................................................................... 50 Desenho dos primers ............................................................................................... 51
Roteiro ........................................................................................................................ 52 Uso do Primer3 Plus ............................................................................................... 52 Verificando especificidade in silico ........................................................................ 54
Capítulo 6: Restrição Enzimática in silico ...................................................................... 57
Roteiro para restrição in silico .................................................................................... 59 Capítulo 7: GenBank ...................................................................................................... 61
Introdução ................................................................................................................... 61
Roteiro ........................................................................................................................ 62 Parte I - Nucleotídeos ............................................................................................. 62
6
Parte II - Número de Acesso ................................................................................... 64 Parte III - Genes ...................................................................................................... 68
Parte IV - Genomas ................................................................................................ 69 Capítulo 8: Blast ............................................................................................................. 71
Introdução ................................................................................................................... 71
Roteiro ............................................................................................................................ 78 Capítulo 9: Filogenia ...................................................................................................... 80
Introdução ................................................................................................................... 80 Escolha das Sequências .............................................................................................. 80
A Análise De Dados Da Filogenia .............................................................................. 82 Alinhamento ............................................................................................................... 82
Modelo de Substituição .............................................................................................. 83 Reconstrução da Árvore Filogenética ......................................................................... 86
Métodos de Distância ............................................................................................. 86
Métodos Cladísticos ................................................................................................ 88 Métodos Probabilísticos .......................................................................................... 89
Avaliação Estatística Da Árvore ................................................................................. 89 A Árvore ..................................................................................................................... 90
Enraizando Árvores ................................................................................................ 92
Utilizando o MEGA 6.06 ............................................................................................ 95 Criando os Arquivos em Fasta ................................................................................ 95
Recuperando Sequências ........................................................................................ 95 Encontrando o Melhor Modelo de Substituição ................................................... 100 Reconstrução da Árvore ....................................................................................... 101
Modificando a Árvore ........................................................................................... 103
Calculando Distâncias Genéticas .......................................................................... 105 Utilizando o Mr. Bayes ............................................................................................. 112
Roteiro .................................................................................................................. 112
Preparando uma corrida simples ........................................................................... 113 Capítulo 10: Pressão Seletiva ....................................................................................... 119
Utilizando o Selecton ................................................................................................ 120 Inserindo os Dados Iniciais ................................................................................... 120 Inserindo Opções Avançadas ................................................................................ 121
Resultados ............................................................................................................. 123
Referências ................................................................................................................... 126
7
Capítulo 1: A PCR
A versão original desse livro não tratava de uma das principais ferramentas do
laboratório de biologia molecular. O objetivo era voltar o livro principalmente para os
trabalhos de bioinformática, no entanto, o uso da PCR muito frequente para se gerar as
sequências de DNA e RNA que serão estudadas mais tarde. Esse capítulo pretende
resumir brevemente o que é a PCR e quais os passos necessários para executá-la.
Estudantes da área da biologia mais experientes no laboratório podem considerá-lo
desnecessário, mas aqueles que ainda estão no início da graduação ou vindos de outras
áreas sem currículo básico de biologia molecular podem necessitar da pequena revisão a
seguir.
PCR é uma sigla para Reação em Cadeia da Polimerase (Polymerase Chain Reaction).
A ideia é antiga, sendo original da década de 80 quando se percebeu que seria possível
gerar grandes quantidades de partes específicas do DNA a partir de uma enzima e de
reagentes que pudessem delimitar a região desejada. O objetivo dessa reação é,
portanto, gerar muitas cópias de uma molécula de uma maneira exponencial. Essas
cópias são de uma região específica e delimitada do DNA que será utilizado como molde.
A própria PCR é uma reação enzimática que ocorre dentro de um microtubo.
Geralmente o volume total não passa de 50 microlitros, sendo mais comum pode volta
de 20-25 microlitros. Além dos próprios eventos bioquímicos que ocorrem nesse tubo,
são necessárias ainda outras duas etapas. Antes de se adicionar todos os reagentes da
PCR no tubo, é necessário extrair o DNA da amostra a ser utilizada. Essa é uma etapa
essencial para o sucesso da reação. Finalizado esse processo, a amostra é adicionada ao
tubo. Feito isso, os resultados devem ser visualizados. A PCR convencional necessita de
ter os resultados da amplificação do DNA visualizados em um gel de agarose, enquanto
outros tipos como a PCR digital e a PCR em tempo real têm os resultados demonstrados
em computadores acoplados às máquinas.
8
Figura 1: Microtubos utilizados na PCR
Figura 2: Termocicladores. Esses são os equipamentos normalmente utilizados onde as
reações de PCR são colocadas para serem submetidas às variações de temperatura necessárias
para que a reação ocorra. Cada máquina pode realizar, em média, até 96 reações por vez, mas
existem outras com capacidades muito maiores como 384 reações.
Extração de Ácidos Nucleicos
A extração de ácidos nucleicos é a primeira etapa da PCR e deve ser praticamente
considerada como um conjunto com a reação tamanha a importância desse processo
para o sucesso do experimento. Diferentes amostras exigem diferentes extrações,
apesar de cada vez mais as empresas lançarem kits que funcionam em uma vasta gama
de tecidos ou células de microrganismos variados.
9
O tipo mais simples de extração é a fervura de colônias de bactérias para PCRs mais
simples que visam, por exemplo, apenas identificação genética da espécie pesquisada.
Uma simples colônia fervida a ponto de inativar a bactéria rende DNA suficiente para
muitas PCRs. Obviamente, o método varia conforme a espécie, mas existem processos
validados dessa extração seguida de PCR.
Outros exemplos de extração são descritos a seguir. Todas costumam passar por um
processo básico de preparação da amostra para quebra do tecido antes do início da
separação do DNA da porção proteica/lipídica. Existem métodos como a quebra física ao
se adicionar nitrogênio seguido de maceração ou a destruição completa do tecido em
equipamentos específicos para maceração. O método mais comum visto nos
laboratórios é o uso de Proteinase K. Essa enzima é uma protease de amplo espectro.
Devido à sua falta de especificidade ao clivar ligações peptídicas, pode ser utilizada em
diversos tecidos. A enzima tem preferência para digestão de proteínas a partir de
aminoácidos hidrofóbicos, sendo ativada pelo íon Ca2+. O pH ótimo é 8,0, porém ainda
age em uma faixa de 4,0 a 12,0. A utilização de um tampão adequado (30 mM EDTA, 30
mM Tris Cl; 800 mM cloreto de guanidina; 5% Tween 20; 0.5% Triton X-100) pode
aumentar em até 300% sua atividade.
Extração por Fenol/Clorofórmio/Álcool Isoamílico
A extração por Fenol/Clorofórmio/Álcool Isoamílico (F/C/A) já foi bastante comum
nos laboratórios, porém foi substituída por kits mais práticos. Suas vantagens são o
preço e a quantidade de ácidos nucleicos obtidos, porém o processo é trabalhoso, usa
reagentes tóxicos e está sujeito a contaminações por proteínas e sais.
A solução obtida após a digestão enzimática do tecido é adicionada a uma mistura
de fenol tamponado saturada (72% fenol, 28% água). A densidade dessa solução é um
pouco maior do que a da água, o que garante que, após a centrifugação, a fase lipídica e
10
proteica fique na parte inferior do tubo e a fase aquosa (contendo ácidos nucleicos) na
parte superior (Figura 3). Essas posições podem ser invertidas caso a solução aquosa
contenha quantidade muito grande de sais, o que alterará as densidades.
Figura 3: Solução da extração F/C/A após centrifugação. 1. Fase aquosa contendo ácidos
nucleicos. 2. Interfase contendo proteínas parcialmente desnaturadas, DNA (caso apenas RNA
esteja sendo extraído e o fenol esteja com pH mais ácido). 3. Fase orgânica com fenol, proteínas,
lipídeos.
O fenol misturado ao clorofórmio é melhor para a desnaturação de proteínas do que
qualquer um desses dois reagentes separados. O álcool isoamílico desfavorece a
formação de espuma. O uso de fenol puro também tem a desvantagem de reter parte
da solução aquosa (cerca de 15%). A presença do clorofórmio reduz esse efeito.
A separação das fases pela centrifugação ocorre devido à densidade diferente das
mesmas. A água tem densidade de 1.00 g/cm3, o fenol 1,07 g/cm3 e o clorofórmio 1,47
11
g/cm3. A presença do clorofórmio permite uma separação mais nítida das fases com
uma interfase.
O DNA tende a permanecer na fase aquosa por ser um polímero polar, pois a água é
mais polar do que a fase F/C/A. As proteínas possuem regiões hidrofóbicas e hidrofílicas.
As regiões hidrofóbicas interagirão com o fenol causando precipitação de formando uma
interfase esbranquiçada que nunca deve ser pipetada. Os lipídeos tenderão a
permanecer na fase F/C/A.
A permanência do DNA na fase aquosa depende do pH do fenol. Quando o pH está
entre 7,5-8,0, os fosfatos permanecerão com carga negativa. Caso o pH seja reduzido
(por volta de 4,0-5,0), as cargas negativas do DNA (principalmente fragmentos maiores)
serão diminuídas, causando sua precipitação para a interfase. Esse fenômeno pode ser
usado para a extração do RNA. Por ser mais ácido (e mais difícil de diminuir sua carga
negativa), o RNA ainda permanecerá na fase aquosa, livre de proteínas, DNA e outras
substâncias.
O DNA será posteriormente precipitado após lavagens com etanol para a remoção
de sais. A primeira lavagem ocorre com Etanol em alta concentração (95%) e na
presença de um sal. O etanol é muito menos polar do que a água. Adicioná-lo a solução
diminui a atração dos grupos fosfatos que permitem a solubilização do DNA. Assim o
DNA interagirá com o sal (como Na+, NH4+ ou Li+) também adicionado e tenderá a
precipitar. Em outra etapa, adiciona-se etanol 70% para precipitar o DNA ao mesmo
tempo em que se diminui a concentração de sais.
Cuidados na extração F/C/A
12
Cuidado se a solução fenólica estiver rosada, POIS é indicativo de
oxidação, o que pode quebrar o DNA e degradar o RNA. É preciso haver um
antioxidante para evitar que isso ocorra com frequência.
Sempre use luvas e jalecos.
O fenol é irritante para as mucosas e pode ser fatal se ingerido ou
inalado em grandes quantidades. Deve-se agir com a cautela adequada ao
utilizá-lo.
Dedique as pipetas exclusivamente para extração de DNA e RNA e não
as utilize no preparo do mix de PCR.
Protocolo simples de extração F/C/A
O protocolo a seguir é um método simples para se obter grandes quantidades de
DNA utilizando-se o método F/C/A. O padrão da metodologia é mais trabalhoso e
extenso, porém o descrito a seguir é bastante útil para obtenção rápida dos ácidos
nucleicos a partir de bactérias ou tecidos.
Reagentes
Tampão TE pH 8,0
Fenol tamponado
Solução F/C/A (50%/48%/2%) – utilizar fenol saturado pH 8,0.
Álcool etílico 95%
Álcool etílico 70%
Acetato de amônio 7,5 M
13
Protocolo
1. Adicionar ao tubo com solução de células lisadas volume igual de F/C/A.
2. Agite fortemente, preferencialmente utilizando um vórtex.
3. Centrifugar a temperatura por 5 min a 700 g.
4. Coletar a fase sobrenadante e transferir para outro tubo.
5. Adicionar o dobro de volume de álcool etílico 100% e metade do volume
de acetato de amônio 7,5 M.
6. Centrifugar a 90% da velocidade máxima da centrífuga.
7. Remover o sobrenadante gentilmente.
8. Adicionar 700 µL de álcool etílico 70%.
9. Centrifugar a 90% da velocidade máxima da centrífuga.
10. Remover o sobrenadante gentilmente.
11. Secar por dez minutos.
12. Ressuspender o pellet com TE pH 8,0.
Extração por coluna de sílica
As extrações por kits a base de centrifugações em colunas de sílica são comuns hoje
em dia. O método se baseia na ligação do ácido nucleicos à fase sólida de sílica seguida
de lavagens para limpeza de íons.
14
O processo é simples e rápido, ocorrendo em menos de quinze minutos
(dependendo da agilidade do operador e do número de amostras). Após a lise das
células, como explicado anteriormente, o material é adicionado a uma solução tampão
de ligação juntamente com etanol.
A mistura das células lisadas, etanol e solução de ligação será adicionada a um tubo
contendo uma fase sólida de sílica. O DNA é absorvido pela sílica quando está em
soluções com alta concentração de íons e pH ≤7. O sódio agirá como uma ponte que
atrai a carga negativa do fosfato do DNA, além de quebrar as ligações de hidrogênio na
água (Figura 4). O tubo será centrifugado e o material coletado será descartado.
A coluna de sílica conterá o DNA e será colocada em outro tubo (há a possibilidade
de se aproveitar o tubo anterior). Agora serão realizados dois processos de lavagem com
tampões específicos para retirar o excesso de sais (um inibidor de PCR). Ao final, convém
fazer centrifugar mais uma vez sem adição de tampão para terminar essa remoção. O
passo seguinte é adicionar a solução de eluição que aumentará o pH na sílica,
desprendendo o DNA para que seja coletado em um tubo próprio.
Figura 4: Coluna de sílica com representação da ponte de ligação dos íons de sódio entre a
sílica e o DNA. A sílica normalmente está ligada à água por pontes de hidrogênio, no entanto, em
altas concentrações iônicas, essa ligação é desestabilizada.
15
A Teoria da PCR
A técnica de PCR foi um dos grandes inventos da Biologia Molecular, transformando
os processos laboratoriais como poucas vezes ocorreu na história da ciência. É hoje uma
das mais utilizadas nas mais variadas áreas, desde a pesquisa a métodos de diagnóstico.
O fundamento da técnica é a amplificação específica e exponencial de regiões do
genoma ou de moléculas de RNA utilizando pares de iniciadores (primers) para delimitar
os pontos de interesse.
Os reagentes básicos de uma PCR são: DNA polimerase, dNTP (os quatro
nucleotídeos; adenina, citosina, timina, guanina), cloreto de magnésio (MgCl2),
iniciadores (oligonucleotídeos iniciadores ou primers), tampão, água e o DNA molde
obtido em processo de extração. Todos esses reagentes devem ser misturados em um
tubo para que a reação ocorra.
A DNA polimerase é a enzima responsável por catalisar a reação, adicionando
nucleotídeos à fita nascente de DNA. A mais conhecida e utilizada delas é a Taq
polimerase, derivada da bactéria Thermus aquaticus. Essa enzima é utilizada por ser
termoestável, isto é, resiste às altas temperaturas em que a PCR ocorre. Sem esta
estabilidade, seria necessário trocá-la a cada passo. É importante lembrar que a enzima
estabilidade da enzima ocorre por determinado tempo, ocorrendo desgaste durante o
processo.
Os dNTPs são os quatro nucleotídeos (adenina - dATP, citosina - dCTP, guanina -
dGTP e timina, dTTP) que serão utilizados no processo de formação da nova fita de
DNA. Deve haver cada um deles em solução e é importante que estejam sempre com os
fosfatos que serão utilizados como energia a ligação de um nucleotídeo a outro pela
DNA polimerase. O termo dNTP significa desoxinucleotídeo trifosfato. Dois desses três
fosfatos serão perdidos no processo de ligação de um nucleotídeo a outro realizado pela
DNA polimerase no momento de extensão da fita de DNA em formação.