rethinking microbial diversity analysis in the high throughput sequencing era
DESCRIPTION
TRANSCRIPT
1
Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas
Trabalho de Conclusão V
RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA
Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador
São Gabriel-RS2011
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
~ 5%
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1. Introdução Geral
1) dificuldade em simular inúmeras condições ambientais em meios de cultura.
1.1. - Estimativa da diversidade microbiana
a) Anomalia de Placas
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.1. - Estimativa da diversidade microbiana
1. Introdução Geral
b) Técnicas independentes de cultivo de micro-organismos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.3. Sequenciadores de nova geração
1. Introdução Geral
…ACGTGACTGAGGCTAG
CTAGACTACTTTATATATATACGTCGT
CACTGATGACTAGATTAACTGATTTAGATACCTTGATTTTAAAAAAATA
…
Primeira Geração
Segunda Geração
Terceira Geração
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
16S primer
ABacterial DNA
16S primer BBarcode
primer B Barcodes 16S rRNA primer
Sample ABarcode 1
Sample BBarcode 2
Sample CBarcode 3
Sample DBarcode 4
Sample A Sample B Sample C Sample D
Mo
difie
d fro
m H
offm
an
n e
t al. (2
00
7) N
ucl. A
cid. R
es.
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
1.3. Crescimento do número de sequências no RPD II e SILVA
1. Introdução Geral
-> Maior crescimento a partir de 2007 (Roesch et al., 2007).
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
http://biology.uoregon.edu/people/BOHANNAN/pics/Microbes.jpg
Grande diversidade
a) O solo apresenta a maior
diversidade microbiana do
ambiente terrestre. O número de
sequências é de fundamental
importância para obtenção
de resultados confiáveis.
- Se o número de sequências não é representativo em um ambiente, os resultados obtidos podem não ser válidos e confiáveis;
- O número de sequências necessários em cada tipo de abordagem pode variar de acordo com o teste aplicado e a diversidade de cada ambiente.
Hipótese:
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
- Demonstrar que o nível de esforço amostral obtido em análises de comparação de comunidades microbianas pode produzir resultados distintos;
- Determinar quais os tipos de análises e inferências mais eficientes quando temos disponível um número pequeno ou grande de sequências obtidos por plataformas de sequenciadores de nova geração.
Objetivos:
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2. Material e Métodos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
5
2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.1. Processamento de sequências, simulação de comunidades
microbianas e análises de Bioinformática
Eliminação de sequênciasde baixa qualidade
trim.pl
Simulação de comunidadesmicrobianas hipotéticas
r_s_q.pl
500 500 500 500100 500 1000 5000
10000 20000
2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.2. Análises de Bioinformática
2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.3. Abordagens baseadas em táxons (taxon-based approaches)
Alinhamento de sequências(Algoritmo de Needleman-Wunsch)
GreengenesMothur
Agrupamento de sequênciaspara formação de UnidadesTaxonômicas Operacionais3 e 20% de dissimilaridade
Mothur
campo1 campo2 campo3
UTO1 4 8 19
UTO2 2 2 1
UTO3 0 1 34
2. Material & Metódos
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
2.2. Abordagens baseadas em testes de hipóteses ( hypothesis testing approaches)
Agrupamento de sequências
CD-HIT
Construção de uma árvorefilogenética
MUSCLE
Comparação de comunidadesmicrobianas
UNIFRAC
Comparação entre comunidades microbianas
ACP - Qualitativo ACP - Quantitativo
Análise de Coordenadas Principais (ACP)
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
Análise de Cobertura = representatividade
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
Florida - 5%; Antártica - 15%; Mauna Ulu - 9.3%; Pu'u Puai bare - 12.4%;– Era esperado um número maior de sequências compartilhadas;– Mesmo conjunto de dados.
a) indivíduos únicos ou compartilhados;
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
Florida - 48%; Mauna Ulu - 59%; Pu'u Puai bare - 47%;
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
– ---> Amostras com uma baixa cobertura não apresentam resultados confiáveis ao ser aplicado Diagramas de Venn;
– ---> É necessário uma alta cobertura (> 90%);
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
---> Aumento da diversidade com o aumento do número desequências em uma amostra;
a) Índices de diversidade = comparação e caracterização decomunidades microbianas
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
---> Sem mudanças significativas.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
---> Sem mudanças significativas.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
---> Sem mudanças significativas.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
b) Estimador de riqueza = Chao1
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)
– ---> Chao1 não apresenta resultados confiáveis quando aplicado numa base de dados com um pequeno número de sequências.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– a) amostras aleatórias com a mesma intensidade amostral (4
– amostras de 500 sequências para cada ambiente);
– b) amostras aleatórias com o aumento da intensidade amostras (100, 500, 1.000, 5.000, 10.000 e 20.000)
– c) amostras aleatórias com o aumento da intensidade amostral (100, 500 e 20.000) para comparação de três ambientes.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> (A) - 10.000 sequências são necessárias para formação de agrupamento;
– ---> (B) - Formação de agrupamentos a partir de 500 sequências.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> (A) e (B): sem formação de agrupamentos.
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– ---> Limitação: as amostras poderiam ser muito similares, devido a uma mesma origem de base de dados;
–
– ---> Qual o nível de cobertura para comparar comunidades microbianas de ambientes distintos?
3. Resultados
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
3.2. Abordagens filogenéticas (Quando devem ser usadas?)
– (A) e (B) baixa cobertura = ambientes distintos (escala continental)
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Cobertura;
b) Ambiente a ser analisado.
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Cobertura;
Com base nos resultados de cobertura (51 - 81%) era esperado que o número de Unidades Taxonômicas Operacionais entre as amostras fosse relativamente alto.
É necessário ter uma cobertura (> 90%) para a aplicação dos Diagramas de Venn
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Cobertura;
– Um grande porcentagem de espécies estão presentes em um número pequeno.
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Normalização do número de sequências;
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Normalização do número de sequências;
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Chao1 = apenas com intensidade amostral alta
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Chao1 = apenas com intensidade amostral alta
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
a) Baixa cobertura e abordagens filogenéticas
4. Discussão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?
b) Ambientes similares
I) ACP - quantitativo = 500 sequências
II) ACP = qualitativo = 10.000 sequências
5. Conclusão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
- Abordagens baseadas na informação filogenética são de extrema importância para a comparação de comunidades microbianas do solo com alta ou baixa cobertura;
- Abordagens baseadas em Unidades Taxonômicas Operacionais são úteis para detectar mudanças em UTOs específicas, mas é necessário uma alta cobertura.
5. Conclusão
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
46
Agradecimentos:
- Ao CNPq, pela bolsa de Iniciação Científica;
47
Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas
Trabalho de Conclusão V
RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA
Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador
São Gabriel-RS2011
L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51