rethinking microbial diversity analysis in the high throughput sequencing era

47
1 Universidade Federal do Pampa Curso de Bacharelado em Ciências Biológicas Trabalho de Conclusão V RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador São Gabriel-RS 2011 L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Upload: leandro-lemos

Post on 11-Jan-2015

1.110 views

Category:

Education


1 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Rethinking microbial diversity analysis in the high throughput sequencing era

1

Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas

Trabalho de Conclusão V

RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA

Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador

São Gabriel-RS2011

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 2: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 3: Rethinking microbial diversity analysis in the high throughput sequencing era

~ 5%

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1. Introdução Geral

1) dificuldade em simular inúmeras condições ambientais em meios de cultura.

1.1. - Estimativa da diversidade microbiana

a) Anomalia de Placas

Page 4: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.1. - Estimativa da diversidade microbiana

1. Introdução Geral

b) Técnicas independentes de cultivo de micro-organismos

Page 5: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.3. Sequenciadores de nova geração

1. Introdução Geral

…ACGTGACTGAGGCTAG

CTAGACTACTTTATATATATACGTCGT

CACTGATGACTAGATTAACTGATTTAGATACCTTGATTTTAAAAAAATA

Primeira Geração

Segunda Geração

Terceira Geração

Page 6: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

16S primer

ABacterial DNA

16S primer BBarcode

primer B Barcodes 16S rRNA primer

Sample ABarcode 1

Sample BBarcode 2

Sample CBarcode 3

Sample DBarcode 4

Sample A Sample B Sample C Sample D

Mo

difie

d fro

m H

offm

an

n e

t al. (2

00

7) N

ucl. A

cid. R

es.

Page 7: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.3. Crescimento do número de sequências no RPD II e SILVA

1. Introdução Geral

-> Maior crescimento a partir de 2007 (Roesch et al., 2007).

Page 8: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

http://biology.uoregon.edu/people/BOHANNAN/pics/Microbes.jpg

Grande diversidade

a) O solo apresenta a maior

diversidade microbiana do

ambiente terrestre. O número de

sequências é de fundamental

importância para obtenção

de resultados confiáveis.

Page 9: Rethinking microbial diversity analysis in the high throughput sequencing era

- Se o número de sequências não é representativo em um ambiente, os resultados obtidos podem não ser válidos e confiáveis;

- O número de sequências necessários em cada tipo de abordagem pode variar de acordo com o teste aplicado e a diversidade de cada ambiente.

Hipótese:

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 10: Rethinking microbial diversity analysis in the high throughput sequencing era

- Demonstrar que o nível de esforço amostral obtido em análises de comparação de comunidades microbianas pode produzir resultados distintos;

- Determinar quais os tipos de análises e inferências mais eficientes quando temos disponível um número pequeno ou grande de sequências obtidos por plataformas de sequenciadores de nova geração.

Objetivos:

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 11: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material e Métodos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

5

Page 12: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.1. Processamento de sequências, simulação de comunidades

microbianas e análises de Bioinformática

Eliminação de sequênciasde baixa qualidade

trim.pl

Simulação de comunidadesmicrobianas hipotéticas

r_s_q.pl

500 500 500 500100 500 1000 5000

10000 20000

Page 13: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.2. Análises de Bioinformática

Page 14: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.3. Abordagens baseadas em táxons (taxon-based approaches)

Alinhamento de sequências(Algoritmo de Needleman-Wunsch)

GreengenesMothur

Agrupamento de sequênciaspara formação de UnidadesTaxonômicas Operacionais3 e 20% de dissimilaridade

Mothur

campo1 campo2 campo3

UTO1 4 8 19

UTO2 2 2 1

UTO3 0 1 34

Page 15: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.2. Abordagens baseadas em testes de hipóteses ( hypothesis testing approaches)

Agrupamento de sequências

CD-HIT

Construção de uma árvorefilogenética

MUSCLE

Comparação de comunidadesmicrobianas

UNIFRAC

Page 16: Rethinking microbial diversity analysis in the high throughput sequencing era

Comparação entre comunidades microbianas

ACP - Qualitativo ACP - Quantitativo

Análise de Coordenadas Principais (ACP)

Page 17: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Análise de Cobertura = representatividade

Page 18: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Page 19: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Florida - 5%; Antártica - 15%; Mauna Ulu - 9.3%; Pu'u Puai bare - 12.4%;– Era esperado um número maior de sequências compartilhadas;– Mesmo conjunto de dados.

a) indivíduos únicos ou compartilhados;

Page 20: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Florida - 48%; Mauna Ulu - 59%; Pu'u Puai bare - 47%;

Page 21: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

– ---> Amostras com uma baixa cobertura não apresentam resultados confiáveis ao ser aplicado Diagramas de Venn;

– ---> É necessário uma alta cobertura (> 90%);

Page 22: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Aumento da diversidade com o aumento do número desequências em uma amostra;

a) Índices de diversidade = comparação e caracterização decomunidades microbianas

Page 23: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Page 24: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 25: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 26: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 27: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

b) Estimador de riqueza = Chao1

Page 28: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

– ---> Chao1 não apresenta resultados confiáveis quando aplicado numa base de dados com um pequeno número de sequências.

Page 29: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– a) amostras aleatórias com a mesma intensidade amostral (4

– amostras de 500 sequências para cada ambiente);

– b) amostras aleatórias com o aumento da intensidade amostras (100, 500, 1.000, 5.000, 10.000 e 20.000)

– c) amostras aleatórias com o aumento da intensidade amostral (100, 500 e 20.000) para comparação de três ambientes.

Page 30: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

Page 31: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> (A) - 10.000 sequências são necessárias para formação de agrupamento;

– ---> (B) - Formação de agrupamentos a partir de 500 sequências.

Page 32: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> (A) e (B): sem formação de agrupamentos.

Page 33: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> Limitação: as amostras poderiam ser muito similares, devido a uma mesma origem de base de dados;

– ---> Qual o nível de cobertura para comparar comunidades microbianas de ambientes distintos?

Page 34: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– (A) e (B) baixa cobertura = ambientes distintos (escala continental)

Page 35: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

b) Ambiente a ser analisado.

Page 36: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

Com base nos resultados de cobertura (51 - 81%) era esperado que o número de Unidades Taxonômicas Operacionais entre as amostras fosse relativamente alto.

É necessário ter uma cobertura (> 90%) para a aplicação dos Diagramas de Venn

Page 37: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

– Um grande porcentagem de espécies estão presentes em um número pequeno.

Page 38: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Normalização do número de sequências;

Page 39: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Normalização do número de sequências;

Page 40: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Chao1 = apenas com intensidade amostral alta

Page 41: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Chao1 = apenas com intensidade amostral alta

Page 42: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Baixa cobertura e abordagens filogenéticas

Page 43: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

b) Ambientes similares

I) ACP - quantitativo = 500 sequências

II) ACP = qualitativo = 10.000 sequências

Page 44: Rethinking microbial diversity analysis in the high throughput sequencing era

5. Conclusão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

- Abordagens baseadas na informação filogenética são de extrema importância para a comparação de comunidades microbianas do solo com alta ou baixa cobertura;

- Abordagens baseadas em Unidades Taxonômicas Operacionais são úteis para detectar mudanças em UTOs específicas, mas é necessário uma alta cobertura.

Page 45: Rethinking microbial diversity analysis in the high throughput sequencing era

5. Conclusão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 46: Rethinking microbial diversity analysis in the high throughput sequencing era

46

Agradecimentos:

- Ao CNPq, pela bolsa de Iniciação Científica;

Page 47: Rethinking microbial diversity analysis in the high throughput sequencing era

47

Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas

Trabalho de Conclusão V

RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA

Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador

São Gabriel-RS2011

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51