analisis de secuencias obtenidas por pirosecuenciación

9
ANALISIS DE SECUENCIAS OBTENIDAS POR PIROSECUENCIACIÓN Data analisys metogology

Upload: mepacheco89

Post on 10-Aug-2015

40 views

Category:

Science


4 download

TRANSCRIPT

Page 1: Analisis de secuencias obtenidas por pirosecuenciación

ANALISIS DE SECUENCIAS OBTENIDAS POR PIROSECUENCIACIÓN

Data analisys metogology

Page 2: Analisis de secuencias obtenidas por pirosecuenciación

Roche 454 FLX/FLX+ platform

Novais & Thorstenson (2011)

Because the added nucleotide is known, the sequence of the template can be determined (Ronaghi, 2001)

Page 3: Analisis de secuencias obtenidas por pirosecuenciación

1. Calidad y eliminación del ruido, de las secuencias

2. Análisis de diversidad

http://www.researchandtesting.com/sequencing-services.php

Page 4: Analisis de secuencias obtenidas por pirosecuenciación

1. Generación de archivos SFF

2. Reducción del ruido y chequeo de quimeras

3. Chequeos de calidad y formato FASTA / Generación de archivos de "calidad“

4. Identificación taxonómica

5. Análisis de datos

Page 5: Analisis de secuencias obtenidas por pirosecuenciación

.SFFArchivo binario:

1. Flujograma2. Puntuación de calidad3. Secuencias, con longitudes definidas

Representa los datos en bruto y muchos incluyen lecturas que pueden haber sido excluidas

(longitud o detección de quimeras)

Mothur o BioPython

Page 6: Analisis de secuencias obtenidas por pirosecuenciación

DENOISING & CHIMERA CHECKING(Reducción del ruido & Chequeo de quimeras)

1. Ajuste de calidad (Limpiar los extremos)2. Clustering (Agrupar/eliminar reads)3. Chequeo de quimeras (Detectar/eliminar)4. Denoising (Corrección de errores)

Page 7: Analisis de secuencias obtenidas por pirosecuenciación

QUALITY CHECKING & FASTA FORMATTED SEQUENCE/QUALITY FILE GENERATION(Generación de archivos de "calidad“)

Los reads tratados se agrupan en FASTA>IS7-nosZ::HX8YCVF03F7TDH rank=0276239 x=2432.5 y=995.0 length=304AAAACAACCGCTGTTCATCGACAGCCAGCACGACGAGCGAAACTTGCTGATGCAACACCGCCTGCATC

1. Secuencias error2. Secuencias con bajos valores de calidad3. Secuencias de < longitud a la esperada (o de 250 bp)

Page 8: Analisis de secuencias obtenidas por pirosecuenciación

TAXONOMIC IDENTIFICATION (Determinación de la identidad)

1. Ordenamiento de secuencias de > a < longitud2. Agrupación en OTU´s con 100% de identidad (USEARCH)3. Cada OTU se archiva en formato FASTA4. Cada OTU se contrasta con secuencias de la NCBI, usando una

distribucion .NET que usa BLASTN+5. % de identidad = nivel taxonómico

% Nivel taxonómico

> 97 Especie

95 – 97 Genero

90 – 95 Familia

80 – 85 Clase

77 – 80 Phylum

< 77 % son descartadas

HSP ≥ 75 % DE LA SECUENCIA

CONSULTADA

Page 9: Analisis de secuencias obtenidas por pirosecuenciación

• Laboratory Research & Testing. (2012). Data Analysis Methodology. Lubbock, TX, USA. Recuperado en Agosto del 2014, de: http://www.researchandtesting.com/docs/Data_Analysis_M etho dology.pdf

• Novais RC, & Thorstenson YR. (2011) The evolution of Pyrosequencing (R) for microbiology: From genes to genomes. J Microbiol Meth. 86: 1–7.

• Ronaghi, M., 2001. Pyrosequencing sheds light on DNA sequencing. Genome Res. 11, 3–11.

Bibliografía