analisis de secuencias obtenidas por pirosecuenciación

ANALISIS DE SECUENCIAS OBTENIDAS POR PIROSECUENCIACIÓN

Data analisys metogology

Roche 454 FLX/FLX+ platform

Novais & Thorstenson (2011)

Because the added nucleotide is known, the sequence of the template can be determined (Ronaghi, 2001)

1. Calidad y eliminación del ruido, de las secuencias

2. Análisis de diversidad

http://www.researchandtesting.com/sequencing-services.php

1. Generación de archivos SFF

2. Reducción del ruido y chequeo de quimeras

3. Chequeos de calidad y formato FASTA / Generación de archivos de "calidad“

4. Identificación taxonómica

5. Análisis de datos

.SFFArchivo binario:

1. Flujograma2. Puntuación de calidad3. Secuencias, con longitudes definidas

Representa los datos en bruto y muchos incluyen lecturas que pueden haber sido excluidas

(longitud o detección de quimeras)

Mothur o BioPython

DENOISING & CHIMERA CHECKING(Reducción del ruido & Chequeo de quimeras)

1. Ajuste de calidad (Limpiar los extremos)2. Clustering (Agrupar/eliminar reads)3. Chequeo de quimeras (Detectar/eliminar)4. Denoising (Corrección de errores)

QUALITY CHECKING & FASTA FORMATTED SEQUENCE/QUALITY FILE GENERATION(Generación de archivos de "calidad“)

Los reads tratados se agrupan en FASTA>IS7-nosZ::HX8YCVF03F7TDH rank=0276239 x=2432.5 y=995.0 length=304AAAACAACCGCTGTTCATCGACAGCCAGCACGACGAGCGAAACTTGCTGATGCAACACCGCCTGCATC

1. Secuencias error2. Secuencias con bajos valores de calidad3. Secuencias de < longitud a la esperada (o de 250 bp)

TAXONOMIC IDENTIFICATION (Determinación de la identidad)

1. Ordenamiento de secuencias de > a < longitud2. Agrupación en OTU´s con 100% de identidad (USEARCH)3. Cada OTU se archiva en formato FASTA4. Cada OTU se contrasta con secuencias de la NCBI, usando una

distribucion .NET que usa BLASTN+5. % de identidad = nivel taxonómico

% Nivel taxonómico

> 97 Especie

95 – 97 Genero

90 – 95 Familia

80 – 85 Clase

77 – 80 Phylum

< 77 % son descartadas

HSP ≥ 75 % DE LA SECUENCIA

CONSULTADA

• Laboratory Research & Testing. (2012). Data Analysis Methodology. Lubbock, TX, USA. Recuperado en Agosto del 2014, de: http://www.researchandtesting.com/docs/Data_Analysis_M etho dology.pdf

• Novais RC, & Thorstenson YR. (2011) The evolution of Pyrosequencing (R) for microbiology: From genes to genomes. J Microbiol Meth. 86: 1–7.

• Ronaghi, M., 2001. Pyrosequencing sheds light on DNA sequencing. Genome Res. 11, 3–11.

Bibliografía

analisis de secuencias obtenidas por pirosecuenciación

Science

secuencias de longitud

ordenamiento de secuencias

secuencias error

chequeos de calidad

ajuste de calidad

puntuacin de calidad

ruido chequeo de quimeras

bajos valores de calidad