similaridad de cadenas genéticas bienvenido martínez redondo sergio garcía esteban 2008/2009

Download Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009

Post on 28-Jan-2016

219 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • Similaridad de cadenas genticas Bienvenido Martnez RedondoSergio Garca Esteban2008/2009

  • Filogenia y similaridad de cadenasEstructura del ADNUna molcula de ADN esta formada por dos cadenas, llamadas nucletidos.Cada nucletido esta formado por una molcula de azcar, un grupo fosfato y un compuesto nitrogenado llamado base.Esta base puede ser adenina(A), citosina(C), guanina(G) o timina(T)Las cadenas de genes vendrn representadas por una serie de letras A-C-G-T.

  • Filogenia y similaridad de cadenasMutacionesUn cambio en alguno de los nucletidos de una molcula de ADN provoca una mutacin.Las mutaciones son la nica fuerza evolutiva capaz de crear variabilidad.Existen dos tipos de mutaciones:Las producidas por la insercin o delecin de un nucletido.Las producidas por la sustitucin de un nucletido por otro.

  • Filogenia y similaridad de cadenasFilogeniaEl objetivo de la filogenia es convertir la informacin de las secuencias de nucletidos en un rbol evolutivo de las mismas.El proceso consta de dos pasos:Primero, alineamiento de secuencias.Segundo, construccin del rbol.

  • Filogenia y similaridad de cadenasAlineamiento de secuenciasEl alineamiento de secuencias consiste en comparar dos secuencias homlogas para determinar la divergencia desde un ancestro comn.Cuando dos secuencias queden alineadas, se producirn tres tipos de emparejamientos:Matches: coincidencias en el mismo lugar del mismo nucletido.Mismatches: no coincidencias en el mismo lugar del mismo nucletido.Gaps: son emparejados entre nada y el nucletido. Se producen por el proceso de alineamiento.

  • Filogenia y similaridad de cadenasAlineamiento de secuenciasExisten dos tipos de alineamiento:Local: Buscan regiones entre dos protenas que son parecidas, aunque se hallen rodeadas de zonas completamente diferentes. tiles para protenas modulares.Global: Se extiende a lo largo de toda la longitud de las secuencias. tiles cuando las secuencias son parecidas a lo largo de toda su longitud.

  • Algoritmos para el alineamiento globalMatriz de Puntos (Gibss & McIntyre)Consiste en colocar una de las cadenas en la primera fila y la otra en la primera columna, marcando los puntos en los que coincidan.Despus se trata de trazar rectas que unan de la mejor forma posible, la esquina superior izquierda con la esquina inferior derecha, de forma que pasemos por el mayor nmero de puntos.

  • Filogenia y similaridad de cadenasAlgoritmo de Needleman-WunschFue desarrollado en 1970 por Saul Needleman y Chistian Wunsch.Esta basado en programacin dinmica y siempre encuentra la solucin ptima.El proceso que sigue es el siguiente:Cadenas a alinear son A y B, con |A|=m,|B|=n.Definimos la matriz S, donde cada elemento S(i,j) indica la similitud entre los simbolos el alfabeto.Definimos tambin una variable d que indica la penalizacin por hueco.

  • Filogenia y similaridad de cadenasAlgoritmo de Needleman-WunschCreamos una matriz interna llamada F, que almacenara los resultados parciales de cada alineamiento.En cada iteracin, el valor (i,j) de F, indica el alineamiento ptimo entre A[0,i] y B[0,i]. Por tanto el elemento (n,m) de F contendr el alineamiento ptimo.Una vez calculada F, solo queda obtener la secuencia de alineamiento consistente en llegar desde la posicin (n,m) hasta la (1,1)

  • Filogenia y similaridad de cadenasAlgoritmo de Needleman-WunschExplicacin de la matriz S:Para estas secuencias:AGCCTATC ACC_T_TC Con d= -5

    Con S=

    Tendramos:Score = S(A,A) + S(G,C) + S(C,C) + d + S(T,T) + d + S(T,T) + S(C,C) = 29

    AGCTA10-1-3-4G-17-5-3C-3-590T-4-308

  • Filogenia y similaridad de cadenasAlgoritmo de Needleman-WunschInicio del algoritmo: F0j = d * j Fi0 = d * i Recursin para obtener el siguiente elemento de forma ptima: Fij = max(Fi 1,j 1 + S(Ai,Bj),Fi,j 1 + d,Fi 1,j + d)

    Calculamos la matriz F:for i=0 to length(A)-1 F(i,0)

  • Filogenia y similaridad de cadenasAlgoritmo de Needleman-Wunsch AlignmentA
  • Herramienta PropiaHemos desarrollado una herramienta, que implementa el algoritmo de Needleman-Wunsch.La hemos implementado en java y desarrollado con el NetBeans.Esta herramienta nos ofrece la posibilidad de cargar las cadenas mediante ficheros, modificar la matriz S y nos muestra tanto el alineamiento de las cadenas como las puntuaciones de similaridad.En la direccin http://xylian.igh.cnrs.fr/ se puede encontrar una herramienta llamada ALIGN muy parecida.

  • Herramienta Propia

  • Herramienta Propia

  • ConclusionesAmplitud del campo de la BioInformticaConseguir abstraer los problemas puramente tcnicosNuestro tema se planteaba muy bien desde un punto de vista informticoNecesidad de comunicacin entre ambos sectores