embl-ebi pablo porras millán, scientific curator [email protected] capturando el interactoma:...
TRANSCRIPT
EMBL-EBI
Pablo Porras Millán, scientific curator
Capturando el interactoma: creación y análisis de bases de datos de interacciones moleculares
EMBL-EBIEMBL-EBI
Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398
¿Por qué estudiar el interactoma?
EMBL-EBIEMBL-EBI
EMBL-EBIEMBL-EBI
Serendipitiously Recovered Component
Most Important Component
Really Important ComponentUndoubtedly Most
Important Component
EMBL-EBIEMBL-EBI
Un modelo que se ajusta a la realidad
El modelo del biólogo
EMBL-EBIEMBL-EBI
European Institute of Bioinformatics
EMBL-EBIEMBL-EBI
GenomasGenomas
Secuencias de nucleótidosSecuencias de nucleótidos
Expresión génicaExpresión génica
ProteomasProteomas
Familias, motivos y dominios proteicos
Familias, motivos y dominios proteicos
Estructura de proteínasEstructura de proteínas
Interacciones proteína-proteína
Interacciones proteína-proteína
Sustancias químicasSustancias químicas
Rutas biológicasRutas biológicas
SistemasSistemas
BibliografíaBibliografía
Secuencias de proteínasSecuencias de proteínas
Tipos de datos registrados en el EBI
EMBL-EBIEMBL-EBI
Un par de definiciones…
Interacciones proteína-proteína (IPPs): contactos físicos y selectivos que ocurren entre pares de proteínas en determinadas regiones moleculares y en un contexto biológico definido. Interactoma: Conjunto de interacciones proteína-proteína que tienen lugar en la célula / en un organismo / en un contexto biológico determinado…
Red de interacciones proteína-proteína: Representación gráfica de un conjunto de IPPs en la que las proteínas se representan en forma de nodos y las interacciones en forma de aristas.
EMBL-EBIEMBL-EBI
¿Por qué estudiar interacciones proteína-proteína (IPPs)?
1. Para predecir la función biológica de la proteína• “culpable por asociación”• Proteínas con funciones similares deberían agruparse
2. Para mejorar la caracterización de complejos proteicos y vías biológicas• Las redes de interacción funcionan como un mapa-borrador
en el que ensamblar los elementos que forman las vías biológicas
Nivel gen
ADN ARN
Nivel proteína
1 proteína =
1 función
1 proteína =
n funciones=
n redes
¡MAL!
EMBL-EBIEMBL-EBI
Culpable por asociación
Histona metiltransferasaPapel en desarrollo temprano y hematopoyesis
Proto-oncogénFactor de transcripción
Kinasa ciclina-dependienteRegulación de la transcripción
Mediador de la actividad de la ARN-polimerasaRegulación de la transcripción
Modulador transcripcionalRegulación de la transcripcióndependiente de kinasas
Modulador transcripcional activado por receptorModulación de la transcripción, transducción de señales, activado por kinasasPapel en la inhibición de la curación de heridas
Posible oncoproteínaActivación de la transcripción
Posible oncoproteínaImplicado en la regulación de la transcripción
CiclinaRegulación de ciclina-kinasa, regulación transcripción y ciclo celular
Algo que ver con transcripción y control del ciclo celular
EMBL-EBI11
• Interacciones binarias – Dos participantes
• Colocalización – Proximidad de dos o más
participantes
• Ints. n-arias (asociaciones) – Purificación de
complejos
• Ints. funcionales / directas – Ej. Ints. enzimáticas
Tipos de interacciones proteína-proteína
EMBL-EBI12
Interacciones binarias
EMBL-EBI13
Colocalización
EMBL-EBI14
Interacciones n-arias (asociaciones)
Schleiff et al., Nat Rev Mol Cell Biol. 2011. PMID: 211396380
EMBL-EBIEMBL-EBI
Interacciones funcionales / directas
• Generalmente ensayos in vitro• Los participantes suelen conocerse por
adelantado (predeterminados)• Ejs.- ensayos enzimáticos, SPR, cristalografía,
métodos que usan proteínas purificadas…
Imágenes tomadas de Wikipedia: http://en.wikipedia.org/wiki/X-ray_crystallographyhttp://en.wikipedia.org/wiki/Surface_plasmon_resonancehttp://en.wikipedia.org/wiki/Protein_adsorption_in_the_food_industry
EMBL-EBI
Doble híbrido (Y2H)
Alto
ren
dim
ient
o
Difracción de rayos X
Baj
o re
ndim
ient
oPurificación por afinidad en tándem
+ espectrometría de masas (TAP-MS)
Métodos de detección de PPIs
Ningún método puede reproducir una verdadera interacción binaria observada en
condiciones fisiológicas – todas las interacciones detectadas
experimentalmente son esencialmente artefactos
EMBL-EBIEMBL-EBI
Dominios de interacción
Solapamiento de rangos en la secuencia:
Representando IPPs: dominios de interacción
EMBL-EBIEMBL-EBI
• Algunos metodos experimentales generan datos de tipo complejo: Ej. Purificación por afinidad en tándem (TAP)
• Cuando se debe convertir esta información en datos binarios, hay 2 algoritmos disponibles:
Representando IPPs: El problema de los complejos
EMBL-EBIEMBL-EBIDe Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078.
Bases de datos de interacciones: tipos
EMBL-EBIEMBL-EBI
Bases de datos primarias: niveles de curación
CURACIÓN A FONDO
CURACIÓN SUPERFICIAL
Curación superficial
BioGRID – curación activa, número limitado de organismos modelo
HPRD – curación activa, centrada en humanos, predicción de interacciones
MPIDB – curación activa, interacciones en microbios
InnateDB – curación activa – interacciones relacionadas con inmunidad innata
Curación a fondo
IntAct – curación activa, amplia cobertura de especies, todo tipo de moléculas
MINT – curación activa, amplia cobertura de especies, sólo IPPs
DIP – curación activa, amplia cobertura de especies, sólo IPPs
MPACT – actualmente sin curación, cobertura de especies limitada, sólo IPPs
MatrixDB – curación activa, sólo moléculas de la matriz extracelular
BIND – detuvo la curacción en 2006/7, amplia cobertura de especias, todo tipo de moléculas – la información está quedando desfasada
I2D – curación activa – IPPs implicadas en cáncer
EMBL-EBIEMBL-EBI
Bases de datos primarias: cobertura
De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078.
Cobertura de IPPs humanas en las principales bases de datos públicas
EMBL-EBIEMBL-EBI
Un estándar para la representación de interacciones: el consorcio iMEX
www.imexconsortium.org
Orchard et al., Nature Methods, PMID: 22453911.
EMBL-EBIEMBL-EBI
Cliente de consulta unificada: PSICQUIC
www.ebi.ac.uk/Tools/webservices/psicquic/view/main.xhtml
PSICQUIC
ConsultaMIQL
Entrada
InteraccionesPSI-MI
Salida
PSICQUICRegistro
PSICQUICServicio A
PSICQUICServicio B
PSICQUICServicio C
EMBL-EBI
Entrada
Publicación
Experimento 1
Interacción 1
Participante 1
Características
Participante 2
Características
Interacción 2
Experimento 2
Interacción 3 Interacción 4
…… …
[A] Nivel publicación (entrada)
[B] Nivel experimento
[C] Nivel interacción
[D] Nivel participante
[E] Nivel característica
IntAct: Esquema de almacenamiento de datos
EMBL-EBIEMBL-EBI
IntAct: Uso de la ontología PSI-MI
EMBL-EBIEMBL-EBI
CURACIÓN
PROPUESTAS DIRECTAS
DATOS DE INTERACCIONES MOLECULARES PUBLICADOS
PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA
IntAct: El trabajo del “curator”(curador)
EMBL-EBI
REFERENCIAS CRUZADAS
FAMILIAS Y DOMINIOS
InterPro
MOLÉCULAS PEQUEÑAS
ChEBI
FUNCIÓN
Gene Ontology
SECUENCIAS GENOMA
Ensembl
UniProtKB
SECUENCIASPROTEÍNA
PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA
DATOS DE INTERACCIONES MOLECULARES PUBLICADOS
CURACIÓN
PROPUESTAS DIRECTAS
Otros
ESTRUCTURA,ORGANISMO,
TEJIDO, ETC…
EMBL-EBIDetalles de la interacción
Enlace a UniProtKB o a Dasty
Resultados de la búsqueda
EMBL-EBIEMBL-EBI
IntAct: Representando interacciones
EMBL-EBI
IntAct: el visualizador Dasty
EMBL-EBIEMBL-EBI
IntAct: Visualizando interacciones con networkView
EMBL-EBIEMBL-EBI
www.ebi.ac.uk/training/online/course/intact-molecular-interactions-ebi
Más información sobre IntAct: cursos “on-line” en el EBI
EMBL-EBIEMBL-EBIBlisson et al., 2011, Nature Biotechnology, PMID: 21706016.
Desafíos en representación e integración de datos en las redes de IPPs
EMBL-EBIEMBL-EBI
Mas información sobre el análisis del interactoma
• Nuestro grupo ha escrito un tutorial dentro de un programa de la Human Protein Organization (HUPO) tratando la importancia del análisis de las redes de interacciones moleculares y que presenta un ejemplo de análisis guiado para el lector: Koh, Porras, Aranda, Hermjakob, & Orchard, 2012, Journal of Proteome Research, PMID: 22385417.
• Una buena revisión general acerca de conceptos básicos en el estudio del interactoma: De Las Rivas & Fontanillo, 2010, PLoS Computational Biology, PMID: 20589078.
• Otra revisión general, centrada en el estudio del interactoma en relación a enfermedades humanas: Vidal, Cusick, & Barabási, 2011, Cell, PMID: 21414488.
• Una revisión reciente sobre biología de redes diferencial, el estudio de las diferencias entre situaciones biológicas distintas en contraste con el interactoma estático: Ideker & Krogan, 2012, Molecular Systems Biology, PMID: 22252388.
• Asignar puntuaciones en función de la confianza a interacciones moleculares requiere usar estrategias paralelas y complementarias. En este artículo de evalúa la fiabilidad de distintos métodos de detección experimental con respecto a un set de interacciones de referencia: Braun et al., 2008, Nature Methods, PMID: 19060903.
• Para terminar, un buen ejemplo de análisis usando datos que proceden de bases de datos primarias. Los autores construyen una red de alta calidad usando datos de interacciones binarias en las que hay información acerca de las superficies de interacción a resolución atómica, integran información relativa a mutaciones causantes de enfermedad y encuentran que existe una correlación entre la posición de dichas mutaciones en las superficies de interacción y su predisposición a causar enfermedad: X. Wang et al., 2012, Nature Biotechnology, PMID: 22252508.
EMBL-EBI
Agradecimientos
Henning Hermjakob
Jefe de grupo
Rafael Jiménez
Marine Dumousseau
Noemídel Toro
John Gómez
Equipo de desarrolladores
Sandra Orchard
Margaret Duesbury
Jyoti Khadake
Equipo de curaciónCoordinadora