desarrollo de una estrategia de anÁlisis de datos de

1
DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE SECUENCIACIÓN DE GENOMA COMPLETO PARA LA PRIORIZACIÓN DE VARIANTES EN NUEVOS GENES DE DISTROFIAS HEREDITARIAS DE RETINA 1 UGC Medicina Maternofetal, Genética y Reproducción, Instituto de Biomedicina de Sevilla, H. U. Virgen del Rocío/Universidad de Sevilla/CSIC, Sevilla, España. 2 Centro de Investigación Biomédica en Red de Enfermedades Raras (CIBERER), Sevilla, España. 3 UGC Oftalmología, H.U. Virgen Macarena, Sevilla, España. 4 Retics Oftared, Instituto de Salud Carlos III, Madrid, España. Elena Fernández-Suárez 1, 2 , María González-del Pozo 1,2 , Nereida Bravo-Gil 1,2 , Cristina Méndez-Vidal 1,2 , Marta Martín-Sánchez 1 , Enrique Rodríguez-de la Rúa 3,4 , Mª José Morillo-Sánchez 4 , Salud Borrego 1,2 and Guillermo Antiñolo 1,2 PACIENTES Y MÉTODOS RESULTADOS 1. Toulis V y cols., Genes (Basel) 2020 2. Arno G y cols., Am J Hum Genet 2016 3. van El CG y cols., Eur J Hum Genet 2013 4. Niroula A y cols., PLoS Comput Biol. 2019 REFERENCIAS AGRADECIMIENTOS Para más información:[email protected] Los autores agradecen a las familias que han participado en el estudio. Este trabajo ha sido apoyado por el Instituto de Salud Carlos III (ISCIII), el Ministerio de Economía y Competitividad de España y cofinanciado por la Unión Europea (FEDER, “Una manera de hacer Europa) [PI18-00612], Consejería de Salud y Familias de la Junta de Andalucía [PEER-0501-2019] y la Fundación Isabel Gemio/Fundación Cajasol [FGEMIO-2019-01]. El CIBERER es una iniciativa del ISCIII y del Ministerio de Economía y Competitividad. EFS tiene una ayuda del ISCIII [FI19/00091) (FSE, “Invirtiendo en tu futuro”). NBG tiene una ayuda de la Consejería de Salud y Familias de la Junta de Andalucía [RH-0118- 2020]. MMS tiene una ayuda asociada al proyecto CTS-1664 financiado por la Consejería de Economía, Conocimiento y Emprendimiento de la Junta de Andalucía. Definir un flujo de trabajo para el análisis de datos de WGS basado en el uso de predictores que permita la identificación de nuevos genes/variantes asociadas con las DHR. INTRODUCCIÓN OBJETIVO Las distrofias hereditarias de retina (DHR) constituyen un grupo de enfermedades raras que afectan a los fotorreceptores de la retina provocando la pérdida total o parcial de visión. Se caracterizan por su gran heterogeneidad clínica y genética 1 . * La traslación de WGS a la práctica clínica es difícil debido a la ausencia de protocolos de análisis estandarizados 3 . Las herramientas de predicción ayudan a la priorización de las variantes en los estudios de WGS 4 . * La correcta aplicación de los predictores se debe basar en el uso de cutoffs confiables para el grupo de variantes en estudio. * Hay una gran falta de consenso entre qué predictor(es) usar y el cutoff a aplicar. * FASES DEL ESTUDIO 1 Curación de los datos de NGS de la cohorte de entrenamiento: Las variantes exónicas y de splicing (primer codón del exón y ±10 pb del intrón) en genes ya asociados a las DHR fueron clasificadas según el criterio ACMG y su significancia clínica. 2 Estudio estadístico de 14 predictores: Comparación y redefinición de los cutoffs de 14 herramientas de predicción mediante el análisis de curvas ROC. Estudio combinatorial en el que se analizaron 93 modelos. Modelos óptimos: Verdaderos positivos ≥ 85%; Falsos positivos ≤ 35%; Valores perdidos ≤ 30%. 3 Validación del flujo de trabajo desarrollado: Evaluación de su eficacia y traslación a otras enfermedades genéticas hereditarias. 4 Aplicación en la cohorte de descubrimiento: Análisis de los datos de WGS de la cohorte de descubrimiento para la identificación de nuevas variantes/genes asociados a las DHR. Alamut Bacth® Bystro CADD Non-splicing Splicing PhyloP PhastCons SIFT MAPP Grantham SSF NNS MaxEnt SPiCE PhyloP-100w PhastCons- 100 CADD v1.3 CADD v1.6 SpliceAI 1 Variantes curadas en los 209 pacientes de la cohorte de entrenamiento: 695 variantes 65 variantes de splicing 247 variantes 34 variantes de splicing 942 variantes en genes DHR Selección del mejor modelo combinado y de los cutoffs óptimos. 2 La aplicación del flujo de trabajo sobre los datos de WGS permite la identificación de una variante candidata en la familia A. 4 AL APLICAR LOS CUTOFFS PERSONALIZADOS SE REDUCE EN UN 84,62% EL NÚMERO DE VARIANTES PARA ANALIZAR MANUALMENTE FLUJO DE TRABAJO DESAROLLADO NON-SPLICING CADD v1.6 ≥22,25 SIFT ≤0,175 MAPP ≤0,098 GRANTHAM ≥28,00 SpliceAI ≥0,405 NNS ≥62,73 MEJORES MODELOS CONCLUSIONES *Individuos secuenciados por WGS. 3 SPLICING El algoritmo desarrollado permite recuperar el ~90% de las variantes causales del conjunto de variantes de validación en todas las patologías analizadas. Cohorte validación de pacientes con DHR I. La curación de las variantes del grupo de entrenamiento ha permitido tener unos datos de partida de calidad para calcular cutoffs más confiables para cada una de las herramientas de predicción. II. La combinación de las herramientas CADD, MAPP, Grantham y SIFT ha permitido reducir la tasa de falsos positivos en nuestra estrategia de filtrado. III. El mejor modelo combinado para la priorización de las variantes de splicing ha sido “SpliceAI+NNS”. IV. La aplicación de cutoffs personalizados ha permitido aumentar la eficacia en el análisis de datos de WGS ya que se ha conseguido reducir considerablemente el número de variantes a ser analizadas manualmente. V. La estrategia de análisis desarrollada permite una correcta priorización y valoración de los datos WGS de pacientes con DHR en la práctica clínica. Significancia clínica B P Tras el análisis rutinario el 40% permanece sin diagnóstico genético 2 . Técnicas de mayor alcance * * Reanálisis Secuenciación completa de genoma (WGS) Secuenciación completa de exoma (WES)

Upload: others

Post on 24-Jun-2022

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE

DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE SECUENCIACIÓN DE GENOMA COMPLETO PARA LA PRIORIZACIÓN DE

VARIANTES EN NUEVOS GENES DE DISTROFIAS HEREDITARIAS DE RETINA

1 UGC Medicina Maternofetal, Genética y Reproducción, Instituto de Biomedicina de Sevilla, H. U. Virgen del Rocío/Universidad de Sevilla/CSIC, Sevilla, España. 2 Centro de Investigación Biomédica en Red de Enfermedades Raras (CIBERER), Sevilla, España.

3 UGC Oftalmología, H.U. Virgen Macarena, Sevilla, España. 4 Retics Oftared, Instituto de Salud Carlos III, Madrid, España.

Elena Fernández-Suárez1, 2, María González-del Pozo1,2, Nereida Bravo-Gil1,2, Cristina Méndez-Vidal1,2, Marta Martín-Sánchez1, Enrique Rodríguez-de la Rúa3,4, Mª José Morillo-Sánchez4, Salud Borrego1,2 and Guillermo Antiñolo1,2

PACIENTES Y MÉTODOS

RESULTADOS

1. Toulis V y cols., Genes (Basel) 20202. Arno G y cols., Am J Hum Genet 20163. van El CG y cols., Eur J Hum Genet 20134. Niroula A y cols., PLoS Comput Biol. 2019

REFERENCIAS AGRADECIMIENTOS

Para más información:[email protected]

Los autores agradecen a las familias que han participado en el estudio. Este trabajo ha sido apoyado por el Instituto de Salud Carlos III (ISCIII), el Ministerio de Economía yCompetitividad de España y cofinanciado por la Unión Europea (FEDER, “Una manera de hacer Europa) [PI18-00612], Consejería de Salud y Familias de la Junta de Andalucía[PEER-0501-2019] y la Fundación Isabel Gemio/Fundación Cajasol [FGEMIO-2019-01]. El CIBERER es una iniciativa del ISCIII y del Ministerio de Economía y Competitividad.EFS tiene una ayuda del ISCIII [FI19/00091) (FSE, “Invirtiendo en tu futuro”). NBG tiene una ayuda de la Consejería de Salud y Familias de la Junta de Andalucía [RH-0118-2020]. MMS tiene una ayuda asociada al proyecto CTS-1664 financiado por la Consejería de Economía, Conocimiento y Emprendimiento de la Junta de Andalucía.

Definir un flujo de trabajo parael análisis de datos de WGS

basado en el uso de predictores que permita la identificación de nuevos genes/variantes

asociadas con las DHR.

INTRODUCCIÓN OBJETIVO

Las distrofias hereditarias de retina (DHR) constituyen un grupo de enfermedades raras que afectan a los fotorreceptores de la retina provocando la pérdida total o parcial de visión. Se caracterizan por su gran heterogeneidad clínica y genética1.

*

La traslación de WGS a la práctica clínica es difícil debido a la ausencia de protocolos de análisis estandarizados3.

Las herramientas de predicción ayudan a la priorización de las variantes en los estudios de WGS4.

*

La correcta aplicación de los predictores se debe basar en el uso de cutoffs confiables para el grupo de variantes en estudio.

*

Hay una gran falta de consenso entre qué predictor(es) usar y el cutoff a aplicar.

*

FASES DEL ESTUDIO

1 Curación de los datos de NGS de la cohorte de entrenamiento: Las variantes

exónicas y de splicing (primer codón del exón y ±10 pb del intrón) en genes ya asociados

a las DHR fueron clasificadas según el criterio ACMG y su significancia clínica.

2 Estudio estadístico de 14 predictores: Comparación y redefinición de los cutoffs de 14 herramientas

de predicción mediante el análisis de curvas ROC. Estudio combinatorial en el que se analizaron 93 modelos. Modelos óptimos: Verdaderos positivos ≥ 85%; Falsos positivos ≤ 35%; Valores perdidos ≤ 30%.

3 Validación del flujo de trabajo desarrollado: Evaluación de su eficacia y traslación a otras

enfermedades genéticas hereditarias.

4 Aplicación en la cohorte de descubrimiento: Análisis de los datos de WGS de la cohorte de

descubrimiento para la identificación de nuevas variantes/genes asociados a las DHR.

Alamut Bacth®Bystro CADD

Non-splicing Splicing

PhyloPPhastCons

SIFTMAPP

Grantham

SSFNNS

MaxEntSPiCE

PhyloP-100wPhastCons-

100CADD v1.3

CADD v1.6

SpliceAI

1 Variantes curadas en los 209 pacientes de la cohorte de entrenamiento:

695 variantes → 65 variantes de splicing

247 variantes → 34 variantes de splicing942 variantes en genes DHR

Selección del mejor modelo combinado y de los cutoffs óptimos.2

La aplicación del flujo de trabajo sobre los datos de WGS permite la identificación de una variante candidata en la familia A.

4

AL APLICAR LOS CUTOFFS PERSONALIZADOS SE

REDUCE EN UN 84,62% EL NÚMERO DE

VARIANTES PARA ANALIZAR MANUALMENTE

FLUJO DE TRABAJO DESAROLLADO

NON-SPLICING

CADD v1.6

≥22,25

SIFT

≤0,175

MAPP

≤0,098

GRANTHAM

≥28,00

SpliceAI

≥0,405

NNS

≥62,73

MEJORES MODELOS

CONCLUSIONES

*Individuos secuenciados por WGS.

3

SPLICING

El algoritmo desarrollado permite recuperar el ~90% de las variantes causales del conjunto de variantes de validación en todas las patologías analizadas.

Cohorte validación de pacientes con DHR

I. La curación de las variantes del grupo de entrenamiento ha permitido tener unos datos de partida de calidad para calcular cutoffs más confiables para cada una de las herramientas de predicción.

II. La combinación de las herramientas CADD, MAPP, Grantham y SIFT ha permitido reducir la tasa de falsos positivos en nuestra estrategia de filtrado.

III. El mejor modelo combinado para la priorización de las variantes de splicing ha sido “SpliceAI+NNS”.

IV. La aplicación de cutoffs personalizados ha permitido aumentar la eficacia en el análisis de datos de WGS ya que se ha conseguido reducir considerablemente el número de variantes a ser analizadas manualmente.

V. La estrategia de análisis desarrollada permite una correcta priorización y valoración de los datos WGS de pacientes con DHR en la práctica clínica.

Significancia clínica

B

P

Tras el análisis rutinario el 40% permanece sin diagnóstico genético2.

Técnicas de mayor alcance

*

*

Reanálisis

Secuenciación completa de genoma (WGS)

Secuenciación completa de exoma (WES)