caractérisation moléculaire des tumeurs oligodendrogliales...
TRANSCRIPT
Olivier SAULNIER
Licence professionnelle de biotechnologies
Spécialité génomique
E.N.C.P.B – Cnam – AFi24
2012 – 2013
Caractérisation moléculaire des tumeurs
oligodendrogliales anaplasiques
Chefs d’équipe : Pr. Jean-Yves DELATTRE – Pr. Marc SANSON
Maître d’apprentissage : Dr. Ahmed IDBAIH
Encadrante : Catherine CARPENTIER
Professeur tuteur : Isabelle ÉTIENNE
Durée : 12 mois (15 septembre 2012 – 14 septembre 2013)
Centre de Recherche de l’Institut du Cerveau et de la Moelle épinière (CR-ICM)
Equipe de neuro-oncologie expérimentale
UPMC UMR_S975, Inserm UMR 975, CNRS UMR 7225
Groupe hospitalier Pitié Salpêtrière – Bâtiment ICM
47-83 boulevard de l'hôpital
75013 Paris, France
Table des abréviations
2-HG : 2-HydroxyGlutarate
ADN : Acide DésoxyriboNucléique
AII : Astrocytome
AIII : Astrocytome anaplasique
ARC : Association pour la Recherche sur le Cancer
ARN : Acide RiboNucléique
ARTC : Association pour la Recherche sur les Tumeurs Cérébrales
BWA : Burrows-Wheeler Aligner
CBTRUS : Central Brain Tumor Registry of the United States
CDKN2A : Cyclin-dependent kinase inhibitor 2A
CGH array : Comparative Genomic Hybridization array
CIC : Capicua transcriptional repressor
CNRS : Centre National de la Recherche Scientifique
COSMIC : Catalogue Of Somatic Mutations In Cancer
CRB : Centre de Ressources Biologiques
CR-ICM : Centre de Recherche de l’Institut du Cerveau et de la Moelle épinière
CTBP2 : C-Terminal Binding Protein 2
dbSNP : database SNP
ddNTP : Didésoxyribonucléotides
DMSO : Diméthylsulfoxyde
EGF : Epidermal growth factor
EGFR : Epidermal growth factor receptor
ENCPB : École Nationale de Chimie, Physique et Biologie
EVS : Exome Variant Server
FAT1 : tumor suppressor homolog 1
FUBP1 : Far ipstream element binding protein 1
GBM : Glioblastome
GBMO : Glioblastome à composante oligodendrogliale
ICM : Institut du Cerveau et de la Moelle épinière
ICR : Institute of Cancer Research
IDH1 : Isocitrate dehydrogenase 1
IDH2 : Isocitrate dehydrogenase 2
IGV : Integrative Genomics Viewer
IK : Indice de Karnofsky
INCa : Institut National du Cancer
InDels : Insertions/Délétions
Inserm : Institut national de la santé et de la recherche médicale
IRM : Imagerie par Résonance Magnétique
MgCl2 : Chlorure de magnésium
MID : Multiplex IDentifiers
NGS : Next Generation Sequencing
NOTCH1 : Notch 1
NOTCH2 : Notch 2
OAII : Oligoastrocytome
OAIII : Oligoastrocytome anaplasique
OII : Oligodendrogliome
OIII : Oligodendrogliome anaplasique
OMS : Organisation Mondiale de la Santé
ONT : OncoNeuroThèque
OS : Overall Survival
pb : paire de bases
PBS : Phosphate Buffered Saline
PCR : Polymerase Chain Reaction
PCV : Procarbazine, CCNU, Vincristine
PFS : Progression-Free Survival
pH : potentiel Hydrogène
POLA : Prise en charge des OLigodendrogliomes Anaplasiques
PTP : PicoTiterPlate
RBPJ : Recombination signal Binding Protein for immunoglobulin kappa J region
rcf : relative centrifugal force
RIN : RNA Integrity Number
rpm : rotation par minute
SETD2 : SET Domain containing 2
SNC : Système Nerveux Central
SNP : Single Nucléotide Polymorphism
SNV : Single Nucléotide Variation
SYNE1 : Spectrin repeat containing, nuclear envelope 1
TDM : Tomodensitométrie
TERT : Telomerase reverse transcriptase
Tm : melting Temperature
TP53 : Tumor protein p53
UCSC : University of California, Santa Cruz
UMR : Unité Mixte de Recherche
UPMC : Université Pierre et Marie Curie
UTR : UnTranslated Region
WES : Whole-Exome Sequencing
p. 4
Sommaire
Présentation de l’entreprise
Introduction
Les gliomes
Les oligodendrogliomes anaplasiques
Le contexte du projet et objectifs
Matériel et méthodes
1) Extraction, quantification et qualification des acides nucléiques
2) Détermination du statut IDH1/IDH2 par séquençage direct
3) Caractérisation moléculaire des tumeurs sur puce pan-génomique
4) Recherche de variants par séquençage haut débit : Whole-Exome Sequencing
a) Principe du séquençage haut débit sur plateforme Illumina
b) Traitement bio-informatique des données générées
c) Validation des mutations par séquençage direct
5) Séquençage moyen débit du gène CIC via la technologie 454 – Roche®
a) Principe du séquençage par la technologie 454 sur GS Junior
b) Traitement bio-informatique des données
c) Validation des mutations par séquençage direct
Résultats
1) Population d'étude
2) Mise en évidence d'altérations génétiques et génomiques dans les OIII
a) Validation des altérations connues
b) Validation des altérations originales
c) Mise en évidence de voies de signalisation
Discussion et perspectives
Conclusion personnelle
Références bibliographiques
Annexes
p. 5
Présentation de l'entreprise
Dans le cadre de ma formation (licence professionnelle de biotechnologies, spécialité génomique)
réalisée à l'École Nationale de Chimie, Physique et Biologie (ENCPB) à Paris; j'ai effectué mon apprentissage
en alternance au sein du Centre de Recherche de l’Institut du Cerveau et de la Moelle épinière (CR-ICM).
L’Institut du Cerveau et de la Moelle épinière (ICM) est une fondation internationale reconnue d'utilité
publique, fondée en 2005 et présidée par le Professeur Gérard SAILLANT. L’ICM dispose de plus de
22 000 m² de laboratoires, d'un important Centre de Ressources Biologiques (CRB) et d’un pôle de
plateformes de haute technologie permettant à l’ensemble des 600 chercheurs, ingénieurs et techniciens de se
consacrer pleinement à la recherche sur les maladies neurologiques. Ce centre, installé au cœur du groupe
hospitalier Pitié-Salpêtrière à Paris, étudie les causes ainsi que les mécanismes des grandes pathologies du
système nerveux, comme, par exemple, la maladie de Parkinson, la maladie d'Alzheimer, la sclérose en
plaques et les tumeurs cérébrales.
Aujourd'hui, l'un des objectifs majeurs de la recherche menée dans l’ICM est de favoriser de nouvelles
découvertes scientifiques avec des perspectives d’applications diagnostiques et/ou thérapeutiques chez les
patients souffrant de maladie neurologique. C'est dans cette perspective que le CR-ICM, créé en 2009, s'est
installé au sein du bâtiment de l'ICM début 2011, regroupant ainsi, en un même lieu, patients, médecins,
chercheurs et techniciens. Le CR-ICM est une Unité Mixte de Recherche (UMR) sous la tutelle de l'Université
Pierre et Marie Curie (UPMC), de l'Institut National de la Santé et de la Recherche Médicale (Inserm) et du
Centre National de la Recherche Scientifique (CNRS). Les financements du CR-ICM sont d’origines très
diverses. Ils proviennent de financements associatifs/institutionnels, (comme la fondation Association pour la
Recherche sur le Cancer (ARC) pour la recherche sur le cancer, l’Association pour la Recherche sur les
Tumeurs Cérébrales (ARTC) ou l’Institut National du Cancer (INCa)) des contrats et des donateurs privés
ainsi que des différentes tutelles (Inserm, CNRS, UPMC). Son budget global en 2011 était de 38,5 millions
d'euros (salaires inclus).
Les différentes missions du CR-ICM sont axées sur la recherche fondamentale et appliquée,
notamment dans le but de mieux comprendre l'organisation et le fonctionnement, normaux et pathologiques,
du système nerveux. L’ICM est constitué de 22 équipes scientifiques réparties selon 4 axes de recherche :
- Axe I : maladies neurodégénératives
- Axe II : excitabilité, synapse et pathologies associées
- Axe III : développement, pathologies gliales et réparation
- Axe IV : cognition, émotion, action
C'est au sein du troisième axe que j'ai réalisé mon apprentissage et plus particulièrement dans l'équipe
de neuro-oncologie expérimentale des Professeurs Jean-Yves DELATTRE et Marc SANSON. Les objectifs
généraux de l'équipe, concentrés sur les tumeurs cérébrales, sont :
- l'identification de biomarqueurs moléculaires
- la compréhension des mécanismes moléculaires et cellulaires impliqués dans l'oncogenèse des
tumeurs cérébrales
- le développement et l’évaluation de nouvelles thérapies dans des modèles précliniques de tumeurs
cérébrales
p. 6
L'équipe de neuro-oncologie expérimentale dispose de la plus grande biobanque de tumeurs cérébrales
d'Europe (OncoNeuroThèque – ONT, Groupe hospitalier Pitié-Salpêtrière) avec plus de 11 000 individus
inclus dont plus de 4 000 souffrant de gliomes (document 1). ONT est une tumorothèque en cours de
certification pour la norme NF S 96-900 et est localisée sur deux étages à l'ICM. Elle regroupe des fragments
tumoraux congelés de différents types de tumeurs cérébrales : (i) des gliomes qui représentent plus de 50%
des tumeurs primitives du système nerveux central (SNC), (ii) des méningiomes, (iii) des lymphomes
cérébraux primitifs et (iv) des tumeurs cérébrales plus rares.
Afin de pouvoir mettre à disposition l’ensemble des données cliniques, pathologiques et moléculaires
des patients ; une base de données a été mise en place regroupant toutes ces informations (document 2).
p. 7
Document 1 : Répartition des ressources biologiques d’OncoNeuroThèque (ONT) Légende : A. Représentation de la base de données d’OncoNeuroThèque selon l’histologie des tumeurs gliales. GBM : glioblastome (grade IV); GBMO
: glioblastome à composante oligodendrogliale (grade IV); OIII : oligodendrogliome anaplasique (grade III); OAIII : oligoastrocytome anaplasique
(grade III); AIII : astrocytome anaplasique (grade III); OII : oligodendrogliome (grade II); OAII : oligoastrocytome (grade II); AII : astrocytome
(grade II). B. Répartition de la diversité de la biobanque selon le type d’échantillon stocké.
Document 2 : Base de données OncoNeuroThèque A. Base de données cliniques d’OncoNeuroThèque B. Base de données moléculaires d’OncoNeuroThèque
p. 8
Introduction
Les gliomes
Les gliomes sont des tumeurs cérébrales primitives dérivant des cellules macrogliales (astrocytes,
oligodendrocytes et épendymocytes) qui composent la macroglie du SNC. Par analogie aux cellules
macrogliales normales, il existe donc trois principaux types de gliomes : (i) les astrocytomes, (ii) les
oligodendrogliomes et (iii) les oligoastrocytomes ou les gliomes mixtes. Les épendymomes constituant un
groupe singulier au sein des gliomes, ils ne seront pas abordés ici.
Les gliomes touchent aussi bien les adultes que les enfants, leur incidence annuelle est de 5 cas pour
100 000 habitants. En effet, chaque année, en France, sont diagnostiqués entre 3000 et 4000 nouveaux cas. La
prolifération des cellules gliales cancéreuses dans le cerveau entraîne une augmentation de la pression dans la
boîte crânienne et une compression du parenchyme cérébral avec l’apparition de signes cliniques. Les
symptômes les plus fréquemment observés sont des céphalées, des crises d'épilepsie et/ou des handicaps
neurologiques (moteurs, sensitifs et/ou cognitifs). La tumeur peut être visualisée chez le patient par des
examens neuroradiologiques (TDM cérébral et IRM cérébrale) mais le diagnostic de certitude pour les gliomes
repose sur l’examen histologique d’un fragment tumoral sous microscope.
L'Organisation Mondiale de la Santé (OMS) a mis en place, d'après un consensus, une classification
histologique ou neuropathologique des tumeurs cérébrales dont la dernière modification date de 2007 1. Cette
classification a pour but d'unifier la nomenclature histologique des gliomes, permettant donc à tous les
neuropathologistes de donner une même terminologie pour des tumeurs phénotypiquement semblables. Cette
classification individualise 7 principaux types de gliomes en fonction du phénotype des cellules tumorales et
du grade de malignité. Le grade de malignité des gliomes tient compte de plusieurs paramètres : (i) la
différenciation cellulaire, (ii) la densité cellulaire, (iii) la présence d’atypies nucléaires, (iv) le degré d’activité
mitotique et (v) la présence de nécrose (document 3). La tumeur primitive du SNC la plus fréquente et la plus
agressive est l'astrocytome de grade IV ou glioblastome qui représente plus de 50 % de l'ensemble des tumeurs
gliales malignes (annexe 1). Ces derniers ont une survie globale médiane de 15 mois 2.
p. 9
Document 3 : Classification des tumeurs gliales d’après l’OMS (2007) adapté de Louis et al., 2007 1
Typ
e h
isto
log
iqu
eG
rad
e O
MS
Dif
fére
ncia
tio
nD
en
sité
cell
ula
ire
Aty
pie
s
nu
clé
air
es
Acti
vit
é
mit
oti
qu
eN
écro
seP
roli
féra
tio
n
va
scu
lair
e
Ast
rocyto
me
dif
fus
IIhau
t d
egré
de
dif
fére
ncia
tio
nm
od
érée
occas
ionnel
les
abse
nte
ou
faib
leab
sente
abse
nte
Ast
rocyto
me
anap
lasi
que
III
Anap
lasi
e fo
cal
e o
u
dif
fuse
augm
enté
e d
iffu
sém
ent
ou f
ocal
emen
tp
rése
nte
sp
rése
nte
abse
nte
abse
nte
Glio
bla
sto
me
IVfa
ible
élev
éem
arq
uée
sm
arq
uée
pré
sente
pré
sente
Olig
od
end
roglio
mes
IIb
ien d
iffé
rencié
em
od
érée
po
ssib
lem
ent
mar
quée
s
abse
nte
ou
occas
ionnel
le
abse
nte
ou
faib
leno
n p
roém
inen
te
Olig
od
end
roglio
me
anap
lasi
que
III
Anap
lasi
e fo
cal
e o
u
dif
fuse
éven
tuel
lem
ent
augm
enté
e
éven
tuel
lem
ent
mar
quée
s
éven
tuel
lem
ent
fort
e
éven
tuel
lem
en
t fo
rte
po
ssib
le
Olig
oas
tro
cyto
me
IIb
ien d
iffé
rencié
efa
ible
ou m
od
érée
-ab
sente
ou
faib
le
abse
nte
ou
faib
leab
sente
Olig
oas
tro
cyto
me
anap
lasi
que
III
-év
entu
elle
men
t fo
rte
éven
tuel
lem
ent
pré
sente
s
éven
tuel
lem
ent
fort
e
éven
tuel
lem
en
t fo
rte
po
ssib
le
Tu
meu
rs
ast
rocyta
ires
Tu
meu
rs o
lig
o-
ast
rocyta
ires
Tu
meu
rs
oli
go
den
dro
cyta
ires
p. 10
Aujourd’hui, avec l’arrivée des nouvelles technologies de séquençage haut débit, l’analyse
moléculaire des gliomes a permis de découvrir des altérations moléculaires pertinentes sur le plan biologique
et sur le plan clinique. Certaines de ces altérations moléculaires détectées dans les tumeurs gliales constituent
dorénavant des biomarqueurs diagnostiques et pronostiques. La découverte de ces altérations moléculaires a
aussi permis de mieux comprendre la gliomagenèse ainsi que la mise en évidence de l’importante
hétérogénéité intratumorale et intertumorale 3 de ces tumeurs.
De nombreuses altérations moléculaires impliquées dans gliomagenèse ont été découvertes, telles que
des mutations, des amplifications, des réarrangements ou des délétions chromosomiques dérégulant des
oncogènes ou des gènes suppresseurs de tumeurs.
Les principales altérations génomiques et génétiques mises en évidence dans les gliomes sont :
- la perte des bras chromosomiques : co-délétion 1p et 19q 4,5
- la mutation ponctuelle de gènes : IDH1 6,7
, CIC 8–11
, FUBP1 8–10
, promoteur TERT 12,13
- la délétion de gènes suppresseurs de tumeurs : TP53 14
, CDKN2A 15
- l'amplification d'oncogène : EGFR 16,17
p. 11
Les oligodendrogliomes anaplasiques
Épidémiologie
Les oligodendrogliomes anaplasiques (OIII) représentent 6,2 % des gliomes d'après le rapport établi
par le Central Brain Tumor Registry of the United States (CBTRUS) 18
. En France, entre 300 et 600 nouveaux
cas d'OIII sont diagnostiqués chaque année.
Anatomopathologie
Les OIII sont des gliomes diffus malins de haut grade de malignité (grade III selon la classification de
l'OMS de 2007). Sur le plan anatomopathologique, ils sont caractérisés par des cellules de phénotype
oligodendrocytaire en "œuf sur le plat" et organisés en "nid d’abeille" 19
(document 4).
Aspects radiologiques
Sur le plan radiologique, les OIII sont le plus souvent caractérisés par une localisation frontale et une
prise de contraste (document 5), traduisant la rupture de la barrière hémato-encéphalique 20
.
Traitements
Le traitement des patients souffrant d’un OIII repose sur un trépied thérapeutique : (i) la chirurgie, (ii)
la radiothérapie et (iii) la chimiothérapie. La chirurgie, permettant la résection tumorale, doit être aussi large
que possible tout en préservant le patient de toute séquelle neurologique. La chirurgie est suivie d’une
radiothérapie encéphalique. La chimiothérapie est prescrite selon le statut des bras chromosomiques 1p/19q
(présence de la co-délétion 1p/19q ou non). Si la tumeur présente une co-délétion des bras chromosomiques
1p/19q, une chimiothérapie (Procarbazine, CCNU, Vincristine -PCV-) précoce adjuvante à la radiothérapie est
délivrée. En effet, ce biomarqueur génomique est associé à une meilleure réponse à la chimiothérapie précoce.
En l’absence de co-délétion 1p/19q, la place de la chimiothérapie est discutée et évaluée dans le cadre d’essais
cliniques.
Pronostic
Le pronostic des patients souffrant d’OIII est très hétérogène, en fonction des caractéristiques
cliniques et moléculaires de la tumeur, et varie de 2 à 20 ans 21
.
p. 12
Document 4 : Aspects neuropathologiques d’un oligodendrogliome anaplasique tiré de Mokhtari et al., 2013 19
Légende : Coupe histologique d’un oligodendrogliome anaplasique organisé en "nid d’abeille" et présentant une prolifération vasculaire.
Document 5 : Aspects neuroradiologiques d’un oligodendrogliome anaplasique tiré Reyes et al., 2013 20
Légende : IRM d’un oligodendrogliome anaplasique localisé au niveau frontal gauche et présentant une prise de contraste.
p. 13
Caractéristiques moléculaires
Plusieurs altérations génétiques et génomiques ont été identifiées dans les OIII (document 6) comme
(i) la co-délétion des bras chromosomiques 1p et 19q, (ii) les mutations des gènes IDH1 ou IDH2, (iii) les
mutations du gène CIC, (iv) les mutations du gène FUBP1 et (v) les mutations du promoteur du gène TERT.
La co-délétion des bras chromosomiques 1p/19q est observée dans environ 75% des OIII et est
associée à un meilleur pronostic et à une meilleure réponse à la chimiothérapie 5.
Les mutations des gènes IDH1 et IDH2 sont observés dans plus de 80% des OIII 6,7
. Les gènes IDH1
et IDH2 codent respectivement pour les isocitrates déshydrogénases NADP+ dépendantes 1 (cytosolique) et
2 (mitochondriale). Ces deux protéines jouent un rôle essentiel dans le métabolisme cellulaire, elles permettent
la conversion de l'isocitrate en α-cétoglutarate. Les mutations retrouvées dans les gènes IDH1 et IDH2 sont
des "points-chauds" (ou hotspots). Elles touchent respectivement les codons R132 et R1727 (annexe 2) et ont
été décrites pour la première fois en 2009 6. Ces mutations situées au sein du site actif des enzymes IDH1 et
IDH2 provoquent une modification de leur spécificité et conduisent à une production et une accumulation de
2-hydroxyglutarate (2-HG) qui contribuerait à la formation et à la progression de gliomes 22
.
Ces deux altérations (co-délétion 1p/19q et la mutation IDH1/2) sont des caractéristiques moléculaires
majeures avec une grande valeur pronostique. En effet, il a été montré que la co-délétion des bras
chromosomiques 1p et 19q était un facteur pronostique favorable dans les oligodendrogliomes. Il a également
été montré que les mutations des gènes IDH1 et IDH2 étaient aussi associées à un pronostic favorable
indépendamment de la perte des bras chromosomiques 1p/19q 23
(document 7).
Le gène CIC, localisé sur le chromosome 19q, est un répresseur transcriptionnel impliqué notamment
dans la voie du récepteur de l’EGF. Il est retrouvé muté dans 50 à 60% des OIII 8–11
.
Le gène FUBP1, situé sur le chromosome 1p, code pour une protéine régulatrice de l’expression de
l’oncogène c-myc qui est lui-même impliqué dans de nombreux cancers. Il est retrouvé muté dans 15 à 20%
des OIII 8–10
.
Le gène TERT est impliqué dans le maintien de la longueur des télomères. Son promoteur a
récemment été découvert muté dans 85% des OIII 12,13
. Cette mutation participerait à l’immortalisation des
cellules gliales normales et à leur engagement dans le développement tumoral.
p. 14
Document 6 : Principales altérations génétiques et génomiques retrouvées dans les oligodendrogliomes
anaplasiques de grades III (OMS)
Altération Région impliquée % variants Littérature
co-délétion 1p19q 75 Reifenberger J. et al. (1994)
Cairncross G. J. et al. (1998)
mutation IDH1 80 Yan H. et al. (2009)
Hartmann C. et al. (2009)
mutation CIC 50 à 60
Bettegowda C. et al. (2011)
Jiao Y. et al. (2012)
Sahm F. et al. (2012)
Yip S. et al. (2012)
mutation FUBP1 15 à 20
Bettegowda C. et al. (2011)
Jiao Y. et al. (2012)
Sahm F. et al. (2012)
mutation promoteur TERT 85 Killela P. J. et al. (2013)
Arita H. et al. (2013)
Document 7 : Courbe de survie des gliomes de grade III en fonction des statuts des bras chromosomiques
1p/19q (co-délétés ou non) et des gènes IDH1/IDH2 (muté ou non) tiré de Labussière et al., 2010 23
Légende : A : IDH1/IDH2 muté et co-délétion 1p/19q; B : IDH1/IDH2 muté sans co-délétion 1p/19q; C : IDH1/IDH2 non muté
p. 15
Le contexte du projet et objectifs
Dans le cadre de mon apprentissage, j'ai travaillé sur la caractérisation moléculaire des tumeurs
oligodendrogliales anaplasiques des patients pris en charge dans le cadre du réseau national multicentrique
"Prise en charge des OLigodendrogliomes Anaplasiques" (POLA). Le réseau POLA a été labélisé en 2009 par
l’INCa. L'objectif de l'ensemble du réseau POLA est d'améliorer et d'harmoniser, au niveau national, la prise
en charge médicale et la recherche effectuée sur les OIII et plus largement sur les tumeurs oligodendrogliales
malignes (oligoastrocytomes anaplasiques, oligoastrocytomes anaplasiques avec nécrose et glioblastomes à
composante oligodendrogliale). Le réseau POLA encourage également la recherche biologique et clinique sur
ces tumeurs rares via notamment la constitution de la plus grande biobanque internationale d’échantillons
biologiques (sang et tumeur). Les échantillons proviennent, après leur consentement écrit et signé, de patients
souffrant d'OIII. Le réseau POLA regroupe 35 groupes hospitaliers français qui sont sous la coordination de
deux centres de références :
- le centre de référence clinique (Pr. DELATTRE) du groupe hospitalier Pitié-Salpêtrière à Paris
- le centre de référence d'anatomopathologie (Pr. FIGARELLA-BRANGER) de l'hôpital la Timone à
Marseille
Le réseau POLA est notamment constitué d'un groupe de recherche translationnelle dont l'objectif est
la recherche de biomarqueurs moléculaires diagnostiques et pronostiques. Cette recherche translationnelle est
primordiale pour les médecins car elle permet d’affiner la prise en charge médicale du patient d’après le profil
moléculaire de sa tumeur. C'est dans cette optique qu'est réalisé, pour chaque patient inclus dans le réseau
POLA, 2 à 3 semaines après la chirurgie, une analyse moléculaire afin de connaître les caractéristiques
génomiques de sa tumeur.
En plus du groupe translationnel, le réseau POLA comprend d’autres groupes de recherche :
(i) épidémiologie, (ii) radiologie, (iii) anatomopathologie et (iv) neurotoxicité des traitements anti-tumoraux.
Pour qu’un patient soit inclus dans le réseau POLA, une double relecture histologique est réalisée dans le but
de conforter et de valider le diagnostic. En février 2013, après une double relecture histologique, le réseau
POLA comptait 573 patients.
Mon objectif au sein de l’équipe de neuro-oncologie expérimentale fût la caractérisation moléculaire
des tumeurs oligodendrogliales anaplasiques. Pour cela, j’ai travaillé sur l’exploitation et la validation de
données de séquençage exonique haut débit (Whole-Exome Sequencing – WES) mettant en œuvre des notions
de bio-informatique ainsi que du séquençage Sanger. J’ai également été amené à réaliser du séquençage
moyen débit (technologie 454 – Roche®) sur le gène CIC afin de valider les données de la littérature.
De plus, j’ai effectué des manipulations dites "de routine" lors de chaque réception de nouveaux
prélèvements POLA. Il s’agissait d’extraire l’Acide DésoxyriboNucléique (ADN), de réaliser un séquençage
systématique des gènes IDH1 et IDH2, par séquençage Sanger, ainsi que l'analyse du profil génomique sur
puce d’hybridation génomique comparative (Comparative Genomic Hybridization array -CGH array-).
J’ai également réalisé des extractions d’Acide RiboNucléique (ARN) ainsi que leur qualification sur
Bioanalyzer2100 (Agilent®) dans l’objectif de faire du séquençage haut débit d’ARN. Ces travaux sont menés
en collaboration avec le Pr. Mark LATHROP de l’Université McGill (Montréal, Canada) et sont en cours
d’analyse, ils ne seront donc pas détaillés dans ce mémoire.
p. 16
Matériel et méthodes
1) Extraction, quantification et qualification des acides nucléiques
Matériel biologique
Chaque semaine, les échantillons tumoraux POLA sont envoyés (depuis les laboratoires de
neuropathologie nationaux participant au réseau POLA) à l’ICM. Ils sont traités puis stockés dans un but de
recherche moléculaire, sous forme de tissus congelés ou de bloc inclus en paraffine. L'échantillon doit
contenir au moins 60% de cellules tumorales pour être jugé représentatif de la tumeur.
57 gliomes de grade III (OMS), confirmés par une double relecture histologique centralisée, ont été
inclus dans le réseau POLA et constituent notre population d'étude du WES. 51 d'entre eux sont des OIII
(89,5%) et 6 sont des oligoastrocytomes anaplasiques ou gliomes mixtes (10,5%).
Extraction d’ADN à partir de tissu congelé
Dans le cas de tissus congelés, un morceau de tissu tumoral est coupé afin d’en extraire l’ADN
génomique, le reste de tissu est congelé dans de l’azote liquide à -196°C. Le morceau de tissu tumoral est
incubé pendant une nuit à 56°C sous agitation (450 rotations par minute -rpm-) avec 1mL de tampon de lyse
(Lysis Buffer L13, Invitrogen®) et 20µL de protéinase K à 20 mg/mL (Roche
®). Le tampon de lyse va
permettre la dégradation des membranes tandis que la protéinase K va hydrolyser les protéines cellulaires.
Une fois la lyse complète de l’échantillon, on ajoute 10µL de RNAse A à 20 mg/mL (Invitrogen®) et on laisse
incuber 5 minutes à température ambiante, ceci dans le but d’hydrolyser l’ARN de l’échantillon.
L’ADN génomique est ensuite purifié à l’aide de l’automate iPrep™
Purification Instrument
(Invitrogen®) et du kit iPrep
™ ChargeSwitch
® gDNA Tissue Kit (Invitrogen
®). La purification de l’ADN
génomique se base sur la technologie ChargeSwitch®, développée par Invitrogen
®, reposant sur l’utilisation de
billes magnétiques sur lesquelles sont greffés des groupements ionisables. À potentiel Hydrogène (pH)
inférieur à 6, les groupements sont chargés positivement ce qui va permettre la fixation de l’ADN, qui lui, est
chargé négativement par ses phosphates. Les billes (et donc l’ADN) sont retenues par un aimant, tandis que
les contaminants sont éliminés par lavage. La charge des billes est ensuite neutralisée en augmentant le pH
(par une solution peu saline) ce qui va permettre d’éluer l’ADN en se détachant des billes magnétiques.
Extraction d’ADN à partir de tissu fixé au formaldéhyde et inclus en paraffine
Dans le cas de bloc inclus en paraffine, 10 coupes de 20 µm sont coupées au microtome afin d’en
extraire l’ADN. 500 µL de Phosphate Buffered Saline (PBS) sont ajoutés aux copeaux de paraffine et incubés
pendant 10 minutes à 90°C dans le but de rendre la paraffine liquide. Ensuite, le tube est immédiatement
centrifugé pendant 15 minutes à 10 000 relative centrifugal force (rcf) puis placé dans la glace afin de
solidifier le disque de paraffine. En effet, la paraffine étant moins dense que la solution aqueuse, il va se
former un disque de paraffine sur le haut du tube qu’on élimine ensuite à l’aide d’une pince. La suite du
protocole est identique à celui décrit pour le tissu congelé. Le principe de la purification via le kit iPrep™
ChargeSwitch® gDNA Tissue Kit (Invitrogen
®) est présenté en annexe 3.
p. 17
Quantification et qualification d’ADN
L’ADN génomique est quantifié à l’aide d’un spectrophotomètre Nanodrop (ND-8000, Thermo
Scientific®) en déposant 1,5 µl d’échantillon. Les deux principaux avantages du dosage au Nanodrop est le
faible volume de matériel nécessaire et le fait qu’il n’y ait pas de dilution préalable nécessaire. Les protéines
absorbent majoritairement à 280 nm ; les composés chimiques et phénoliques majoritairement à 230 nm, et
l’ADN majoritairement à 260 nm. Les rapports A260
/A280
et A260
/A230
permettent d’évaluer la pureté des acides
nucléiques présents dans chaque échantillon. Pour considérer un échantillon pur en ADN, le rapport A260
/A280
doit être compris entre 1,8 et 2,0. Si ce rapport est inférieur à 1,8, la contamination en protéines est considérée
comme importante. Le rapport A260
/A230
, lui, doit être proche de 2,0 afin de pouvoir considérer l’échantillon
exempt de contaminants.
Extraction d’ARN à partir de tissu congelé
Un morceau de tissu tumoral est placé dans un tube contenant des billes de céramique (FastPrep™
Lysing Matrix, MP Biomedicals) et du trizol (responsable de la lyse des cellules). Le tissu est broyé deux fois
pendant 40 secondes à 6 000 rcf à l’aide de l’appareil FastPrep (FastPrep ® FP120, Savant Bio 101). La phase
liquide est transférée dans un tube Eppendorf® et est homogénéisée grâce à un agitateur rotatif pour finaliser la
lyse cellulaire. Du chloroforme est ensuite ajouté au lysat cellulaire pour créer une phase aqueuse et une phase
organique. Le chloroforme va permettre de dissocier les acides nucléiques, qui s'accumuleront au niveau de la
phase aqueuse, des autres constituants cellulaires. La phase aqueuse est récupérée après centrifugation dans un
autre tube qui sera placé dans l’automate de purification iPrep™. La purification se fait à l’aide de billes
magnétiques ionisables qui vont fixer les acides nucléiques et permettre l’élimination des contaminants via des
étapes de lavages. Les ARN sont ensuite précipités par de l’isopropanol, lavés par différents tampons et enfin
élués dans 100 µL d’eau RNase free.
Quantification et qualification d’ARN
Les ARN sont quantifiés à l’aide d’un spectrophotomètre Nanodrop (Nanodrop 8000
Spectrophotometer, Thermo Fisher Scientific) en déposant 1,5 µl d’échantillon. Pour considérer un échantillon
pur en ARN, le rapport A260
/A280
doit être proche ou supérieur à 2,0. Si ce rapport est inférieur à 1,8, la
contamination en protéines est considérée comme importante. Le rapport A260
/A230
doit être proche de 2,0 afin
de pouvoir considérer l’échantillon exempt de contaminants.
La qualité des ARN totaux extraits est vérifiée sur puce RNA 6000 Nano Kit (Agilent®) à l’aide d’un
Bioanalyzer2100 (Agilent®). L’instrument met en œuvre un système d’électrophorèse sur puce microfluidique
permettant l’analyse des échantillons à partir de faible quantité (25 ng à 500 ng). Les avantages du
Bioanalyzer sont : la faible consommation en matériel biologique, la reproductibilité des résultats et
l’automatisation du procédé. À l’aide d’un intercalant, l’appareil mesure en temps réel l’intensité de
fluorescence en fonction du temps de migration dans les microréseaux. Pour chaque échantillon, un chiffre,
compris entre 1 et 10, est donné résultant de la qualité globale de l’ARN : c’est le RIN (RNA Integrity
Number). Ce chiffre permet d’attribuer un score à la qualité de l’ARN, plus il est élevé plus la préparation
d’ARN est considérée comme "intacte" ou de "bonne qualité". Le RIN est calculé via un algorithme prenant
en compte l’aire sous les différents pics obtenus, la ligne de base, le ratio ARNr 28S/ARNr18S et l’éventuelle
présence de dégradation. Selon les applications, on considère une préparation d’ARN correcte à partir d’un
RIN ≥ 7. L’étude sur le séquençage des ARN étant en cours d’analyse à Montréal, aucun résultat ne sera
présenté ici. Un exemple d’électrophorégramme et les résultats obtenus au Bioanalyzer sont présentés dans le
document 8 et en annexe 4.
p. 18
Document 8 : Profil électrophorétique d’ARN sur Bioanalyzer 2100 (Agilent®)
p. 19
2) Détermination du statut IDH1/IDH2 par séquençage direct
Dans le but de déterminer le statut mutationnel IDH1 et IDH2 d’une tumeur, l’ADN tumoral est
séquencé par la méthode Sanger 24. Cette méthode de séquençage par synthèse enzymatique, s’appuie sur
l’utilisation de Didésoxyribonucléotides (ddNTP) aussi appelés "terminateurs de chaines". Ces ddNTP ont
pour caractéristique de porter un atome d’hydrogène à leur extrémité 3’ à la place du groupement OH habituel
ce qui empêche l’incorporation d’un autre nucléotide. Chaque ddNTP porte un fluorochrome différent de
manière à pouvoir distinguer quelle base a été incorporée. Suite à la réaction enzymatique, on obtient donc
statistiquement un ensemble de brins d’ADN de longueurs différentes correspondants aux brins
complémentaires de la séquence du brin matrice. Un schéma de principe du séquençage par la méthode Sanger
est présenté en annexe 5.
On réalise donc dans un premier temps une PCR (Polymerase Chain Reaction) classique afin
d’amplifier notre région cible dans le but d’obtenir un signal détectable. Pour cela, on utilise le kit FastStart
PCR Master (Roche®) qui contient à la fois une ADN polymérase recombinante mais aussi le tampon (qui
contient notamment le chlorure de magnésium (MgCl2), co-facteur essentiel aux ADN polymérases) et les
dNTP. La Taq recombinante a pour caractéristique d’être inactive à des températures inférieures à 75°C car
elle a été chimiquement bloquée afin d’éviter l’amplification de séquences non spécifiques. Elle est "libérée"
dans le milieu réactionnel par un chauffage de 5 minutes à 95°C. Elle est qualifiée de Hot Start. Le milieu
réactionnel de la PCR classique ainsi que le cyclage utilisé sont indiqués en annexe 6 et 7.
La taille des amplicons attendus est de 290 paires de bases (pb) pour IDH1 et 170 pb pour IDH2. 2µL
de produit PCR sont déposés au Caliper LabChip® GX (PerkinElmer
®) (annexe 8). Le Caliper est un appareil
mettant en œuvre un système de microfluidique permettant la séparation des acides nucléiques. Les avantages
du Caliper sont la faible consommation en échantillon (2 µL de produit PCR), la rapidité (30 secondes de
migration par échantillon), la sensibilité et la reproductibilité. Les amplicons sont ensuite purifiés à l’aide du
kit Agencourt AMPure XP (Beckman Coulter ©) (annexe 9). Ce kit de purification permet, à l’aide de billes
magnétiques ionisables, de purifier les amplicons d'une taille supérieur à 100 paires de bases (pb) en éliminant
donc les amorces en excès, les dimères d’amorces, les dNTP non incorporés et les sels.
Une fois les produits de PCR purifiés, on réalise la réaction de séquençage. Pour cela, l’ADN est
mélangé avec l’amorce sens ou anti-sens ainsi que le mix du kit Big Dye Terminator v3.1 (Applied
Biosystems®) qui contient l’ADN polymérase, les 4 dNTP, les 4ddNTP marqués et le tampon. Le milieu
réactionnel de la réaction de séquençage ainsi que le cyclage utilisé sont indiqués en annexe 10 et 11. Les
produits de séquençage sont ensuite purifiés à l'aide du kit Agencourt CleanSEQ (Beckman Coulter ©
) afin
d’éliminer les ddNTP non incorporés ainsi que les autres réactifs non utilisés. Puis les échantillons sont
séquencés sur un séquenceur 48 capillaires 3730XL DNA Analyzer (Applied Biosystems®).
Les 916 électrophorégrammes réalisés au cours du projet sont ensuite lus par le logiciel Chromas Lite
et comparés par rapport aux séquences de références des gènes IDH1 et IDH2.
Pour le gène IDH1, la séquence de référence est : ATA-GGT-CGT-CAT-GCT
Pour le gène IDH2, la séquence de référence est : ATT-GGC-AGG-CAC-GCC
p. 20
3) Caractérisation moléculaire des tumeurs sur puce pan-génomique
La technique de CGH array a été inventée en 1998 25
et connaît un essor considérable depuis les
années 2005. Elle permet, à l’aide de puces à ADN, la détection à haute résolution des anomalies
chromosomiques sur l’ensemble du génome.
Le principe de la CGH array repose sur une hybridation compétitive entre un ADN cible et un ADN
de référence, tous deux marqués par un fluorochrome différent. Les puces pan-génomiques d’Agilent® se
présentent sous forme de lame de verre, sur lesquelles plusieurs dizaines de milliers à plus d’un million de
sondes de 60 bases sont fixées via un système de jet d’encre. Ces fragments d’ADN de séquence et de position
génomique connue couvrent l’ensemble du génome et sont représentatifs d’une seule séquence génomique
chacun.
Le marquage est réalisé à l’aide de deux fluorochromes : les cyanines 3 et 5. Pour chaque échantillon,
l’ADN de référence (ADN sanguin) est marqué par la cyanine 3 et l’ADN cible (ADN tumoral) est marqué
par la cyanine 5. Les puces utilisées sont des lames de 4 spots sur lesquels sont fixés 180 000 sondes couvrant
l’ensemble du génome humain, soit une sonde tous les 17kb. L’ensemble des kits et leurs coûts sont
référencés en annexe 12.
Préparation et marquage des ADN par amorçage aléatoire
Les couples d’ADN tumoral-sanguin sont dégradés par la chaleur pendant 30 minutes à 95°C dans le
but d’obtenir de petits fragments d’ADN afin de permettre l’hybridation avec les sondes. La dégradation de
l’ADN est vérifiée sur gel d’agarose, la présence d’un smear est synonyme d’une bonne dégradation.
1 µg d’ADN tumoral et sanguin sont placés dans des tubes. On y ajoute 5 µL de random primers, qui
sont des amorces aléatoires qui vont se fixer aléatoirement sur l’ensemble du génome. On chauffe à 95°C
pendant 10 minutes afin de dénaturer l’ADN puis on place immédiatement les tubes dans la glace pendant
5 minutes dans le but de figer l’ADN dans un état dénaturé.
La réaction de marquage se fait en ajoutant dans chaque tube des dNTP, des cy3-dUTP ou cy5-dUTP
et le fragment Exo-Klenow de l’ADN polymérase I d’Escherichia Coli. Conventionnellement l’ADN sanguin
est marqué par la cyanine 3 et l’ADN tumoral par la cyanine 5. Le fragment Exo-Klenow est utilisé pour le
marquage des ADN car il n’a conservé que son activité polymérase. Les deux activités exonucléasiques 5’-3’
et 3’-5’ ont été perdues. L’élongation se fait à 37°C pendant deux heures puis l’ADN polymérase est inactivée
en chauffant 10 minutes à 65°C.
p. 21
Purification des ADN marqués et calcul des rendements de marquages
Une fois marqué, chaque ADN est purifié à l’aide des filtres Microcon®-
30kDa Centrifugal Filter
(Merck Millipore®). Ce filtre permet de retenir l’ADN sur sa membrane de cellulose et donc d’éliminer les
cyanines non incorporées ainsi que les autres contaminants. Après purification, les ADN marqués sont dosés
au Nanodrop selon les longueurs d’ondes d’excitation des cyanines 3 et 5 (à 550 nm et 649 nm,
respectivement). Cela nous permet de connaître le nombre de molécules de cyanines présent dans la
préparation (en pmol/µL) et la concentration en ADN (ng/µL). On évalue ensuite le volume récupéré après
purification afin d’en déduire la quantité totale d’ADN dans la préparation. Puis, en divisant cette quantité par
le nombre de molécules de cyanines présent dans la préparation, on obtient un rendement d’incorporation qui
correspond au nombre de molécules de cyanines incorporées par nanogramme d’ADN (pmol/ng). Le
rendement des cyanines est toujours supérieur pour l’ADN sanguin. Cela est dû au fait que la cyanine 5 est
plus grande que la cyanine 3 et s’incorpore donc plus difficilement. De plus la cyanine 5 est sensible à la
dégradation par l’ozone contrairement à la cyanine 3 qui ne l’est pas. Les couples d’ADN tumoral-sanguin
sont ensuite mélangés de façon équimolaire.
Hybridation, lavages et lecture de la lame de CGH array au scanner
On ajoute au pool d’ADN marqués un agent bloquant, de l’ADN humain Cot-1 et du tampon
d’hybridation qu’on incube pendant 3 minutes à 95°C puis 30 minutes à 37°C. L’agent bloquant est utilisé
afin de réduire les hybridations non spécifiques sur la lame, tandis que les séquences de 50-300 pb enrichies
en séquences répétées (comme Alu, Kpn) présentes dans l’ADN humain Cot-1 servent à bloquer, par
hybridation, les séquences répétées contenues dans nos échantillons.
10 µg d’ADN marqués sont ensuite hybridés sur chaque spot de la lame et incubés à 65°C pendant 48
heures à 20 rpm. Une fois le temps d’hybridation terminé, on désassemble et on rince la lame pendant
5 minutes dans un tampon de lavage puis 1 minute dans un second tampon de lavage préchauffé à 37°C. Ce
dernier contient notamment de l’acétonitrile qui permet d’éliminer toute trace liquide sur la lame avant le
passage au scanner. Les lavages permettent d’éliminer les hybridations aspécifiques qui se sont
éventuellement formées lors de l’hybridation.
La lame est ensuite placée dans un scanner MS 200 Microarray Scanner (NimbleGen, Roche®). Un
premier scan est réalisé avec une résolution de 40 µm permettant d’obtenir une image rapide de la lame et
d’observer d’éventuelles traces de lavage. Un second scan est réalisé avec une résolution de 2 µm. Le scanner
génère alors deux images, l’une avec la longueur d’onde d’émission de la cyanine 3, 570 nm et l’autre avec
celle de la cyanine 5, 670 nm. Les deux images sont ensuite analysées, calibrées et corrigées en fonction du
bruit de fond, puis superposées à l’aide du logiciel CytoGenomics (Agilent®). A la suite de cette analyse, un
score de qualité est attribué pour chaque spot reflétant la reproductibilité des réplicats, le nombre de sondes
hors de la calibration et l’écart médian de signal entre l’échantillon tumoral et sanguin. Le fichier généré est
ensuite analysé à l’aide du logiciel Nexus Copy Number (BioDiscovery®) qui nous permet ensuite de
visualiser les différentes altérations génomiques de façon quantitative.
p. 22
4) Recherche de variants par séquençage haut débit : Whole-Exome Sequencing
L’objectif du WES est d’identifier de nouveaux gènes impliqués dans l’oncogenèse des gliomes de
grade III (OMS) et d’étudier leur sens clinico-biologique.
Les manipulations de WES ont été réalisées par l’équipe du Pr. Mark LATHROP, au Centre National
de Génotypage (CNG, Évry), sur une cohorte de 57 patients du réseau POLA pour lesquels nous disposions de
l’ADN tumoral, de l’ADN sanguin et des données cliniques. Les données générées ont ensuite été analysées
par l’équipe du Pr. Richard HOULSTON, à l’Institute of Cancer Research (ICR, Londres).
Depuis 2007, avec l’avènement des séquenceurs de nouvelle génération, il est désormais possible de
séquencer massivement, rapidement et à relativement faible coût. Cette nouvelle ère a considérablement
bouleversé le monde de la recherche et marque un pas vers une meilleure compréhension de certaines
pathologies. Le WES a été réalisé sur un séquenceur haut débit HiSeq2000 (Illumina®)
a) Principe du séquençage haut débit sur plateforme Illumina
Les différentes étapes de l’analyse WES sont les suivantes :
- préparation de la librairie d'ADN
- capture des exons
- amplification clonale : bridge PCR
- réaction de séquençage
Préparation de la librairie d'ADN
5 µg d’ADN tumoral et sanguin sont fragmentés de manière aléatoire par nébulisation de manière à
obtenir des fragments de 300-800 pb qu'on sélectionne par électrophorèse. Les extrémités sont réparées dans
le but d'obtenir des bouts francs afin de lier des adaptateurs aux extrémités (document 9).
Capture des exons
Une fois la librairie d'ADN préparée, une étape de capture des exons est réalisée. L'ADN génomique
est capturé à l'aide du kit SureSelect Human All Exon Kits (Agilent®). Ce kit se base sur la technologie
SureSelect qui permet la capture des exons selon la méthode d'enrichissement en solution (document 10). Une
librairie de sondes longues d'ARN biotinylées (120 pb) représentant l'ensemble des exons du génome humain
ainsi que les régions 3' UnTranslated Region (UTR) et 5' UTR sont mélangées à notre librairie d'ADN.
Agilent® a choisi des sondes ARN plutôt qu'ADN car l'hybridation ARN/ADN est plus forte qu'une
hybridation ADN/ADN et permet une meilleure sensibilité pour la suite du séquençage. Après 24 heures
d'hybridation, des billes magnétiques recouvertes de streptavidine sont ajoutées afin de capturer à l'aide d'un
aimant magnétique toutes les séquences qui se seront hybridées aux ARN biotinylées. Les billes sont ensuite
éliminées par lavage et l'ARN est hydrolysé par une ribonucléase.
p. 23
Document 9 : Préparation de la librairie d'ADN tiré de http://www.illumina.com
Légende : Fragmentation aléatoire de l’ADN, réparation des extrémités en "bouts francs" et ligation d’adaptateurs
Document 10 : Capture des régions exoniques à l’aide du kit SureSelect Human All Exon Kits (Agilent®)
tiré de http://www.genomics.agilent.com/ Légende : Capture des exons à l’aide de sondes ARN biotinylées représentant chacune une région exonique spécifique du génome humain.
p. 24
Amplification clonale : bridge PCR
Une PCR en pont en phase solide (bridge PCR) est réalisée afin d'amplifier de façon clonale une
molécule d'ADN en plusieurs millions de copies. La librairie d'ADN est déposée sur une puce de séquençage
haut débit (flow-cell) sur laquelle sont fixées des millions de séquences simples brins complémentaires des
adaptateurs de la librairie. Une des extrémités de l'ADN va s’hybrider avec les oligonucléotides fixés sur la
flow-cell et avec des conditions de stringence particulières, un pont va se former avec la seconde extrémité
libre qui va s'hybrider à un oligonucléotide complémentaire voisin. Après plusieurs cycles de dénaturation,
d’hybridation et d’élongation, des millions de séquences issues de séquences uniques vont former ce qu'on
appelle des clusters (document 11).
Réaction de séquençage
Après l'amplification, la réaction de séquençage est faite à l'aide de terminateurs de chaînes
réversibles. Ces dNTP chimiquement modifiés portent à leurs extrémités 3' un fluorochrome caractéristique du
dNTP et un groupement "bloqueur" qui ne permet pas l'incorporation d'un nucléotide à sa suite. La réaction de
séquençage se fait de façon cyclique : (i) les dNTP sont ajoutés, (ii) les dNTP non incorporés sont éliminés par
lavage, (iii) lecture du dNTP incorporé par excitation du fluorochrome via un laser, (iv) libération du
groupement "bloqueur" et (v) élimination du fluorochrome.
b) Traitement bio-informatique des données générées
Les données générées par le WES sont considérables et l'analyse bio-informatique qui en découle est
lourde et primordiale (annexe 13). Une première analyse appelée base calling consiste en l'analyse des images
générées par le séquenceur et la détermination d'un score de qualité reflétant la qualité du séquençage : le
phred quality score. Le phred score reflète la probabilité que le nucléotide lu soit une erreur de séquençage.
Par exemple un phred de 10 signifie qu'il y a 1/10 chance que la base lue ne corresponde pas à la base réelle.
Un phred de 30 signifie qu'il y a 1/1000 chance que la base lue ne corresponde pas à la base réelle, soit une
fiabilité équivalente à 99,999 %.
À l’aide du logiciel Burrows-Wheeler Aligner (BWA- http://bio-bwa.sourceforge.net), un alignement
des reads (lectures) est réalisé sur le génome de référence humain public le plus récent, datant de février
2009 : hg19 (University of California, Santa Cruz – UCSC). Cette étape permet, outre son alignement sur le
génome humain, d'attribuer, à chaque base, une couverture qui reflète le nombre de fois que la base a été lue
par le séquenceur.
Une étape de variant calling est ensuite appliquée via le logiciel GATK UnifiedGenotyper
(http://www.broadinstitute.org/gatk/gatkdocs/org_broadinstitute_sting_gatk_walkers_genotyper_UnifiedGeno
typer.html) dans le but de détecter les Single Nucléotide Variation (SNV) et des insertions/délétions (InDels).
Les variations détectées ainsi que les régions codantes et non codantes sont ensuite annotées via le
logiciel GATK SnpEff (http://gatkforums.broadinstitute.org/discussion/50/adding-genomic-annotations-using-
snpeff-and-variantannotator). Pour chaque variation détectée, un impact fonctionnel théorique est donné : high
(élevé), moderate (moyen), low (faible) et modifier (modificateur). L’impact fonctionnel prend en compte à la
fois la nature de la mutation (e.g. mutation ponctuelle de type SNV, mutation entrainant un changement du
cadre de lecture de type InDels) mais aussi sa position génomique (e.g. régions codantes : exons, régions non
codantes : introns, 3’ UTR et 5’ UTR).
p. 25
Document 11 : Schéma de principe de l'amplification clonale par bridge PCR tiré de http://www.illumina.com
Légende : Amplification clonale en pont en phase solide et formation de clusters à la surface de la flow-cell.
p. 26
Les Single Nucléotide Polymorphism (SNP) sont des variations d'un nucléotide par un autre et
représentent à eux seuls environ 90 % des variations génétiques entre individus. Les SNP sont généralement
localisés dans les régions fermées (non traduites) de l'ADN ou dans les régions introniques. Ils peuvent aussi
être dans les régions codantes de l'ADN mais la fonction principale de la protéine codée est très rarement
modifiée. C'est pour cette raison qu'un filtre est appliqué. Seules les variations non constitutionnelles
(somatiques), non référencées dans database SNP (dbSNP) et ayant un impact fonctionnel high ou moderate.
Les mutations ayant un impact fonctionnel low (n’entrainant pas de changement d’acide aminé) et modifier
(située dans les régions non codantes) ne sont donc pas conservées.
Les critères de sélection des variants sont :
- phred score (qualité) > 30
- couverture (quantité) > 30X
- SNV tumeur-spécifique
- non référencé dans dbSNP
- impact fonctionnel élevé ou modéré
c) Validation des mutations par séquençage direct
Malgré les progrès technologiques de ces dernières années, le séquençage haut débit reste une analyse
à grande échelle pour laquelle des erreurs sont encore commises. C'est pourquoi on se doit de valider les
variations sélectionnées par séquençage direct. La méthode de Sanger est une méthode rapide, faible et peu
coûteuse permettant donc de facilement valider les variations sélectionnées.
Les couples d’ADN tumoral-sanguin sont amplifiés puis séquencés en utilisant le même protocole que
dans la partie 2. Seules les variations somatiques sont conservées.
p. 27
5) Séquençage moyen débit du gène CIC via la technologie 454 – Roche®
Dans le but d'enrichir les données obtenues par WES et de valider la fréquence de mutation du gène
CIC de la littérature, un séquençage moyen débit sur GS Junior System (Technologie 454, Roche®) sur une
série de 52 OIII présentant tous une co-délétion des bras 1p et 19q, a été réalisé. Cette série comporte
32 tumeurs déjà passées en WES et 20 tumeurs supplémentaires, ceci dans le but de vérifier le pourcentage de
variants sur le gène CIC par rapport aux données de la littérature (Cf. résultats de WES).
Le GS Junior System (Roche®) est le "modèle de paillasse" de la société Roche
® utilisant la
technologie 454. Cette technologie se base sur une amplification clonale via une PCR en émulsion puis par un
pyroséquençage. 100 000 à 150 000 lectures de 300-400 pb sont générées en 10 heures, soit un total d’environ
50 mégabases. Ce séquençage a été réalisé sur le GS Junior de la plateforme Génotypage et Séquençage située
au 2ème
étage de l’ICM.
a) Principe du séquençage par la technologie 454 sur GS Junior
Les différentes étapes du séquençage sur GS Junior sont les suivantes :
- amplification des régions exoniques d’intérêt
- préparation de la librairie d'ADN
- amplification clonale : émulsion PCR
- enrichissement des billes positives
- réaction de séquençage : le pyroséquençage
Amplification des régions exoniques d’intérêt
Les 20 exons composants le gène CIC ont donc été découpés par amplicons de 200 à 300 pb chacun,
pour un total de 28 amplicons finaux (annexe 14). L’ensemble des régions exoniques de l’ADN tumoral ont
été amplifiées par PCR pour les 52 patients d’après le protocole en annexe 15. Une séquence universelle de
20 pb est ajoutée à l’extrémité 5’ de chaque amorce dans le but de pouvoir ajouter les adaptateurs par la suite.
Du diméthylsulfoxyde (DMSO) est ajouté dans le milieu réactionnel de la PCR afin d’augmenter le rendement
d’amplification en réduisant la formation de structure secondaire. Après purification, la taille des amplicons
est vérifiée en déposant 2µL de produits PCR au Caliper (document 12).
Préparation de la librairie d’ADN
Tous les amplicons d’un même échantillon (28 amplicons par échantillon) sont mélangés dans un
même puits de façon équimolaire. Les pools d’amplicons sont purifiés à l’aide du kit Agencourt AMPure XP
(Beckman Coulter ©
). Une touchdown PCR est ensuite réalisée (annexe 16) dans le but d’ajouter les
adaptateurs MIDs (Multiplex IDentifiers) grâce aux séquences universelles de nos amplicons. Les MIDs sont
de courtes séquences de dix paires de bases qui permettent d’identifier chaque échantillon selon son étiquette
MID lors du séquençage. Les adaptateurs contiennent, en partant de 5’, l’amorce A ou B pour le séquençage,
la clé et la séquence MID (document 13). La clé est une séquence de quatre bases permettant au séquenceur de
ne pas commencer le séquençage des fragments qui n’ont pas d’adaptateurs à leurs extrémités.
p. 28
Document 12 : Migration des amplicons du gène CIC au Caliper
Document 13 : Ajout des adaptateurs A et B par PCR tiré de la fiche technique Roche®
Légende : Les adaptateurs A et B sont ajoutés, par PCR, aux amplicons grâce à leur séquence universelle présente à chaque extrémité (vert foncé).
Adaptateur A : Amorce A – Clé – MID
Adaptateur B : Amorce B – Clé – MID
p. 29
Une Taq polymérase recombinante de haute-fidélité est utilisée afin d’éviter au maximum les erreurs
lors de l’élongation. Une touchdown PCR est réalisée dans le but de réduire au maximum les hybridations non
spécifiques et donc la formation d’amplicons non souhaités. Pour cela, la température d’hybridation est placée
10°C au-dessus de la Tm (melting Temperature) des amorces puis est diminuée de 1°C par cycle pendant
10 cycles jusqu’à atteindre la Tm des amorces. Les 10 premiers cycles permettent d’augmenter la stringence et
donc de n’amplifier que nos séquences cibles. Puis les 30 cycles suivants permettent d’augmenter le
rendement d’amplification en abaissant la température d‘hybridation à la Tm des amorces.
Les amplicons de PCR MID sont ensuite déposés au Caliper puis purifiés à l’AMPure XP. Une fois
purifié, les échantillons (contenant chacun les 28 amplicons) sont dosés au Nanodrop puis mélangés dans un
seul puits de façon équimolaire. Le tube contient donc les 52 échantillons pour lesquels il y a 28 amplicons
chacun. Ce maxi pool est purifié, dosé puis déposé au Caliper (document 14). Notre librairie d’ADN est
désormais prête.
Amplification clonale : émulsion PCR
L’émulsion PCR est réalisée dans un mélange huile/eau afin de former des microgouttelettes (ou
microréacteurs) contenant les "acteurs de la PCR" ainsi que des billes de captures, sur lesquelles sont fixées
des millions de sondes complémentaires des séquences MIDS (document 15). Afin d’amplifier de façon
clonale un seul fragment d’ADN, on va travailler en condition limitante, c'est-à-dire que dans chaque
microréacteur, on souhaite qu’il y ait soit 1, soit 0 molécule d’ADN. Pour que cela soit effectif, il faut déposer
2 molécules d’ADN/bille. Les conditions de l’émulsion PCR sont standardisées : on dispose de 5 millions de
billes que l’on mélange avec 5 µL de notre échantillon. Par conséquent, il faut déposer 10 millions de
molécules dans un volume de 5µL, on dilue donc notre échantillon à 2*106 molécules d’ADN/µL. Pour cela, à
partir de la concentration de notre maxi pool et de la taille moyenne de la totalité des amplicons, on arrive au
nombre de molécules d’ADN par µL avec la formule suivante :
Nombre de molécules/µL de maxi ADN Nombre d'Avogadro
Masse molaire moyenne d'une paire de base Taille moyenne amplicons
[ADN] : concentration en ADN en ng/µL ; Nombre d’Avogadro 6,022 1023 mol-1 ; Masse molaire moyenne d’une paire de base 656,6 g/mol ;
Taille moyenne des amplicons = 379 pb.
Enrichissement des billes positives
Une fois l’amplification faite, on réalise une étape d’enrichissement qui consiste à conserver
uniquement les billes sur lesquelles il y a eu une amplification. Pour cela, des amorces biotinylées,
complémentaires des amorces A et B, sont ajoutées et vont s’hybrider aux fragments d’ADN. Cette
particularité permet, par l’ajout de billes magnétiques recouvertes de streptavidine, de fixer, via la biotine, les
billes sur lesquelles il y a eu une amplification. Cela permet donc, par des étapes de lavage, d’éliminer toutes
les billes qui n’ont pas eu d’amplification lors de l’émulsion PCR.
p. 30
Document 14 : Migration du maxi pool au Caliper Légende : Le maxi pool contient les 52 échantillons, identifiés par des MIDs différents, pour lesquels on dispose, pour chacun, les 28 amplicons du
gène CIC.
Document 15 : Schéma de principe de l’émulsion PCR tiré de la fiche technique Roche® Légende : A. L’ADN est ajouté aux billes de captures de façon limitante afin d’obtenir statistiquement une ou zéro molécule d’ADN par bille. B. Tous
les "acteurs" de la PCR sont présents dans les microréacteurs. C. L’amplification clonale de la molécule d’ADN se fait au sein du microréacteur. D. Le
mélange huile/eau est ensuite brisé afin de récupérer les billes de captures sur lesquelles se trouvent des millions de copies du fragment initial.
p. 31
Réaction de séquençage : le pyroséquençage
La technologie 454 de chez Roche® se base sur le pyroséquençage (document 16). Les 4 bases de
l'ADN sont ajoutées de façon cyclique : une base après l'autre avec des étapes de lavage entre chaque base.
Lorsque la base ajoutée est complémentaire du brin matrice, il y a ajout de la base et libération d'un
pyrophosphate qui sera transformé en ATP par une enzyme présente dans le milieu réactionnel (la
sulfurylase). Une seconde enzyme (la luciférase) va se servir de cet ATP afin d’émettre un signal luminescent
qui sera ensuite détecté par une caméra CCD (charge coupled device).
500 000 billes sont ensuite déposées sur un support de 5cm x 2cm, appelé PicoTiterPlate (PTP), qui
contient 350 000 puits (document 17) dans le but d’obtenir statistiquement une bille par puits. Un "sandwich"
est déposé au sein de chaque puits de la PTP (document 18). Une première couche d’enzyme est déposée,
ensuite sont déposées nos billes d’ADN, puis une seconde couche d’enzyme et enfin une dernière couche est
déposée. Les deux premières couches d'enzymes contiennent la sulfurylase et la luciférase nécessaire au
séquençage. Alors que la dernière couche contient notamment de l’apyrase servant à dégrader les dNTPs en
excès ainsi que l’ATP.
Un des inconvénients de cette technologie (qu'on retrouve également dans la plupart des autres
technologies) est que dans les régions homopolymériques, le signal capté par la caméra CCD n'est pas
systématiquement proportionnel au nombre de bases ajoutées. C’est pourquoi il faut en tenir compte lors de
l’analyse bio-informatique qui en découle.
b) Traitement bio-informatique des données
En sortie du séquençage, les fichiers sont démultiplexés puis analysés à l’aide du logiciel CLC
Genomics Workbench (CLC bio®). Les séquences brutes sont alignées avec la séquence de référence du gène
CIC d’après l’algorithme de Smith-Waterman. Les variants sont détectés puis annotés via le programme
Probabilistic Variant Caller du logiciel. Une requête est ensuite réalisée via Access (Microsoft Office®) afin de
croiser les variations obtenues avec les bases de données publiques de 1 000 Genomes Project, Catalogue Of
Somatic Mutations In Cancer (COSMIC) et Exome Variant Server (EVS). Cela permet d’identifier les
variations détectées lors du séquençage qui ont déjà été décrites dans les bases de données et donc notamment
d’identifier les SNP.
Les critères de sélection des variants sont :
- couverture > 10X
- région non homopolymérique
- Au moins 5 % de reads mutés dans les 2 sens (F et R)
- SNV tumeur-spécifique
- non référencé dans 1 000 Genomes Project
- impact fonctionnel élevé ou modéré
c) Validation des mutations par séquençage direct
Tout comme le séquençage haut débit, l’étape de validation des variations détectées reste encore à ce
jour nécessaire.
Les couples d’ADN tumoral-sanguin sont amplifiés puis séquencés en utilisant le même protocole que
dans la partie 2. Seules les variations somatiques sont conservées.
p. 32
Document 16 : Schéma de principe du pyroséquençage – technologie 454 (Roche®).
tiré de la fiche technique Roche® Légende : Lors de l’incorporation d’une base, un pyrophosphate (PPi) est libéré, il va être utilisé par une sulfurylase afin de former de l’ATP qui lui-
même va servir à une luciférase pour émettre un signal luminescent qui sera capté par une caméra CCD.
Document 17 : PicoTiterPlate (PTP)
Document 18 : Mise en place du "sandwich" au sein de la PicoTiterPlate (PTP) tiré de la fiche technique Roche®
Résultats
1) Population d'étude
Les données cliniques, biologiques, pathologiques de la population d'étude sont présentées dans le
document 19.
57 patients du réseau POLA ont été inclus dans notre étude : 38 hommes et 19 femmes (sexe ratio H/F
2,0). L’âge médian était de 48 ans (extrêmes 27-81 ans). Toutes les tumeurs étaient des gliomes de grade III
confirmés par une double relecture neuropathologique centralisée (51 OIII et 6 OAIII).
L’indice de Karnofsky (IK) est un score de performance servant à mesurer la capacité d’une personne
à exécuter les actes de la vie quotidienne (e.g. habillage, toilette). Il permet donc de mesurer une éventuelle
amélioration ou aggravation du handicap lié à la maladie. Plus l’indice est faible, plus le patient est handicapé
par la maladie et plus il a besoin d’aide pour les actes de la vie quotidienne. L'IK médian de la population
d'étude est de 90 (un IK >70 indique que le patient est autonome à domicile).
La notion de survie sans progression (Progression-Free Survival – PFS), traduit le temps écoulé
jusqu'à une éventuelle progression (aggravation ou décès) de la maladie. Alors que la survie globale (Overall
Survival – OS), traduit le temps écoulé jusqu'à l'éventuel décès du patient. Ces deux notions permettent de
réaliser des courbes de survies qui sont très couramment utilisées afin d'étudier l’efficacité d’un traitement ou
la présence/absence d'un biomarqueur sur l’évolution de la pathologie.
Les manifestations cliniques au diagnostic étaient des crises d'épilepsie, des céphalées, des troubles
cognitifs et un déficit sensitivo-moteur chez respectivement 53,7%, 35,2%, 16,7% et 9,3% des patients. La
localisation de la tumeur était frontale chez 73,7% des patients et une prise de contraste sur les examens
radiologiques a été observée dans 70,0% des tumeurs.
Des figures mitotiques, des atypies cytonucléaires, de la nécrose, de la vascularisation endocrinoïde et
des calcifications étaient respectivement observées dans 100%, 59%, 27%, 95%, 86% des tumeurs.
2) Mise en évidence d'altérations génétiques et génomiques dans les OIII
a) Validation des altérations connues
Par CGH array
La co-délétion 1p/19q :
Le statut des bras chromosomiques des tumeurs a été déterminé par analyse du profil sur puce pan-
génomique de CGH array et la co-délétion 1p/19q a été observée dans 82,5% des tumeurs.
L’image présentée dans le document 20 est un profil obtenu en CGH array d’un OIII après analyse par
le logiciel Nexus Copy Number (BioDiscovery). Le nuage de points bleus représente l'ensemble des sondes
couvrant la totalité du génome humain. Les lignes situées aux extrémités en vert et rouge correspondent
respectivement aux amplifications géniques et aux délétions homozygotes. Les lignes intermédiaires verte et
rouge correspondent aux gains et aux délétions hétérozygotes. La ligne jaune correspond à la ligne de base
caractéristique du profil de la tumeur. Dans le cas où la ligne de base franchit les bornes délimitées par les
lignes verte et rouge, il y a alors une aberration chromosomique, comme ici, par exemple, avec la co-délétion
1p/19q.
Document 19 : Représentation des données cliniques, biologiques et pathologiques de la cohorte en fonction
de la co-délétion 1p/19q Légende : 1p/19q : tumeurs présentant la co-délétion des bras chromosomiques 1p et 19q ; Non 1p/19q : tumeurs ne présentant pas la co-délétion des
bras chromosomiques 1p et 19q ; OIII : oligodendrogliome anaplasique ; OAIII : oligoastrocytome anaplasique ; IK : Indice de Karnofsky ; PFS : survie
sans progression (Progression-Free Survival) ; Nb : Nombre ; OS : survie globale (Overall Survival) ; Déficit SM : déficit sensitivo-moteur ; cyto. :
cytonucléaires ; Vasc. endo. : vascularisation endocrinoïde.
1p/19q Non 1p/19q Total
Nombre | Pourcentage 47 | 82,5% 10 | 17,5% 57
Histologie OIII 45 | 95,7 6 | 60,0 51 | 89,5
OAIII 2 | 4,3 4 | 40,0 6 | 11,5
Clinique
Âge médian [min-max] 49 [31-81] 46 [27-81] 48 [27-81]
Sexe ratio (H/F) 1,9 2,3 2,0
IK médian [min-max] 90 [60-100] 85 [80-100] 90 [60-100]
PFS (semaines) 113 99 109
Nb d'évènements 15 5 20
OS (semaines) 123 99 118
Nb d'évènements 5 1 6
Signes cliniques
Épilepsie 23 | 52,3 6 | 60,0 29 | 53,7
Céphalées 16 | 36,4 3 | 30,0 19 | 35,2
Troubles cognitifs 9 | 15,8 0 | 0 9 | 16,7
Déficit SM 3 | 6,8 2 | 20,0 5 | 9,3
Localisation tumorale Frontale 36 | 76,6 6 | 60,0 42 | 73,7
Non Frontale 11 | 23,4 4 | 40,0 15 | 26,3
Prise de contraste Présence 29 | 70,7 6 | 66,7 35 | 70,0
Absence 12 | 21,3 3 | 33,3 15 | 30,0
Neuropathologie
Mitose 46 | 100 10 | 100 56 | 100
Atypies cyto. 23 | 50,0 10 | 100 33 | 58,9
Nécrose 11 | 23,9 4 | 40,0 15 | 26,8
Vasc. endo. 44 | 95,7 8 | 80,0 52 | 92,9
Calcification 39 | 84,8 9 | 100 48 | 85,7
Document 20 : Profil de CGH array d’un oligodendrogliome anaplasique Légende : Profil d’un oligodendrogliome anaplasique en CGH array présentant la co-délétion des bras chromosomiques 1p et 19q.
Par Whole-Exome Sequencing (WES)
L’analyse bio-informatique des résultats du WES a mis en évidence que 1 316 gènes sont retrouvés
mutés au moins une fois, 262 gènes sont retrouvés mutés au moins deux fois et enfin 66 gènes sont retrouvés
mutés trois fois et plus au sein de la population d’étude.
Les gènes IDH1 et IDH2 :
La présence (ou non) de mutations sur le gène IDH1 et IDH2 a été définie par séquençage direct par la
méthode Sanger et 94,7% des tumeurs présentant une mutation sur les gènes IDH1 ou IDH2.
Le gène IDH1 est retrouvé muté chez 47/57 patients. Après validation, toutes les mutations ont été
validées (82,5%). L'ensemble des mutations retrouvées sur le gène IDH1 se situent au niveau du résidu
arginine situé en position 132 (annexe 17)
Le gène IDH2 est retrouvé muté chez 6/57 patients (document 21). Après validation, toutes les
mutations ont été validées (10,5%). L'ensemble des mutations retrouvées sur le gène IDH2 se situent au niveau
du résidu arginine situé en position 172 (annexe 18)
Le gène CIC :
Le gène CIC est retrouvé muté chez 12/57 patients (document 22). Après validation, 11/57 patients
(19,3%) ont été confirmés en séquençage Sanger.
Le gène FUBP1 :
Le gène FUBP1 est retrouvé muté chez 10/57 patients (document 23). Après validation, 9/57 patients
(15,8%) ont été confirmés en séquençage Sanger.
Document 21 : Validation des mutations retrouvées sur le gène IDH2 Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2694 co-délété 15 90631838 C T Subst. V
2807 co-délété 15 90631838 C T Subst. V
2898 co-délété 15 90631838 C T Subst. V
3000 co-délété 15 90631838 C T Subst. V
3016 co-délété 15 90631838 C A Subst. V
3443 co-délété 15 90631838 C T Subst. V
Document 22 : Validation des mutations retrouvées sur le gène CIC Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2472 co-délété 19 42791371 AG - fs I
42796553 TG - fs V
2671 co-délété 19 42795715 CAGT - fs V
2688 co-délété 19 42794104 G A Subst. V
2691 co-délété 19 42793217 TCAG - fs V
2708 co-délété 19 42799059 C T Subst. V
2755 co-délété 19 42791715 C T Subst. V
2842 co-délété 19 42794521 CT - fs V
2921 co-délété 19 42791757 C T Subst. V
3063 co-délété 19 42791757 C T Subst. V
3122 co-délété 19 42797749 C A Subst. I
3320 co-délété 19 42791176 - TGTT fs V
3463 co-délété 19 42791736 A G Subst. V
Document 23 : Validation des mutations retrouvées sur le gène FUBP1 Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2402 co-délété 1 78422271 - T fs V
2472 co-délété 1 78425914 C A Stop I
2485 co-délété 1 78430858 CCATCATGGCGAT - fs V
2551 co-délété 1 78422357 AGCTTGGGCT - fs V
2716 co-délété 1 78432429 G C Subst. V
78432436 G A Subst. V
2755 co-délété 1 78430423 G - fs V
2807 co-délété 1 78430381 G T Stop V
2911 co-délété 1 78426115 ACCTCCTGGGCC - InDel V
78426115 - GAGG fs V
3126 co-délété 1 78430342 G T Subst. V
3237 co-délété 1 78430405 AT - fs V
b) Validation des altérations originales
D’après la fonction cellulaire et l'hypothétique rôle dans la gliomagenèse des gènes altérés, nous avons
décidé, de façon arbitraire, de valider une série de gènes qui nous semblait pertinent du point de vue de la
pathologie. C’est pourquoi, les mutations retrouvées sur les gènes SYNE1, FAT1 et SETD2 ont été validées par
séquençage Sanger.
Le gène SYNE1 :
Le gène SYNE1, spectrin repeat containing, nuclear envelope 1, localisé sur le chromosome 6q24 est
retrouvé muté chez 4/57 patients (document 24). Après validation, 3/57 patients (5,3%) ont été confirmés en
séquençage Sanger.
Le gène FAT1 :
Le gène FAT1, tumor suppressor homolog 1, localisé sur le chromosome 4q35 est retrouvé muté chez
3/57 patients (document 25). Après validation, toutes les mutations ont été validées (5,3%).
Le gène SETD2 :
Le gène SETD2, SET Domain containing 2, localisé sur le chromosome 3p21 est retrouvé muté chez
3/57 patients (document 26). Après validation, 2/57 patients (3,5%) ont été confirmés en séquençage Sanger.
Document 24 : Validation des mutations retrouvées sur le gène SYNE1 Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2497 co-délété 6 152728256 A T Stop V
2671 co-délété 6 152763221 C T Subst. V
2747 co-délété 6 152615124 G A Stop I
3063 co-délété 6 152734612 AT - fs V
Document 25 : Validation des mutations retrouvées sur le gène FAT1 Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2688 co-délété 4 187518845 G A Subst. V
2807 co-délété 4 187554873 G A Subst. V
2842 co-délété 4 187629096 C G Subst. V
Document 26 : Validation des mutations retrouvées sur le gène SETD2 Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Chr Position Séq réf. Altération Nature Validation
2747 co-délété 3 47162672 C T Stop V
2832 co-délété 3 47098936 C T Subst. I
2877 non co-délété 3 47163248 C T Stop V
c) Mise en évidence de voies de signalisation
Afin de mieux comprendre l’oncogenèse des OIII, nous nous sommes intéressés aux éventuelles voies
de signalisation et métabolique qui seraient altérées. Pour cela, la liste des 66 gènes retrouvés mutés dans au
moins 3 tumeurs a été analysée via l’outil d’annotation fonctionnel de DAVID Pathway.
(http://david.abcc.ncifcrf.gov). Cet outil regroupe les données de plusieurs banques de données métaboliques
comme Kegg, Biocarta, Panther, Reactome. Après analyse de la liste de gènes retrouvés altérés dans les OIII,
une liste de voies de signalisation et métabolique est générée (document 27). Avec une p-value égale à 0,0017,
la voie de signalisation Notch est celle qui sort en première avec 4 gènes impliqués.
Les 4 gènes impliqués dans la voie Notch sont : (i) Notch 1 (NOTCH1), (ii) Notch 2 (NOTCH2), (iii)
Recombination signal Binding Protein for immunoglobulin kappa J region (RBPJ) et (iv) C-Terminal Binding
Protein 2 (CTBP2). 14 mutations sur ces gènes ont été retrouvées sur un total de 11 patients (document 28).
Après validation, 8/57 patients (14,0%) ont été confirmés comme étant altérés sur la voie de signalisation
Notch (i.e. présentant au moins une mutation génique sur la voie Notch).
Document 27 : Mise en évidence de voies de signalisation/métabolique impliquées dans l’oncogenèse des
OIII. tiré de http://david.abcc.ncifcrf.gov
Légende : Term : termes relatifs aux gènes impliqués dans la voie. Count : nombre de gènes impliqués dans la voie. % : pourcentage de gènes impliqués
dans la voie par rapport au nombre de gènes totaux.
Document 28 : Validation des mutations retrouvées sur la voie de signalisation Notch Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger.
Tumeur Statut 1p/19q Gène Chr Position Séq réf. Altération Nature Validation
2472 co-délété RBPJ 4 26426018 AGTT - fs I
2532 co-délété NOTCH1 9 139412245 G T Subst. V
2691 co-délété RBPJ 4 26426018 AGTT - fs V
2702 co-délété
RBPJ 4 26426316 AACA - fs V
RBPJ 4 26426318 A T Subst. V
RBPJ 4 26426321 G A Subst. V
2819 co-délété NOTCH1 9 139412278 G A Subst. V
2842 co-délété CTPB2 10 126678125 T - fs I
2877 non co-délété NOTCH1 9 139412254 ACG - InDel V
2915 co-délété NOTCH1 9 139412204 G A Subst. V
NOTCH1 9 139413137 - AGAA fs V
3000 co-délété NOTCH2 1 120469171 G - fs V
3063 co-délété CTPB2 10 126678125 T - fs I
3463 co-délété NOTCH2 1 120491683 AA - fs V
Discussion et perspectives
Discussion du matériel et méthodes
Les OIII sont des tumeurs cérébrales primitives malignes très hétérogènes d’un patient à l’autre. Le
traitement des patients présentant un OIII repose sur la neurochirurgie, la radiothérapie et la chimiothérapie.
Malgré ce traitement lourd, les OIII ont tendance à récidiver à plus ou moins long terme. De nouveaux
traitements plus efficaces et mieux tolérés sont donc nécessaires.
Le développement de nouveaux traitements passe par une meilleure connaissance de l’oncogenèse
moléculaire des OIII qui, elle-même nécessite l'analyse d’un nombre important de tumeurs sur un ensemble de
biomarqueurs moléculaires.
Les OIII sont des tumeurs rares. En effet, environ 300 à 600 cas sont diagnostiqués chaque année en
France. Outre son objectif d’harmoniser la prise en charge médicale des patients souffrant d’OIII sur tout le
territoire français, le réseau POLA encourage la recherche biologique, notamment par la constitution d'une
importante biobanque d'échantillons provenant de patients souffrant d'OIII. À notre connaissance, la
tumorothèque POLA constitue la plus grande tumorothèque dédiée aux OIII dans le monde. Elle permet donc
des études moléculaires sur un grand nombre d'échantillons. Néanmoins, cette tumorothèque, constituée de
manière prospective à partir de 2008, ne permet pas encore de faire des études pronostiques compte tenu du
recul encore limité.
La convergence des grandes biobanques de tumeurs et l'arrivée des techniques de biologie moléculaire
à haut débit ont permis de faire des avancées considérables dans la caractérisation moléculaire des OIII. En
effet, les puces pan-génomiques et le séquençage à haut débit ont permis de mettre en évidence et/ou de
préciser des altérations génétiques dans les OIII : (i) la co-délétion des bras chromosomiques 1p et 19q dans
75%, (ii) les mutations des gènes IDH1 et IDH2 dans 80%, (iii) les mutations des gènes CIC dans 50 à 60% et
(iv) les mutations des gènes FUBP1 dans 15 à 20%. Ces techniques de biologie moléculaire ont néanmoins des
limites et nécessitent encore des validations par des approches conventionnelles. Au cours de notre étude,
94/102 (92,2%) des mutations détectées par Next Generation Sequencing (NGS) ont été validées par
séquençage à la méthode Sanger. Dans le futur, de nouveaux séquenceurs plus sensibles, utilisant des faibles
quantités de matériel voire de l’ADN issue d'une cellule unique permettront encore d’accélérer les découvertes
sur la biologie des OIII.
Discussion des résultats
Nos résultats confirment des résultats clinico-biologiques connus dans la littérature concernant les OIII
mais ils apportent également de nouvelles données originales. Les résultats moléculaires (document 29)
confirmatoires et originaux seront discutés successivement.
Résultats confirmatoires :
Les gènes IDH1 et IDH2 sont mutés respectivement dans 82,5% et 10,5% des échantillons de notre
série. Toutes les tumeurs 1p/19q co-délétées sont IDH mutées. En revanche, seulement 3 tumeurs non 1p/19q
co-délétées sont IDH-mutées.
Par WES, le gène CIC est retrouvé muté dans 19,3% de notre population et dans respectivement 34,0%
et 0% des OIII 1p/19q co-délétés et des OIII non 1p/19q co-délétés. On a observé un manque de sensibilité
pour la détection de mutations sur le gène CIC en NGS car le pourcentage de variants est significativement
plus faible que celui déjà décrit dans la littérature des OIII 8–11
.
Il nous a donc semblé nécessaire de vérifier le pourcentage de variants détectés lors du WES sur le
gène CIC. C’est pourquoi, nous avons procédé au séquençage moyen débit du gène CIC par une technologie
complémentaire (454 – Roche®). 52 tumeurs oligodendrogliales anaplasiques 1p/19q co-délétées ont donc été
séquencées puis validés par séquençage Sanger sur l'ADN tumoral et constitutionnel. Il s’avère que 48,1% des
tumeurs sont retrouvées mutées (document 30) ce qui corrèle bien avec les données déjà connues sur ce gène.
Par ces résultats, on a pu mettre en évidence la présence de 8 faux-négatifs qui n'avaient pas été détectés en
WES.
Dans le but de connaître la raison du nombre de faux-négatifs sur ce gène, à partir des fichiers bruts
d’alignement (.bam) provenant du séquençage whole-exome, j’ai visualisé, pour chaque faux-négatif, les
séquences du gène à l’aide du logiciel Integrative Genomics Viewer (IGV – Broad Institute®). Ce logiciel
permet d’aligner des fichiers .bam avec un génome de référence. Le génome humain hg 19 (UCSC) est
téléchargé puis chargé sur IGV.
Après visualisation de l’ensemble des faux-négatifs, on observe que pour tous, la couverture de
l’ensemble du gène CIC est faible voire nulle pour certains exons. En effet, on voit bien, à partir de
l'annexe 19, que la région où une mutation a été détectée par séquençage au GS Junior est très faiblement
couverte (3 reads) par séquençage whole-exome. On observe bien que sur les 3 reads, deux d’entre eux
présentent la mutation attendue (tumeur 2551 : C => T). Cependant la couverture étant trop faible, la mutation
ne passe pas le filtre et est donc éliminée. A contrario, l'annexe 20 présente une tumeur mutée sur le gène
IDH1 (R132H : CGT => CAT). On observe bien que la région génomique 2q33.3 est beaucoup mieux
couverte (> 50 reads) et permet donc une meilleure détection de la mutation.
Ce phénomène étant étendu à l’ensemble des faux-négatifs, on peut s’expliquer du fait de la perte des
bras chromosomiques 1p et 19q qui est très répandue dans les OIII (tous les faux-négatifs présentent la co-
délétion 1p/19q). En effet, les tumeurs 1p/19q co-délétées ont une quantité de matériel génétique de ces
régions inférieure aux non co-délétés. Il se pourrait donc que lors de la capture des exons, les gènes se trouvant
sur les positions génomiques 1p et 19q (e.g. le gène CIC) soient moins bien capturés et donc moins bien
couverts lors du séquençage. Cela expliquerait donc le fait que 8 tumeurs ne sont pas retrouvées mutées sur le
gène CIC par WES mais le sont par séquençage au GS Junior.
Le gène FUBP1 est retrouvé muté dans respectivement 19,1% et 0% des OIII 1p/19q co-délétés et des
OIII non 1p/19q co-délétés. Le pourcentage de variants corrèle avec celui retrouvé dans la littérature qui est de
15 à 20% dans les OIII selon les études.
Document 29 : Représentation schématique des altérations moléculaires retrouvées dans la population d’étude
Document 30 : Validation des mutations retrouvées sur le gène CIC par séquençage moyen débit Légende : Chr : chromosome ; Statut 1p/19q : statut de la co-délétion des bras chromosomiques 1p et 19q ; Séq. Réf : séquence de référence ;
Altération : séquence retrouvée lors du séquençage whole-exome ; Subst. : mutation ponctuelle de type SNV ; fs : mutation entrainant un changement du
cadre de lecture (frameshift) ; InDel : insertion ou délétion n’entrainant pas de changement du cadre de lecture ; Stop : mutation entrainant l’apparition
d’un codon stop ; V : mutation validée par séquençage Sanger I : mutation invalidée par séquençage Sanger ; NA : non applicable.
Tumeur Chr Position Séq réf. Altération Nature Validation Somatique
2472 19 42791371 AG - fs I NA
19 42796553 TG - fs V oui
2497 19 42795829 C T Stop V oui
2543 19 42796244 C T Stop V NA
2551 19 42791757 C T Subst. V oui
2618 19 42796240 C - fs V NA
2661 19 42797282 AG - fs V NA
2668 19 42791716 G A Subst. V oui
2671 19 42795715 CAGT - fs V oui
2702 19 42793076 T - fs V oui
2716 19 42791863 AC - fs V oui
2754 19 42791782 - GGGCCCTGGTCCA
CCAGCGTCATC fs V NA
2755 19 42791715 C T Subst. V oui
2830 19 42794737 T - fs V oui
2832 19 42795048 G T Stop V oui
2878 19 42799059 C T Subst. V oui
2921 19 42791757 C T Subst. V oui
3016 19 42795521 - T fs V oui
3032 19 42799067 GA - fs V oui
3063 19 42796558 G - fs V oui
3125 19 42791757 C T Subst. V oui
3149 19 42795270 G T Subst. I NA
3327 19 42797278 C T Stop V oui
3464 19 42799039 A G Subst. V NA
3472 19 42791239 C T Subst. V non
19 42791724 A - fs V oui
3551 19 42791758 G A Subst. V NA
3557 19 42791859 T C Subst. V oui
Résultats originaux :
Trois gènes intéressants, sur les bases de nos connaissances de leurs fonctions biologiques, ont été
retrouvés mutés de manière récurrente dans les OIII : SYNE1, FAT1 et SETD2
SYNE1 (Spectrin repeat containing, nuclear envelope 1) est muté dans 5,3% des tumeurs de notre
étude. Il s’agit d'un gène de 146 exons localisé dans la région chromosomique 6q24 codant pour une protéine
des membranes nucléaires. Cette dernière interagit avec des filaments d’actine et la lamina du cytoplasme et
participe au positionnement et à la forme du noyau dans la cellule. Elle jouerait notamment un rôle dans la
migration neuronale chez la souris 26,27
.
FAT1 (tumor suppressor homolog 1) est muté également dans 5,3% des tumeurs de notre série. Il
s’agit d’un gène de 27 exons localisé sur la région chromosomique 4q35 codant pour une protéine appartenant
à la famille des cadhérines. Elle est impliquée dans les liaisons cellules/cellules et joue un rôle dans la polarité
et la migration cellulaire 28,29
.
SETD2 (SET domain containing 2) est muté dans 3,5% des tumeurs de notre cohorte et dans 6,4% des
tumeurs 1p/19q co-délétées. Il s’agit d’un gène de 21 exons localisé sur la région chromosomique 3p21 codant
pour une protéine responsable de la méthylation de l’histone H3 et serait donc impliqué dans la modulation de
la structure chromatinienne 30
. De plus, il a été décrit que la mutation du gène SETD2 conduirait à une
diminution de la méthylation des histones et engendrait une transcription accrue du gène TERT ce qui
expliquerait le rôle suppresseur de tumeur du gène SETD2 31
.
Implication de la voie Notch :
Compte tenu de l’absence de nouvelle mutation génique ponctuelle très fréquente (≥25%), nous nous
sommes intéressés aux voies de signalisation intracellulaires dérégulées par des mutations génétiques rares. De
manière intéressante, la voie Notch via des mutations génétiques portant sur des gènes différents est touchée
dans ~15% des OIII (document 31).
La voie Notch apparait intéressante dans l’oncogenèse des OIII pour plusieurs raisons :
(i) La voie Notch joue un rôle clé dans le développement du système nerveux. En effet, l’activation
de la voie Notch induit une répression de la différenciation vers un sous-type neuronal et
oligodendrocytaire tout en induisant une différenciation astrocytaire 32,33
.
(ii) Plusieurs études ont montré l’importance de la voie Notch dans la formation et au développement
tumoral. Le rôle suppresseur de tumeur ou oncogène des gènes de la voie de signalisation n’est
pas encore clairement défini.
(iii) De plus, il agirait notamment sur l’oncogène c-myc 34
et il a été montré, en 2011, que la
surexpression de la protéine NOTCH1 serait associée à un facteur de mauvais pronostic dans les
gliomes 35
(document 32).
Cette voie de signalisation, altérée dans près de 15% de notre population d'étude, constitue donc une cible
privilégiée afin de comprendre les mécanismes conduisant à la gliomagenèse des OIII. Dans l’idéal, afin de
valider ces hypothèses il faudrait étudier, sur le plan fonctionnel, le rôle de la voie Notch dans les OIII.
Document 31 : Représentation des données cliniques, biologiques, pathologiques et moléculaire de la cohorte
en fonction de l'altération de la voie Notch Légende : Notch mutée : voie de signalisation Notch altérée ; Notch non mutée : voie de signalisation Notch non altérée ; OIII : oligodendrogliome
anaplasique ; OAIII : oligoastrocytome anaplasique ; IK : Indice de Karnofsky ; PFS : survie sans progression (Progression-Free Survival) ; Nb :
Nombre ; OS : survie globale (Overall Survival) ; Déficit SM : déficit sensitivo-moteur ; cyto. : cytonucléaires ; Vasc. endo. : vascularisation
endocrinoïde.
Notch mutée Notch non mutée Total
Nombre | Pourcentage 8 | 14,0% 49 | 86,0% 57
Histologie OIII 7 | 87,5 44 | 89,8 51 | 89,5
OAIII 1 | 12,5 5 | 10,2 6 | 11,5
Clinique
Âge médian [min-max] 48 [37-81] 48 [27-81] 48 [27-81]
Sexe ratio (H/F) 7 1,7 2,0
IK médian [min-max] 90 [60-100] 90 [70-100] 90 [60-100]
PFS (semaines) 106 109 109
Nb d'évènements 3 17 20
OS (semaines) 106 123 118
Nb d'évènements 2 4 6
Signes cliniques
Épilepsie 4 | 50,0 25 | 54,3 29 | 53,7
Céphalées 4 | 50,0 15 | 32,6 19 | 35,2
Troubles cognitifs 2 | 25,0 7 | 15,2 9 | 16,7
Déficit SM 1 | 12,5 4 | 8,7 5 | 9,3
Localisation tumorale Frontale 4 | 50,0 38 | 77,5 42 | 73,7
Non Frontale 4 | 50,0 11 | 22,5 15 | 26,3
Prise de contraste Présence 6 | 75,0 29 | 69,0 35 | 70,0
Absence 2 | 25,0 13 | 31,0 15 | 30,0
Neuropathologie
Mitose 8 | 100 48 | 100 56 | 100
Atypies cyto. 6 | 75,0 27 | 56,25 33 | 58,9
Nécrose 4 | 50,0 11 | 22,9 15 | 26,8
Vasc. endo. 7 | 87,5 45 | 93,75 52 | 92,9
Calcification 5 | 62,5 20 | 41,2 48 | 85,7
Moléculaire
Mutation IDH1/IDH2 8 | 100 46 | 93,9 54 | 94,7
Mutation CIC 3 | 37,5 16 | 32,7 19 | 33,3
Mutation FUBP1 0 | 0 9 | 18,4 9 | 15,8
Co-délétion 1p/19q 7 | 87,5 40 | 81,6 47 | 82,5
Document 32 : Courbe de survie des gliomes astrocytaires en fonction de l’expression de la protéine NOTCH1 tiré de Li J. et al., 2011 35
Légende : - : expression nulle ; + : faible expression; ++ : expression modérée ; +++ : forte expression
Conclusion personnelle
Pour conclure, cette année d’apprentissage fut pour moi une expérience professionnelle instructive et
enrichissante. J’ai été au cœur de la vie d’une équipe de recherche à la pointe de la neuro-oncologie. Cela m’a
permis de me former à de nombreuses technologies modernes et d’acquérir de nouvelles notions dans un
domaine qui m’était alors inconnu auparavant mais qui m’a subjugué.
Cette expérience a changé ma façon de travailler au sein d’un laboratoire, tant sur le professionnalisme
que se doit de tenir un laboratoire de diagnostic par rapport à ses prestataires, que sur l’organisation et la
méthodologie à adopter au quotidien.
Ce fut une année dont je garderais énormément de souvenirs et que je n’oublierais jamais. Ce fut pour
moi une excellente expérience que je recommande vivement et que je referais sans aucune hésitation.
Références bibliographiques
[1] Louis D N et al., The 2007 WHO classification of tumours of the central nervous system. Acta Neuropathol.
2007. 114, 97–109
[2] Stupp R et al., Radiotherapy plus concomitant and adjuvant temozolomide for glioblastoma. N. Engl. J. Med.
2005. 352, 987–996
[3] Gerlinger M et al., Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N.
Engl. J. Med. 2012. 366, 883–892
[4] Reifenberger J et al., Molecular genetic analysis of oligodendroglial tumors shows preferential allelic
deletions on 19q and 1p. Am. J. Pathol. 1994. 145, 1175–1190
[5] Cairncross J G et al., Specific genetic predictors of chemotherapeutic response and survival in patients with
anaplastic oligodendrogliomas. J. Natl. Cancer Inst. 1998. 90, 1473–1479
[6] Yan H et al., IDH1 and IDH2 mutations in gliomas. N. Engl. J. Med. 2009. 360, 765–773
[7] Hartmann C et al., Type and frequency of IDH1 and IDH2 mutations are related to astrocytic and
oligodendroglial differentiation and age: a study of 1,010 diffuse gliomas. Acta Neuropathol. 2009. 118, 469–
474
[8] Bettegowda C et al., Mutations in CIC and FUBP1 contribute to human oligodendroglioma. Science 2011.
333, 1453–1455
[9] Jiao Y et al., Frequent ATRX, CIC, FUBP1 and IDH1 mutations refine the classification of malignant
gliomas. Oncotarget 2012. 3, 709–722
[10] Sahm F et al., CIC and FUBP1 mutations in oligodendrogliomas, oligoastrocytomas and astrocytomas. Acta
Neuropathol. 2012. 123, 853–860
[11] Yip S et al., Concurrent CIC mutations, IDH mutations, and 1p/19q loss distinguish oligodendrogliomas from
other cancers. J. Pathol. 2012. 226, 7–16
[12] Killela P J et al., TERT promoter mutations occur frequently in gliomas and a subset of tumors derived from
cells with low rates of self-renewal. Proc. Natl. Acad. Sci. U. S. A. 2013. 110, 6021–6026
[13] Arita H et al., Upregulating mutations in the TERT promoter commonly occur in adult malignant gliomas and
are strongly associated with total 1p19q loss. Acta Neuropathol. 2013. 126, 267–276
[14] Nigro J M et al., Mutations in the p53 gene occur in diverse human tumour types. Nature 1989. 342, 705–708
[15] Ueki K et al., CDKN2/p16 or RB alterations occur in the majority of glioblastomas and are inversely
correlated. Cancer Res. 1996. 56, 150–153
[16] Wong A J et al., Increased expression of the epidermal growth factor receptor gene in malignant gliomas is
invariably associated with gene amplification. Proc. Natl. Acad. Sci. U. S. A. 1987. 84, 6899–6903
[17] Wong A J et al., Structural alterations of the epidermal growth factor receptor gene in human gliomas. Proc.
Natl. Acad. Sci. U. S. A. 1992. 89, 2965–2969
[18] Dolecek T A Propp J M Stroup N E & Kruchko C., CBTRUS statistical report: primary brain and central
nervous system tumors diagnosed in the United States in 2005-2009. Neuro-Oncol. 2012. 14 Suppl 5, v1–49
[19] Mokhtari K Uro-Coste E Jouvet A & Figarella-Branger D., Référentiel de prise en charge pathologique d’un
gliome diffus de l’adulte dans le cadre du réseau POLA. 2013
[20] Reyes G & Dehais C., Oligodendrogliomes anaplasiques Corrélations IRM cérébrale et altérations
moléculaires. 2013
[21] Idbaih A et al., Genomic aberrations associated with outcome in anaplastic oligodendroglial tumors treated
within the EORTC phase III trial 26951. J. Neurooncol. 2011. 103, 221–230
[22] Dang L et al., Cancer-associated IDH1 mutations produce 2-hydroxyglutarate. Nature 2009. 462, 739–744
[23] Labussière M et al., All the 1p19q codeleted gliomas are mutated on IDH1 or IDH2. Neurology 2010. 74,
1886–1890
[24] Sanger F Nicklen S & Coulson A R., DNA sequencing with chain-terminating inhibitors. Proc. Natl. Acad.
Sci. U. S. A. 1977. 74, 5463–5467
[25] Pinkel D et al., High resolution analysis of DNA copy number variation using comparative genomic
hybridization to microarrays. Nat. Genet. 1998. 20, 207–211
[26] Smith E R Zhang X-Y Capo-Chichi C D Chen X & Xu X-X., Increased expression of Syne1/nesprin-1
facilitates nuclear envelope structure changes in embryonic stem cell differentiation. Dev. Dyn. Off. Publ. Am.
Assoc. Anat. 2011. 240, 2245–2255
[27] Taranum S et al., LINC complex alterations in DMD and EDMD/CMT fibroblasts. Eur. J. Cell Biol. 2012.
91, 614–628
[28] Tanoue T & Takeichi M., New insights into Fat cadherins. J. Cell Sci. 2005. 118, 2347–2353
[29] Lee S et al., Differentially expressed genes regulating the progression of ductal carcinoma in situ to invasive
breast cancer. Cancer Res. 2012. 72, 4574–4586
[30] Dalgliesh G L et al., Systematic sequencing of renal carcinoma reveals inactivation of histone modifying
genes. Nature 2010. 463, 360–363
[31] Newbold R F & Mokbel K., Evidence for a tumour suppressor function of SETD2 in human breast cancer: a
new hypothesis. Anticancer Res. 2010. 30, 3309–3311
[32] Wang S et al., Notch receptor activation inhibits oligodendrocyte differentiation. Neuron 1998. 21, 63–75
[33] Grandbarbe L et al., Delta-Notch signaling controls the generation of neurons/glia from neural stem cells in a
stepwise process. Dev. Camb. Engl. 2003. 130, 1391–1402
[34] Weng A P et al., c-Myc is an important direct target of Notch1 in T-cell acute lymphoblastic
leukemia/lymphoma. Genes Dev. 2006. 20, 2096–2109
[35] Li J et al., Notch1 is an independent prognostic factor for patients with glioma. J. Surg. Oncol. 2011. 103,
813–817
Annexes
Annexe 1 : Distribution des tumeurs cérébrales primitives malignes
Annexe 2 : Répartition des mutations en fonction de leurs fréquences sur les gènes IDH1 et IDH2
Annexe 3 : Principe de la purification de l’ADN génomique via le kit iPrep™
ChargeSwitch® gDNA Tissue
Kit (Invitrogen™
)
Annexe 4 : Quantification et qualification des ARN extraits au Bioanalyzer2100 (Agilent®)
Annexe 5 : Schéma de principe du séquençage par la méthode Sanger
Annexe 6 : Programme des cycles d’amplification de la PCR classique
Annexe 7 : Milieu réactionnel de la PCR classique
Annexe 8: Migration des produits de PCR classique au Caliper
Annexe 9 : Principe de la purification des produits de PCR via le kit Agencourt AMPure XP
Annexe 10 : Milieu réactionnel de la réaction de séquençage
Annexe 11 : Programme des cycles d’amplification de la réaction de séquençage
Annexe 12 : Références et prix des kits pour CGH array
Annexe 13 : Traitement bio-informatique du Whole-Exome Sequencing
Annexe 14 : Liste des amorces du gène CIC
Annexe 15 : Protocole d’amplification du gène CIC
Annexe 16 : Ajout des MIDs par touchdown PCR
Annexe 17 : Mutation R132H sur le gène IDH1
Annexe 18 : Mutation R172K sur le gène IDH2
Annexe 19 : Visualisation sur IGV d’une tumeur présentant une mutation (C => T) sur le gène CIC
Annexe 20 : Visualisation sur IGV d’une tumeur présentant la mutation R132H (CGT => CAT) sur le gène
IDH1
Annexe 1 : Distribution des tumeurs cérébrales primitives malignes adapté de Dolecek et al., 2012 18
Annexe 2 : Répartition des mutations en fonction de leurs fréquences sur les gènes IDH1 et IDH2 adapté de Hartmann et al., 2009 7
Légende : Répartition des mutations retrouvées dans les gènes IDH1 et IDH2 dans une cohorte de 1 010 gliomes.
Gène Variation nucléotidique Changement de l'acide aminé n | %
IDH1
G395A R132H 664 | 92,7%
C394T R132C 29 | 4,2%
C394A R132S 11 | 1,5%
C394G R132G 10 | 1,4%
G395T R132L 2 | 0,2%
IDH2
G515A R172K 20 | 64,5%
G515T R172M 6 | 19,3%
A514T R172W 5 | 16,2%
Annexe 3 : Principe de la purification de l’ADN génomique via le kit iPrep™
ChargeSwitch® gDNA Tissue
Kit (Invitrogen™
) tiré de http://products.invitrogen.com
54%
3,3% 5,9%
9,5%
6,2%
7,2%
13,7% glioblastome (GBM)
oligoastrocytome anaplasique (OAIII)
astrocytome anaplasique (AIII)
astrocytome (AII)
oligodendrogliome anaplasique (OIII)
non spécifié
autres gliomes
Annexe 4 : Quantification et qualification des ARN extraits au Bioanalyzer2100 (Agilent®)
Annexe 5 : Schéma de principe du séquençage par la méthode Sanger tiré de http://www.biopsci.com
Annexe 6 : Programme des cycles d’amplification de la PCR classique
Réactif [initiale] 1 réaction (20 µL) [finale]
FastStart PCR Master 2X 10 µL 1X
Amorce sens 20 µM 1 µL 1 µM
Amorce anti-sens 20 µM 1 µL 1 µM
ADN 50 ng/µL 1 µL 50 ng
Eau
7 µL
Annexe 7 : Milieu réactionnel de la PCR classique
Nombre de cycles Température Durée
Dénaturation 94°C 5 min
Dénaturation 94°C 30 sec
Hybridation x40 60°C 45 sec
Élongation 72°C 1 min
Élongation finale 72°C 10 min
Conservation 8°C ∞
Annexe 8: Migration des produits de PCR classique au Caliper
Annexe 9 : Principe de la purification des produits de PCR via le kit Agencourt AMPure XP tiré de https://www.beckmancoulter.com
Annexe 10 : Milieu réactionnel de la réaction de séquençage
Réactif [initiale] 1 réaction (10 µL) [finale]
Big Dye Terminator V3.1
1 µL
Amorce sens ou anti-sens 2 µM 2 µL 0,4 µM
Sequencing Buffer 5X 1,5 µL 0,75X
Produits PCR purifiés
2 µL
Eau
3,5 µL
Annexe 11 : Programme des cycles d’amplification de la réaction de séquençage
Nombre de cycles Température Durée
Dénaturation 95°C 1 min
Dénaturation 95°C 10 sec
Hybridation x25 50°C 5 sec
Élongation 60°C 4 min
Conservation 8°C ∞
Annexe 12 : Références et prix des kits pour CGH array tiré de http://www.genomics.agilent.com
Produit Référence Prix catalogue ($)
lames SurePrint G3 Human CGH Microarray Kit, 4x180k (Agilent) 3 363
kit de marquage SureTag Complete DNA Labeling Kit (Agilent) 2 494
kit d'hybridation Oligo aCGH/ChIP-on-chip Hybridization Kit (Agilent) 502
kit de lavage Oligo aCGH/ChIP-on-chip Wash Buffer 1, 2 (Agilent) 495
supports de lames Hybridization Gasket Slide Kit (Agilent) 185
Annexe 13 : Traitement bio-informatique du Whole-Exome Sequencing
Annexe 14 : Liste des amorces du gène CIC
Nom d'amorce séquence (5'-3') Taille
CICex1F TGAGGAGGTGCGAGCCC
CICex1R ACCCCCACCACCGTTACTCC
CICex2F TCACCTGGCTCCTTTCCA
CICex2R AACAGCTGCCGACTCAG
CICex3F ACCTCTGTGTCCCCAGAACC
CICex3R CTCAGGGAACTCACGCATC
CICex4F CAGAGACATGGCCCTCAC
CICex4R TTCTCCCGCTGCATTAAACA
CICex5F GTCCTAACTGTCCCGCTCTG
CICex5R CCAAGAGGCAACAGCGTTA
CICex6F GCCTTCCAGGTAACGCTGT
CICex6R AGAGCCAAGGGGCTGACTA
CICex7F CTGTCATAGCGCCACTCTCT
CICex7R CTGCCCTGGACAGGTTCC
CICex8F ACCCTCTCTGCCACCTATCC
CICex8R GGTCCTGGGCAAGATTCTG
CICex9F CCTTCCTGGACAGCACTC
CICex9R AAACAGACATTCCCATGGCTT
CICex10F-1 TCGGAGTGTCCTGACCTG
CICex10R-1 CTGCCCTGACCAGACTC
CICex10F-2 TCCTCGCCTGCTTCCT
CICex10R-2 CACCAGTGTCTGCAGGAT
CICex10F-3 ACCAGGCCCCTCAGTCAT
CICex10R-3 CATTTGGAGACGCCTCAG
CICex10F-4 CATCGCCTCTAAGCCCTT
CICex10R-4 CTGGGCAATGAACTGGACA
CICex10F-5 GCCACTGTCACTAACCTACTGG
CICex10R-5 AAACGGATGCTGGTGGTG
CICex10F-6 GGAATCACCCAGGTACAGTAC
CICex10R-6 AAGGGAGCCAAACAGGAC
CICex11F TGTTTGGCTCCCTTGTAACC
CICex11R GCCAACATCCAGCAGGTAGA
CICex12F AGGTCTTGGTCTTCCCCT
CICex12R ATAGGTGATTCTGCCGCAG
CICex13F TTACCTCACTCCTCCCCATT
CICex13R GAAGCAGGAGACCAAGTTAGG
CICex14F-1 CCCTAACTTGGTCTCCTGCTT
CICex14R-1 TGGCCACAGTGTAGACCAG
CICex14F-2 ATTTTACTCTGGCAGCCCTG
CICex14R-2 AGGTCATGGAACCTGCTAGT
CICex15F-1 TGTCAGATCAACCCAGAGCA
CICex15R-1 CCCCTCAAGCTCAGACTC
297
298
295
275
295
284
235
276
288
275
295
320
240
278
285
287
288
187
279
265
273
CICex15F-2 AGTCCGAGAGCCAACTGC
CICex15R-2 GAGAGACACACAGGCATGGA
CICex16F ATCTCCCTGCCCATCTCC
CICex16R CCTAACACGCTCCACCAAG
CICex17F CTTGGTGGAGCGTGTTAGG
CICex17R CTGCCCTCCACCTAAGGA
CICex18F AGGAAGAACTCCACGGGTA
CICex18R CCTTCCAGAGACCCACTC
CICex19F TCCCCTGTGAAATAGAATGCAG
CICex19R TACAGATAAGTCCCACCCGA
CICex20F-1 GCTCCCCACCGTTTTTCTAT
CICex20R-1 AGAGTCCGAGCTGGGTGAG
CICex20F-2 TCCTCTCCCTGTACCGC
CICex20R-2 CCCCACATACTGTCCATGT
294
287
265
291
266
307
278
Annexe 15 : Protocole d’amplification du gène CIC
Réactif [initiale] 1 réaction (10 µL) [finale]
FastStart PCR Master 2X 5 µL 1X
Amorce sens 10 µM 1 µL 1 µM
Amorce anti-sens 10 µM 1 µL 1 µM
DMSO 100% 0,7 µL 7%
ADN 20 ng/µL 1 µL 20 ng
Eau
7 µL
Nombre de cycles Température Durée
Dénaturation 94°C 5 min
Dénaturation 94°C 15 sec
Hybridation x40 60°C 45 sec
Élongation 72°C 1 min
Élongation finale 72°C 10 min
Conservation 8°C ∞
Annexe 16 : Protocole d'ajout des MIDs par touchdown PCR
Réactif [initiale] 1 réaction (25 µL) [finale]
FastStart Hight Fidelity 5 U/µL 0,25 µL 1,25 U
dNTP 10 µM 0,5 µL 0,2 µM
Amorce MID sens 10 µM 0,5 µL 0,2 µM
Amorce MID anti-sens 10 µM 0,5 µL 0,2 µM
Tampon 10X 2,5 µL 1X
DMSO 100% 1,25 µL 5%
Pools d’amplicons purifiés
1 µL
Eau
18,5 µL
Nombre de cycles Température Durée
Dénaturation 94°C 10 min
Dénaturation 94°C 45 sec
Hybridation x10 65°C * 45 sec
Élongation 72°C 2 min
Dénaturation 94°C 45 sec
Hybridation x30 55°C 45 sec
Élongation 72°C 2 min
Élongation finale 72°C 10 min
Conservation 8°C ∞
* : diminution de 1°C/cycle
Annexe 17 : Mutation R132H sur le gène IDH1 Légende : Électrophorégramme d’une tumeur présentant la mutation R132H (CAT > CGT) sur le gène IDH1.
Annexe 18 : Mutation R172K sur le gène IDH2 Légende : Électrophorégramme d’une tumeur présentant la mutation R172K (AGG > AAG) sur le gène IDH2.
Annexe 19 : Visualisation sur IGV d’une tumeur présentant une mutation (C => T) sur le gène CIC
Annexe 20 : Visualisation sur IGV d’une tumeur présentant la mutation R132H (CGT => CAT) sur le gène
IDH1