développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 réseaux ......

86
Développement d’un algorithme permettant la prédiction des métastases à partir de mutations germinales et celles du clone fondateur chez des patients atteints du cancer. Mémoire Jean-Sébastien Milanese Maîtrise en biologie cellulaire et moléculaire Maître ès sciences (M. Sc.) Québec, Canada © Jean-Sébastien Milanese, 2018

Upload: others

Post on 27-Jul-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

Développement d’un algorithme permettant la prédiction des métastases à partir de mutations germinales et celles du clone

fondateur chez des patients atteints du cancer.

Mémoire

Jean-Sébastien Milanese

Maîtrise en biologie cellulaire et moléculaire Maître ès sciences (M. Sc.)

Québec, Canada

© Jean-Sébastien Milanese, 2018

Page 2: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

Développement d’un algorithme permettant la prédiction des métastases à partir de mutations germinales et celles du clone

fondateur chez des patients atteints du cancer.

Mémoire

Jean-Sébastien Milanese

Sous la direction de :

Arnaud Droit, directeur de recherche

Page 3: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking
Page 4: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

iii

RÉSUMÉ

Avec les constantes avancées du séquençage de nouvelle génération (NGS), la

quantité de données disponibles devient massive. En parallèle, les méthodes de

détection au cancer demeurent très spécifiques et peu efficaces. De plus, le taux

de survie des patients est directement relié à la progression tumorale et par

conséquent, aux méthodes de détection. Malgré des avancées technologiques

très importantes dans les dernières années, le taux de mortalité du cancer ne

cesse d’augmenter. L’importance de développer des nouvelles méthodes de

détection applicables à tous les types de cancer devient une nécessité. Jusqu’à

présent, il n’existe aucun modèle permettant d’utiliser le séquençage de nouvelle

génération qui permet la prédiction de caractéristiques cancéreuse (ex :

récurrence, résistance, etc.). Les sections suivantes démontrent la création d’un

modèle utilisant des mutations somatiques et germinales pour prédire la

récurrence et son applicabilité au travers de tous les types de cancers (et même

différentes maladies). En utilisant des signatures géniques (combinaisons de

gènes) spécifiques à chaque cancer, nous avons été en mesure d’obtenir une

précision de 90% (et plus) pour le groupe où le cancer est récurrent. De nos

connaissances, ceci est la première tentative de développement de modèle

permettant de prédire le pronostic du patient en utilisant le NGS. Ceci amène un

nouvel aspect pour la médecine personnalisée et spécialement pour le dépistage

du cancer.

Page 5: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

iv

ABSTRACT

With the constant progress in neext generation sequencing, the quantity of data

available for investigation becomes massive. In parallel, cancer detection

methods and treatments remain very specific and barely accurate. Moreover, the

patients survival rate are directly linked with tumoral progression and therefore,

to cancer detection methods. Despite continual technological advances in recent

years, the global cancer mortality rate keeps rising. The creation of new detection

methods accessible to all cancer types becomes a necessity. As of now, there is

no model available that using sequencing data to predict cancer traits (ex:

recurrence, resistance, etc.). The following sections demonstrate the creation of

such model using somatic and germline mutations to predict recurrence and its

applicability across all cancer types (and even across different diseases). By

using gene signatures specific to each cancer types, we were able to obtain an

accuracy of 90% (and more) for the cohort where the cancer was recurrent. To

our knowledge, this is the first attempt to develop a model that can predict the

patient’s prognosis using genome sequencing data. This will affect future studies

and improve personalized medicine as well as cancer detection methods.

Page 6: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

v

Page 7: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

vi

TABLE DES MATIÈRES

Résumé ..................................................................................................................................................................................... iii

Abstract .................................................................................................................................................................................... iv

Liste des figures ................................................................................................................................................................ viii

Liste des abréviations ..................................................................................................................................................... ix

Remerciements ................................................................................................................................................................... xii

Chapitre 1 Introduction ................................................................................................................................................ 1

1.1 Le Cancer .............................................................................................................................................................. 1

1.1.1 Origine ........................................................................................................................................................... 1

1.1.2 Base génétique et caractéristiques du cancer (« Cancer Hallmarks ») ............... 2

1.1.3 Taux d’incidence et mortalité ....................................................................................................... 13

1.1.4 Diagnostics ............................................................................................................................................... 15

1.1.5 Traitements ............................................................................................................................................... 16

1.1.6 Hétérogénéité et résistance ........................................................................................................... 22

1.1.7 La génétique du cancer et sa progression jusqu'à présent ...................................... 25

1.2 Biologie des systèmes ................................................................................................................................ 27

1.2.1 Concept ....................................................................................................................................................... 27

1.2.2 Sentiers métaboliques et diaphonie (« crosstalk ») ....................................................... 28

1.2.3 Réseaux ...................................................................................................................................................... 29

Chapitre 2 Problématique, hypothèse et objectifs ................................................................................... 34

2.1 Problématique .................................................................................................................................................. 34

2.2 Hypothèse et objectifs ................................................................................................................................ 35

Chapitre 3 Article ............................................................................................................................................................... 36

Avant-Propos .................................................................................................................................................................. 36

3.1 Résumé ................................................................................................................................................................. 36

3.2 Abstract ................................................................................................................................................................ 38

3.3 Introduction ....................................................................................................................................................... 39

3.4 Methods ................................................................................................................................................................ 41

3.5 Results .................................................................................................................................................................. 43

3.6 Discussion .......................................................................................................................................................... 48

3.7 References .......................................................................................................................................................... 51

Page 8: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

vii

3.8 Tables .................................................................................................................................................................... 55

3.9 Figures and legends ..................................................................................................................................... 57

Chapitre 4 Discussion générale ............................................................................................................................... 62

4.1 Le NGS et son utilisation comme outil de prédiction ............................................................. 62

4.2 Impacts du clone fondateur dans l’expansion clonale du cancer .................................. 63

4.3 Les mutations germinales et leur potentielle utilisation ....................................................... 64

4.4 Vision à long terme ....................................................................................................................................... 64

Conclusions et perspectives...................................................................................................................................... 66

Bibliographie ........................................................................................................................................................................ 67

Page 9: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

viii

LISTE DES FIGURES

Figure 1.1 Le développement du cancer.

Figure 1.2 Les capacités distinctes du cancer « Cancer Hallmarks ».

Figure 1.3 Le microenvironnement tumoral, la réponse immunitaire et la

diaphonie (« cross-talk ») métabolique.

Figure 1.4 Graphique démontrant le taux d’incidence normalisé selon l’âge (TINA)

du cancer chez les hommes et les femmes au fil des années au Canada.

Figure 1.5 Graphique démontrant le taux de mortalité normalisé selon l’âge

(TMNA) du cancer chez les hommes et les femmes au fil des années au Canada.

Figure 1.6: Réseau non dirigé représentant les gènes associés à la prolifération

du glioblastome.

Page 10: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

ix

LISTE DES ABRÉVIATIONS

Akt/pKb Protein kinase B

APS Antigène Prostatique Spécifique

Bcl-2 B-Cell Lymphoma 2

BER Base Excision Repair

BRCA1/2 Breast Cancer Gene 1/2

ChIP-Seq Chromatin Immunoprecipitation Sequencing

CTL Cytotoxic T Lymphocyte

EGA European Genome-phenome Archive

EGFR Epidermal Growth Factor Receptor

EMT Epithelial Mesenchymal Transition

ER+/RE+ Estrogen Receptor Positive/Récepteur d’estrogène positif

ERK Extracellular signal-regulated kinase

FISH Fluorescence in situ hybridization

GLUT1 Glucose transporter 1

GWAS Genome Wide Association Study

HGP Human Genome Project

ICGC International Cancer Genome Consortium

NER Nucleotide Excision Repair

NHEJ Non-homologous end joining

NIH National Institute of Health

MAPK Mitogen-activated protein kinase

MEC Matrice extracellulaire

MMR Mismatch repair

mTor/mTorC1 Mammalian target of rapamycin complex 1

NK Natural killer cell

Rb/pRb Retinoblastoma Protein

SNP Single Polymorphism Nucleotide

TCGA The Cancer Genome Atlas

TERT Telomerase reverse transcriptase

Page 11: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

x

TP53/p53 Tumor Protein p53

TSP1 Thrombospondin 1

UTR Untranslated Regions

VEGF Vascular endothelial growth factor

WES Whole Exome Sequencing

Page 12: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

xi

« We cannot solve our problems

with the same thinking we used

when we created them. »

Albert Einstein

Page 13: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

xii

REMERCIEMENTS

En premier lieu, j’aimerais remercier mon directeur de maîtrise Dr Arnaud Droit, et Dr

Edwin Wang, pour m’avoir donné l’opportunité de pouvoir exécuter mon propre projet

pendant 3 années. Malgré les obstacles tout au long du chemin, personnels et

professionnels, nous avons mené à terme le projet et sommes en processus de publier

un article dans Jama Oncology. Edwin, jusqu’à aujourd’hui, je persiste à croire que tu

es une des personnes les plus innovatrices pour ce qui est de la biologie des systèmes

appliquée au cancer. J’ai apprécié nos conversations scientifiques quotidiennes et elles

ont été une source de motivation pour moi tout au long de ces années. Ton désir et ta

passion de faire avancer la science sont une source d’inspiration pour tous les

professionnels en recherche. J’aimerais également remercier tous les membres de

l’équipe du NRC : Naif Zaman, Chabane Tibiche, Jinfeng Zou et notre chef d’équipe

André Nantel. Vos connaissances, votre aide et votre support sont (et seront) toujours

très appréciés. De plus, j’aimerais remercier Mme Eileen Raymond qui m’a initialement

présenté à Dr Wang. Cette maîtrise et ce projet n’auraient pu être réalisables sans votre

appui à tous.

En second lieu, j’aimerais remercier ma famille qui m’a supporté tout au long de cette

étape. Plus spécifiquement mon père, qui est une source d’inspiration majeure pour

moi, merci de m’avoir guidé et motivé lorsque le projet n’avançait pas au rythme que je

désirais. Merci pour ton support dans tous mes choix de carrière, et ce, même lorsque

je me questionnais sur ceux-ci. Merci pour ton constant soutien et pour la fierté que tu

m’attribues chaque jour.

Page 14: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking
Page 15: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

1

CHAPITRE 1 INTRODUCTION

1.1 Le Cancer

1.1.1 Origine

Les premières observations du cancer proviennent de l’Antiquité égyptienne.

Hippocrates, un des premiers observateurs du cancer, fut l’un des premiers à

caractériser la maladie. Il désigna le terme karkinos (carcinos ou carcinoma) à

celle-ci après avoir observé des ulcères chroniques ou des croissances

cellulaires anormales (tumeurs malignes). Karkinos signifie crabe en grec et est

attribuable à la densité de veines accrochées à la tumeur telle un crabe et toutes

ces pattes l’entourant. Le terme oncos fût ensuite introduit pour désigner une

croissance cellulaire anormale ou tumeur maligne. Certains physiciens

déclaraient déjà la maladie d’incurable alors que d’autres avaient opté pour la

chirurgie (ou excision). Par contre, les traditions égyptiennes ne permettaient pas

d’ouvrir un cadavre et donc, peu de caractéristiques ont pu être observées et

vérifiées (1) (2). Ce n’est donc que beaucoup plus tard que certaines hypothèses

concernant les phénomènes biologiques entourant le cancer ont pu être

formulées. Au 18e siècle, à l’aide du microscope, des cellules cancéreuses ont

été observées à l’extérieur du tissu primaire par un chirurgien nommé Campbell

de Morgan et formulaient donc la première évidence des métastases (3). En

1902, les premières bases génétiques de la maladie furent émises par Theodor

Boveri qui suggéra que certaines mutations causant une croissance anormale

pouvaient être transmissibles par les chromosomes (hérédité) et que certains

agents pathogènes pouvaient promouvoir la maladie (agents carcinogènes). Il

introduit également certains termes comme gène suppresseur de tumeur,

oncogène et des points de contrôles cellulaires (4). Vers la fin du 18e siècle, à

l’aide de la découverte de la radiation, Marie et Pierre Curie ainsi qu’Henri

Coutard développèrent le premier traitement contre le cancer excluant la

Page 16: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

2

chirurgie; traitement qui est encore utilisé aujourd’hui (5). Finalement, la lutte

contre le cancer fût enfin reconnue mondialement en 1971 lorsque le président

des États-Unis Richard Nixon mit en vigueur l’acte national contre le cancer qui

avait pour but de promouvoir les risques associés au cancer et principalement,

de mettre en garde la population (6). Malheureusement, encore aujourd’hui,

plusieurs milliards de dollars sont investis par plusieurs pays chaque année et le

taux de mortalité du cancer semble ne pas diminuer. Bien évidemment, avec une

espérance de vie plus élevée, les chances de développer un cancer augmentent.

Le taux de mortalité, les enjeux des méthodes de détection et les traitements

alternatifs seront discutés dans les sections à venir (1.1.3, 1.1.4 et 1.1.5,

respectivement).

1.1.2 Base génétique et caractéristiques du cancer (« Cancer Hallmarks »)

L’ADN d’une cellule normale est toujours sujet à des changements génétiques

(mutations, amplifications, délétions). Les changements endogènes sont des

modifications de l’ADN causés par des phénomènes à l’intérieur de la cellule

(ex. : oxydation, alkylation, erreur de réplication, etc.). Ceux-ci sont corrigés par

des mécanismes cellulaires comme le MMR, le BER, le NER, la recombinaison

homologue, la jonction d’extrémités non homologues (NHEJ) et à l’aide de

certains gènes (BRCA1, BRCA2, la famille Uvr, MSH, etc.). Les changements

exogènes, quant à eux, sont des agents pathogènes qui ont un effet direct sur

l’ADN (rayons X, rayons-γ, rayons ultraviolets, benzène) qui sont une partie

intégrante de notre environnement (soleil, rayons X, etc.) ou notre mode de vie

(cigarette, alimentation, etc.) (7). Pour qu’une cellule devienne cancéreuse,

plusieurs mutations sont transmises de génération en génération lors de la

mitose et confèrent plusieurs avantages sélectifs à cette cellule (Figure 1.1).

Parmi ces avantages, un des plus importants est la capacité de croitre à une

fréquence plus élevée que les cellules normales. Lorsque cette cellule se sera

multipliée à plusieurs reprises, la sous-population de cellules se nommera plutôt

une tumeur. Si cette sous-population de cellules est capable d’envahir un autre

Page 17: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

3

tissu, nous parlerons d’une tumeur maligne (cancéreuse) et si ce n’est pas le

cas, cette tumeur sera bénigne. Une tumeur bénigne est souvent beaucoup

moins dangereuse qu’un cancer. Dans la plupart des cas, une simple excision

peut convenir et les patients sont totalement hors de danger. Évidemment,

plusieurs gènes sont impliqués dans le processus de formation de cellules

cancéreuses et certains mécanismes/voies peuvent aider ou nuire à cette

formation. Les gènes qui vont généralement aider la formation de cellules

cancéreuses sont généralement des gènes favorisant la prolifération (EGFR,

Ras, etc.); ces gènes sont nommés des oncogènes (ou proto-oncogènes). À

l’inverse, les gènes qui protègent la cellule contre des étapes favorisant la

formation du cancer sont des gènes nommés des gènes suppresseurs de tumeur

(BRCA1, BRCA2). Ceux-ci peuvent avoir plusieurs fonctions diverses: réparation

de l’ADN, apoptose, inhibiteur de croissance, etc. Les cellules cancéreuses

inhibent donc ces gènes et peuvent échapper à plusieurs points de contrôle.

La progression du cancer a été caractérisée au fil des années et maintenant, il

est possible de déterminer à n’importe quel moment le stage d’une tumeur. Il

existe maintenant 5 stages (stage 0 à IV) qui permettent de classifier la

progression du cancer. Stage 0 est la phase in situ ou la phase nulle. Le patient

possède une croissance anormale de cellule, mais celle-ci n’est pas cancéreuse

(tumeur bénigne). Stage 1 représente la phase locale et implique que le patient

possède une petite tumeur localisée dans son organe/tissu de développement.

Stage 2 est une phase un peu plus complexe. Celle-ci caractérise une tumeur

plus large que le stage 1 et/ou une invasion d’un ou plusieurs ganglions

lymphatiques (ceci varie en fonction du type de cancer). Le stage 3, quant à lui,

implique qu’il y a déjà des cellules cancéreuses à l’intérieur des ganglions et que

la tumeur s’est propagée dans 1 ou plusieurs tissus proches. Finalement, le

stage 4 est la phase la plus avancée du cancer et implique une invasion distante

des cellules (métastases). De même, pour certains types de cancer (ex :

glioblastome, colon), certaines gènes régulateurs sont directement associés à un

stage en particulier et il devient possible d’immédiatement identifier ceux-ci (8).

Page 18: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

4

Le concept de cellule cancéreuse a été révisé au fil des années ainsi que ses

caractéristiques. Comme mentionné précédemment, les cellules ont d’abord été

identifiées par leur prolifération (ou croissance) augmentée par rapport aux

cellules normales. Cependant, plusieurs mécanismes ont maintenant été

identifiés et sont référés aujourd’hui comme les capacités distinctes des

cancéreuses ou « Cancer Hallmarks » (Figure 1.2) (9) (10).

Figure 1.1 : Le développement du cancer. Adaptée de (78).

Page 19: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

5

Puisque la machinerie cellulaire des cellules cancéreuses est accélérée versus

celle des cellules normales, les cellules cancéreuses évoluent plus rapidement et

donc, peuvent acquérir des avantages sélectifs plus rapidement. Comme

mentionné ci-dessus, les cellules cancéreuses possèdent une fréquence de

croissance plus élevée que les cellules normales, car leurs signaux de

prolifération sont maintenus. Des phénomènes comme la dérégulation de

l’expression des protéines réceptrices (donc une expression plus élevée) rendent

ainsi ces cellules hypersensibles aux signaux de croissance ou même, une

modification de la structure du récepteur augmentant l’interaction avec le ligand

(facteur de croissance) (11). Par ailleurs, certaines mutations somatiques

acquises peuvent conférer une activation constitutive de facteurs de croissance.

Un bon exemple est une mutation dans la structure de la protéine B-Raf qui

résulte directement d’une activation constitutive de la voie de signalisation

MAPK/ERK qui promeut la transcription de l’ADN et par conséquent, la

prolifération cellulaire (12). Toutefois, une cellule proliférant à un niveau élevé

Figure 1.2 : Les capacités distinctes du cancer « Cancer Hallmarks ».

Adaptée de (9).

Page 20: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

6

peut éventuellement tomber en sénescence ou simplement, enclencher la mort

cellulaire. La sénescence est une réponse cellulaire qui permet de stopper la

duplication d’une cellule s’étant déjà dupliquée à plusieurs reprises (donc stopper

la prolifération). Ce mécanisme dépend des protéines oncogéniques RAS, MYC

et Raf et est directement relié à leur signalisation. Donc, paradoxalement, une

suractivation de la prolifération peut causer la sénescence et/ou l’apoptose.

Cependant, il est possible aux cellules cancéreuses, grâce à leur machinerie, de

contrecarrer ces mécanismes et continuer leur croissance.

Les cellules cancéreuses sont également capables d’échapper aux inhibiteurs de

croissance. Comme discuté antérieurement, les inhibiteurs de croissance sont

majoritairement des gènes suppresseurs de tumeurs. Il n’est donc pas étonnant

que les cellules cancéreuses inhibent ces gènes puisqu’ils nuisent à leur survie.

Les deux plus importants suppresseurs de tumeur sont Rb (ou pRb) et p53 (ou

TP53). La protéine Rb est l’un des gènes clé dans les points de contrôle du cycle

cellulaire (G1/S, plus spécifiquement) et est inhibée dans plusieurs types de

cancers. Elle intègre plusieurs signaux intra- et extracellulaire pour déterminer si

une cellule peut passer en phase S. Lorsque celle-ci est inactivée, les cellules

peuvent donc passer en phase S alors que celle-ci est activée, certaines cellules

resteront en phase G1, ne pourront se répliquer et entreront éventuellement en

apoptose (13). La protéine TP53, quant à elle, a souvent été référée comme une

gardienne du génome. En effet, elle assure l’intégrité de l’ADN et enclenche

l’apoptose si l’ADN d’une cellule contient trop de dommages (ou si la cellule a

subi un trop grand stress). Si TP53 est inactivée, il n’y a donc aucune vérification

de l’ADN. Les cellules endommagées ne seront pas détruites et pourront donc

se répliquer pour ensuite, transmettre toutes leurs mutations à la génération

suivante. Il n’est donc pas surprenant de voir que TP53 est muté dans presque

tous les types de cancer et à une fréquence relativement élevée (entre 2 et 94%)

(14).

Page 21: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

7

Une des réponses cellulaires les plus utilisées par le corps humain pour corriger

multiples anomalies à l’intérieur de la cellule est l’apoptose. Il ne peut suffire que

l’ADN soit moindrement endommagé ou que les signaux de croissance soient

surexprimés et celle-ci peut être détruite. Donc, si une cellule prolifère trop

rapidement, elle peut entrer en apoptose. Encore une fois, les cellules

cancéreuses sont capables de résister à l’apoptose et contourner ce mécanisme.

Par conséquent, les cellules non détruites favorisent directement la

tumorigénèse. L’apoptose est subdivisée en deux voies d'autant plus importantes

l’une que l’autre : la voie intracellulaire (intrinsèque) et extracellulaire

(extrinsèque). La voie extrinsèque implique la liaison du ligand Fas à son

récepteur et à l’aide d’autres signaux extracellulaires vont enclencher une

cascade d’activation des protéines caspases (protéases), qui elles à leur tour,

vont activer l’apoptose. Cette voie est généralement moins exploitée par les

cellules cancéreuses, car modifier une chaine de signaux extracellulaires n‘est

pas une simple tâche. La voie intrinsèque, quant à elle, est constituée

principalement des protéines Bax, Bak et Bcl-2. Les protéines Bax et Bak sont

des protéines qui vont briser la membrane cellulaire externe. Ces deux protéines

sont généralement inhibées par la famille des Bcl (ou Bcl2). Lorsque la

membrane cellulaire externe est brisée, des signaux proapoptotiques sont

largués (entre autres le cytochrome C) et vont activés, à leur tour, une cascade

de caspases activant ainsi, l’apoptose (15) (16). Les facteurs antiapoptotiques

(ou inhibiteurs) comme Bcl2 sont largement surexprimés dans les cellules

cancéreuses. La voie intrinsèque de l’apoptose est donc très inhibée et les

cellules cancéreuses peuvent résister à la mort cellulaire. Une autre voie de

signalisation grandement ciblée par les cellules cancéreuses est celle de PI3-

kinase, Akt et mTor. Cette voie favorise la prolifération et inhibe l’apoptose (et

autophagie) en intégrant des facteurs de croissance (EGF, insuline, VEGF, etc.).

Suite à l’intégration de ces signaux, PI3K va phosphorylé Akt qui va à son tour

activé mTor et enclenché la voie. Une fois de plus, PI3K est ciblé par les cellules

cancéreuses et peut être muté jusqu’à 52,2% dans certains types de cancers

Page 22: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

8

(13). Subséquemment, les cellules peuvent échapper à l’apoptose et à

l’autophagie.

Le concept d’immortalité est un concept qui a émergé très récemment. Comme

mentionné auparavant, les cellules ont un potentiel limité de réplication. La

sénescence est un mécanisme cellulaire qui implique que les cellules possèdent

un âge (ou nombre maximal de réplications). Après ce nombre spécifique de

réplications, la cellule peut soit entrer en apoptose ou tomber en phase de

dormance (sénescence). Si elle entre en sénescence, la cellule reste dans un

état viable, mais ne peut se répliquer. Cependant, il est possible d’observer des

cellules qui transcendent cette barrière et finalement, possède un potentiel infini

de réplication. Ce phénomène est nommé immortalisation et est présent chez les

cellules cancéreuses. Le potentiel de réplication est en fait lié aux télomères. Les

télomères sont des répétitions d’hexanucléotides au bout des chromosomes et

ayant pour but de protéger l’ADN codant de ceux-ci. Par conséquent, la longueur

des télomères indique le nombre de réplications réalisées par la cellule. Lorsque

ceux-ci deviennent si courts qu’ils ne peuvent plus protéger l’ADN des

chromosomes, la cellule a donc atteint son potentiel de réplication et va entrer en

apoptose ou en sénescence (17). La télomérase est la protéine responsable

d’ajouter les répétitions sur les télomères. En contraste, celle-ci est pratiquement

non exprimée chez les cellules non immortalisées et est présente dans

pratiquement toutes les cellules immortalisées. Évidemment, sa présence est

fortement corrélée avec une inhibition de la barrière apoptose/sénescence.

Malgré cela, une sous-unité de la télomérase (TERT) a été associée pour avoir

un rôle dans plusieurs autres mécanismes comme la réparation de l’ADN, la

prolifération et même à plusieurs autres sites sur les chromosomes en dehors

des télomères suggérant que celle-ci possède un rôle beaucoup plus complexe

(18) (19). Par le fait même, le rôle des télomères serait également plus complexe

qu’une simple barrière de protection contre l’ADN. De plus, dans une majorité de

tumeurs, les mutations sur p53 affectent directement l’instabilité du génome et

favorisent fortement les changements génétiques (amplification, délétions,

Page 23: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

9

duplication). Ces changements ont un impact direct sur la longueur des

chromosomes et par conséquent, les télomères.

Lorsqu’il est question de croissance cellulaire, il est toujours question des

nutriments et d’énergie. Naturellement, étant donné que les cellules cancéreuses

prolifèrent plus rapidement, celles-ci requièrent non seulement plus de

nutriments, mais également, de se débarrasser de molécules toxiques (CO2 par

exemple). Ceci est réalisé par l’angiogénèse. L’embryogénèse et la formation de

cellules endothéliales sont toujours associées avec la vasculogénèse (formation

de nouveaux vaisseaux) et avec l’angiogénèse (expansion des vaisseaux déjà

existants). Suite à cette croissance rapide, ces deux mécanismes deviennent

latents et ne redeviennent actifs qu’après un certain traumatisme (ex. : une

blessure, cycle de reproduction féminin). Ce phénomène est surnommé

l’interrupteur angiogénique (« angiogenic switch »). À l’opposé, chez les cellules

cancéreuses, cet interrupteur est constamment activé (20). Les régulateurs

principaux de l’angiogénèse sont VEGF et TSP1. VEGF est un facteur de

croissance responsable de la formation de vaisseaux lors du développement

natal, de la survie des cellules endothéliales et en réponse à des situations

physiologiques chez les adultes. VEGF peut se lier à des récepteurs tyrosine

kinase et peut être régulés à plusieurs niveaux. VEGF est généralement

surexprimé dans les cellules cancéreuses, rendant ainsi la liaison plus efficace.

TSP1 agit plutôt comme une contrepartie et inhibe l’angiogénèse. TSP1 se lie

également aux récepteurs de la membrane extracellulaire et est en compétition

directe avec VEGF. Contrairement aux tissus normaux, les néoplasmes ne sont

pas entourés de vaisseaux sains. Malgré le fait que l’angiogénèse est toujours

active chez les cellules cancéreuses, l’excès de vaisseaux dans un espace

restreint entraine souvent plusieurs problèmes comme des vaisseaux déformés

et empilés l’un sur l’autre, des fuites, un flux sanguin irrégulier et même des

microhémorragies (21). Par contre, l’angiogénèse est un phénomène qui varie

énormément selon le type de cancer (hyper ou hypo). VEGF est un facteur de

croissance excessivement régulé et par conséquent, des mutations dans des

Page 24: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

10

gènes clés ont un impact direct sur son expression. Par exemple, des mutations

sur des oncogènes comme Ras et Myc favorisent énormément l’angiogénèse.

Les mécanismes entourant l’invasion d’autres tissus et les métastases n’ont été

que caractérisés que très récemment. Il était clair que les tumeurs atteignaient

un stage plus élevé lorsque celle-ci pouvait traverser la zone épithéliale et ainsi,

avoir accès à la circulation sanguine. Cependant, depuis le début des années

2000, plusieurs progrès pour élucider ce mécanisme ont été faits et il est

maintenant connu que cette transition est un résultat obtenu lorsque les cellules

perdent leur adhésion. En effet, l’adhérence des cellules représente en quelque

sorte leur ancrage et leur positionnement. Lorsque cet ancrage est perdu, il est

possible aux cellules de pouvoir migrer à différents endroits (et même traverser

des membranes). La protéine la plus importante à ce niveau est la E-cadhérine.

La E-cadhérine est responsable du contact cellule-cellule et du contact cellule-

MEC qu’elle maintient à l’aide de jonctions adhérentes. Si celle-ci n’est pas

exprimée, les cellules perdent donc toutes leurs jonctions adhérentes et par

conséquent, leur contact cellule-cellule et leur contact cellule-MEC (22). De plus,

plusieurs carcinomes agressifs sont caractérisés par la perte (ou diminution)

d’expression de la E et N-cadhérine. Lorsque les cellules obtiennent la

caractéristique d’invasion, celle-ci vont donc effectuer une transition épithéliale-

mésenchyme (EMT), vont pouvoir accéder à la circulation sanguine et migrer

dans n’importe quel tissu par la suite. La nouvelle génération de cellules dans un

autre tissu est ce qu’on appelle les métastases. Additionnellement, les cellules

cancéreuses métastatiques sont différentes génétiquement des cellules

cancéreuses du tissu primaire. Puisqu’elles sont différentes, les traitements et

drogues associés à ceux-ci doivent forcément être différents et compliquent

beaucoup plus la situation (qualité de vie du patient, effets secondaires, etc.). La

capacité d’invasion peut également être par la communication entre les cellules

cancéreuses du stroma et les cellules cancéreuses du tissu primaire. Les

cellules néoplasiques du stroma peuvent induire une sécrétion de protéines

stimulant l’invasion (ex. : CCL5) (23). Le microenvironnement de la tumeur a un

impact majeur sur l’acquisition de cette capacité.

Page 25: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

11

Comme mentionné précédemment, les cellules néoplasiques nécessitent une

grande portion d’énergie pour maintenir leur croissance accélérée. Cette

demande d’énergie a donc demandé un ajustement au niveau du métabolisme

pour combler cette demande d’énergie. En condition aérobique, les cellules vont

transformer le glucose en pyruvate à l’aide de la glycolyse et produire du dioxyde

de carbone dans les mitochondries (cycle de Krebbs). À l’opposé, en condition

anaérobique, très peu pyruvate sera transporté vers les mitochondries. Les

cellules cancéreuses sont capables de reprogrammer leur métabolisme du

glucose indépendamment de la présence d’oxygène. Ce mécanisme est réalisé

en favorisant grandement la glycolyse menant à une phase surnommée

« glycolyse aérobique » (ou « Warburg effect ») et consiste plutôt, à une

fermentation d’acide lactique (24). Le niveau d’augmentation de la glycolyse est

atteint à l’aide de l’augmentation d’expression du transporteur du glucose

GLUT1. Ceci concorde parfaitement avec le fait que le niveau de glucose peut

refléter et même identifier une population de cellules cancéreuses. Par ailleurs,

puisque les cellules sont si flexibles à ce niveau, il devient très complexe de

pouvoir cibler le néoplasme en utilisant le glucose. De plus, plusieurs liens ont

été établis avec la glycolyse aérobique et des mutations dans des gènes

oncogènes/suppresseur de tumeur clé (Ras entre autres). Ras possède un effet

direct sur les facteurs de transcriptions HIF1α et HIF2α, qui eux à leur tour,

régulent la glycolyse (25). Dans certains cas, il a même été observé que deux

sous-populations de cellules peuvent croitre en symbiose à l’aide de ce

mécanisme. Dans ce cas spécifique, une sous-population utilise la glycolyse et

l’autre, la fermentation, permettant ainsi aux deux sous-populations de pouvoir

proliférer sans nuire à l’autre. Le terme de sous-population sera revu en détail

dans la section hétérogénéité à venir (1.1.6). Ceci démontre encore une fois un

exemple de communication entre les cellules cancéreuses (« crosstalk ») (26).

Un autre phénomène émergent encore non expliqué est celui d’échapper à la

destruction immunitaire. La réponse immunitaire est un mécanisme cellulaire par

lequel chacune des cellules est considérée comme étant en

surveillance. Lorsqu’une cellule agit anormalement, celle-ci est reconnue par les

Page 26: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

12

macrophages et est détruite. Ce contournement n’est pas seulement utilisé par

les cellules néoplasiques, mais également, par les virus. Évidemment, si le

système immunitaire est compromis ou inexistant (immunodéficient), le

pathogène pourra se propager (ou proliférer) plus rapidement. Cette réponse

immunitaire est généralement contournée lorsque les lymphocytes sont soit

mutés ou sous-exprimés. En effet, les CTLs (lymphocytes T) et les NKs sont

souvent des cibles de choix pour les cellules cancéreuses (Figure 1.3). Il existe

donc énormément de communication (« crosstalk ») entre les cellules

cancéreuses et leur microenvironnement. En communiquant avec celui-ci, elles

sont en mesure de dérégler plusieurs sentiers métaboliques qui leur favorisent

une prolifération. Par conséquent, en diminuant l’efficacité des lymphocytes, les

cellules cancéreuses peuvent encore une fois, bénéficier d’un environnement

plus apte à leur croissance.

Figure 1.3: Le microenvironnement tumoral, la réponse immunitaire et la diaphonie (« cross-

talk ») métabolique. En phase d’élimination, les lymphocytes T et NKs vont pouvoir éliminer

les cellules anormales. En phase de prolifération, certains facteurs de croissance (TGFβ) vont

inhiber la réponse immunitaire permettant la prolifération des cellules cancéreuses. Adaptée

de (80).

Page 27: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

13

1.1.3 Taux d’incidence et mortalité

Malgré le fait que le cancer est une maladie connue et caractérisée depuis très

longtemps, il n’y a toujours aucun traitement définitif non spécifique qui garantit à

100% la survie du patient. Par conséquent, année après année, il est possible

d’observer des augmentations au niveau de l’incidence du cancer (Figure 1.4 et

1.5). Il est à noter que sur ces figures, l’augmentation du taux d’incidence est

assez évidente et indépendante avec l’âge. Cependant, il est à noter que le taux

de mortalité est également en augmentation, mais puisque celui-ci est

standardisé avec l’âge, les résultats sont moins apparents. De plus, l’espérance

de vie augmente année après année grâce aux progrès de la médecine et les

personnes plus âgées sont plus à risque de développer un cancer. Cette

situation crée une problématique mondiale puisque le cancer peut affecter

n’importe qui. En assumant que la population mondiale augmente chaque année,

les nouveaux cas de cancer deviennent de plus en plus massifs et la mortalité

rattachée à ceux-ci également. En 2012, il a été estimé que 12,1 millions de

nouveaux cas de cancers ont été diagnostiqués et 8,2 millions de personnes

sont décédées suite à un cancer. Ceci représente une augmentation de 48%

pour l’incidence et 61% pour la mortalité depuis 1990 (27) (28). En fait, le cancer

est maintenant la plus grande cause de décès mondial suivi des maladies

cardiaques et des accidents cérébraux vasculaires (29). Il est donc évident que

plusieurs progrès doivent encore être faits au niveau des méthodes de détection

et au niveau des traitements.

Page 28: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

14

Figure 1.4: Graphique démontrant le

taux d’incidence normalisé selon

l’âge (TINA) du cancer chez les

hommes et les femmes au fil des

années au Canada. Adaptée de (79).

Figure 1.5: Graphique démontrant le

taux de mortalité normalisé selon l’âge

(TMNA) du cancer chez les hommes et

les femmes au fil des années au

Canada. Adaptée de (79).

Page 29: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

15

1.1.4 Diagnostics

Plusieurs avancées ont été faites au niveau des méthodes de dépistage depuis

quelques années. Certains cancers possèdent maintenant des protocoles

permettant ainsi un suivi plus régulier des patients. Il est très important de

comprendre qu’au niveau génétique/médicinal, un suivi régulier d’un patient

révèle davantage d’informations qui peuvent par la suite engendrer une meilleure

prévention (que ce soit pour le cancer ou toute autre maladie).

Malheureusement, la majorité des tests de dépistage mis en place sont des tests

relativement invasifs que les médecins ne veulent évidemment pas soumettre à

leurs patients à moins d’avoir préalablement certaines justifications (ex. : biopsie,

colonoscopie, sigmoidoscopie, PAP test, etc.) de même que les conséquences

rattachées un faux positif. Il n’existe que très peu de tests non invasifs

fréquemment utilisés avec peu (ou aucun) d’effet néfaste sur le corps (ex. :

mammographie, résonnance magnétique, rayons X, tomographie, APS). Ceux-ci

sont d’ailleurs beaucoup plus utilisés dans la pratique de nos jours. De plus, la

fiabilité de ces tests peut parfois être remise en question. Pour le cancer de la

prostate, les seuls tests disponibles sont l’examen digital et le test de l'APS

(antigène prostatique spécifique). Cependant, les deux méthodes ont des

désavantages assez importants. Pour le APS, un niveau élevé de APS n’est pas

nécessairement associé au cancer. Par ailleurs, plusieurs facteurs influencent

énormément les résultats du test (ex. : stress, fréquence d’éjaculation, etc.). Les

faux positifs rattachés au test sont également très importants. Selon certaines

études, environ 25% des hommes possédant une APS élevé ont bel et bien un

cancer alors que tous ces hommes seront sujets à une biopsie après le test (30).

Pour l’examen rectal, celui-ci est toujours très subjectif au médecin qui l’applique.

Non seulement le médecin peut juger l’examen dans les limites de la normale,

mais la sensibilité elle-même du praticien peut être un facteur crucial à ce

niveau. Donc, encore une fois, l’efficacité des méthodes est remise en question.

Page 30: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

16

En matière d’efficacité, les tests génétiques seront toujours plus avantageux.

Non seulement ceux-ci, pour la plupart, sont non invasifs (simple prise de sang),

mais en plus, peuvent permettre d’avoir le profil génétique complet du patient si

désiré (WES). Les tests de dépistage pour BRCA1/BRCA2 sont le meilleur

exemple dans cette catégorie. Par contre, outre le fait qu’une mutation dans

BRCA1 ne garantit pas à 100% le développement d’un cancer, les mutations

héréditaires de BRCA1 sont représentées dans une très faible partie de la

population (0.0025% à 0.00125% selon les ethnicités) ce qui signifie que le test

est généralement négatif (et donc très spécifique) (31). Il existe donc un grand

manque de tests de dépistage possédant une grande efficacité de même que

peu de spécificité. Les problèmes de détection sont un grand enjeu pour les

traitements du cancer puisque lorsque celui-ci est détecté trop tard, les

traitements sont beaucoup moins efficaces et les chances de survie diminuent

drastiquement. Pour ce qui est des symptômes, lorsque ceux-ci sont finalement

visibles, le cancer est déjà très avancé et encore une fois, ceci n’aide en aucun

cas les futurs traitements. Bien évidemment, la communauté scientifique est

consciente que ceci est un problème majeur et par conséquent, plusieurs

nouvelles méthodes de détection sont mises au point en tentant de résoudre ce

problème (ex : biopuces, nanopuces) (32). Cependant, celles-ci requiert

beaucoup plus de suivi pour les patients que de simples tests génétiques (ou

prise de sang).

1.1.5 Traitements

Lorsqu’un cancer est diagnostiqué chez un patient, quelques méthodes de

traitements sont disponibles. Les 3 principales méthodes sont la chirurgie, la

chimiothérapie et la radiothérapie. Bien évidemment, la progression du cancer

joue un rôle crucial dans l’élaboration d’un plan de traitement. Jusqu’à

aujourd’hui, le meilleur traitement disponible reste la chirurgie. Cependant, il

n’est pas toujours possible d’exciser la tumeur. Si celle-ci est déjà trop large, ou

potentiellement située à un endroit plus dangereux pour le patient (ex. : près d’un

Page 31: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

17

nerf ou d’une artère), le médecin ne peut pas toujours exciser complètement la

tumeur. La chirurgie reste la meilleure option si celle-ci est possible, car elle cible

uniquement les cellules cancéreuses. Par le fait même, plusieurs types de

cancers démontrent un taux de rémission plus élevé lorsque la tumeur est

excisée (33) (34). Par conséquent, les chances de survie sont directement

reliées aux méthodes de détection. Cela explique également pourquoi certains

types de cancers possèdent un taux de mortalité si élevé (ex. : ovaire, pancréas).

Les cancers sont détectés trop tard et il devient impossible d’opérer à ce

moment. Également, il est possible pour certains types de cancers que les

risques associés à la chirurgie soient très élevés et donc, celle-ci n’est pas

utilisée comme traitement (ex. : cerveau, cou). Il n’est pas surprenant que le taux

de mortalité pour ces cancers soit plus haut.

Un autre type de traitement utilisé contre le cancer est la radiothérapie. La

radiothérapie utilise des particules à haute fréquence (ex. : rayons X, rayons

gamma, etc.) en but de cibler les cellules cancéreuses. Par contre, cette

méthode cible également les cellules normales et possède donc certains

désavantages. Il existe plusieurs moyens d’introduire cette radioactivité. La

radiothérapie externe est le premier type de traitement. Celle-ci consiste à utiliser

une machine externe pour introduire les radiations de l’extérieur du corps à

l’intérieur de la tumeur. Le traitement peut prendre plusieurs semaines et dépend

de la grosseur de la tumeur, du stage et du type de celui-ci, de la santé globale

du patient, etc. La radiothérapie interne (brachythérapie) consiste à introduire un

implant radioactif à l’intérieur du corps. Par la suite, les cellules néoplasiques

deviennent plus susceptibles à la radiothérapie et sont plus facilement détruites.

Finalement, la radiothérapie systémique, quant à elle, consiste à introduire des

médicaments radioactifs à l’intérieur du corps (intraveineux ou oral). Ces

molécules vont s’associer aux cellules cancéreuses et détruire celle-ci à l’aide de

leur radioactivité. La radiothérapie possède plusieurs désavantages. Non

seulement celle-ci peut causer plusieurs effets secondaires (ex. : saignement,

vomissement, fatigue, etc.), mais la radiothérapie endommage les tissus

Page 32: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

18

entourant la tumeur et elle altère le mécanisme de coagulation. Par contre, la

radiothérapie est très efficace pour réduire la grosseur d’une tumeur et est donc

très efficace pour les petites tumeurs (stage 1 et 2) (35) (36). De plus,

contrairement à une chirurgie, il est possible de pouvoir préserver l’organe

atteint. Cependant, il n’est jamais garanti que celle-ci puisse détruire la totalité

des cellules cancéreuses et par conséquent, ne peut être utilisé comme seul et

unique traitement lorsque le cancer est plus avancé. C’est d’ailleurs une des

raisons pour laquelle plusieurs traitements sont fréquemment jumelés lorsqu’il

est question d’éradication complète du cancer.

Un deuxième traitement largement utilisé est la chimiothérapie. La

chimiothérapie est utilisée lors de différentes situations dans la médecine

courante et pour différents objectifs. Pour les cancers peu avancés (stage 1 et

2), la chimiothérapie est généralement appliquée suite à une chirurgie. Son but

est de potentiellement anéantir les cellules cancéreuses restantes que la

chirurgie n’aurait pas réussi à éliminer. Pour les cancers plus avancés, la

chimiothérapie permet de potentiellement contrôler (ou ralentir) le cancer. Cela

peut parfois permettre une espérance de vie plus élevée selon ce que le patient

désire. Cependant, la chimiothérapie est l’un des traitements les plus toxiques

présentement utilisés en médecine et est beaucoup plus souvent perçue comme

un traitement de dernier recours. Celle-ci contient une liste foudroyante d’effets

secondaires comme les vomissements, étourdissements, problèmes de fertilité,

manque de concentration, diarrhée, problèmes au niveau de la coagulation, etc.

L’effet secondaire le plus drastique est la suppression du système immunitaire.

Les patients bénéficiant d’une rémission du cancer deviennent donc vulnérables

à multiples infections et maladies qui sont normalement sans danger (ex. :

rhume, allergies, etc.). En fait, la chimiothérapie est un traitement avec une

spécificité pratiquement non existante et donc, les agents chimiothérapeutiques

ciblent toutes les cellules. Il existe plusieurs classes d'agents

chimiothérapeutiques et ceux-ci possèdent tous différents mécanismes d’action :

les agents alkylants, les anthracyclines, les perturbateurs du cytosquelette, les

Page 33: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

19

inhibiteurs des topoisomérases, les inhibiteurs des histones déacétylase, les

analogues des nucléotides et leurs précurseurs, les inhibiteurs de protéines

kinases, les peptides antimicrobiens, les platines, les rétinoïdes et finalement, les

vinca alcaloïdes. Les agents alkylants sont des médicaments qui agissent

directement sur l’ADN (ex. : cyclophosphomide, méchloretamine). Ceux-ci vont

rajouter un groupement alkyle sur l’ADN bloquant ainsi la réplication de l’ADN et

entrainant la dégradation cellulaire (37). Les anthracyclines sont une autre classe

de médicaments utilisés contre le cancer (ex. : doxorubicin, daunorubicin). Ceux-

ci possèdent 4 grands mécanismes d’action. Premièrement, les anthracyclines

sont en mesure d’intercaler les bases de l’ADN et de l’ARN simple brin causant

donc une inhibition de réplication. Deuxièmement, elles peuvent causer une

inhibition de la topoisomérase II ce qui va en retour inhiber la transcription et la

réplication de l’ADN. Troisièmement, elles sont capables d’augmenter la

production de radicaux libres et ainsi, endommagent directement l’ADN, les

protéines et les membranes. Finalement, les anthracines peuvent également

séparer les histones de la chromatine résultant ainsi à des modifications de

l’épigénome et d’une mauvaise réparation de l’ADN (38). Les perturbateurs du

cytosquelette (ou taxanes) sont également une autre classe d’agent

chimiothérapeutique (ex. : paclitaxel, docetaxel). Ceux-ci interfèrent avec les

microtubules en entrainant leur bris causant ainsi, une inhibition de la division

cellulaire (39). L’utilisation des inhibiteurs d’histone déacétylase est aussi

fréquemment utilisée. Certains médicaments (ex. : vorinostat, romidepsine) vont

être en mesure d’inhiber les histones déacétylase favorisant donc l’apoptose

(40). L’utilisation des inhibiteurs de topoisomérase I (ex. : irinotecan, topotecan)

ou II (ex : etoposide, teniposide) est également largement utilisée. L’inhibition de

la topoisomérase entraine une diminution d’ADN déplié et celle-ci ne peut donc

pas entrer en réplication et en transcription par la suite (41) (42). De même,

plusieurs inhibiteurs de kinases sont utilisés. Ceux-ci sont très variés et

possèdent différentes fonctions. Par exemple, le Bortezomib est un inhibiteur de

la protéase. En inhibant celle-ci, le point de contrôle G2-M n’est pas franchi et la

cellule va tomber en apoptose. Par conséquent, le Bortezomib agit directement

Page 34: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

20

sur la prolifération cellulaire (43). Des nucléotides et précurseurs analogues sont

un autre type d’agent chimiothérapique utilisé (ex. : méthotrexate, fluorouracil).

Ceux-ci vont interférer avec la synthèse des nucléotides ou des précurseurs de

ceux-ci inhibant ainsi la synthèse de l’ADN (44) (45). Les peptides microbiens

(ex. : bléomycine, actinomycine), quant à eux, sont des médicaments qui se lient

directement à l’ADN ou induisent des bris à celle-ci (46). Encore une fois, ceci

inhibe la transcription et la réplication. Les platines, ou les drogues néoplasiques

à base de platine, sont des agents thérapeutiques qui vont directement se lier à

l’ADN en faisant des liaisons transversales, des liaisons entre brins et des

liaisons entre les brins et les protéines. Les rétinoïdes sont une autre classe

d’agent chimiothérapeutique qui a été découvert récemment. Leur mécanisme

d’action reste un peu inconnu, mais il a été démontré que ceux-ci peuvent

stopper la différenciation et la prolifération des cellules cancéreuses (47).

Finalement, la dernière classe de médicaments chimiothérapeutiques utilisées

sont les vinca alcaloïdes (ex : vincristine, vinblastine). Ceux-ci se lient à la

tubuline pendant l’anaphase ou produisent des fragments de microtubules

favorisant ainsi leur détachement du centrosome. Suite à ceci, la cellule entrera

en apoptose et sera détruite (48).

Comme mentionné ci-dessus, aucune de ces classes de médicaments ne

possède une affinité particulière pour les cellules cancéreuses et peuvent donc,

affecter n’importe quels types de cellules. Cela explique en grande partie

pourquoi la chimiothérapie est si toxique par rapport à d’autres traitements. Non

seulement les patients ne sont pas garantis que ce traitement va ralentir ou

détruire leur cancer, mais en plus, celui-ci affecte énormément la qualité et

l’espérance de vie. Ceci concorde bien avec le fait que seulement 2.4% des

patients aux États-Unis possèdent un taux de survie de 5 ans ou plus lorsqu’ils

sont sujets à la chimiothérapie (49). Par ailleurs, plusieurs protocoles déjà mis en

place dans la médecine courante utilisent un médicament spécifique pour traiter

différents types et sous-types de cancer. Dans ce cas, il n’est pas surprenant de

voir que le taux de rémission est si faible puisque non seulement les cancers

Page 35: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

21

sont génétiquement différents, mais en plus, différentes sous-populations à

l’intérieur du même cancer peuvent être très différentes génétiquement. Une

solution possible à ce monstrueux problème serait d'exécuter une transition entre

la médecine courante et la médecine personnalisée. Les patients pourraient être

dépistés régulièrement (bien avant qu’un cancer se manifeste), mais lorsque

celui-ci est développé, les gènes clés seraient immédiatement identifiés et les

médicaments seraient ajustés en conséquence, et ce, indépendamment du type

du cancer. Ceci diminuerait non seulement les coûts rattachés au cancer, mais

augmenterait l’efficacité des agents chimiothérapeutiques utilisés. Les coûts

associés au cancer aux États-Unis sont estimés à 124.57 milliards de dollars et

sont prévus d’augmenter jusqu’à 157.77 milliards en 2020 et sont justement un

problème majeur (50).

Finalement, puisque l’enjeu majeur des méthodes mentionnées ci-dessus est la

spécificité (capacité de cibler seulement les cellules cancéreuses), d’autres

approches comme l’immunothérapie ont émergés depuis quelques années. La

réponse immunitaire joue un rôle crucial dans la lutte contre le cancer. Les

macrophages, lymphocytes T et les anticorps sont en constant combat avec les

cellules cancéreuses. La stratégie principale est d’altérer (ou d’injecter) des

anticorps monoclonaux (ex : herceptine) possédant des antigènes exclusif aux

cellules cancéreuses. De cette façon, le système immunitaire ira cibler les

cellules cancéreuses possédant les antigènes ciblés (51) (52).

Malheureusement, la constante évolution des cellules cancéreuses interfèrent

énormément avec ces méthodes et l’acquisition de nouvelles mutations ou de

nouveaux antigènes diminuent grandement l’efficacité de l’immunothérapie.

Conformément, l’immunothérapie n’est jamais utilisée comme méthode unique

de traitement mais bel et bien, en combinaison avec d’autres méthodes

mentionnées ci-dessus.

Page 36: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

22

1.1.6 Hétérogénéité et résistance

L’hétérogénéité est un concept émergeant qui a pris beaucoup d’ampleur depuis

quelques années. En effet, l’hétérogénéité était très peu discutée avant que le

phénomène de résistance se manifeste et était même, très peu acceptée dans la

communauté scientifique. Avec la découverte des caractéristiques du cancer, les

méthodes de traitement se sont orientées vers des gènes ayant une importance

majeure (« cancer driver genes ») comme potentielles cibles de traitement (ex. :

p53, Rb, Ras, etc.). Cependant, les résultats attendus ne concordaient pas avec

l’importance de ceux-ci et le taux de rémission des patients n’a pas démontré les

attentes anticipées. La raison pour laquelle ces traitements ne fonctionnent pas à

grande échelle est l’hétérogénéité. L’hétérogénéité est un mécanisme cellulaire

qui fait partie de la division cellulaire. Lorsqu’une cellule se divise, son matériel

génétique inné (mutations germinales, hérédité) et acquis (mutations

somatiques) est transmis à la génération suivante. Si, lors de sa croissance,

cette cellule a acquis de nouvelles caractéristiques ou de nouveaux phénotypes,

ceux-ci seront transmis à la génération suivante et ainsi de suite. La première

génération de cellules cancéreuses est référée au clone fondateur et les sous-

populations possédant les mêmes phénotypes sont les sous-clones (ou clones)

(voir figure 1.5).

Page 37: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

23

Par conséquent, d’un point de vue génétique, les clones provenant du même

type de cancer pour 2 individus peuvent être complètement différents

(hétérogénéité intertumorale) et également, peuvent être complètement

différents à l’intérieur du même individu (hétérogénéité intratumorale). Puisque

ces clones sont génétiquement différents, certains d’entre eux peuvent favoriser

différentes voies de signalisation pour exprimer leur phénotype (ou

caractéristique) (53). La résistance d’un cancer à un certain médicament devient

donc explicable par le fait que soit 1 ou plusieurs clones n’utilisent pas la voie

ciblée par la drogue utilisée. Il devient donc impossible de pouvoir traiter

plusieurs patients avec le même médicament sans préalablement connaître le

profil génétique de celui-ci. Cela est extrêmement reflété dans l’efficacité de

traitement comme la chimiothérapie par exemple. Plusieurs protocoles sont déjà

en place selon certains types de cancers et les médecins suivent les étapes

préalablement établies. Bien évidemment, certains ajustements ont été faits à ce

niveau. L’utilisation de thérapie combinatoire où plusieurs agents

Figure 1.5: L’expansion clonale du cancer. Adaptée de (71).

Page 38: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

24

chimiothérapeutiques sont utilisés (où multiples voies sont ciblées) est

maintenant une pratique commune. Cependant, il existe énormément de voie et

de gènes à l’intérieur du corps humain et l'utilisation d'une combinaison de

médicaments sans avoir le profil génétique du patient représente du essaie

erreur et ne devrait, en aucun cas, être une option de traitement viable pour les

patients (surtout considérant les effets néfastes de la chimiothérapie) (54). De

plus, il est très difficile de déterminer le nombre de clones pour un patient. Il n’y a

aucune approche en ce moment accepté par une majeure partie de la

communauté scientifique pour identifier des clones. Par conséquent, même si un

patient répond bien à un traitement (en rémission), il est possible que le

traitement n’ait pas tué tous les clones et le cancer pourrait resubmerger.

Également, comme mentionnées auparavant, les cellules cancéreuses sont

constamment en communication et réagissent grandement à leur

microenvironnement. Dans certains cas, il a été démontré que des clones

pouvaient acquérir une résistance après avoir été sous pression (ex. :

radiothérapie, chimiothérapie); un phénomène très similaire aux bactéries (ex. :

résistance à l’ampicilline) (55). Les clones sont aussi capables d’interagir entre

eux soit par compétition ou par coopération. Lorsqu’il y a compétition, les clones

vont tenter de croitre le plus rapidement possible au détriment des autres. Il y

aura donc une pression de sélection et un clone deviendra plus gros. À l’inverse,

si les clones coopèrent entre eux, différents clones vont favoriser différentes

voies de sorte à ne pas nuire à la croissance des clones adjacents et formeront

une tumeur généralement plus agressive (56) (57). Dans tous ces cas, la

médecine personnalisée semble être l’approche la plus apte à surmonter ces

phénomènes et donc détecter les profils génétiques (ou clones) devient

impératif.

Page 39: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

25

1.1.7 La génétique du cancer et sa progression jusqu'à présent

Malgré les enjeux concernant le cancer mentionné précédemment, la

communauté scientifique tente continuellement d'acquérir et de caractériser la

tumorigénèse et les mécanismes entourant celle-ci (ainsi que le gènes et les

sentiers métaboliques impliqués). Initialement, le portrait génétique du cancer

était si peu connu que l'obtention de nouveaux éléments biologiques sur un seul

gène constituait une avancée majeur (ex: p53) (58) (59). Comme dans plusieurs

autres maladies, les traitements résultants des ces découvertes furent

principalement de la thérapie génique (immunothérapie, virologie et transfert de

gène) (60). Malheureusement, jusqu'à aujourd'hui, aucunes de ces thérapies ne

peut être utilisée uniquement pour traiter le cancer en raison de plusieurs

caractéristiques des cellules cancéreuses (ex: résistance, hétérogénéité, etc.).

L'émergence des caractéristiques des cellules cancéreuses (9) et la visualisation

du cancer comme une entité (c.-à-d. une combinaison de mutations aux travers

plusieurs gènes et non un seul) entraîna un changement de paradigme. Suite à

ceci, avec l'apparition du NGS, une multitude de projets à grande échelle (ex:

GWAS, 1000 génomes, TCGA) ont été entamés dans le but de créer un

catalogue détaillé de variations génétiques (ex: SNPs, variants, insertions,

délétions, variation du nombre de copie, etc.) du génome humain (61) (62) (63)

(64) ainsi qu'une liste exhaustive de mutations exclusivement associées au

cancer (COSMIC) (65). Avec la constante évolution du NGS et la diminution des

coûts rattachés à celui-ci, la grandeur et la disponibilité de plusieurs ensembles

de données ne cessent d'augmenter. Plusieurs expériences sont maintenant

caractérisées et disponibles publiquement (ex: expression génique, expression

des miARNs, méthylation, etc.) (66). Toutes ces informations sont maintenant

disponibles dans une masse de base de données (ex: Ensembl, NIH, EGA,

cBioPortal, ICGC, etc.) et peuvent maintenant être intégrées dans n'importes

quelles études à travers le monde. Ceci est primordial pour obtenir une image

globale de la situation et pour tenter de représenter le phénomène biologique au

meilleur de nos capacités. De plus, avec un large catalogue à notre portée,

Page 40: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

26

plusieurs biais potentiellement rattachés à nos ensembles de données peuvent

être déchiffrés rapidement et amenés à des conclusions biologiques beaucoup

plus significatives (ex: âge, sexe, ethnicité, environnement, etc.). Bien

évidemment, plusieurs régions et éléments du génome sont encore très peu

documentés et pourraient, dans un futur proche, améliorer davantage notre

compréhension du cancer (ex: ARN non-codants, introns, mutations germinales,

etc.).

Malgré ceci, il n'y a eu que très peu d'avancement au niveau clinique pour le

cancer depuis plusieurs années. Les traitements restent peu efficaces et le taux

de mortalité est automatiquement corrélé avec l'inefficacité de ceux-ci. Il existe

donc un immense goulet d'étranglement entre la gigantesque quantité

d'information et la disponibilité de modèles prédictifs biologiques ayant un effet

clinique. De tels modèles pourraient non seulement avoir un impact majeur au

niveau diagnostic mais également, sur l'efficacité des traitements. Jusqu'à

présent, les méthodes diagnostiques disponibles sont très spécifiques (ex:

biopsie) et possèdent toujours quelques risques. L'utilisation de la salive et du

plasma sanguin demeure une avenue prometteuse à ce sujet (67) (68). Les

mutations extraites du NGS peuvent aussi renforcées la classification du cancer

préalablement dominée par l'histologie. Par ailleurs, l'utilisation du NGS

permettrait l'incorporation de l'impact collectif des mutations spécifiques à

chaque patient et contrecarrerait l'hétérogénéité intratumorale (médecine

personnalisée) (69).

Page 41: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

27

1.2 Biologie des systèmes

1.2.1 Concept

La biologie des systèmes est un domaine qui cible les interactions entre

plusieurs composantes et qui étudie le comportement global d’un système. Les

composantes du système étudié sont très variables et peuvent être des gènes,

protéines, sentiers métaboliques, etc. La biologie des systèmes utilise des

approches computationnelles et mathématiques pour créer des modèles qui

représentent le comportement des systèmes étudiés. Les systèmes représentés

deviennent donc plus simples et il devient possible d’étudier le contexte

biologique complet. Comme plusieurs mécanismes et réponses cellulaires

dépendent de plusieurs facteurs et signaux, il est logique d’utiliser le maximum

d’information disponible lorsque l’on veut établir un modèle. La biologie des

systèmes est donc utilisée conjointement avec la bio-informatique, la

protéomique, la transcriptomique, l’épigénétique, la métabolomique, la biologie

cellulaire, l’enzymologie, etc. En extractant une grosse quantité d‘information

provenant de différents domaines, le modèle construit devient plus complet. Il

devient possible de pouvoir représenter le contexte biologique plus précisément.

Cependant, la biologie des systèmes requiert énormément d’analyse de données

et dépend visiblement des données disponibles. Par ailleurs, le but global de la

biologie de systèmes est de simplifier un système ayant pour but de l’étudier. En

incorporant le maximum d’informations disponibles, le système peut rapidement

devenir surchargé et contrecarrer ce principe. Au niveau du cancer, il est

possible de combiner plusieurs voies métaboliques et une combinaison de gènes

qui peuvent devenir des cibles thérapeutiques ou de dépistage. Par conséquent,

ceci peut non seulement améliorer les traitements déjà mis en place, mais

également, augmenter l’efficacité des méthodes de détection du cancer (non

invasif).

Page 42: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

28

1.2.2 Sentiers métaboliques et diaphonie (« crosstalk »)

La diaphonie (« crosstalk ») est un phénomène par lequel certaines

composantes d’un système affectent un ou plusieurs autres composantes du

même système. Ce phénomène est utilisé à grande échelle à l’intérieur du corps

humain et constitue principalement un rôle de régulation. Les composantes sont

généralement des gènes ou protéines à l’intérieur d’un sentier (ou cascade)

métabolique. Ces sentiers sont en fait un équilibre de stimulus extérieurs qui

engendrent des réponses cellulaires (prolifération, apoptose, etc.). Par exemple,

si une cellule capte des facteurs de croissance extracellulaire (EGF, TGFβ), la

machinerie intracellulaire engendrera une cascade qui favorisera la prolifération.

Plusieurs mécanismes sont donc régulés à haut niveau de sorte à pouvoir

détecter et interpréter ces signaux. Bien évidemment, si ces signaux ou certaines

composantes du sentier sont altérés, la réponse cellulaire va donc être changée

elle aussi. Les cellules cancéreuses exploitent plusieurs sentiers de cette

manière en utilisant une variété de protéines et de gènes (plusieurs mentionnés

ci-dessus). Ceci leur permet d’adapter leur microenvironnement de manière à

pouvoir contourner plusieurs réponses cellulaires et favoriser leur survie. Ceci

est partiellement reflété avec la résistance et l’hétérogénéité tumorale. Les

cellules cancéreuses s’adaptent en favorisant de nouveaux sentiers

métaboliques et survivent à certains traitements. La biologie des systèmes

devient donc une approche idéale pour étudier le comportement et l’évolution

des cellules cancéreuses. Avec une image plus globale et plus complète de la

cellule, il est possible d’étudier et idéalement, d’anticiper son comportement

cellulaire. Ceci permettrait finalement d’utiliser une combinaison de gènes et de

sentiers cruciaux à la survie de la cellule cancéreuse. Comme mentionné plus

tôt, puisqu’il existe de l’hétérogénéité au travers des individus, ceci devra être

utilisé uniquement pour chaque patient et démontre l’importance de la médecine

personnalisée.

Page 43: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

29

1.2.3 Réseaux

Les réseaux (ou graphes) sont utilisés pour modéliser une variété de systèmes

(ex. : trajet d’avion, compte bancaire, etc.). Les composantes étudiées (ex :

clients, villes, gènes) sont habituellement représentées par des sommets et les

interactions entre chaque sommet sont reliées par des arêtes. Il est possible de

représenter toutes les interactions avec leur direction si celles-ci sont définies

dans le système étudié. De plus, les interactions et les sommets peuvent être

représentés par des valeurs si le système étudié le permet. Par conséquent, il

devient possible d’évaluer et quantifier un système d’un point de vue statistique.

Des perturbations (ex. : mutations, amplifications, etc.) peuvent être introduites et

à ce moment, il est possible d’étudier la stabilisation du graphe et d’évaluer son

comportement (70). L’analyse des graphes peut donc déterminer plusieurs

situations avantageuses ou non selon le modèle étudié. D’un point de vue

biologique, les gènes (ou protéines) et leurs interactions (ex. : positive, négative,

physique, etc.) peuvent être illustrés facilement à l’aide d’un réseau (Figure 1.6).

L’incorporation de plusieurs sentiers peut faciliter la compréhension du

comportement du système. Pour ce qui est du cancer, comme discuté

précédemment, plusieurs voies métaboliques semblent être contournées lorsque

les cellules cancéreuses sont sujettes à un traitement. Une approche utilisant

une modélisation graphique qui cible directement ce problème pourrait non

seulement donner davantage d’informations sur le comportement des cellules

cancéreuses (et cellules-microenvironnement), mais pourrait être utilisée comme

méthode de détection (voir chapitre 3). Des combinaisons de gènes clés

(signature) seraient utilisables pour diriger les traitements, mais aussi, comme

outil de détection. Bien évidemment, les graphiques utilisés devraient être

spécifiques à un sous-type (ex. : cancer du sein luminal, basal, etc.) et les

perturbations seraient distinctes pour chaque patient. Ceci amènerait donc une

spécificité intra- et inter-tumoral de même qu’une spécificité intra- et inter-

individus ce qui constitue un problème majeur en ce moment avec les méthodes

courantes utilisées. Les signatures pourraient d’autant plus être utilisées comme

cibles thérapeutiques (ex. : chimiothérapie combinatoire).

Page 44: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

30

Ceci augmenterait l’efficacité des traitements et réduirait grandement les effets

néfastes de ceux-ci. Suivant ce concept, il devient possible d’identifier plusieurs

gènes associés à un phénotype désiré (ex. : métastases, maladie cardiaque,

etc.) et identifier des signatures en conséquence (section 3) (71). Ceci signifie

qu’il n’y a aucune mutation aléatoire lors du développement du cancer et que

toutes ces mutations sont des étapes par lesquelles le cancer peut progresser.

Ainsi, toutes ces mutations peuvent être utilisées pour détecter et surveiller de

près la progression tumorale (72). La médecine courante pourrait donc introduire

des protocoles permettant de suivre certains patients avec des antécédents

médicaux ou des antécédents familiaux et veiller à ce que la progression du

phénotype (s’il y a lieu) soit suivie. Bien évidemment, le cancer pourrait lui-même

être détecté avec cette approche et malgré le fait que certains groupes de

Figure 1.6: Réseau non dirigé représentant les gènes associés à la prolifération du

glioblastome. Chaque sommet représentant un gène et chaque arête une interaction

entre les sommets impliqués. Tirée de (81).

Page 45: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

31

recherche tentent d’accomplir cette tâche, cette méthode n’a pas encore été

explorée assez profondément pour réaliser ceci (73).

1.3 La bio-informatique et son importance

Depuis la fin du projet du génome humain en 2003, les méthodes de

séquençage ont subi d’énormes avancées. Avec le séquençage de nouvelle

génération (NGS), il est maintenant possible de séquencer le génome humain

pour moins de 1000$ et cela prend environ 26h (74). Initialement, durant le HGP,

ceci avait pris 13 ans et couté environ 2,7 milliards de dollars. De plus, plusieurs

sous-méthodes ont été développées depuis le NGS. De nos jours, le

séquençage du génome entier est beaucoup moins utilisé qui l’était au début des

années 2000. Le séquençage complet des exomes (WES) est une méthode

beaucoup plus utilisée lorsqu’il est question d’obtenir le profil génétique d’un

patient (c’est-à-dire ses mutations). Le séquençage d’ARN (RNA-seq) est

également utilisé à grande échelle lorsqu’il est question d’obtenir le profil

d’expression des cellules du patient. Plusieurs autres méthodes subséquentes

ont également été développées au fil des années pour différents types d’études

(ex. : ChIP-Seq, FISH, séquençage ciblé, etc.). Bien évidemment, avec toutes

ces nouvelles méthodes, la quantité de données découlant de ces analyses

augmentent sans arrêt et par conséquent, la bio-informatique prend beaucoup

d’ampleur. Il est toujours important d’avoir une bonne quantité de données

lorsque l’on veut entreprendre une investigation. Cependant, ces données

doivent être analysées et traitées avant même de pouvoir être utilisables; ceci

est réalisé à l’aide de la bio-informatique. Avec des avancées technologiques

immenses, il n’est pas surprenant de voir une corrélation entre la quantité de

données émises et l’utilisation (expansion) de la bio-informatique. En bref, la bio-

informatique représente le pont majeur entre les méthodes expérimentales et les

méthodes informatiques (ex. : statistiques, réseaux, modèles, etc.). La bio-

informatique permet maintenant beaucoup d’approches qui ne semblaient pas

possibles auparavant. Des calculs complexes qui pouvaient prendre des mois et

même des années sont maintenant réalisés en quelques jours avec l’aide de

Page 46: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

32

multiserveurs contenant plusieurs processeurs et même, dans certains cas,

plusieurs cartes graphiques (parallélisme). Il est donc possible de représenter

des systèmes beaucoup plus complexes et de simuler leurs comportements pour

améliorer notre compréhension de ceux-ci (ex. : modélisation biomoléculaire,

biologie des systèmes, apprentissage automatique, etc.). Mais encore, les

algorithmes (méthodes) pour traiter les données produites par le NGS sont

constamment améliorés par la communauté scientifique de sorte à produire des

données de plus en plus précises et ne pas négliger aucun aspect

potentiellement omis durant ce traitement. Par conséquent, plusieurs

compagnies se consacrent maintenant à l’analyse de données (ex : Biobase,

Bina technologies, etc.). Certaines compagnies informatiques ont même

commencé à offrir certains services d’analyses de fichiers de séquençages

puisque ceux-ci deviennent de plus en plus immenses (ex. : Microsoft, Google). Il

existe aussi plusieurs compagnies qui procurent de l’espace de stockage et du

temps du calcul (ex. : Annai Systems, GNS healthcare, etc.) pour des plus petits

laboratoires qui n’ont pas les moyens d’investir dans ces services. De plus, pour

des maladies ayant un impact mondial comme le cancer, les compagnies veulent

évidemment avoir des méthodes de dépistage (biomarqueurs) et des signatures

disponibles au public (ex. : 23andMe). Bien évidemment, l’intérêt soudain des

multinationales pour la bio-informatique n’a absolument aucun lien avec la

recherche et est principalement consacré à procurer des services, mais il est

intéressant de voir que ces compagnies voient l’immense potentiel de celle-ci.

D’autre part, les sciences computationnelles amènent plusieurs avantages au

niveau temporel et une certaine flexibilité. Par exemple, d’un point de vue

expérimental, si l’on désire tester un médicament, il faut passer par des essais

cliniques et ceux-ci sont très régulés et très longs. D'un point de vue

informatique, il serait possible de tester plusieurs médicaments pour plusieurs

types de cancers à la fois et déterminer si ceux-ci ont l’effet désiré ou non (cibles

thérapeutiques). Les essais cliniques suivant ces analyses sont donc beaucoup

plus efficaces. Par contre, les modèles informatiques ne sont jamais parfaits et

requièrent toujours des améliorations. Par conséquent, la bio-informatique

Page 47: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

33

requiert généralement des preuves expérimentales pour valider les résultats

obtenus. Cependant, celle-ci peut accélérer de façon significative la durée de

l’étude et même explorer plus largement le mécanisme désiré. Les méthodes

informatiques et expérimentales doivent donc être utilisées conjointement pour

maximiser leurs avantages.

Page 48: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

34

CHAPITRE 2 PROBLÉMATIQUE, HYPOTHÈSE ET OBJECTIFS

2.1 Problématique

Même avec les avancements réalisés sur le cancer, il n’existe toujours aucune

méthode de dépistage offert pour tous les types de cancers. Additionnellement,

le meilleur traitement disponible reste la chirurgie et est proportionnellement

affecté par la progression du cancer. Par conséquent, les méthodes de

dépistage affectent directement la survie des patients. De plus, depuis

l’existence du NGS, la disponibilité et quantité de données disponibles

augmentent sans arrêt et aucun modèle jusqu’à présent ne permet la prédiction

d’un phénotype donné à l’aide des fichiers de séquençage. Également, plusieurs

études utilisent déjà des signatures génétiques (combinaisons de gènes) pour

identifier certains types de cancers. Il existe donc une grande corrélation entre

les mutations et la progression tumorale. Ainsi, la création de modèles

permettant de prédire un phénotype à l’aide de mutations provenant des fichiers

de séquençage devient une priorité. Par ailleurs, la prédiction de phénotype peut

non seulement améliorer grandement les méthodes de détection, mais aussi, le

comportement tumoral et augmenter l’efficacité des médicaments utilisés en

ciblant des gènes responsables du phénotype en question. Si l’efficacité des

traitements couramment utilisés est augmentée, la survie des patients l’est

également. Finalement, puisque la létalité du cancer reste un problème d’une

importance mondial, ces problèmes restent d’une priorité extrême et une

amélioration à ce niveau génèrerait donc un impact majeur aussi scientifique que

médical.

Page 49: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

35

2.2 Hypothèse et objectifs

Si les signatures géniques peuvent être utilisées comme outil de prédiction, il

devrait être possible d’utiliser les mutations des patients pour obtenir des

signatures exclusives pour chaque patient. Par ailleurs, aucune méthode ne

permet la prédiction de certains phénotypes (c.-à-d. récurrence). De plus, il

n’existe en ce moment aucun modèle permettant d’utiliser les mutations

provenant des fichiers de séquençage. Par conséquent, si un modèle

(algorithme) peut être développé permettant cette tâche, ceci avantagerait

grandement la médecine personnalisée. Également, si les mutations somatiques

peuvent refléter la progression tumorale, les mutations germinales peuvent

hypothétiquement être utilisées selon le même principe. Avec un suivi accru du

patient, il serait donc possible de détecter un phénotype spécifique avant même

son apparition. Finalement, en utilisant la biologie des systèmes et des réseaux

de gènes, il pourrait être possible de représenter et d’étudier un phénotype. En

utilisant des cancers bien détaillés (ovaire et sein), il serait possible de bien

caractériser la récurrence de ceux-ci et potentiellement, de prédire si le cancer

d’un patient développera des métastases. Les objectifs sont donc :

- Représenter et caractériser un phénotype à l’intérieur d’un réseau de gènes

pour en étudier son comportement.

- En utilisant le NGS et le comportement du phénotype étudié, extraire des

mutations somatiques ayant un impact sur les gènes clés causant la

récurrence (phénotype étudié).

- Identifier des signatures géniques distinctes à chaque type de cancer pouvant

permettre la prédiction de la récurrence du patient.

- Tenter d’utiliser les mutations germinales comme outil de prédiction de la

même manière que les mutations somatiques.

Page 50: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

36

Chapitre 3 Article

AVANT-PROPOS

La section qui suit représente l’intégrité totale de mon projet de maîtrise. J’ai été

la principale personne à travailler sur ce projet et j’ai réalisé toutes les étapes de

celui-ci avec l’aide de mes collègues (mentionnés ci-dessous). Les

méthodes/résultats ont été soumises sous forme d’article dans le journal JAMA

Oncology en août 2016 et avons resoumis en Juin 2017 (avec corrections

demandées). Bien évidemment, le projet entier a été supervisé par mon directeur

Dr Arnaud Droit et Dr Edwin Wang en collaboration avec tous les membres du

laboratoire du Conseil National de Recherches du Canada à Montréal: Naif

Zaman, Chabane Tibiche et Jinfeng Zou.

3.1 Résumé

Importance: La diminution constante des coûts de séquençage augmente

constamment l’accessibilité du séquençage du génome pour des applications

cliniques routinières. Le développement de tests ayant des pronostiques basés

sur le génome pour les patients atteints du cancer (lorsque diagnostiqué) va

avoir un impact significatif sur la sélection des traitements et la survie du patient,

ce qui est crucial pour les cliniciens et leurs prises de décisions.

Objectifs : Développer et valider les signatures géniques et leurs pronostiques

en utilisant des données de séquençages des clones fondateurs de la tumeur

(c.-à-d., la cellule cancéreuse fondatrice transformée d’une cellule normale après

avoir acquise une série de mutations) ou les mutations germinales des patients

atteints du cancer des ovaires et du sein.

Plans, paramètres et participants : 272 patients ayant un cancer du sein RE+

(luminal) et 267 patients ayant un carcinome séreux ovarien avec un suivi

clinique ont été utilisé. Le séquençage des exomes complets (WES) de la tumeur

Page 51: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

37

et du tissu normal conjoint furent sélectionnés. 63 tumeurs ovariennes et 80

tumeurs luminals furent désignées pour représenter l’ensemble des données

d’entrainement et le reste pour l’ensemble des données de validation.

Mesure des résultats principaux : Les signatures géniques identifiées à partir

des données de séquençage des mutations germinales et des clones fondateurs

des patients peuvent prédire les résultats médicaux des patients.

Résultats : Nous avons correctement identifié des signatures géniques qui

donnent un pronostique médical en utilisant le séquençage complet des exomes

des mutations germinales et des clones fondateurs des patients. Nous avons

montré que des signatures dérivées des mutations génomiques germinales ou

des clones fondateurs distinguent significativement la récurrence des patients

ayant le cancer des ovaires (P=1.0x10-6 et 3.3x10-6 pour les mutations

germinales et celles du clone fondateur, respectivement) de même que la

récurrence des patients atteints du cancer du sein (P=3.7x10-3 et 1.1x10-3 pour

les mutations germinales et celles du clone fondateur, respectivement).

Cependant, les signatures provenant des mutations du clone fondateur

démontrent une meilleure performance comparée à celle des mutations

germinales.

Conclusions et pertinence : Les signatures géniques dérivées des mutations

germinales ou celles provenant du clone fondateur des patients prédisent

significativement le pronostique du cancer. Ces résultats impliquent qu’un profil

génétique d’un patient peut prédire des phénotypes médicaux (et la santé du

patient) et est une méthode potentielle non invasive pour développer des tests

pronostiques provenant du génome en séquençant la salive ou le sang du

patient.

Page 52: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

38

3.2 Abstract

Importance: Continual reduction in sequencing cost is expanding the

accessibility of genome sequencing for routine clinical applications. Development

of noninvasive, genome-based prognostic tests for cancer patients at diagnosis

will significantly impact on treatment selection and patients’ outcomes, which is

critical for clinicians in making decisions.

Objective: To develop and validate prognostic gene signatures using whole

exome sequencing data of tumor founding clones (i.e., the founding cancer cell

transformed from a single normal cell through acquiring a series of mutations) or

germlines of breast and ovarian cancer patients.

Designs, settings and Participants: 272 luminal-breast and 267 serous ovarian

cancer patients who have clinical follow-up have been used. Tumors and their

paired normal samples have been whole exome-sequenced. 63 ovarian and 80

luminal-breast cancer patients, respectively, were used for discovery while the

rest of the patients were used for validation.

Main Outcome Measures: Gene signatures identified from the sequencing data

of cancer patients’ germlines or tumor founding clones significantly predict

patient outcome.

Results We successfully identified gene signatures for cancer prognosis using

the whole exome sequencing data of either tumor founding clones or patients’

germlines. We showed that gene signatures derived from genomic mutations of

either germlines or tumor founding clones significantly distinguished recurred and

non-recurred ovarian cancer patients (P=1.0x10-6 and 3.3x10-6 for germlines and

founding clones, respectively) and breast cancer patients (P=3.7x10-3 and

1.1x10-3 for germlines and founding clones, respectively), although founding

clone mutations derived gene signatures have slightly better performance than

germline mutations derived ones.

Page 53: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

39

Conclusions and Relevance: Gene signatures derived from patients’ germline

mutations or tumor founding clone mutations significantly predicted cancer

prognosis. These results imply that a patient’ genetic makeup could predict

clinical outcomes and it is potential to develop a non-invasive, genome-based

prognostic test by sequencing a patient’s blood or saliva sample.

3.3 Introduction

Tumor recurrence and metastasis is the leading cause of cancer mortality.

Accurately predicting of tumor recurrence and metastasis could greatly aid

clinicians in making treatment decisions. For example, most of the low-risk breast

cancer patients (i.e., patients whose tumors do not recur for 10 years after

surgery alone) do not gain survival benefits from adjuvant therapy (i.e.,

chemotherapy given after surgery to reduce the risk of cancer recurrence), but

will suffer from its toxic side effects. Prognostic biomarkers could predict if a

patient is likely to get tumor recurrence and metastasis after surgical removal.

Therefore, it is helpful to identify patients who should be treated with

chemotherapy. With the decreasing cost of genome sequencing, prognostic

prediction using genome sequencing data have become of great clinical interest.

In the past, some germline mutations have been associated with the outcomes of

cancer patients. For example, germline mutations in BRCA1/2 have a good

prognosis in ovarian cancer patients33, while TP53 and ATM mutations in

chronic lymphocytic leukemia patients have poor survival, independent of other

factors32. Thus far, only a handful gene mutations in germlines have been

associated with cancer outcomes, furthermore, these genes represent only a

small fraction of cancer patients. In general, cancer recurrence and metastasis

are the results of multiple gene interactions, therefore, we are reasoning that a

collective germline genetic variants/mutations in cancer patients might be

Page 54: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

40

associated with patient outcomes. Next-generation sequencing provides an

opportunity to test this hypothesis. Furthermore, genome sequencing

technologies are becoming more affordable and accessible for routine clinical

usage. If the collective germline mutations of a cancer patient could predict

his/her clinical outcome, genome sequencing of patients’ blood or saliva samples

could provide a noninvasive way for determining patients’ prognosis and help

clinicians in making treatment decisions.

Predicting cancer prognosis using genome sequencing data has proven

challenging, since complex genetic diseases including cancer exhibit extensive

mutational heterogeneity. For example, gene mutation status varies widely

across individual cancer cells. In other words, mutated genes are rarely shared

between any two individual tumors, even of the same cancer type. Each patient

tumor thus harbors a unique genomic profile 1,2,5,13,14,20. This feature of tumor

mutations makes it extremely hard to make predictions using collective genomic

mutations. Although tumor collective genomic mutations have not been

successful for making predictions, they have been used for tumor classifications

based on a network approach11. This approach transforms the mutations of an

individual sample into a profile which is similar to gene expression profiles (here,

we called this process as ‘network profiling’).

In this study, to predict cancer prognosis using sequencing data (i.e.,

eTumorMetastasis), we first took a network profiling approach which transforms

genome sequencing data into network-derived profiles (i.e., netProfiles). To

identify gene signatures, we modified our previously developed Multiple Survival

Screening (MSS) algorithm 11, which was originally designed to identify cancer-

hallmark-based gene expression signatures, and then applied combinatory

cancer-hallmark-based gene signature sets (CSS sets) approach7 to the

netProfiles. We showed that the germline mutations of either cancer patients or

tumor founding clones (i.e., the founding cancer cell transformed from a single

normal cell through acquiring a series of mutations) successfully predicted the

recurrence and patient outcomes in breast and ovarian cancers. These results

Page 55: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

41

imply that the germline mutations of cancer patients play a critical role in tumor

recurrence, metastasis and patient outcomes. Furthermore, genome sequencing

of blood or saliva samples of cancer patients could provide a noninvasive,

convenient, and timely prognostic test.

3.4 Methods

Data for tumors and their paired normal samples

Whole exome-sequence data of serous ovarian and luminal-breast tumors and

their paired normal samples were obtained from TCGA. Patients for which

information on recurrence and clinical follow-up is available were selected for the

analysis. In total, 272 and 267 ovarian and luminal-breast tumor samples have

been used in this study. Gene expression profiles and SNP 6.0 array data of

these samples were also downloaded from TCGA.

Determine functionally mutated genes

To determine whether a genetic variant is functionally mutated, we ran the

following tools: Variant Effect Predictor 19 (e.g., a functional mutation is defined

as deleterious or damaging), CRAVAT 6 (e.g., a functional mutation is defined as

a score higher than or equal to 0.5) and MutationTaster2 21 (e.g., a functional

mutation is defined as having a disease impact). For a given sample, we merged

all functional mutations predicted by the three tools for further analysis. In this

study, all the mutated genes mentioned are ‘functionally mutated genes’.

Construction of luminal-breast and ovarian cancer-specific metastasis

networks

To construct the breast luminal-breast cancer specific metastasis network, we

modified a previous procedure for constructing luminal breast cancer-specific

cancer survival and proliferation networks 27. Briefly, we extracted a subnetwork

by mapping the luminal-breast cancer specific metastasis-associated genes onto

a human signaling network. To do so, we first identified metastasis-associated

genes using luminal cancer cell lines and tumor samples. We obtained the gene

Page 56: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

42

expression data of 22 luminal cancer cell lines from the Cancer Cell Line

Encyclopedia (CCLE, http://www.broadinstitute.org/ccle). Gene expression

data normalization was conducted with the median centering and z-score

normalization method described previously 17. Using the ratio of two genes’

expression values (i.e., CDH1/VIM for determining epithelial–mesenchymal

transition), we classified these lines into epithelial (n=13, CDH1/VIM > 1.2) and

mesenchymal (n=9, CDH1/VIM <= 1.2) lines. Modulated genes (called Set 1)

were identified by conducting a t-test comparison (P < 0.05) of the two groups of

cell lines with 10 re-samplings (i.e., each re-sampling randomly took 60% of the

original samples). We also obtained the gene expression data of 1,197 luminal

tumor samples from METBRIC set

(https://www.ebi.ac.uk/ega/studies/EGAS00000000083). These samples include

information about cancer recurrence and clinical follow-up. Using this set, we

used a t-test (P < 0.05) to identify significantly-modulated genes between the

recurred and non-recurred samples. Next, we performed Kaplan-Meier survival

tests on the modulated genes to identify survival-associated genes (called Set 2)

using 10 re-samplings. We further identified potential cancer gene regulators by

analyzing the copy number data (SNP 6.0 data) of the luminal tumor samples

from TCGA. The SNP 6.0 data were processed using GISTIC to obtain GISTIC

scores for each gene. For a given gene in a sample, if its GISTIC score was

greater than 0.3 and its expression value was ranked among the top 50% of the

genome, we defined this gene as a cancer regulator (for details, see Zaman et

al., 2013 27). The regulators of all TCGA’s luminal tumor samples were defined as

Set 3. We mapped all the genes from Sets 1, 2 and 3 onto the signaling network

(eg, merging the manually curated human signaling network 4,18 and a protein

interaction network 15) and extracted their links to obtain a luminal-breast cancer

specific metastasis network that contains 6,148 genes and 62,004 interactions.

The same procedure was applied to construct an ovarian cancer specific

metastasis network. To do so, gene expression of 17 ovarian cancer cell lines

from CCLE and ovarian tumors from GSE13876 and GSE26712 were used while

SNP 6.0 data of TCGA ovarian tumors were used.

Page 57: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

43

Generation of netProfiles using a network propagation approach

To generate a netProfile for a sample, we projected its functionally mutated

genes as seeds onto its cancer type-specific metastasis network and then

applied a network propagation algorithm 24 to obtain heating scores of the genes

within the network. We applied a scaling factor of 100,000 to the heating scores

and then conducted data transformation using the median centering and z-score

within sample approach 17.

Statistical Analysis

Statistical significance of the prognostic groups (ie, high- or low-risk groups

defined by gene signatures) was determined using Kaplan-Meier survival plots. A

prognostically significant result was defined by log-rank P< .05. All the analyses

were performed using the R statistics package.

3.5 Results

Tumor founding clone mutations predict tumor recurrence

To determine if genome sequencing data can be used to predict cancer

prognosis, we first used mutations of tumor founding clones. A single normal cell

is assumed to acquire a series of random mutations until their combined effect

results in its transformation into a founding cancer cell (e.g., the founding clone),

an early evolutionary stage of a tumor. Additional accumulation of mutations from

this founding clone leads to the formation of a tumor that is composed of a

heterogeneous mixture of cells (Fig. 1). Therefore, each tumor originates from a

founding clone whose mutations are ubiquitously present in all the cells of that

tumor. New mutations do not arise in isolation but rather act together in a

complementary manner within the context of the established genomic landscape;

therefore, the pre-existing mutations or genetic variants (i.e., in germlines or

founding clones) of a molecular network may have a profound effect on the fate

of the cells and determine whether novel mutations will result in cell death, clonal

expansion, metastasis and other cancer hallmark traits25. This implies that the

Page 58: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

44

genetic makeup of the founding clone provides an evolutionary constraint for

sequential subclone generation and limits the genetic and clonal complexity of

tumors. Tumor genome sequencing allows us to dissect founding and subclones

and to replay the tape of tumor evolutionary history, while eTumorMetastasis

developed here allows us to examine the evolutionary and patient outcomes that

are affected by these early evolutionary events (eg, mutations in early

evolutionary stages). Therefore, we examined whether the mutations in founding

clones could predict tumor recurrence and metastasis.

This hypothesis was first tested using serous ovarian tumor whole exome

sequencing data. Serous ovarian cancer represents more than 70% of ovarian

cancers. Fig 2 shows the flowchart for identifying gene signatures using genome

sequencing data. To predict cancer prognosis using founding clone mutations,

we first constructed an ovarian cancer-specific metastasis network (Methods) by

modifying our previous method of constructing a luminal-specific cancer survival

network 27. We identified functionally mutated genes in the founding clones using

the sequencing data of ovarian tumors and their paired normal samples

(Supplementary Methods). New mutations need to function together with pre-

existing mutations to activate and promote cancer hallmark networks such as

metastasis networks25; therefore, founding clone mutations contain both germline

mutations and founding clone somatic mutations. To generate a netProfile for a

founding clone, we projected its mutated genes onto the ovarian cancer

metastasis network using the network propagation algorithm (Methods). This

resulted in a founding clone-specific netProfile in which the network genes were

assigned with heating scores.

To identify gene signatures for predicting tumor recurrence, we modified our

previously developed MSS algorithm17. MSS has been originally designed for

identifying gene signatures from gene expression profile. To apply MSS to

netProfiles, we modified the MSS by generating 5 million random gene sets (30

gene each) from a selected cancer hallmark gene group to classify 200 random

sets of netProfiles (i.e., classify into recurred and non-recurred sample groups)

derived from the training set, and finally selected 1,000 to 5,000 gene sets that

Page 59: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

45

are able to classify at least 180 sets of the 200 sets of netProfiles (details in the

pseudocode of eTumorMetastasis, Supplementary Methods). We identified 12

gene signatures (Supplementary Table 1) and showed that they were

significantly predictive in 4 validation sets (Supplementary Table 2). To further

improve the prediction accuracy, we built combinatory gene signature sets (CSS

sets, Supplementary Methods) 7 using the identified gene signatures. We further

showed that the CSS sets (Supplementary Table 3) significantly distinguished

recurred and non-recurred tumors in all 4 other validation sets (P=3.3x10-6, Table

1 and Fig 3a-b).

To demonstrate a broader applicability of eTumorMetastasis, we applied it to

TCGA breast tumors. Breast cancer has two major molecular subtypes: luminal

and basal. Luminal tumors represent a large proportion (~70%) of the breast

tumors. Through an examination of sequencing data and clinical follow-up

information, we found that TCGA collected several hundred of luminal tumors but

only ~100 basal tumors. We therefore decided to use luminal tumors to

implement eTumorMetastasis. We showed that founding clone-derived gene

signatures significantly distinguished recurred and non-recurred tumors in

validation sets of luminal-breast cancer patients (P=1.1x10-3, Supplementary

Tables 1, 4-5 and Supplementary Fig. 1), suggesting that the algorithm is

applicable to other cancer types. These results strongly indicate that late

evolutionary events and patient outcomes (i.e., tumor recurrence and metastasis)

are highly dependent on the genomic landscape of early evolutionary stages

(i.e., founding clone).

Germline mutations of cancer patients predict tumor recurrence

Cancer is a process of asexual evolution driven by genomic alterations. A single

normal cell randomly acquires a series of mutations that allows it to proliferate

and to be transformed into a founding clone thus initiating tumor progression. We

hypothesized that mutagenic processes are essentially blind or non-purposeful,

however, to drive cancer metastasis, new mutations will be selected if they

Page 60: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

46

integrate into the pre-existing genomic landscape (i.e., germline mutations or

germline genetic variants) to trigger or activate a cancer metastasis network25.

This means that pre-existing germline genetic variants could provide a profound

constraint on the evolution of founding clones and subclones, and therefore, has

a contingent effect on tumor evolution and patient outcomes. As shown above,

founding clone mutations are able to predict tumor recurrence. Thus, we asked if

the genomic landscape of a patient’s germline could predict a cancer patient

outcome.

To do so, we used the sequencing data of luminal-breast and ovarian cancer

patient germlines to identify gene signatures for predicting tumor recurrence. We

extended the procedures used for founding clones to the patient germline

sequencing data. Finally, we identified 8 and 10 gene signatures for luminal-

breast and ovarian cancer, respectively (to understand the signature number

differences, see Supplementary Methods). CSS sets were constructed using

these gene signatures. The CSS sets of ovarian cancer significantly

distinguished recurred and non-recurred tumors in all the validation sets of

ovarian cancer patients (P=1.0x10-6, Table 2, Fig. 3c-d, Supplementary Tables 1

and 8 and Supplementary Fig. 2). Similarly, the CSS sets of breast cancer

significantly distinguished recurred and non-recurred tumors in all the validation

sets of breast cancer patients (P=3.7x10-3, Supplementary Tables 1, 6-7). These

results support our hypothesis that clinical outcome is significantly dependent on

the original germline genomic landscape of the cancer patient. Practically,

genome sequencing a patient’s blood or saliva sample provides a convenient,

timely and noninvasive way to predict patient outcome in a clinical setting.

To understand why germline genomic landscapes of cancer patients are

predictive for tumor recurrence, we conducted enrichment analysis of the genes

with high heating scores derived from germline mutations (Supplementary

Methods). We found that high heating-score genes derived from germline

mutations of the recurred ovarian cancer patients are enriched with cell-cell

adhesion but not in non-recurred patients (Supplementary Table 9). This data

Page 61: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

47

suggest that germline genetic variants or mutations of the recurred patients

influence cell-cell adhesion process, with is related to metastasis. Furthermore,

although cell cycle and DNA damage are enriched in the high heating scored

genes for both recurred and non-recurred ovarian cancer patients, they are more

significant in the recurred group (Supplementary Table 9). These results suggest

that germline genetic variants in the recurred patients promote more cell

proliferation (i.e., cell cycle) and genome instability (i.e., DNA damage), which

also promote metastasis. It is well known that molecular mechanisms of

tumorigenesis are different between luminal-breast cancer and ovarian cancer2.

We found that cell migration and FGF pathway are significantly enriched in the

high heating scored genes of recurred patients but not in non-recurred patients

(Supplementary Table 10). FGF pathway has been reported to promote breast

cancer metastases for a long time28. These results suggest that germline

mutations in the recurred and non-recurred patients are different such that

recurred patients germline genetic variants promote more cell proliferation and

cell migration.

Of note, in both cancer types we could not identify gene signatures which are

involved in immune response (i.e., a cancer hallmark) using germline mutations,

but successfully identified immunologically related gene signatures using

founding clone mutations. These results suggest that functionally mutated genes

that help cancer cells to escape from host immune system were positively

selected during early stage (i.e., founding clone) of tumorigenesis. In addition,

we observed that the prediction performance of founding clone derived CSS sets

is better than that of germline derived CSS sets. These results are consistent

with the fact that a founding clone lies downstream of the germline ancestor cell

during tumor evolution.

Page 62: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

48

3.6 Discussion

Predicting cancer prognosis using genome sequencing data

As genome sequencing technologies are becoming more affordable and

accessible for routine clinical usage, they are now being used for personalized

genomic tests such as TruGenome clinical sequencing tests (Illumina), Personal

DNA tests (23andMe), FoundationOne cancer sequencing tests (Foundation

Medicine) and so on. At the moment, it is easy to generate personal genome

sequencing data, but extremely difficult to interpret in the context of personal

health. Genomic reports derived from these genomic tests often use a single

gene mutation or SNP as a link to complex genetic diseases or to guide certain

treatments. However, most of these associations are very weak and ambiguous,

because complex genetic diseases result from the interactions between multiple

genetic mutations and other factors. Clearly, to properly interpret personalized

genomic testing results, it is necessary to use a collection of mutations to predict

phenotypes or diseases. In this study, we showed that a combination of network

profiling and MSS allows the prediction of cancer prognosis using genome

sequencing data, which paves the way for the application of sequencing

technology in clinics.

Network profiling allows to estimate the collective effects of genomic alterations

(i.e., functionally mutated genes) on cancer hallmark networks (details about

cancer hallmark networks can be found in the recent review25) that better

represent the phenotypic consequences of mutated genes. Tumor recurrence

may be regulated by a transition state between metastatic and non-metastatic in

a metastasis network. Rare commonalities of mutated genes between tumors

suggest that there are multiple ways in which genetic alterations may trigger a

state transition. However, the collective effects of multiple mutated genes may

converge into a few sets of networked genes (i.e., gene signatures) that

modulate the transition state between metastatic and non-metastatic. Each of

these sets (i.e., gene signatures) contains a group of genes along with a

representation of their regulatory relationships and strengths (i.e., represented by

Page 63: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

49

heating scores here). In this context, we expected that these gene signatures

might predict tumor recurrence and metastasis.

Germline genomic landscapes impact cancer patient outcomes

Genome-wide germline genetic variants can be easily obtained by genome

sequencing of cells from liquid biopsies such as blood or saliva samples.

Prognostic prediction using a patient's germline genomic landscape opens up the

possibility of assessing cancer patients’ risk of recurrence in a noninvasive

manner, which allows forecasting of cancer recurrences in a quick, convenient

and minimally painful manner. Cancer recurrence and metastasis are highly

complex processes where interactions between tumors and their hosts (i.e.,

encoded by the germline genomic landscapes of the cancer patients) play a

dominant role. Therefore, we hypothesized that, once a patient develops cancer,

the chance of tumor recurrence is significantly dependent on that patient’s

germline genomic landscape. Our observation that germline genomic landscapes

can predict tumor recurrence and metastasis supports this hypothesis.

The tumor microenvironment, which can also be modulated by the patients’

genetic makeup could also influence tumor recurrence. Thus far, our

understanding of the fundamental biology of the tumor-host interaction has been

limited. However, several reports provide evidence that germline mutations of

cancer patients modulate metastasis through the tumor microenvironment. It is

known that germline-encoded receptors could trigger innate immune responses

in cancer patients29. The presence or absence of the T cell-inflamed tumor

microenvironment phenotype in individual patients also the result from

interactions between somatic differences at the level of the tumor cells and

germline polymorphism differences at the level of the host. Patients with T cell-

inflamed tumors often have good prognosis30. Germline mutations of cancer

patients could mediate the efficiency of the immune systems in the tumor

Page 64: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

50

microenvironment. For example, lung cancer patients with germline mutations in

the Nrf2 gene have good prognosis, due to a mechanism that Nrf2 exerts anti-

metastatic activity by regulating the inflammatory status and redox balance of the

hematopoietic and immune systems of cancer patients31. In prostate cancer,

patients with some germline variants of the ASPN D locus are highly associated

with poorer oncologic outcomes32, probably through its interactions with TGF-b.

These studies support the hypothesis that the cancer patients’ genetic makeup

influences metastasis. Taken together, the germline genomic landscape of a

cancer patient might provide not only a substantial constraint on tumor

recurrence for tumor cells, but also constrains for the tumor microenvironment,

which ultimately has a profound impact on patient outcomes. These insights

provide rationales that clinical outcomes of carcinogenesis could be predicted

based on the germline genomic landscapes of cancer patients. This study sheds

light on the possibility that metastasis rates are predictable based on the

germline genomic landscapes of cancer patients. These results prompted us to

propose that future studies of tumor metastasis would benefit from a shift to

genome-based studies in the early evolution of tumors. Traditionally, germline

mutations have been largely ignored in cancer genomics studies. Many cancer

genomic studies, including the TCGA efforts, have often focused on somatic

cancer driving mutations, while filtering out germline mutations before formal

analysis of tumor genome sequencing data.

In summary, we implemented an eTumorMetastasis algorithm for predicting

prognosis based on genome sequencing data. We showed that sequencing of

patient germline genomes might provide an efficient, non-painful and convenient

way for predicting tumor recurrence. Moreover, genome sequencing of blood or

salivary samples of cancer patients could provide a non-invasive test for

prognosis that could help doctors in making treatment decisions.

Page 65: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

51

3.7 References

1 Cancer Genome Atlas Network, "Integrated genomic analyses of ovarian carcinoma," Nature 474(7353), 609 (2011).

Ref Type: Journal

2 Cancer Genome Atlas Network, "Comprehensive molecular portraits of human breast tumours," Nature 490(7418), 61 (2012).

Ref Type: Journal

3 J. C. Costello, et al., "A community effort to assess and improve drug sensitivity prediction algorithms," Nat. Biotechnol. 32(12), 1202 (2014).

Ref Type: Journal

4 Q. Cui, et al., "A map of human cancer signaling," Mol. Syst. Biol. 3, 152 (2007).

Ref Type: Journal

5 T. Davoli, et al., "Cumulative haploinsufficiency and triplosensitivity drive aneuploidy patterns and shape the cancer genome," Cell 155(4), 948 (2013).

Ref Type: Journal

6 C. Douville, et al., "CRAVAT: cancer-related analysis of variants toolkit," Bioinformatics. 29(5), 647 (2013).

Ref Type: Journal

7 S. Gao, et al., "Identification and Construction of Combinatory Cancer Hallmark-Based Gene Signature Sets to Predict Recurrence and Chemotherapy Benefit in Stage II Colorectal Cancer," JAMA Oncol. doi:10.1001/jamaoncol.2015.3413 (2015).

Ref Type: Journal

8 G. Gundem, et al., "The evolutionary history of lethal metastatic prostate cancer," Nature 520(7547), 353 (2015).

Ref Type: Journal

9 D. Hanahan and R. A. Weinberg, "Hallmarks of cancer: the next generation," Cell 144(5), 646 (2011).

Ref Type: Journal

10 Douglas Hanahan and Robert A. Weinberg, "The Hallmarks of Cancer," Cell 100(1), 57 (2000).

Ref Type: Journal

11 M. Hofree, et al., "Network-based stratification of tumor mutations," Nat. Methods 10(11), 1108 (2013).

Page 66: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

52

Ref Type: Journal

12 M. K. Hong, et al., "Tracking the origins and drivers of subclonal metastatic expansion in prostate cancer," Nat. Commun. 6, 6605 (2015).

Ref Type: Journal

13 D. T. Jones, et al., "Dissecting the genomic complexity underlying medulloblastoma," Nature 488(7409), 100 (2012).

Ref Type: Journal

14 S. Jones, et al., "Core signaling pathways in human pancreatic cancers revealed by global genomic analyses," Science 321(5897), 1801 (2008).

Ref Type: Journal

15 T. S. Keshava Prasad, et al., "Human Protein Reference Database--2009 update," Nucleic Acids Res. 37(Database issue), D767-D772 (2009).

Ref Type: Journal

16 M. D. Leiserson, et al., "Pan-cancer network analysis identifies combinations of rare somatic mutations across pathways and protein complexes," Nat. Genet. 47(2), 106 (2015).

Ref Type: Journal

17 J. Li, et al., "Identification of high-quality cancer prognostic markers and metastasis network modules," Nat. Commun. 1, 34 (2010).

Ref Type: Journal

18 L. Li, et al., "The human phosphotyrosine signaling network: Evolution and hotspots of hijacking in cancer," Genome Res. 22(7), 1222 (2012).

Ref Type: Journal

19 W. McLaren, et al., "Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor," Bioinformatics. 26(16), 2069 (2010).

Ref Type: Journal

20 D. W. Parsons, et al., "An integrated genomic analysis of human glioblastoma multiforme," Science 321(5897), 1807 (2008).

Ref Type: Journal

21 J. M. Schwarz, et al., "MutationTaster2: mutation prediction for the deep-sequencing age," Nat. Methods 11(4), 361 (2014).

Ref Type: Journal

Page 67: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

53

22 The Cancer Genome Atlas Research Network, "Comprehensive genomic characterization defines human glioblastoma genes and core pathways," Nature 455(7216), 1061 (2008).

Ref Type: Journal

23 The Cancer Genome Atlas Research Network, "Comprehensive molecular characterization of human colon and rectal cancer," Nature 487(7407), 330 (2012).

Ref Type: Journal

24 O. Vanunu, et al., "Associating genes and protein complexes with disease via network propagation," PLoS. Comput. Biol. 6(1), e1000641 (2010).

Ref Type: Journal

25 E. Wang, et al., "Predictive genomics: a cancer hallmark network framework for predicting tumor clinical phenotypes using genome sequencing data," Semin. Cancer Biol. 30, 4 (2015).

Ref Type: Journal

26 E. Wang, et al., "Cancer systems biology in the genome sequencing era: Part 1, dissecting and modeling of tumor clones and their networks," Semin. Cancer Biol. 23(4), 279 (2013).

Ref Type: Journal

27 N. Zaman, et al., "Signaling network assessment of mutations and copy number variations predict breast cancer subtype-specific drug targets," Cell Rep. 5(1), 216 (2013).

Ref Type: Journal 28P. Okunieff, et al., "Fibroblast growth factors (FGFS) increase

breast tumor growth rate, metastases, blood flow, and oxygenation without significant change in vascular density," Adv Exp Med Biol. 530, 593 (2003).

Ref Type: Journal 29A. Marcus, et al., "Recognition of tumors by the innate immune

system and natural killer cells," Adv Immunol. 122, 91 (2014). Ref Type: Journal 30A. J. Gentles, et al., "The prognostic landscape of genes and

infiltrating immune cells across human cancers," Nat Med. 21(8), 938 (2015).

Ref Type: Journal

Page 68: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

54

31H. Satoh, et al., "Nrf2-deficiency creates a responsive microenvironment for metastasis to the lung," Carcinogenesis. 31(10), 1833 (2010).

Ref Type: Journal 31P. J. Hurley, et al., "Germline Variants in Asporin Vary by Race,

Modulate the Tumor Microenvironment, and Are Differentially Associated with Metastatic Prostate Cancer," Clin Cancer Res. 22(2), 448 (2016).

Ref Type: Journal

32C. Nabhan, et al., "Predicting Prognosis in Chronic Lymphocytic Leukemia in the Contemporary Era", JAMA Oncol. 1(7), 965 (2015).

Ref Type: Journal 33D. Yang , et al., "Association of BRCA1 and BRCA2 mutations with

survival, chemotherapy sensitivity, and gene mutator phenotype in patients with ovarian cancer", JAMA. 306(14), 1557 (2011).

Ref Type: Journal

Page 69: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

55

3.8 Tables

Table 1 Prediction accuracy and recall rate for validation sets for ovarian cancer using the CNSS sets derived from tumor founding clones

Dataset Number of samples

High-risk Low-Risk

Accuracy (%)* Recall (%)† Accuracy (%)* Recall (%)††

Validation Set 1

35 94.4 60.7 50.0 28.6

Validation Set 2

35 94.7 64.3 50.0 57.1

Validation Set 3

35 93.8 53.6 40.0 28.6

Validation Set 4

35 92.9 46.4 28.6 28.6

Notes:

*Percentage of recurred (i.e., metastatic) samples in the predicted high-risk

group.

†Percentage of the predicted high-risk samples from the recurred group.

**Percentage of non-recurred (i.e., non-metastatic) samples in the predicted low-

risk group.

††Percentage of the predicted low-risk samples from the non-recurred group.

Page 70: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

56

Table 2 Prediction accuracy and recall rate for validation sets for ovarian cancer using the CNSS sets derived from germline mutations

Dataset Number of samples

High-risk Low-Risk

Accuracy (%)* Recall (%)† Accuracy (%)** Recall (%)††

Validation Set 1

35 93.3 100.0 100.0 42.9

Validation Set 2

35 90.5 67.9 57.1 57.1

Validation Set 3

35 90.0 64.3 50.0 42.9

Validation Set 4

35 84.6 39.3 75.0 42.9

Notes:

*Percentage of recurred (i.e., metastatic) samples in the predicted high-risk

group.

†Percentage of the predicted high-risk samples from the recurred group.

**Percentage of non-recurred (i.e., non-metastatic) samples in the predicted low-

risk group.

††Percentage of the predicted low-risk samples from the non-recurred group.

Page 71: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

57

3.9 Figures and legends

Fig 1 Tumor evolution, a founding clone and its mutations. New somatic mutations (dark brown) functionally or epistatically work with germline mutations (green) to form a founding clone (i.e., the earliest, ancestral cancer cell). New somatic mutations occur in the founding clone to generate subclones. A tumor often contains several subclones. Of note, all the mutations from germline and somatic mutations in the founding clone are present in all the subclones and every cancer cell of the tumor. Circles represent cells while colored bars represent mutated genes.

Fig 2 A flowchart of the eTumorMetastasis. Functionally mutated genes of

samples (eg, either from germline or tumor founding clones) are projected on a

metastasis network to generate gene heating scores using a network

propagation approach (i.e., mutated genes become heat sources that diffuse

‘energy’ to neighboring genes along the edges of the network) 24. After this step,

genes and their heating scores are considered as a netProfile for a sample. We

then applied the modified Multiple Survival Screening algorithm 17 to identify gene

signatures that distinguish the two phenotypic groups (i.e., recurred vs non-

recurred tumor samples). Each signature containing a set of genes with heating

scores quantifies the network state transition (i.e., state between recurred and

non-recurred tumors). In the network, nodes and lines represent genes and gene

relations, respectively. Numeral numbers of each network node represent

heating scores.

Fig 3 Kaplan–Meier curves of the risk groups for ovarian cancer patients with 5-year disease-free survival predicted by the CSS sets. CSS sets derived from tumor founding clones’ mutations in (a) the training set and (b) the validation sets (all the samples in 4 validation sets were merged). CSS sets derived from germline mutations in (c) the training set and (d) the validation sets (all the samples in 4 validation sets were merged). Kaplan–Meier curves have been not made for samples which do not have follow-up time. Blue and red curves represent low- and high-risk groups, respectively. P-values were obtained from the χ2-test.

Page 72: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

58

Fig 1

Page 73: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

59

Fig 2

Page 74: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

60

Fig 3

a

b

Page 75: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

61

c

d

Page 76: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

62

CHAPITRE 4 DISCUSSION GÉNÉRALE

4.1 Le NGS et son utilisation comme outil de prédiction

Pour tenter d’améliorer les traitements associés au cancer ainsi que la spécificité

de ceux-ci, de nouvelles méthodes de détection doivent être implémentées. Avec

l’utilisation massive du NGS et de la diminution constante des coûts rattachés à

celui-ci, la nécessité de modèles permettant la détection du cancer (ou même

certains pronostics relatifs à celui-ci) devient une priorité mondiale. Ainsi, la

quantité de données produites par le NGS ainsi que leur accessibilité fournit un

avantage très important au niveau du développement de telles méthodes. Le

chapitre 3 démontre qu’un modèle basé sur le NGS (et les mutations) peut bel et

bien être utilisé pour représenter un pronostic (ou phénotype), mais également,

comme outil de détection (prédiction de 92% et plus pour 2 cancers différents).

Bien évidemment, l’application du modèle demeure à être exploré davantage et

plusieurs autres pronostics pourraient éventuellement être modélisés et détectés

à l’aide de celui-ci. Donc, plus il y aura de données de séquençage disponible et

plus de modèles permettant la prédiction de différents pronostics pourront être

élaborés. Par ailleurs, le séquençage amène un aspect thérapeutique très

convoité puisque celui-ci peut être fait à partir d’un échantillon sanguin et est

donc classifié comme étant une méthode non invasive. Cela représente un gros

avantage au niveau médical puisqu’il n’y a pratiquement aucun effet néfaste sur

le patient et pourra donc être prescrit non seulement en premier lieu, mais

également, au quotidien. De plus, le NGS n’est pas seulement limité à la

détection de mutations. Des méthodes comme le RNA-seq sont en mesure de

représenter le niveau d’expression génique avec une très bonne précision. Par

conséquent, les modèles utilisables pour la prédiction pourraient combiner non

seulement les mutations significatives des gènes, mais également, leur

expression. L’expression génique représente un défi beaucoup plus intéressant

car celle-ci est beaucoup plus dépendante des conditions présentes. Ceci

amènerait une deuxième dimension au modèle et améliorerait la spécificité et la

Page 77: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

63

précision de celui-ci. Jusqu’à présent, l’utilisation de modèles similaires est

minime, ou même non existante. Bien entendu, avant le développement du NGS,

il est impossible de pouvoir concevoir des modèles à ce niveau puisque la

quantité de données requise et disponible pour représenter celui-ci n’étaient pas

suffisantes. Le développement de nouveaux modèles utilisant cette approche

représente donc un phénomène émergent pour la détection du cancer et sera

très intéressant à surveiller.

4.2 Impacts du clone fondateur dans l’expansion clonale du cancer

Comme mentionné précédemment, le clone fondateur représente la première

génération de cellules cancéreuses. Les mutations significatives retrouvées à

l’intérieur de celui-ci sont donc présentes à l’intérieur de tous les autres clones.

Ainsi, non seulement le clone fondateur peut être utilisé comme outil de

prédiction, mais peut également diriger les traitements. Lors de nos analyses, il a

été révélé que les mutations provenant du clone fondateur à l’intérieur des sous-

clones représentent environ 90% des mutations totales. Par conséquent,

l’expansion clonale est fortement structurée par le clone fondateur. Bien entendu,

les caractéristiques acquises (par mutations) par le clone fondateur améliorent

grandement la survie des cellules cancéreuses, mais ceux-ci peuvent également

dicter le comportement du cancer. Les mutations préalablement acquises vont

diriger les mutations futures et accentuer des voies de signalisation très

spécifiques. Le clone fondateur a donc un rôle pour l'aspect diagnostic, pronostic

et thérapeutique. L’hétérogénéité intratumorale observée à l’intérieur des sous-

clones est donc un résultat des mutations du clone fondateur. Ceci explique

également la différence de comportement de sous-type et de types de cancer.

Les bases génétiques (mutations du clone fondateur) sont différentes pour

chacun d’entre eux et conséquemment, les voies de signalisation utilisées et

leurs comportements diffèrent (ex. : cancer luminal et basal). Les mutations

provenant d’agents carcinogènes ou de causes environnementales (avant la

formation de la tumeur) vont elles aussi influencer l’évolution du cancer. Un bel

exemple est le cancer du poumon où les patients sont généralement séparés en

Page 78: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

64

2 groupes : fumeur et non-fumeur (75). La cigarette modifie l’ADN et par

conséquent, engendre une énorme quantité de mutations. Les comportements

des 2 groupes seront donc différents ainsi que leurs signatures géniques (lors de

la détection).

4.3 Les mutations germinales et leur potentielle utilisation

Les mutations germinales sont des mutations retrouvées dans toutes les cellules

et sont héritées de la génération précédente (parents). Malgré le fait que toutes

ces mutations ne sont pas nécessairement reliées au cancer, si le patient

possède un historique familial susceptible au cancer, ces mutations vont agir

comme précurseur du cancer et augmenter les risques associés à celui-ci.

Jusqu’à présent, l’utilisation de mutations germinales comme outil de prédiction

est non existante. La section 3 démontre que ces mutations peuvent en effet

dicter et prédire le comportement du cancer (avec une précision de 80-90%).

Évidemment, celles-ci font partie du clone fondateur et comme mentionné

précédemment, ont un impact majeur à ce niveau. L’efficacité et la précision

obtenues pour la prédiction de la récurrence indiquent que les mutations

pourraient être utilisées pour prédire d’autres phénotypes spécifiques (ex. :

maladie cardiaque, résistance, etc.). Ceci amène un nouvel aspect pour les

méthodes de détection et de dépistage. Des combinaisons de mutations

germinales pourraient être utilisables lors du suivi des patients et ainsi, surveiller

le développement du cancer (s’il y a lieu) ou d’autres pronostics tout aussi

importants.

4.4 Vision à long terme

Malgré les résultats obtenus, plusieurs améliorations peuvent encore être

appliquées au modèle. En premier lieu, parmi les données utilisées pour

construire le réseau, certains ensembles de données datent de plus de 5 ans. Un

raffinement du réseau à ce niveau pourrait permettre une meilleure

représentation de la problématique et même mener à une meilleure prédiction.

Par ailleurs, pour la totalité du projet, nous n'avons tenu compte que des

Page 79: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

65

mutations fonctionnelles et avons ignoré les insertions/délétions. Ces

changements ont également un rôle crucial dans l'instabilité génomique du

cancer. De même, toutes les régions du génome ayant des changements du

nombre de copie ont été ignorées. Une intégration de ces altérations au modèle

serait une option possible. Pour certains types de cancer (ex: pancréas), il existe

beaucoup plus d'altérations au nombre de copie que de mutations fonctionnelles

(76). Par conséquent, le modèle pourrait être très incomplet (potentiellement

même non applicable) pour ceux-ci. En deuxième lieu, l'étude entière repose sur

les parties codantes du génome (exons). Alors que les régions non-codantes

sont souvent associées au phénomène de régulation, il est possible que les

cellules cancéreuses utilisent plusieurs mécanismes pour altérer celles-ci.

L'instabilité génomique (mutations, insertions, délétions) à l'intérieur de plusieurs

régions régulatrices (ex: 3' - 5' UTR, promoteurs) auraient un impact majeur sur

la cellule (77). Ces signatures génétiques pourraient être diversifiées selon le

type de cancer et même selon les patients. Hypothétiquement, il serait donc

envisageable d' utiliser celles-ci comme outil diagnostique au même titre que les

mutations fonctionnelles germinales. Finalement, il serait intéressant de

reproduire les résultats obtenus dans l'article en clinique avec des échantillons

de salive ou de plasma. De bons résultats à ce niveau mènerait éventuellement

à une nouvelle méthode de détection non-invasive envisageable.

Page 80: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

66

CONCLUSIONS ET PERSPECTIVES

Le cancer demeure un problème d’une envergure mondiale. Les traitements

associés à celui-ci sont peu efficaces et mènent à un important taux de mortalité,

et ce, malgré des milliards de dollars d’investissements et des années de

recherches. Il n’existe que quelques méthodes de détection très fiables et celles-

ci sont majoritairement spécifiques à un type de cancer. Par conséquent,

plusieurs cancers sont détectés trop tard et le taux de survie des patients

diminue drastiquement. Bien évidemment, plus le cancer est détecté à un stage

avancé, plus les chances de survie des patients diminuent. L’importance de

nouvelles méthodes de détection est donc massive. Par le fait même, le NGS est

maintenant l’une des technologies les plus utilisées et les données produites par

celui-ci ne cessent d’augmenter. Le développement de modèle de dépistage (ou

prédiction) du cancer en utilisant des données de séquençage devient impératif

et est jusqu’à présent pratiquement non existant. La biologie des systèmes et

l’approche des graphes amènent cette possibilité. En utilisant le NGS et des

mutations clés, il devient possible de, non seulement, modéliser et prédire un

phénotype spécifique (ex. : récurrence), mais également d’intégrer

l’hétérogénéité intra- et inter-tumoral. Donc, cela permet de prédire le

comportement du cancer, orienter les futurs traitements en ciblant des gènes

clés et mêmes, de surveiller le développement du phénotype désiré sur une base

quotidienne (échantillon sanguin). En utilisant des mutations germinales et celles

du clone fondateur, il est possible de prédire un pronostic avec une excellente

précision (90-95%). Bien évidemment, le concept reste à être exploré davantage

et plusieurs autres informations pourraient être intégrées à celui-ci. Néanmoins,

ceci amène une majeure amélioration au niveau du dépistage du cancer et

risque de rediriger les études et les protocoles dans le futur.

Page 81: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

67

BIBLIOGRAPHIE

1. American Cancer Society. The history of Cancer. 2009.

2. Institut Jules Bordet. The history of Cancer. Bruxelles : s.n., 2010.

3. Grange JM, Stanford JL, Stanford CA. Campbell De Morgan's 'Observations on cancer', and their

relevance today. s.l. : Journal of Royal Society of Medecine, 2002. Vol. 95(6).

4. Boveri, Theodor. Concerning the Origin of Malignant Tumours. s.l. : Journal of Cell Science, 2008.

pp. 1-84. Vol. 121.

5. Coutard, Henri. The results and methods of treatment of cancer by radiation. s.l. : Annals of

surgery, 1937. pp. 584-598. Vol. 106(4).

6. Office of Government and Congressional Relations. National Cancer Institute. National

Cancer Act, Legislative History. 2016.

7. James D. Watson, Tania A. Baker, Stephen P. Bell, Alexander Gann, Michael Levine, Richard

Losick, Inglis CSHLP. Molecular Biology of the Gene. 6th edition. s.l. : Pearson, 2008.

8. Identification of 42 Genes Linked to Stage II Colorectal Cancer Metastatic Relapse. Rabeah A. Al-

Temaimi, Tuan Zea Tan, Makia J. Marafie, Jean Paul Thiery, Philip Quirke and Fahd Al-Mulla.

5, s.l. : Int J Mol Sci., 2016, Vol. 17.

9. Douglas Hannahan, Robert A. Weinberg. Hallmarks of cancer. s.l. : Cell, 2000. pp. 57-70. Vol.

100(1).

10. —. Hallmarks of Cancer: The Next Generation. s.l. : Cell, 2011. pp. 646-674. Vol. 144(5).

11. Cheng N, Chytil A, Shyr Y, Joly A, Moses HL. Transforming growth factor-beta signaling-

deficient fibroblasts enhance hepatocyte growth factor signaling in mammary carcinoma cells to

promote scattering and invasion. s.l. : Molecular Cancer Research, 2008. pp. 1521-33. Vol. 6(10).

12. Davies MA, Samuels Y. Analysis of the genome to personalize therapy for melanoma. s.l. :

Oncogene, 2010. pp. 5545-55. Vol. 29(41).

13. Burkhart DL, Sage J. Cellular mechanisms of tumour suppression by the retinoblastoma gene. s.l. :

Nature Reviews Cancer, 2008. pp. 671-82. Vol. 8(9).

14. Kandoth C, McLellan MD, Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF,

Wyczalkowski MA, Leiserson MD, Miller CA, Welch JS, Walter MJ, Wendl MC, Ley TJ, Wilson

RK, Raphael BJ, Ding L. Mutational landscape and significance across 12 major cancer types. s.l. :

Nature, 2013. pp. 333-9. Vol. 502(7471).

15. Adams JM, Cory S. The Bcl-2 apoptotic switch in cancer development and therapy. s.l. : Oncogene,

2007. pp. 1324-37. Vol. 26(9).

Page 82: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

68

16. Lowe SW, Cepero E, Evan G. Intrinsic tumour suppression. s.l. : Nature, 2004. pp. 307-15. Vol.

432(7015).

17. Blasco, MA. Telomeres and human disease: ageing, cancer and beyond. s.l. : Nature Reviews

Genetics, 2005. pp. 611-22. Vol. 6(8).

18. Masutomi K, Possemato R, Wong JM, Currier JL, Tothova Z, Manola JB, Ganesan S,

Lansdorp PM, Collins K, Hahn WC. The telomerase reverse transcriptase regulates chromatin state

and DNA damage responses. s.l. : Proc Natl Acad Sci U S A, 2005. pp. 8222-7. Vol. 102(23).

19. Kang HJ, Choi YS, Hong SB, Kim KW, Woo RS, Won SJ, Kim EJ, Jeon HK, Jo SY, Kim TK,

Bachoo R, Reynolds IJ, Gwag BJ, Lee HW. Ectopic expression of the catalytic subunit of telomerase

protects against brain injury resulting from ischemia and NMDA-induced neurotoxicity. s.l. : J

Neurosci, 2004. pp. 1280-7. Vol. 24(6).

20. Hanahan D, Folkman J. Patterns and emerging mechanisms of the angiogenic switch during

tumorigenesis. s.l. : Cell, 1996. pp. 353-64. Vol. 86(3).

21. Baluk P, Hashizume H, McDonald DM. Cellular abnormalities of blood vessels as targets in

cancer. s.l. : Curr Opin Genet Dev., 2005. pp. 102-11. Vol. 15(1).

22. Cavallaro U, Christofori G. Cell adhesion and signalling by cadherins and Ig-CAMs in cancer. s.l. :

Nature Reviews Cancer, 2004. pp. 118-32. Vol. 4(2).

23. Joyce JA, Pollard JW. Microenvironmental regulation of metastasis. s.l. : Nature Reviews Cancer,

2009. pp. 239-52. Vol. 9(4).

24. O., Warburg. On respiratory impairment in cancer cells. s.l. : Science, 1956. pp. 269-70. Vol.

124(3215).

25. GL., Semenza. HIF-1: upstream and downstream of cancer metabolism. s.l. : Curr Opin Genet

Dev., 2010. pp. 51-6. Vol. 20(1).

26. O., Feron. Pyruvate into lactate and back: from the Warburg effect to symbiotic energy fuel

exchange in cancer cells. s.l. : Radiother Oncol., 2009. pp. 329-33. Vol. 92(3).

27. Center for disease control and prevention. Global Cancer Statistics. 2012.

28. International Agency for Research on Cancer. The global burden on cancer. 2003.

29. World Health Organization. International Agency for Research on Cancer. World Cancer

Report. 2014.

30. MJ., Barry. Clinical practice. Prostate-specific-antigen testing for early diagnosis of prostate

cancer. s.l. : New England Journal of Medecine., 2001. pp. 1373-7. Vol. 344(18).

31. Petrucelli N, Daly MB, Feldman GL. Hereditary breast and ovarian cancer due to mutations in

BRCA1 and BRCA2. s.l. : Genet Med., 2010. pp. 245-59. Vol. 12(5).

Page 83: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

69

32. Gdowski A, Ranjan AP, Mukerjee A, Vishwanatha JK. Nanobiosensors: role in cancer detection

and diagnosis. s.l. : Adv Exp Med Biol, 2014. pp. 33-58. Vol. 807.

33. Strand TE, Rostad H, Møller B, Norstein J. Survival after resection for primary lung cancer: a

population based study of 3211 resected patients. s.l. : Thorax, 2006. pp. 710-5. Vol. 61(8).

34. Bleicher RJ, Ruth K, Sigurdson ER, Beck JR, Ross E, Wong YN, Patel SA, Boraas M, Chang EI,

Topham NS, Egleston BL. Time to Surgery and Breast Cancer Survival in the United States. s.l. :

JAMA Oncology, 2016. pp. 330-9. Vol. 2(3).

35. Eastham JA, Kattan MW, Groshen S, Scardino PT, Rogers E, Carlton CE Jr, Lerner SP.

Fifteen-year survival and recurrence rates after radiotherapy for localized prostate cancer. s.l. : J Clin

Oncol., 1997. pp. 3214-22. Vol. 15(10).

36. Komatsu T, Kunieda E, Oizumi Y, Tamai Y, Akiba T. An analysis of the survival rate after

radiotherapy in lung cancer patients with bone metastasis: is there an optimal subgroup to be treated

with high-dose radiation therapy? s.l. : Neoplasma, 2012. pp. 650-7. Vol. 59(6).

37. Alkylating agents and DNA polymerases. LP, Bignold. 2B, s.l. : Anticancer Res, 2006, Vol. 26, pp.

1327-36.

38. Anthracycline Chemotherapy and Cardiotoxicity. John V McGowan, Robin Chung, Angshuman

Maulik, Izabela Piotrowska, J Malcolm Walker, and Derek M Yellon. 1, s.l. : Cardiovasc Drugs

Ther, 2017, Vol. 31, pp. 63-75.

39. How Taxol/paclitaxel kills cancer cells. Weaver, Beth A. 18, s.l. : Mol Biol Cell, 2014, Vol. 25, pp.

2677–2681.

40. Epigenetic therapy of cancer with histone deacetylase inhibitor. Lakshmaiah KC, Jacob LA,

Aparna S1, Lokanatha D, Saldanha SC. 3, s.l. : J Cancer Res Ther, 2014, Vol. 10, pp. 469-78.

41. Topoisomerase 1 inhibitors and cancer therapy. Moukharskaya J1, Verschraegen C. 3, s.l. :

Hematol Oncol Clin North Am, 2012, Vol. 26, pp. 507-25.

42. Etoposide, topoisomerase II and cancer. Baldwin EL, Osheroff N. 4, s.l. : Curr Med Chem

Anticancer Agents, 2005, Vol. 5, pp. 363-72.

43. Bortezomib as the first proteasome inhibitor anticancer drug: current status and future

perspectives. Chen D, Frezza M, Schmitt S, Kanwar J, Dou QP. 3, s.l. : Curr Cancer Drug Targets,

2011, Vol. 11, pp. 239-53.

44. Cancer chemotherapy: targeting folic acid synthesis. Joerger, Nicole Hagner and Markus. s.l. :

Cancer Manag Res, Vol. 2, pp. 293-301.

45. 5-fluorouracil: mechanisms of action and clinical strategies. Longley DB, Harkin DP, Johnston

PG. 5, s.l. : Nat Rev Cancer, 2003, Vol. 3, pp. 330-8.

Page 84: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

70

46. Actinomycin D inhibits cell proliferations and promotes apoptosis in osteosarcoma cells. Dai-Feng

Lu, Yan-Song Wang, Chao Li, Guo-Jun Wei, Rui Chen, Da-Ming Dong, and Meng Yao. 2, s.l. : Int J

Clin Exp Med, 2015, Vol. 8, pp. 1904–1911.

47. Freemantle SJ, Spinella MJ, Dmitrovsky E. Retinoids in cancer therapy and chemoprevention:

promise meets resistance. s.l. : Oncogene, 2003. pp. 7305-15. Vol. 22(47).

48. Vinca Alkaloids. Maryam Moudi, Rusea Go, Christina Yong Seok Yien, and Mohd. Nazre. 11,

s.l. : Int J Prev Med, 2013, Vol. 4, pp. 1231–1235.

49. Morgan G, Ward R, Barton M. The contribution of cytotoxic chemotherapy to 5-year survival in

adult malignancies. s.l. : Clin Oncol (R Coll Radiol)., 2004. pp. 549-60. Vol. 16(8).

50. Angela B. Mariotto, K. Robin Yabroff, Yongwu Shao, Eric J. Feuer, and Martin L. Brown.

Projections of the Cost of Cancer Care in the United States: 2010–2020. s.l. : J Natl Cancer Inst., 2011.

pp. 117-128. Vol. 103(2).

51. Andrew M. Scott, James P. Allison and Jedd D. Wolchok. Monoclonal antibodies in cancer

therapy. s.l. : Cancer Immun., 2012. Vol. 12.

52. RO., Dillman. Perceptions of Herceptin: a monoclonal antibody for the treatment of breast cancer.

s.l. : Cancer Biother Radiopharm., 1999. pp. 5-10. Vol. 14.

53. Burrell RA, McGranahan N, Bartek J, Swanton C. The causes and consequences of genetic

heterogeneity in cancer evolution. s.l. : Nature, 2013. pp. 338-45. Vol. 501(7467).

54. G., Curigliano. New drugs for breast cancer subtypes: targeting driver pathways to overcome

resistance. s.l. : Cancer Treat Rev., 2012. pp. 303-10. Vol. 34(4).

55. Yoneyama H, Takizawa-Hashimoto A, Takeuchi O, Watanabe Y, Atsuda K, Asanuma F,

Yamada Y, Suzuki Y. Acquired resistance to gemcitabine and cross-resistance in human pancreatic

cancer clones. s.l. : Anticancer Drugs, 2015. pp. 90-100. Vol. 26(1).

56. Polyak K, Marusyk A. Cancer: Clonal cooperation. 2014 : Nature. pp. 52-3. Vol. 508(7494).

57. Wang E, Zou J, Zaman N, Beitel LK, Trifiro M, Paliouras M. Cancer systems biology in the

genome sequencing era: part 2, evolutionary dynamics of tumor clonal networks and drug resistance.

s.l. : Semin Cancer Biol., 2013. pp. 286-92. Vol. 23(4).

58. Cancer. p53, guardian of the genome. DP, Lane. 6381, s.l. : Nature, 1992, Vol. 358, pp. 15-16.

59. p53, the cellular gatekeeper for growth and division. AJ., Levine. 3, s.l. : Cell, 1997, Vol. 88, pp.

323-31.

60. Gene Therapy for Cancer Treatment: Past, Present and Future. Deanna Cross, and James K.

Burmester. 3, s.l. : Clin Med Res, 2006, Vol. 4, pp. 218-227.

Page 85: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

71

61. Mapping copy number variation by population scale genome sequencing. Ryan E. Mills, Klaudia

Walter, Chip Stewart, Robert E. Handsaker, Ken Chen, Can Alkan, Alexej Abyzov, Seungtai

Chris Yoon, Kai Ye, R. Keira Cheetham, Asif Chinwalla, Donald F. Conrad, et al. 7332, s.l. :

Nature, 2011, Vol. 470, pp. 59-65.

62. A global reference for human genetic variation. 1000 Genomes Project Consortium, Auton A,

Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, Marchini JL, McCarthy S, McVean

GA, Abecasis GR. 7571, s.l. : Nature, 2015, Vol. 526, pp. 68-74.

63. An integrated map of structural variation in 2,504 human genomes. Sudmant PH, Rausch T,

Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, Zhang Y, Ye K, Jun G, Fritz MH, Konkel MK,

Malhotra A, Stütz AM, Shi X, Casale FP, Chen J, Hormozdiari F, Dayama G, Chen K, et al. 7571,

s.l. : Nature, 2015, Vol. 526, pp. 75-81.

64. An integrated map of genetic variation from 1,092 human genomes. 1000 Genomes Project

Consortium, Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang

HM, Marth GT, McVean GA. 7422, s.l. : Nature, 2012, Vol. 491, pp. 56-65.

65. The Catalogue of Somatic Mutations in Cancer (COSMIC). Forbes SA, Bhamra G, Bamford S,

Dawson E, Kok C, Clements J, Menzies A, Teague JW, Futreal PA, Stratton MR. s.l. : Curr Protoc

Hum Genet, 2008, Vol. 10.

66. Human cancer databases (Review). ATHANASIA P, DEMETRIOS A. S., and Ioannis

MICHALOPOULOS. 1, s.l. : Oncol Rep, 2015, Vol. 33, pp. 3-18.

67. Saliva: An emerging biofluid for early detection of diseases. Yu-Hsiang Lee, and David T. Wong,.

4, s.l. : Am J Dent, 2010, Vol. 22, pp. 241-248.

68. Detection of cancer DNA in plasma of patients with early-stage breast cancer. Beaver JA, et al. 10,

s.l. : Clin Cancer Res, 2014, Vol. 20, pp. 2643-2650.

69. Next-generation sequencing to guide cancer therapy. Gagan J, Van Allen EM. 1, s.l. : Genome

Med, 2015, Vol. 7, p. 80.

70. Woo JH, Shimoni Y, Yang WS, Subramaniam P, Iyer A, Nicoletti P, Rodríguez Martínez M,

López G, Mattioli M, Realubit R, Karan C, Stockwell BR, Bansal M, Califano A. Elucidating

Compound Mechanism of Action by Network Perturbation Analysis. s.l. : Cell, 2015. pp. 441-51. Vol.

162(2).

71. Milanese JS, Zaman N, Tibiche C, Jinfeng Z, Droit A, Wang E. Genomic landscapes of either

cancer patients’ germlines or tumor founding clones predict tumor recurrence. s.l. : Submitted., 2016.

72. Loeb KR, Loeb LA. Significance of multiple mutations in cancer. s.l. : Carcinogenesis, 2000. pp.

379-85. Vol. 21(3).

73. Zaman N, Milanese JS, Zou J, Wand A, Wang E. Predicting key personalized cancer driver-

mutated genes in advance based on healthy individuals’ genetic makeup. s.l. : Submitted, 2016.

Page 86: Développement d'un algorithme permettant la prédiction des ...€¦ · 1.2.3 Réseaux ... WES Whole Exome Sequencing . xi « We cannot solve our problems with the same thinking

72

74. Miller NA, Farrow EG, Gibson M, Willig LK, Twist G, Yoo B, Marrs T, Corder S, Krivohlavek

L, Walter A, Petrikin JE, Saunders CJ, Thiffault I, Soden SE, Smith LD, Dinwiddie DL, Herd S,

Cakici JA, Catreux S. A 26-hour system of highly sensitive whole genome sequencing for emergency

management of genetic diseases. s.l. : Genome Med., 2015. p. 100. Vol. 7.

75. Tanner NT, Kanodra NM, Gebregziabher M, Payne E, Halbert CH, Warren GW, Egede LE,

Silvestri GA. The Association between Smoking Abstinence and Mortality in the National Lung

Screening Trial. s.l. : Am J Respir Crit Care Med., 2016. pp. 534-41. Vol. 193(5).

76. Recurrent hemizygous deletions in cancers may optimize proliferative potential. Solimini NL, Xu

Q, Mermel CH, Liang AC, Schlabach MR, Luo J, Burrows AE, Anselmo AN, Bredemeyer AL, Li

MZ, Beroukhim R, Meyerson M, Elledge SJ. 6090, s.l. : Science, 2012, Vol. 337, pp. 104-9.

77. Genome-wide analysis of non-coding regulatory mutations in cancer. Nils Weinhold, Anders

Jacobsen, Nikolaus Schultz, Chris Sander, and William Lee. 11, s.l. : Nat Genet, 2015, Vol. 46, pp.

1160-1165.

78. Société Canadienne du Cancer. Développement de la cellule cancéreuse. 2016.

79. Société Canadienne du Cancer, Agence de la santé publique du Canada, Statistiques

Canada. Prévisions concernant le fardeau futur du cancer au Canada. 2015.

80. Monjazeb AM, Zamora AE, Grossenbacher SK, Mirsoian A, Sckisel GD, Murphy WJ.

Immunoediting and antigen loss: overcoming the achilles heel of immunotherapy with antigen non-

specific therapies. s.l. : Front Oncol., 2013. p. 197. Vol. 3.

81. Serão NV, Delfino KR, Southey BR, Beever JE, Rodriguez-Zas SL. Cell cycle and aging,

morphogenesis, and response to stimuli genes are individualized biomarkers of glioblastoma

progression and survival. s.l. : BMC Med Genomics., 2011. p. 49. Vol. 4.