barycentre et première composante principale sur des graphes
TRANSCRIPT
Barycentre et premiere composante principale sur desgraphes
I. Gavra
Universite Paul Sabatier ToulouseJoint work with S. Gadat, L. Miclo, L. Risser.
Journees IOPS, 5-7 Juillet 2017
I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet
II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique
III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique
IV - Simulations
V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion
I - 1 Motivations - Donnees structurees par des graphes
Objet flexible permettant de structurer des donnees :Bibliometrie :
I - 1 Motivations - Donnees structurees par des graphes
� Cinema� Reseaux sociaux� Marketing
I - 2 Geometrie sommaire
La geometrie est decrite sommairement par differents indicateurs :
� Nombre de nœuds� Distribution des degres� Nombre de triangles� . . .
On peut egalement optimiser/calculer des clusters (moins simple) :� Algorithme de Louvain� Spectral Clustering� . . .
Ou bien optimiser/calculer des representations (encore plus difficile) par desalgorithmes de forces :
� Kamada–Kawai (1989)� Fruchterman-Reingold (1991)� . . .
I - 3 Geometrie encore plus elementaire ( !)
Comment calculer le barycentre d’un graphe ?
Si parfois la reponse semble sauter aux yeux . . .
FIGURE: Desserte Air France - KLM
I - 3 Geometrie encore plus elementaire ( !)
Elle peut parfois laisser perplexe . . .
FIGURE: Graphe de citations - Jonathan Goodwin website
I - 4 Formalisation
On se donne un graphe G parametre par� V � t1, . . . , nu ensemble de sommets� E � pwi,jq1¤i,j¤n ensemble d’aretes
Ce graphe est suppose :� Non oriente et pondere :
@pi, jq P V2 wi,j � wj,i P r0,�8s� Si wi,j � 8 il n’y a pas d’arete directe entre i et j.� Plus wi,j est petit, plus l’arete directe entre i et j est courte.� Il n’a pas des boucles : wi,i � 0� Complet : il ne possede qu’une seule composante connexe.
L’objet principal : la distance geodesique sur le graphe G :
dpi, jq � mini�i1Ñi2Ñ...Ñik�j
k�1
`�1
wi`,i`�1 .
I - 5 Moyenne de Frechet
V est lui-meme pondere par une distribution de probabilites : ν
ν traduit l’importance du noeud vis-a-vis du :� nombre de citations d’un auteur� nombre de telechargements d’un article sur ArXiv, . . .� nombre d’entrees enregistrees par la filmographie d’un acteur
Leger souci : la geometrie du graphe n’est pas ! plate " !
Sur un espace euclidien Rd, la moyenne d’une distribution µ est
arg minxPRd
»Rd}x� y}2dµpyq.
Le barycentre du graphe G est alors defini par la moyenne de Frechet :
Mν :� arg minxPE
Uνpxq ou Uνpxq � 12
»G
d2px, yqνpyq. (1)
I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet
II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique
III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique
IV - Simulations
V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion
II - 1 Principe du recuit simule
Quelques rappels sur la methode du recuit simuleHistorique :
� Methode de Laplace, 1800� Grandes deviations : Freidlin & Wentzell, 1965� Algorithme initial : Kirkpatrick, Gelatt, Vecchi, Science,’83� Premiere preuve : Hajek, M.O.R. ’88� Version analyse spectrale : Holley, Kusuoka, Stroock , J.F.A. ’89, Miclo,
I.H.P. ’92
U fonction a minimiser, essentiellement deux idees pour S.A. :
� Utiliser une methode de Laplace et le comportement asymptotique de
πβ9e�Uβ ÝѸ
i
αiδxi
T � 1{β est la temperature.� Realiser un compromis exploration / exploitation par le biais d’un
processus de Markov, continu ou discret.
II - 1 Principe du recuit simule discretE espace d’etats discret. Chercher
arg minxPE
Upxq
� L’exploitation est realisee par un schema de temperature decroissant
βn ÝÑ �8 lorsque n ÝÑ �8.� L’exploration se fait par le biais d’une chaıne de Markov pXnqnPN sur E.� A chaque ! instant ", on utilise une transition Markovienne Qn reglee
pour que la mesure invariante instantanee soit πβn .
Algorithm 1: Metropolis-Hastings Simulated AnnealingData: Fonction U. Schema de temperature pTkqk¥0, Noyau K
1 Initialisation : X0 P E;2 for k � 0 . . .�8 do3 Simuler x1 � KpXk, .q et calculer pk � 1^
!eT�1
k rUpXkq�Upx1qs Kpx1,XkqKpXk,x1q
)4 Actualiser Xk�1 selon Xk�1 �
#x1 avec probabilite pk
Xk avec probabilite 1� pk
5 end6 Sortie : limkÝÑ�8 Xk
II - 1 Principe du recuit simule continu
E espace d’etats continu (typiquement Rd). Chercher
arg minxPE
Upxq
� L’exploitation est realisee par un schema de temperature decroissant
βt ÝÑ �8 lorsque t ÝÑ �8.� L’exploration se fait par le biais d’un processus de Markov pXtqt¥0 a
valeurs dans E, et inhomogene en temps.� A chaque ! instant ", le generateur markovian Lβt est regle pour que la
mesure invariante instantanee soit πβt .
Algorithm 2: Langevin Simulated AnnealingData: Fonction U. Inverse de temperature pβtqt¥0
1 Initialisation : X0 P E;2 @t ¥ 0 dXt � �βt∇UpXtqdt � dBt
3 Sortie : limtÝÑ�8 Xt
II - 2 Optimisation stochastique
Absence de convexite contourne par S.A., mais il y a encore un probleme :
Uνpxq � EY�νrd2px, Yqs �»
EUpx, yqdνpyq
et ν est :� soit inconnue� soit rend le calcul exact de Uν inconcevable en temps de calcul
On exploite une idee provenant des algorithmes stochastiques :
9xt � �∇Uνpxtq ðñ Xn�1 � Xn�γn�1BxUpx, Yn�1q avec pYjqj¥0 i.i.d. � ν
avec ¸n
γn � �8¸
n
γ1�εn �8, pour un ε ¡ 0.
Il suffit de pouvoir faire des evaluations non biaisees des transitions pour quel’algorithme stochastique soit voisin de la descente de gradient standard.
@x P E E rBxUpx, Yn�1qs � ∇Uνpxq
II - 2 Optimisation stochastique
� Notation importante :Uypxq � d2px, yq
� Recuit simule couple a de l’optimisation stochastique ?� On a acces a une suite de v.a. pYnqn¥0 i.i.d. avec Yi � ν.
� Dans le cas discret (Metropolis-Hastings) :
EYn�1�ν rPrXn�1 � x|Xn � x, Yn�1ss � EYn�1�ν
�eT�1
k rUYn�1 pXkq�UYn�1 pxqs�
� eT�1k EYn�1�ν rUYn�1 pXkq�UYn�1 px
1qs
� PMH�SA rXn�1 � x|Xn � xsBilan :
� Une seule observation Y a chaque iteration ne suffit pas� Transition MH � sans biais : evaluations batch dont le nombre Õ avec n
II - 2 Optimisation stochastique
� Notation importante :Uypxq � d2px, yq
� On a acces a une suite de v.a. pYnqn¥0 i.i.d. avec Yi � ν.
� Recuit simule couple a de l’optimisation stochastique ?� Dans le cas continu (Langevin) : @f P C2pEq
EY�ν
�LYβt pf q
�� EY�ν
��βtx∇xf ,∇xUyy � 1
2∆f�
� �βtx∇xf ,∇xUνy � 12
∆f
� LUνβtpf q!
Il semble plus propice de se tourner vers Langevin-SA.
II - 3 Relax quantiqueIl convient d’operer une relaxation du probleme initial, en gerant un espacecontinu ΓG a la place du graphe discret G :
� Mieux qu’un long discours :
FIGURE: Un exemple de graphe quantique/metrique, source : Wikipedia.
� Une arete e est desormais un segment de longueur Le, associee a uneparametrisation xe P r0, Les.
� L’arete est orientee : 0 pointe sur une extremite, Le sur l’autre.� Notion de distance geodesique.
dpx, yq � txe � dpep0q, yqu ^ tLe � xe � dpepLeq, yqu
� On ecrit e � v lorsque l’arete e a une extremite qui est v P V.
II - 3 Relax quantique
Les operateurs differentiels sont definis sur ΓG :
� Premier ordre : extension ! triviale " sur la reunion des interieurs desaretes :
@pf , gq P C1pΓGq @e P E @x P e x∇f pxq,∇gpxqy � x∇f pxeq,∇gpxeqy� Second ordre : extension ! triviale " du Laplacien a l’interieur des aretes.
∆f pvq :� d2e f pvq
Soit DpLq le sous-ensemble des fonctions f P C2pΓGq qui verifient lesconditions de Neumann :
DpLq :�#
f P C2pΓGq t.q. @v P V¸e�v
ae,vdef pvq � 0
+.
Pour tout f P DpLq on definit :
@f P DpLq @x P ΓG Ltpf qpxq � �βtx∇Uνpxq,∇f y � 12
∆f pxq
II - 3 Relax quantique
Via les operateurs differentiels sur ΓG et le domaine DpLq, on a :
Theorem (Freidlin-Wentzell AoP’93)Il existe un unique processus de Markov pXtqt¥0 tel que pour toute fonction fdans DpLq,
f pXtq � f pX0q �» t
0Lf pXsqds,
est une martingale locale.
Definit un processus Feller-Markov sur ΓG (probleme Martingale bien pose)qui essentiellement :
� Est une diffusion standard a l’interieur des aretes� Rebondit uniformement sur tous les voisins aux extremites lorsqu’on
choisit :ae,v � 1
nv
Remarque : On peut definir d’autres diffusions sur ΓG en choisissant d’autresgluing conditions (absorption avec probabilite ¡ 0 par exemple).
I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet
II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique
III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique
IV - Simulations
V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion
III - 1 Recuit homogeneiseOn souhaite utiliser un processus sur ΓG qui possede la dynamique
Ltpf q � �βtx∇Uν ,∇f y � 12
∆f � �βtEY�ν rx∇UY ,∇f ys � 12
∆f
EY�ν correspond a utiliser au temps t une ! infinite " d’observations Y � ν.On definit un processus markovien couple pXt, Ytq :
� Xt : position courante dans ΓG de l’estimation de la moyenne de Frechet� Si la coordonnee Yt est figee sur une valeur y, alors :
Lp1qt,y pf qpxq � �βtx∇xUy,∇xf y � 12
∆xf
Dynamique de Y� Yt : arrivees via un processus de Poisson d’intensite pαtqt¥0.� Chaque nouvelle arrivee est distribuee sur les noeuds de G selon ν.� Cette transition a pour generateur celui du processus de saut :
Lp2qt pf qpyq � αt
»Grftpx, y1q � ftpx, yqsdνpy1q
! Approximation stochastique " : @x P ΓG @y P G
Ltpf qpx, yq � �βtx∇Uypxq,∇xf y � 12
∆xf pxq
�αt
»Grftpx, y1q � ftpx, yqsdνpy1q
III - 1 Recuit homogeneise
Algorithm 3: S.A. homogeneise sur ΓG
Data: Fonction U. Schema de temperature pβtqt¥0. Intensite pαtqt¥0
1 Initialization : Choisir X0 P ΓG et T0 � 0 ;2 for k � 0 . . .�8 do3 while Nαt � k do4 Xt evolue comme un M.B. sur ΓG initialise en X�Tk
.5 end6 Tk�1 :� inftt : Nαt � k � 1u et utiliser Yk�1 � YNαt de loi ν ;7 Le processus Xt saute de X�t vers Yk�1 :
Xt � X�t � βtα�1tÝÝÝÑXtYNαt , (2)
ou ÝÝÝÑXtYNαt est le chemin geodesique de Xt vers YNαt dans ΓG.8 end9 Sortie : limtÝÑ�8 Xt
Comprehension de la formule (2) : on saute de X�t dans la direction YNαt surune distance qui est βtα
�1t .
“Discretisation” Euler explicite de l’EDS :
dXt � �βt∇UYt pXtqdt � dBt
III - 1 Recuit homogeneise
Une illustration graphique :
FIGURE: Evolution schematique du S.A. homogeneise sur ΓG. On observe un saut enT1 vers YT1 � N1 puis un mouvement Brownien sur ΓG pendant T2 �T1. Puis un secondnoeud est echantillonne selon ν : ici YT2 � N5 et un saut vers YT2 a lieu au temps T2.
III - 2 Etude theorique
Notations utiles :
LpXt, Ytq � mt avec ntpxqdx �»
Vmtpx, yqdy et mtpy |xq :� PrY � y |Xt � xs.
Si µβt9 e�βtUν , on va etudier l’evolution conjointe de
Jt :� KLpnt, µβt q �»
ΓG
log�
ntpxqµβt pxq
�dntpxq
et
It :�»
KLpmtp.|xq||νqdntpxq �» �»
log�
mtpy|xqνpyq
�mtpy|xqdy
�dntpxq
En particulier, si Jt ÝÑ 0, l’inegalite de Pinsker implique
PrUpXtq ¡ min Uν � δs ¤ µβt tU ¡ min U � δu � ?2Jt.
On conclut alors puisque :
µβt tU ¡ min U � δu ÝÑ 0 exponentiellement vite O�
e�βtδ
III - 2 Etude theorique
Evolution de Jt : un calcul (presque) standard demontre que
J1t ¤ C1pΓGqrβ1t � β2t Its � 2
»ΓG
�∇x
#dntpxqµβt pxq
+�2
µβt pdxq
On demontre alors une inegalite de Log-Sobolev verifiee par µβt sur ΓG :»
ΓG
�∇x
!aψpxq
)2µβt pdxq ¥ e�c�pUνqβt
C2pΓGqp1� βtq»
ΓG
ψpxq log rψpxqs dµβt pxq,
Proposition
J1t ¤ C1pΓGqrβ1t � β2t Its � e�c�pUνqβt
C2pΓGqp1� βtq Jt
La constante c�pUνq est fondamentale.
c�pUνq :� maxpx,yqPΓ2
G
rHpx, yq � Uνpxq � Uνpyqs �minpUνq
ou Hpx, yq � minγ:xÑy maxsPγx,y Uνpsq.
III - 2 Etude theoriqueEvolution de It : On demontre que
I1t ¤ �αtIt � J1t � C1pΓGqrβ1t � 6β2t s.
Plus l’intensite des arrivees est importante, plus vite It ÝÑ 0.� Calibration finale des deux parametres pαtqt¥0 et pβtqt¥0, on veut :
limt�8
It � limt�8
Jt � 0 et αt le plus petit possible.
� On calibre Kt � Jt � ktIt et etablit une inegalite en
K1t ¤ �εtKt � ηt,
avec εt � e�c�pUν qβt
C2pΓGqp1�βtqet ηt � α�1
t .� Le lemme de Gronwall assure la convergence de Kt vers 0 des que»
εsds � �8 et ηt � opεtq.
TheoremSi on choisit βt � β logpt � 1q avec β c�pUνq�1 et αt � t , alors
limt ÞÝÑ�8
Kt � 0.
I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet
II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique
III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique
IV - Simulations
V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion
IV - 1 Reseau social
N80
N330
N202
N187
N180
N210
N194
N254
N266N141
N329
N142 N21
N66
N332
N331N72 N79
N48
N75
N285
N276
N104
N186
N204
N200
N161
N53
N122
N113
N16 N134
N318
N145
N123
N256
N63
N26
N323
N342
N67N169
N188
N322
N9
N213
N55N15
N344
N233
N234
N118
N25N239
N62
N261
N277N203 N56
N242
N249
N341
N208
N315
N148
N290
N196
N101
N85
N166
N106
N292
N179
N297
N231
N257
N69
N121
N183
N164
N117
N221
N159
N77
N90
N165
N345
N39
N45
N294
N209
N215
N74
N153
N299
N94
N24
N346
N92N302
N336
N76
N300
N73
N191
N126
N160
N228
N54
N105
N10
N57
N88
N30
N27
N260
N50
N303
N38
N1
N3
N236
N133 N130
N272
N280
N178 N283
N270
N184
N281
N320
N284
N135
N197
N139
N251
N206
N108
N127
N36
N309
N348
N479
N404
N445
N461
N392
N387
N431
N395
N419
N426
N451
N439 N397
N370
N460
N373
N432
N402
N444
N421
N420
N413
N198
N495
N473
N471
N448
N425
N386
N441
N415
N379
N455
N463
N390
N442
N372
N407
N422
N466
N429N352
N107
N374
N34
N428
N456N484
N363
N409
N173N465
N427
N440
N430
N393
N464
N462
N423
N453
N447
N459
N380
N443
N468
N485
N435
N457
N358
N477
N357
N486
N389
N401
N381
N424
N467
N454
N498
N411
N356
N472
N499
N437
N351
N476
N384
N406
N364
N385
N369
N469
N350
N399
N480
N449
N371
N433
N362
N89
N225
N102
N143
N95
N319
N287
N46
N23
N177
N227
N47
N131 N289
N43
N273
N264
N218
N78
N328
N306
N86
N174
N17
N162
N140
N114
N19
N116
N157
N71
N155
N61
N245
N267
N307
N286
N124
N49
N237
N129
N190
N347
N81
N125
N51
N175
N68
N83
N240
N99
N278
N301
N255
N8
N91
N181
N275
N193
N241
N152
N337
N32
N282
N279
N305
N216
N151
N44
N167
N205
N333
N14
N28
N244
N111
N93
N310
N20 N226
N312N220
N343N112
N41
N144
N138
N293
N262
N326
N149
N214
N2
N115
N259
N52
N182
N201
N110
N97
N137
N192
N253
N243
N230
N70
N29
N265
N238
N82
N212
N268
N316
N18
N171
N217
N64
N163
N100
N58
N223
N13
N59
N211
N128
N222
N176
N87
N150
N146
N207
N339
N258
N274
N96
N5
N98
N172
N298
N295
N271
N334
N109N252
N11
N35
N12
N335
N37
N154
N185
N325
N313 N248
N232
N199
N132
N40
N314
N304
N170
N291
N308
N324
N0
N224
N156
N119
N158
N490
N489
N418
N474
N396
N361
N382
N410
N359
N367
N434
N482
N488
N416
N388
N446
N438
N417
N391
N493
N492
N483
N414
N481
N353
N497
N354
N458
N360
N355
N475
N452
N470
N450
N403
N398
N400
N436
N408
N376
N378
N375
N412
N368
N349
N405
N383
N377
N478
N491
N365
N494
N366
N487
N496
N394
N147
N288
N263
N22
N120
N250
N296
N327 N229
N321
N6
N338
N311
N247
N219
N195N4
N269
N33
N189
N42
N103
N136
N246
N84
N31
N60
N65
N235
N340
N317
N7
N168
FIGURE: Resultat sur un sous-graphe de Facebook de 500 noeuds et 4000 arete.
Visualisation : Cytoscape
IV - 1 Reseau social
FB500 FB2000 FB4000β Error Med. Freq. Av. time Error Med. Freq. Av. time Error Med. Freq. Av. time14 β� 15 % 0.6042 0.95 s 28 % 0.3519 10.12 s 27 % 0.3314 12.41 s
12 β� 2 % 0.4184 1.38 s 1 % 0.7268 4.25 s 5 % 0.6534 14.11 s
β� 0 % 0.8008 1.48 s 0 % 0.9418 12.36 s 1 % 0.8913 13.55 s
2β� 0 % 0.8321 11.31 s 0 % 0.9892 8.52 s 0 % 0.9647 16.79 s
4β� 0 % 0.8233 13.19 s 0 % 0.9930 15.58 s 0 % 0.9824 31.43 s
8β� 0 % 0.7717 2.36 s 0 % 0.9750 23.25 s 0 % 0.9445 44.46 s
FB500 FB2000 FB4000S Tmax Error Med. Freq. Av. time Error Med. Freq. Av. time Error Med. Freq. Av. time12 S� T�max 2 % 0.7667 0.59 s 0 % 0.9344 3.22 s 0 % 0.8614 6.70 s
S� 2T�max 0 % 0.8049 2.79 s 0 % 0.9610 9.30 s 0 % 0.8970 24.42 s
S� 4T�max 0 % 0.8101 5.60 s 0 % 0.9677 22.21 s 0 % 0.9222 54.73 s
2S� T�max 1 % 0.8345 2.26 s 0 % 0.9512 8.39 s 0 % 0.9062 20.95 s
2S� 2T�max 0 % 0.8361 4.57 s 0 % 0.9586 23.30 s 0 % 0.9121 23.30 s
2S� 4T�max 0 % 0.8423 11.16 s 0 % 0.9735 11.16 s 0 % 0.9366 96.84 s
Temps moyen d’execution sur 100 MC : 13 secondes
IV - 2 Donnees reelles
ROI
IV - 2 Donnees reellesSzulga
Bonichon
Marckert
Mallows
vanDijk
Demichel
Raugi
Simatos
Horowitz
Yamazaki
Ferraz
Barth
Sol\\xc3\\xa9
Egami
Decreusefond
Randriambololona
MoyalTran
Vergne
Delattre
HuGarc\\xc3\\xada Moore
Verd\xc3\xba
Valencia-Pabon
McDiarmid
Z\\xc3\\xa9morVall\\xc3\\xa9eScheicher
Szpankowski
Denise
Oudjane
Rubenthaler
Logothetis
Marsalle
Leonardi
Rosenkrantz
Stanley
Waterman
Altman
DhersinCoutin
Ponty
Flajolet
Ravelomanana
Pouyanne
Banderier
Rouault
Tolley
Louchard
Gouyou-Beauchamps
Francon
Randrianarimanana
Bousquet-M\\xc3\\xa9lou
Paccaut
Corteel
Zimmermann
Ludkovski
SteeleDorea
K\\xc3\\xb6rezlio\\xc7\\xa7lu
Yukich
Deguy
Puech
Promislow
GardyMilevsky
Ney
Feinberg
Sen
Trashorras
Hillairet
Siri-Jegousse
Gao
\\xc3\\x89tor\\xc3\\xa9
Bertein
Suen
deSaporta
vanGaans
Zhang
Rulliere
Falconnet
Wigderson
Norros
Lubachevsky
Brown
Hill
Ivanoff
Freedman
Richou
Spruill
Alencar
Zajic
Schneider
Bordenave
Ruci\xc5\x84ski
Mordecki
Leung
Cocozza-Thivent
Fricker
Fischer
Tibi
Vallois
Ravanelli
Weil
Zhang
Weiss
Reitzner
Billera
Thimonier
Geniet
Bensusan
Wang
Yuan
Henard
Chalendar
Kleinberg
Feige
Karp
Mathieu
Bayraktar
Delmas
Huang
Peleg
Kravitz
Dupuis
Zhang
Liang
Yang
Luccio
Najim
Lueker
Aza\xc3\xafs
Khorunzhiy
Borodin
Mercier
Zhou
Shamir
Azar
Raghavan
Montanari
DasSarma
Slivkins
Broder
Straka
LeGland Chen
Yang
Merhav
Roussignol
Celani
Frieze
KarlinUpfal
Dyer
RobinsonMolla
Pietracaprina
Augustine
Pandurangan
Pisanti
Grossi
KumarDworkMitzenmacher
Salhi
Balan
Zinn
Robert
Fayolle
Temme
MahmoudHordijk
Madiman
Valchev
Aistleitner
El-Nouty
Panholzer
Chigansky
Prodinger
Antunes
Lew
DrmotaAkhavi
Liu
Kuba
dePanafieu
Young
Gittenberger
Budhiraja
Zhou
Regnier
Shwartz
Luschgy
Cohen
Lavault
Huang
Montseny
Song
LelargeEstrade
B\\xc3\\xa1r\\xc3\\xa1ny
Pra\\xc5\\x82at
Gross
MastersSworder
Wu
Sturm
Carey
Maslov
Faddeev
Bobkov Kwapie\\xc5\\x84Guerin
Hamadene
Rutkowski
Bielecki
Orlandi
Cisse Sirbu
BenAlayaTanr\\xc3\\xa9
Schachermayer
Voiculescu
Manou-Abi
Graf
Chistyakov
Christen
Guillin
Albuquerque
Nappo
Ruh
Stockbridge
LeBorgne
Miller
Song
Schreiber
Djehiche
Marchioro
Huet
Hairer
Zabczyk
Tyukov
Mityagin
Doebner
Filipovi\xc4\x87
Weisz
Carmona
Nikeghbali
Sayit
Kabanov
Zani
Guiol
Spehner
Ferri\\xc3\\xa8re
Mania
Maillard
Stauffer
Yehudayoff
Locherbach
Yadin
Schramm
Bardet
Stoltz
Vincenzi
Janssens
Dorobantu
Makarychev
Veber
Andjel Dozzi
Fehr
Peled
Wakolbinger
Kurtz
Wilson
Benjamini
Soundararajan
Ramanan
G\xc3\xb3ra
Tsur
Shinkar
H\\xc3\\xa4ggstr\\xc3\\xb6m
Williams
Delbaen
JonassonMiclo
Hinz
Hernandez-Hernandez
Thieullen
Lima
Schmitt
Grorud
Bucklew
Iscoe
UtzetCoquet
Goodman
Chern
Kane
Ofek
Kendall
Bansaye
Marton
Rhoades
Barrieu
Th\xc3\xa4le
Simonyi
Aldous
DAristotile
Diaconis
Ewald
Pimentel
K\\xc3\\xb6rner
Alonso
Gillet
Janson
Remy
Kardaras
Reingold
Tetali
Amami
Dombry
\xc5\x81uczak
Krell
Nadtochiy
Hanlon
Evstigneev
Zitt
Calka
Sly
Herbertsson
B\\xc3\\xb6r\\xc3\\xb6czky
Hitczenko
Crawford
Pene
Chung
Anulova
Bugeaud
Alon
Chassaing
Brightwell
Hug
Mahfoudh
Kira
Mairesse
Spencer
Loukianov
Garcia
Loukianova
Galves
Lov\\xc3\\xa1sz
ZeitouniJolis
Mart\\xc3\\xadnez
Romik
Angel
ChronopoulouDuminil-Copin
Gurel-Gurevich
Sol\\xc3\\xa9
vanderHofstad
Kulske
Nourdin
Muhle-Karbe
Baxendale
Lyons
Izkovsky
Steif
Gobet
Cattiaux
Lladser
Rost
Takahashi
DaiPra
Sodin
Shkolnikov
Gallardo
Bahsoun
Friedli
Martin
OConnell
Schoenmakers
Mazliak
Karatzas
Kannan
Zhang
Lambert
Petz
Caputo
Guerbaz
Teichmann
Chen
Berger
Meda
Hoffman
Szpirglas
Kozma
Feldman
Melnikov
Kallsen
Rosen
Chavel
Klenke
Hubalek
Pokern
Galves
Lubetzky
Gu\\xc5\\xa3\\xc4\\x83
Sazonov
Liptser
Duarte
ODonnell
Creutzig
Mossel
Abadi
Gloter
Torres
Shapira
Baldi
Graham
Panloup
Schott
Pontier
Luczak
Mayer-Wolf
Assaf
Dobri\xc4\x87
Evans
Dembo
M\\xc3\\xa9min
Shields Meckes
Pemantle
S\xc5\x82omi\xc5\x84ski
\\xc3\\x9cst\\xc3\\xbcnel
Pitman
Veretennikov
Cohen
Winkler
Gombani
Bollob\\xc3\\xa1s
Guiol
Lacayo
Quer-Sardanyons
Rovira
Es-Sebaiy
Newman
Ichiba
Greven
Roelly
Tudor
Gantert
Liggett
Fradon
Mountford
Sidoravicius
T\xc3\xb3thdenHollander
Ruszel
Maes
Ravishankar
Nualart
Grimmett
Rifo
Alexander
Bardina Bjork
Ferrari
Hammond
Bahadoran
Redig
Freire
VivesSanta-Eul\\xc3\\xa0ia
Crisan
Fritz
Vares
Fernandez
Remenik
Santacroce
Cairoli
Ramirez
Molchanov
Stricker
Fontes
Schweizer
Follmer
Virag
Guillotin-Plantard Noreddine
Garz\xc3\xb3n
Schonmann
Cesi
Geman
Darses
ProtterConforti
Bertoglio
Martinelli
Le\\xc3\\xb3n
\xc3\x87etin
Cadel
Bascompte
Deya
Comets
PiccoAl\\xc3\\xb2s
Erd\xc5\x91s
\xc5\xbdigo
Kipnis
Murr
Grandits
Weiss
Runggaldier
Fernandez
Schilling
Jona-Lasinio
Bouten
Guasoni
Villemonais
Cancrini
SanMart\\xc3\\xadn
Cassandro
Briand
Davis
Zervos
Viens
Porchet
Coculescu
Kramkov
Collet
Tindel
Joulin
Benois
Jeanblanc
ElKarouiKohatsu-Higa
Lacoste
Mathieu
Nguy\xe1\xbb\x85nHuuDu
Pardoux
Presutti
TrioloRoynetteChoulli
Dereich
LandimHu
Herrmann
Ouahhabi
Castell
Chesney
Ianiro
Lamberton
Sarr\xc3\xa0
Gobron
Sznitman
Lin
Tarr\\xc3\\xa8s
Merola
Ta\\xc3\\xafbi
Caderoni
Olivieri
Maass
Anderson
DartnellM\\xc3\\xa1rquez-Carreras
Sanz-Sole
Pettersson
Fiel
Song
Bezerra
Tsagkarogiannis
SaadaOb\xc5\x82\xc3\xb3j
Fontana
BaudoinCarmona
Werner
Bressaud
Brassesco
Rozovskii
Ankirchner
Bogachev
Swanson
NardiKrawczykPoisat
Dalang
RollaCaravenna
dosSantos
Beffara
G\xc3\xa4rtner
LeNyJarai
deLima
March
Peres
Pal
Cotar
Poly
Berestycki
Revelle
Aaronson
Dawson
Gorostiza
Limic
vandenBerg
Fleischmann
Goodman
Schinazi
Merzbach
Kesten
Lawler
Xiong
Yor Mytnik
Rolles
Berend
Morters
Konig
Kupper
Chevallier
Birkner
Schweinsberg
Klein Biagini
Khas\\xca\\xb9minski\\xc4\\xad
Durrett
Madan
Stoimenov
Donati-Martin
Winter
NavarroCruz
Zili
Bronstein
Hryniv
\xc4\x8cern\xc3\xbd
Najnudel
LeGall
Sidorova
Shlosman
Feng
Heyne
Corwin
Cabezas
Tudor
Xu
Deuschel
Quastel
VanMoffaert
Huang
Wilbertz
Arguin
Walsh
Bourgade
Biane
Ma\xc3\xafda
Burdzy
Chung
ZessinKirkpatrick
Frangos
Dimitroff
Gayrard
Nualart
Pellegrinotti
R\\xc3\\xa9veillac
Mueller
Schapira
Keane
TudorGuionnet
Xu
BenArous
Salopek
Krylov
Sortais
Gun
Bovier
Cranston
Bassalygo
Pinsker
Rudiger
Prelov
Pecherski\xc4\xad
Adelman
EckhoffRuizdeCh\\xc3\\xa1vez
Ghomrasni
Foondun
Konno
L\\xc3\\xb3pez-Mimbela
Braverman
Tribe
Drapeau
Hawkes
Shiryaev
Tanemura
Levin
Windridge
Goldschmidt
Kogan
Bolthausen
Hu
Keevash
Elworthy
Batchelor
Hyland
Robinson
Marcuard
Zhang
Li
Liu
Bernard
Butko
Ying
Varadarajan
Kim
Zhou
Paycha
Xu
Ouerdiane
Derguzov
Sudakov
Kotani
Winter
Bogdan
Reichmann
Issoglio
Hayman
Zhang
Brown
Petrov
Whittle
Quas
Fukushima
Gouere
Ren
Yuan
Aida
Bao
Cao
Chen
Wu
Smolyanov
Zhang
Bo
Lyons
Hsu
Takeda
Holley
Kuwae
Albeverio
Krasovski\xc4\xad
Barbaresco
Ma
Sagna
Ma
Yan
Taniguchi
Mendez-Hernandez
Park
Williams
Shen
Durran
Engl\\xc3\\xa4nder
Diehl
Saussol
Neate
Lunt
Gong McKean
Franchi
Sztonyk
L\\xc3\\xa9vy
Kulczycki
Caruana
Reuter
Davis
Cipriani
Kree
Chen
Nesterenko
Sabot
Truman
Wang
Housworth
Singh
Lau
Gustafson
Brossard
Kershaw
Setterqvist
Baggett
Duplantier
Shao
Duan
Tudor
Galamba
Ouyang
Metz
Thalmaier
vandenBerg
Mauldin
Xu
Stroock
Coulibaly-Pasquier
UlsamerXu
Plank
Eremenko
Frikha
Delyon
Grigoryan
Fang
Ledrappier
Mao
Wu
Deng
Qian
Basdevant
Wang
Driver
Aleksandrov
Spencer
Ancona
Parry
Bouthemy
Cruzeiro
Benassi
Gairing
Teplyaev
Glover
Bardou
Rockner
Hennequin
Kwa\\xc5\\x9bnicki
Pietruska-Pa\xc5\x82ubaPopescu
St\xc3\xb3s
Lorentz
Feng
Bogachev
Kumar
Hogele
Rudolph
Razborov
Muller
Cass
Taylor
Qian
Yao
Chaumont
ZhengLitterer
Laurence
Semenov
Russo
Swords
Lepingle
Kruk
Appleby
Lapeyre
vonWeizs\\xc3\\xa4cker
Schottstedt
Michel
Peithmann
Marinelli
Bakry
Gassiat
Beznea
Wetzel
Hein
Nazarov
Mohammed
Sab
Davies
Gundy
Jakobson
Pesin
Gerin
Enriquez
Brydges
Bunimovich
Suryanarayana
Smillie
AubrunMichon
Dellacherie
Az\\xc3\\xa9ma
Fromm
\\xc3\\x89mery
Lindstr\xc3\xb8m
Jacob
Gaines
Bottcher
Vondra\xc4\x8dek
Wang
Kusuoka
Gatheral
Durand
Nadakuditi
Yang
Gjerde
OuyangKusuoka
Ub\\xc3\\xb8e
Ladyzhenskaya
Kurtz
Ross
\\xc3\\x98ksendal
Meyer
Grishin
Frohlich
Phan
Raimond
Vormoor
Kumagai
Croydon
Marstrand
Aase
Xiang
Song
Uemura
Hattori
SunKhanin
Bol\xca\xb9shev
Wang
Ayache
Kendall
Kloppel
Kornfeld
Ba\xc4\xaddak
Chen
Privault
LeJan
Vershik
Kirillov
Rozanov
Kolmogorov
Dani
Benaych-Georges
Port\\xc3\\xa8s
Maslova
Friz
Arnaudon
Torrecilla-Tarantino
Allouche
Gr\\xc4\\x83dinaru
Richter
Brunel
Miermont
Kozlov
Aleksandrov
Haas
Bakhtin
Smirnov
Profeta
Ershov
Tang
Menard
Beck
Zabrodin
Zindy
Raja
Oseledets
Mekler
Gurevich
Hattori
Hambly
Andres
Cox
L\\xc3\\xa9ger
Godunov Khelemski\xc4\xadZ\xc3\xa4hle
Onishchik
Wang
Korolyuk
Zalgaller
Reshetnyak
Berestycki
Lavrent\xca\xb9ev
YangKingman
Kutateladze
Taylor
Fujita
Sevast\xca\xb9yanov
Curien
Hughston
Dobrushin
Warren
Karpelevich
Baumgarten
Koteck\\xc3\\xbd
Baik
Ye
Forde
Zambrini
Hobson
Schneider
Guivarch
Mazet
Jiao
Pag\\xc3\\xa8s
Kuptsov
Marchetti
Yan
Xu
Auffinger
Ahn
Maisonneuve
Ueltschi
Minlos
Yang
Pirogov
Fitzsimmons
Jung
Kifer
Tsirelson
Sina\xc4\xad
Sukhov
Doring
Vvedenskaya
He
Monch Barlow
Bass
Henkel
Cherny
Bayer
Ortgiese
Royfman
Unterberger
Fribergh
Koralov
Revuz
Neveu
Hu
Aizenman
P\\xc3\\xa9ch\\xc3\\xa9Scacciatelli
Jansen Zhang
Riedle
Klein
Bonnefont
Spohn
Stauch
DosReis
Yao
Boufoussi
Blanchet-Scalliet
Hajji
Lepeltier
L\\xc3\\xa9onard
Nzi
Lejay
Elliott
Chafa\\xc3\\xaf
Ouknine
Sellami
AitOuahra
Callegaro
Bally
Zargari
Viswanathan
Mourragui
DeMasiBertini
Stoica
Scheutzow
Fehringer
Mao
Bouleau
Imkeller
Pavlyukevich
Yang
Zambotti
Varadhan
Zhang
Szatzschneider
Rodkina
Schulman
Mellouk
Zhang
Millet
\xc5\x81ochowski
Arnold
Edgar
Butt\xc3\xa0
Scarlatti
Matoussi
Freidlin
Petunin
Denis
Victoir
Ledoux
Durrleman
Berkaoui
Erraoui
Aksamit
Horst
Kruse
Deng
Olla
M\\xc3\\xa9l\\xc3\\xa9ard
Eddahbi
Kohlmann
FaggionatoToninelli
Gabrielli
Dupoiron
Blondel
Lakhel
Yor
Cohen
Str
oock
Ledoux
Jaff
ard
Bre
zis
Zeit
ouni
Lions
Nuala
rt1
2
3
4
5
6
7
8
Frequency
(%
)
Il y a un biais d’aspiration de la base de donnees.
I - IntroductionI - 1 MotivationsI - 2 Modele mathematiqueI - 3 Moyenne de Frechet
II - Optimisation globale par recuit simuleII - 1 Principe du recuit simuleII - 2 Optimisation stochastique
III - Recuit homogeneiseIII - 1 Definition du processusIII - 2 Etude theorique
IV - Simulations
V - Analyse en composante principaleV - 1 ACP sur un grapheV - 2 Definition du processusV - 3 Exemple : Reseau socialV - 4 Conclusion
V - 1 ACP dans le cadre euclidien.Methode d’analyse des donnees. Intuition :
� Inclure les donnees dans un ellipsoide (minimal)� Chaque axe de l’ellipsoide represente une composante principale
FIGURE: ACP d’une loi normale multidimensionnelle. Source : Wikipedia
Donnees : x1, . . . xm P Rn. Pour v P Rn :
Sv � txm � tv, t P Ru, ou xm � 1m
m
i�1
xi
Premiere composante principale : Sv1 , ou v1 est t.q. :
v1 P arg min}v}�1
m
i�1
d2pxi, Svq.
V - 1 ACP sur un graphe.G Espace des geodesiques :
G � tγ � ΓG t.q. γ � γ, @x, y P γ, x � y, Dp P Cx,y, p � γ avec |p| � dpx, yqu.
FIGURE: Degre relatif de x P A par rapport a A � Γ connexe, degApxq : dans combien dedirection on peut partir de x, en restant dans A
Gd :� tγ P G t.q. @x P γ, degγpxq ¤ d � 1u.
Espace important, G1 : γ P G1,degγpxq ¤ 2
� Chemin geodesique� Cycle geodesique
V-1. ACP sur un graphe.
Formulation Variationnelle :
UνpCq � Erd2pX,Cqs �n
i�1
d2pxi,Cqνpxiq, (3)
Une composante principale d’ordre d est un element g�d P Gd t.q. :
g�d P arg mingPGd
Uνpgq.
Mdν l’ensemble de minimiseurs de Uν sur Gd.
Premieres composantes principales : M1ν ÝÑ Optimisation sur G1, espace
non-connexe
V - 2 Definition du processusG1 espace approprie :
G1 :�¤
x,yPγ
tg P Cx,y; Dγx,y s.t. gY γx,y P G1.u,
� A partir d’un element g� P arg mingPG1Uνpgq, on peut facilement
construire g� P arg mingPG1Uνpgq.
� Connexe et compact.� Peut-etre separe en cellules homeomorphes a des boules de R et R2.
Operateurs differentiels a travers des homeomorphismes et pour un domainebien choisi on definit :
LCt Fpx, yq � �βtxOUypxq,OxFpx, yqy �∆xFpx, yq � αt
»V
Fpx, yq � Fpx, y1qdνpy1q,(4)
V - 2 Recuit homogeneise sur G1
Algorithm 4: Recuit homogeneise sur G1
Data: Fonction U. Schema de temperature pβtqt¥0. Intensite pαtqt¥0
1 Initialisation : Choisir X0 P G1 ;2 T0 � 0 ;3 for k � 0 . . .�8 do4 while Nαt � k do5 Xt evolue comme un mouvement brownien dirige par OUYk ,
relativement a la structure de G1, initialise en X�Tk.
6 end7 Tk�1 :� inftt : Nαt � k � 1u;8 Au temps t � Tk�1, tirer Yk�1 � YNαt selon la loi ν.9 end
10 Output : limtÝÑ�8 Xt.
V - 2 Recuit homogeneise sur G1
Une illustration graphique :
FIGURE: Evolution schematique du S.A. homogeneise sur G1. On observe un saut enT1 vers YT1 de l’extremite gauche de X puis un mouvement Brownien sur G1 pendantT2 � T1. Puis un second noeud, YT2 , est echantillonne selon ν : et un saut del’extremite droite de X vers YT2 a lieu au temps T2.
V -4 Exemple : Reseau social
FIGURE: Premiere composante principale du sous-graphe de Facebook.
Visualisation : Cytoscape
V - 4 Conclusion
Poursuite des travaux :
� Passage a l’echelle via un clustering preliminaire� Experiences a venir sur la totalite du graphe de ZbMaths� Prouver la convergence du processus pour l’ACP� Ameliorer les performances numeriques pour l’ACP.
Merci de votre attention !