claire mathieu (brown) théorie algorithmique des jeux
TRANSCRIPT
![Page 1: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/1.jpg)
Claire Mathieu (Brown)
Théorie algorithmique des jeux
![Page 2: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/2.jpg)
Introduction Algorithmique et informatique: utiliser les
données pour construire une solution de faible complexité de calcul.
Economie et théorie des jeux: les données et ressources sont partagées ou distribuées entre des participants rationnels égoïstes. En se servant éventuellement d’incitations financières, construire une solution compatible avec les intérêts de chaque participant.
![Page 3: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/3.jpg)
Equilibre de Nash
Véracité
Liens commerciaux de moteurs de recherche
Partage de coût égalitaire
![Page 4: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/4.jpg)
Equilibre de Nash
![Page 5: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/5.jpg)
Equilibre de Nash Un participant a un choix de possibilités
(enchères, chemins dans un réseau, etc.)
Quand chaque participant choisit une possibilité, la solution ainsi définie a une valeur pour chacun
Equilibre: Participant x. Etant donné les choix des autres participants, x n’a pas de raison de changer son choix.
![Page 6: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/6.jpg)
Existence Il n’existe pas toujours d’équilibre (pur)
Exemple: deux joueurs, l (ligne) et c (colonne). Chacun a deux possibilités: 0 ou 1. Si l=c, l paye 1 euro à c, sinon c paye 1 euro à l.
Il existe toujours un équilibre mixte: chaque participant choisit une distribution sur l’ensemble de ses possibilités. Etant donné la distribution du concurrent, x n’a pas de raison de changer sa distribution (elle maximise la valeur moyenne)
Théorème de Nash, théorème de dualité de programmation linéaire, théorème du minmax de Yao.
![Page 7: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/7.jpg)
Calcul Quelle est la complexité de calcul d’un
équilibre de Nash?
Jeu à 2 joueurs où le perdant paye le gagnant (somme des valeurs = 0): résolution d’un programme linéaire, polynomial
Jeu à 2 joueurs général: PPAD-difficile. PPAD: classe des problèmes de recherche (type point fixe)
![Page 8: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/8.jpg)
Truthfulness
![Page 9: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/9.jpg)
Mécanismes Participants ont des valeurs qui leur sont
privées
Concevoir un mécanisme (algorithme) qui les encourage à révéler leurs vraies valeurs
Exemple typique: enchères.
Chaque participant a en tête une valeur qu’il attribue aux objets à vendre
![Page 10: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/10.jpg)
Enchères de Vickrey Chaque participant fait une enchère
Le gagnant est l’auteur de l’enchère la plus élevée
Il paye le montant de la deuxième enchère la plus élevée
Aucun participant n’a de raison de mentir, et donc l’objet revient finalement à la personne qui lui donne le plus de valeur: maximisation du “bien-être de la société” (social welfare)
![Page 11: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/11.jpg)
Vickrey-Clarke-Groves
Find the solution maximizing the social welfare - the sum of the values which participants give to the solution.
If participant x is part of the solution, then charge x an amount equal to the increase in other players’ utility (in best solution) in the absence of x
Truthful - no incentive to lie about value
Example: buying s-t path in a network. Participants are edges, edge lengths l(e) are private. Find shortest s-t path p, and pay each edge e of p payment(e)=l(p’)-(l(p)-l(e)), where p’ is the shortest path in G-e.
![Page 12: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/12.jpg)
Digital goods auction
Downloadable audio file: duplicated at no cost. Infinite supply. Participant j bids v(j),
v(1)v(2) v(3)…
Vickrey-Clarke-Groves: sells at price 0
How to stay truthful but get some revenue?
Without truthfulness, single-price selling to at least 2 participants brings revenue
F=max(2*v(2),3*v(3),4*v(4),…)
Randomized algorithm, truthful, with revenue Cst* F
![Page 13: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/13.jpg)
Randomized algorithm
Partition the participants into two subsets at random
Find best single-price p for first set, and sell item at price p to every participant of second set who bid at least p
![Page 14: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/14.jpg)
Sponsored search auctions
![Page 15: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/15.jpg)
Google’s income Keyword searches yields organic results and
sponsored results
![Page 16: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/16.jpg)
Liens commerciaux Publicitaires payent Google à chaque clic
Enchère similaire a Vickrey. Un mot-clé
k espaces publicitaires numerotés 1,2,…,k
Publicitaire j, de valeur v(j), fait une enchère b(j)
Les k enchères les plus élevées gagnent, dans l’ordre b(1),b(2),…,b(k); un clic sur j coûte b(j+1) au publicitaire
![Page 17: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/17.jpg)
Propriétés
t(j) = qualité de l’espace j = proba d’un clic
Il peut être avantageux de mentir
Stabilité: il existe un equilibre de Nash pur
b(k+1)=v(k+1)
b(j)=t(j)/t(j+1) b(j+1)+(1-t(j)/t(j+1)) v(j)
![Page 18: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/18.jpg)
Dynamique Comment arriver à cet équilibre?
Par un algorithme glouton: publicitaire fait une enchère de facon à avoir l’espace j qui maximise son profit t(j)(v-b(j+1)), si les autres conservent leurs enchères précédentes
Parmi les choix d’enchères, il fait l’enchère b qui donne même profit à l’espace j et à l’espace j-1:
t(j)(v-b(j+1))=t(j-1)(v-b)
Théorème: Si à chaque répétition un publicitaire aléatoire met à jour son enchère, alors il y a convergence en temps fini.
![Page 19: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/19.jpg)
Cost-sharing
![Page 20: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/20.jpg)
Partage de coûts Comment partager les bénéfices ou les
coûts d’une action commune pour que tous soient satisfaits?
Problème du multicast avec coût des arêtes partagé entre les participants
![Page 21: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/21.jpg)
Cost-sharing Multicast
edge e used by the paths of n(e) terminals charges each terminal c(e)/n(e). Terminals are selfish, non-cooperative.
Nash equilibrium (N.E.): no terminal wants to change its path if everything else stays the same.
Question: how much more costly is the outcome of selfish choices? That is: bound (cost of N.E.)/ OPT?
![Page 22: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/22.jpg)
Impact of selfishness
(cost of worst N.E.)/OPT = n [Koutsoupias Papadimitriou‘99] Price of anarchy
(cost of best N.E.)/OPT = O(log n/ loglog n) [Anshelevich Dasgupta Kleinberg Tardos Wexler Roughgarden ‘04, Agarwal Charikar ‘06] Price of stability
Question: what about (cost of N.E.)/OPT for N.E. reachable by some process?
Best response dynamics: when activated, a terminal always chooses its current cheapest path to root
![Page 23: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/23.jpg)
Two phase model Activation model [Chekuri Chuzhoy Lewin-Eytan Naor Orda ‘06]
Phase 1: Terminals are activated one by one Phase 2: Re-activated terminals may change their
path (arbitrary sequence of re-activations)
Ω(log n/ loglog n)≤ (cost of resulting N.E.)/OPT≤ O(√n log2 n)[CCLNO]
r
t1
t3
t2
t4
Phase 1r
t1
t3
t2
t4
Phase 2
re-fires
![Page 24: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/24.jpg)
Results Two phase model
Ω(log n) ≤ (cost of resulting N.E.)/OPT ≤ O(log3 n)
General sequence of interleaved activations and re-activations, except that terminal arrivals (first activations) are in random order
(cost of resulting N.E.)/OPT = O(√n polylog(n))
We now sketch proof of O(log3 n) result
![Page 25: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/25.jpg)
Proving O(log3 n) Potential function
cost ≤ potential ≤ O(log n)*cost
Re-activations decrease potential
So, cost after phase 2 ≤ potential after phase 2 ≤ potential after phase 1 ≤ O(log n)*cost after phase 1
Must prove: (cost after phase 1)≤ O(log2 n)*OPT
![Page 26: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/26.jpg)
Analysis of phase 1
1. Define “Gap revealing” linear program (cost after phase 1) ≤ Value(LP)
2. Relax the LP and write dual linear program Value(LP) ≤ Value(Dual) by linear programming duality
3. Define feasible dual solution… Value(Dual) ≤ Value(solution)
4. … of value O(log2 n) OPT Value(solution) = O(log2 n) OPT
![Page 27: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/27.jpg)
Gap revealing LP s(i): cost of i’s path on arrival of i
b(i): cost of new edges bought by i
Cost after phase 1 is at most b(i)’s
If terminal j arrives after terminal i, then j could go to i and reuse i’s path with discount:
s(j)≤ d(j,i)+s(i)-b(i)/2
![Page 28: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/28.jpg)
Relax, take dual Take a tree T over the terminals, such that
child of t arrives after terminal t for all t
Relax the linear program by writing the constraint s(j)≤ d(j,i)+s(i)-b(i)/2 for j child of i in T only
So, dual LP has one variable z(j) for each edge of T between j and parent(j) (C(i): children of i in T)
![Page 29: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/29.jpg)
How is T defined? Must have: child of t arrives after terminal t
for all t
Take Eulerian tour π of min spanning tree of terminals. We have: Cost(π) 2 OPT
Try to have: parent(j) is in the vicinity of j along π, and so: d(j,parent(j))=O(log2 n)* Cost(π)
r
t1
t2 t4t3
Left subtree
Right subtree
Path to root
![Page 30: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/30.jpg)
Random Arrivals Result
O(√n polylog(n)) proof sketch
Arbitrary interleaving of arrivals and reactivations, but: assume order of arrivals is random
Analyze potential Φ
Reactivations decrease potential
Φ(k): potential right after kth terminal arrives; bound E[Φ(k+1) - Φ(k) given Φ(k)]
![Page 31: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/31.jpg)
Analysis: arrival of j
Path picked by j could be complicated. Instead,
Take Eulerian tour π of min spanning tree of terminals.
Pick i randomly from previously arrived terminals in the vicinity of j along π, Connect j to i and follow i’s path.
![Page 32: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/32.jpg)
Open Problem General theme: Bound cost of solutions
reachable by best response dynamics
Obvious open question:analyze arbitrary mix of arrivals and reactivations
![Page 33: Claire Mathieu (Brown) Théorie algorithmique des jeux](https://reader034.vdocuments.site/reader034/viewer/2022051515/551d9d91497959293b8c6fbf/html5/thumbnails/33.jpg)
Conclusion Interactions fructueuses entre informatique
et economie/theorie des jeux