les nombres premiers, entre l’ordre et le chaosrmages.free.fr/maths/les_nombres_premiers.pdf ·...

184
Les Nombres premiers, entre l’ordre et le chaos Gérald Tenenbaum Professeur à l’Institut Elie Cartan à Nancy Michel Mendès France Professeur à l’Université Bordeaux 1

Upload: voliem

Post on 16-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Les Nombres premiers,entre l’ordre et le chaos

Gérald TenenbaumProfesseur à l’Institut Elie Cartan à Nancy

Michel Mendès FranceProfesseur à l’Université Bordeaux 1

© Dunod, Paris, 2011 pour la présente édition

Une précédente édition de cet ouvrage a été publiéeen 1997 aux Presses Universitaires de France

dans la collection « Que sais-je ? », rééditée en 2000.

ISBN : 978-2-1005-5936-7

Ce livre est dédié à la mémoire de Paul Erdos,qui nous a quittés en septembre 1996, aumoment même où nous achevions la rédactionde la première édition. Il fut pour nous un oncle(ainsi que l’appelaient ses amis) et un maître.Un géant des mathématiques a disparu, maisson empreinte marquera bien des siècles à venir.

Table des matières

Avant-propos xi

Notations et conventions xix

Chapitre 1 La genèse : d’Euclide à Tchébychev 1

1. Introduction 1

2. Une brève histoire de ce qui va suivre 6

3. Décomposition canonique 11

4. Congruences 13

5. Intermezzo cryptographique : systèmes à clefs publiques 17

6. Résidus quadratiques 20

7. Retour sur l’infinitude de l’ensemble des nombrespremiers 22

8. Le crible d’Ératosthène 24

9. Les théorèmes de Tchébychev 26

10. Les théorèmes de Mertens 32

11. Le crible de Brun et le problème des nombres premiersjumeaux 36

vii

TABLE DES MATIÈRES

Chapitre 2 La fonction zêta de Riemann 43

1. Introduction 43

2. Une brève histoire de ce qui va suivre 45

3. Produit eulérien 48

4. Prolongement analytique 51

5. La droite σ = 1 et le théorème des nombres premiers 57

6. L’hypothèse de Riemann 64

7. Conséquences arithmétiques des renseignements sur leszéros 69

Chapitre 3 Répartition stochastique des nombrespremiers 73

1. Introduction 73

2. Une brève histoire de ce qui va suivre 74

3. Progressions arithmétiques 77

4. Le théorème de Green et Tao 89

5. Le modèle de Cramér 91

6. Le théorème de Goldston, Pintz et Yıldırım 98

7. Équirépartition modulo un 102

8. Vision géométrique 108

Chapitre 4 Une preuve élémentaire du théorème desnombres premiers 113

1. Introduction 113

2. Intégration par parties 117

3. Convolution des fonctions arithmétiques 119

viii

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

4. La fonction de Möbius 123

5. Valeur moyenne de la fonction de Möbius et théorèmedes nombres premiers 126

6. Entiers sans grand ou sans petit facteur premier 131

7. La fonction de Dickman 136

8. La preuve de Daboussi, revisitée 140

Chapitre 5 Les grandes conjectures 147

Lectures complémentaires 159

Index 161

ix

Avant-propos

Issu de notre ouvrage Les Nombres premiers, paru dans la collectionQue sais-je ? et à présent épuisé, ce petit livre représente un parisans doute ambitieux : fournir au grand public scientifique unedescription concise de la théorie analytique moderne des nombrespremiers — à l’exclusion toutefois des apports de la théorie desformes modulaires.

Répondant à des questions posées depuis l’Antiquité — y a-t-ilbeaucoup de nombres premiers ?, comment se répartissent-ils ?,etc. —, ce domaine connaît depuis un siècle un essor sans précédent,dû notamment aux interactions avec la théorie des probabilités.Les tables de nombres premiers mettent en évidence un aspectchaotique, dont le désordre apparent s’accorde finalement avec desmodèles aléatoires classiques, issus, par exemple, de phénomènesphysiques. Là est précisément l’objet de cet opuscule : décrire,puis tenter de comprendre, comment une suite aussi hautementdéterminée que celle des nombres premiers peut renfermer unetelle part de hasard.

Insistons un peu sur ce point. Le hasard total, le chaos, c’est lacomplexité infinie. Par ailleurs, la complexité d’un nombre entiercroît manifestement avec sa taille, et répondre à des questionsde base devient souvent difficile : le nombre 243112609 − 1 est-ilpremier ?(1) Combien de fois son développement décimal contient-il le chiffre 7 ? etc. Au voisinage de l’infini, la suite des nombresentiers, et partant celle des nombres premiers, mime le hasard. Lesdirections modernes de la théorie analytique des nombres tententde rendre compte des modalités de cette tendance.

1. Oui, d’après Edson Smith (2008).

xi

AVANT-PROPOS

Physiciens et philosophes discutent encore de l’hypothétique« variable cachée », malgré les travaux convaincants d’Alain Aspect,qui semblent en proscrire l’existence. L’école de Copenhague,avec Niels Bohr, défend la thèse que le monde subatomique estrégi par le hasard. Einstein, quant à lui, rêve d’une explicationsub-subatomique totalement déterministe. La suite des nombrespremiers ne pourrait-elle servir de modèle aux idées d’Einstein, luiqui prétendait que Dieu ne joue pas aux dés au moment mêmeoù Mark Kac, éminent arithméticien, professait l’opinion que lesnombres premiers s’adonnent secrètement au jeu de pile ou face ?

La dialectique ordre/désordre occupe les théoriciens des nombresdepuis que Legendre et Gauss ont conjecturé une répartitionharmonieuse des nombres premiers, à savoir que le n-ième nombrepremier pn est proche de n ln n.(1) Une telle régularité dans l’aléa-toire ne doit pas surprendre : quoi de plus imprévisible que lejet d’une pièce de monnaie alors que la probabilité qui régitl’événement, constamment égale à 1

2 , prévoit une tendance àl’équilibre entre les piles et les faces ? Tous ceux qui ont observé lasuite des nombres premiers ont remarqué à la fois l’irrégularité etla régularité de leur distribution. À l’instar du jeu de pile ou face, lecomportement en moyenne est régulier alors que les fluctuationslocales, ici le passage de pn à pn+1, demeure très complexe.

Nous avons choisi de décrire ces phénomènes de répartitionen nous appuyant sur le cheminement historique et l’évolutiongraduelle de la philosophie — c’est-à-dire la représentationarchétypale — des nombres premiers. Les Chapitres 1, 2 et 4sont principalement consacrés aux résultats de régularité, alors quele Chapitre 3 traite surtout des aspects aléatoires de la répartition.Au Chapitre 5, nous décrivons les conjectures principales quisous-tendent la théorie et nous comprenons, in fine, que cettedichotomie n’est qu’apparente : hasard et nécessité se conjuguentharmonieusement pour produire de la structure, chacune des

1. Cette assertion, qui porte aujourd’hui le nom de théorème des nombres premiers, a étédémontrée par Jacques Hadamard et Charles de La Vallée-Poussin en 1896.

xii

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

deux perspectives éclairant et expliquant l’autre ; compte-tenu descontraintes liées à la structure d’ordre des entiers, la répartitiondes nombres premiers s’avère aussi harmonieuse que possible.

La présente édition diffère notablement des précédentes. Nousavons, en particulier, significativement enrichi les introductionsdes différents chapitres de manière à fournir au non-spécialiste unedescription aussi fidèle que possible du contenu mathématiqueet des idées-forces sous-jacentes. Ces développements, largementmétaphoriques, peuvent, en toute rigueur, être omis par un lecteurrompu au langage mathématique et aux notions principales utiliséesdans le texte : logarithmes, congruences, nombres complexes,convergences, interversion de sommations, etc. En revanche, ilspeuvent constituer l’essentiel de l’apport pour celui qui ne possèdepas (ou pas encore) le bagage scientifique nécessaire au décryptagedes démonstrations. Notre espoir est qu’ils recèlent également unintérêt pour le scientifique chevronné, soit en fournissant une pistede vulgarisation — les scientifiques parlent aussi aux profanes —, soiten mettant en évidence une « philosophie mathématique » implicite.

Nous avons également tenu compte des récentes avancées de lathéorie en incluant la recension de deux résultats remarquables.

Le premier, dû à Goldston, Pintz et Yıldırım, affirme que, pourtout ε > 0, la différence pn+1 − pn entre deux nombres premiersconsécutifs est inférieure à ε ln pn pour une infinité d’indices n.(1)

On est loin de la conjecture des nombres premiers jumeaux selonlaquelle cette différence est infiniment souvent égale à 2, mais celareprésente un saut qualitatif considérable.

Le second résultat est dû à Green et Tao. Il confirme une importanteconjecture d’Erdos selon laquelle la suite des nombres premierscontient des progressions arithmétiques arbitrairement longues. Ainsi{3, 5, 7} est une progression de raison 2 et de longueur 3, alors que

1. Plus précisément, ces auteurs établissent que, pour une constante convenable c, on a

pn+1 − pn � c√

ln pn(ln ln pn)2

pour une infinité d’indices n.

xiii

AVANT-PROPOS

{199, 409, 619, 829, 1039, 1249, 1459, 1669, 1879, 2089} estune progression de raison 210 et de longueur 10. On sait dorénavantqu’il en existe de longueur supérieure à toute borne donnée par avance.

Nous ne donnerons pas les preuves de ces résultats. Elles sontlongues et profondes et les détailler nous conduirait loin horsdu cadre de cet ouvrage. Nous tenterons toutefois de satisfaire lacuriosité du lecteur en fournissant des indications aussi précisesque possible sur les idées essentielles. Signalons que Terence Taoa été récompensé en 2006 par la Médaille Fields, la plus hautedistinction internationale pour les mathématiques.

Nous avons cru intéressant de parsemer cette édition d’illus-trations de mathématiciens cités ici. Si le texte nous fait plongerdans une abstraction souvent exigeante, les portraits apportentune dimension sensible à l’exposé : les mathématiciens sontdes êtres humains et voir leurs visages permet d’approcher leurspersonnalités. Derrière leurs regards, on pourra peut-être devinerce minuscule décalage qui souvent détermine une vie entière.

Tout choix est par nature restrictif : notre parti pris narratif a aussises dangers et ses désavantages. Rompant délibérément (certainsdiront scandaleusement) avec une tradition séculaire dans ce typed’ouvrage, nous ne fournissons pas de table de nombres premiers(1)

et nous ne donnons pas notre démonstration favorite de la loi deréciprocité quadratique. Plus grave, les divers aspects de la théoriedu crible sont seulement esquissés, bien que cette approche aitfourni de remarquables avancées, et nous n’abordons pas les diverseset profondes généralisations des nombres premiers en algèbrecommutative : idéaux premiers des corps de nombres, polynômesirréductibles sur un anneau ou un corps fini, etc. On consulteraà cet effet les ouvrages classiques disponibles en français.(2) Nousoccultons aussi, quasi totalement, l’aspect « diviseurs » des nombres

1. Une carence à laquelle suppléeront aisément les calculatrices de bureau.2. Voir, par exemple : Samuel, Théorie algébrique des nombres, Hermann, 1967 ;Borevitch & Chafarevitch, Théorie des nombres, Gauthier–Villars, 1967 ; Serre, Corpslocaux, Hermann, 1968.

xiv

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

premiers qui fournit pourtant aux méthodes probabilistes dela théorie des nombres un champ d’investigation privilégié.(1)

Enfin, nous ne faisons qu’aborder très succinctement (au § 1.5)les aspects cryptographiques et algorithmiques de la théorie, dontles saisissantes applications ont franchi, depuis plusieurs décennies,les frontières de la médiatisation grand public.(2)

La science en général, et, en son sein, les mathématiques,constitue une part sans cesse grandissante de la culture générale.Par ailleurs, les ouvrages « plaisants et délectables »(3) consacrés auxaspects spectaculaires des nombres premiers ne manquent pas, etcertains sont d’ailleurs tout à fait remarquables.(4) Nous avons doncchoisi d’assumer notre différence, selon une expression aujourd’huiconsacrée, en visant un peu plus haut qu’il n’est d’usage dans unouvrage de vulgarisation. Nous sommes conscients que certainsdéveloppements pourront sembler ardus — ils le sont. Nous avonsparfois préféré un court calcul (le dessin des mathématiciens)à de longues explications, et le style est volontairement dense,voire, de place en place, allusif. Cela nous a paru nécessaire à lamise en évidence des arguments essentiels. Ainsi, nous espéronsqu’un lecteur assidu et tenace verra sa curiosité satisfaite par despreuves localement complètes — c’est en particulier avec ce soucique nous avons rédigé le Chapitre 4, essentiellement autonome.Mais nous encourageons aussi le lecteur plus pressé, ou moinsdésireux d’entrer dans les détails, à lire cet opuscule « en diagonale »,tant il est vrai que seules les définitions comptent, pourvu qu’onles comprenne, et avec elles l’émergence d’une logique/musique

1. Ce point de vue est développé dans quelques ouvrages à présent classiques, enparticulier : Elliott, Probabilistic number theory (2 vol.), Springer Verlag, 1979-1980 ;Hall & Tenenbaum, Divisors, Cambridge University Press, 1988 ; Montgomery& Vau-ghan, Multiplicative number theory I, Cambridge University Press, 2007 ; Tenenbaum,Introduction à la théorie analytique et probabiliste des nombres, Belin 2008.2. Pour en savoir plus, voir par exemple les ouvrages de Robin, de Menezes, vanOorschot & Vanstone, et de Koblitz, cités dans la bibliographie.3. Selon l’expression de Bachet (1612).4. L’exhaustif Nombres premiers : mystères et records (PUF, 1994) de Ribenboim, et lelumineux Merveilleux nombres premiers (Belin, 2000) de Delahaye en font partie.

xv

AVANT-PROPOS

intrinsèque où elles s’appellent mutuellement. Le reste n’est quebavardage.

À la lecture analytique scolaire consistant à ne lire la ligne n + 1que lorsque l’on a compris et assimilé la ligne n, nous voulonsopposer (ce qui est rendu possible précisément par la relativetension de l’exposé), une lecture synthétique, un glissando, où le fildirecteur est sans cesse apparent. La synthèse faite, rien n’empêche(et, on l’aura compris, c’est en fait nécessaire pour progresserencore) de reprendre la lecture plume en main et d’affronter larigueur, voire la rugosité, des démonstrations. Le jeu en vaut lachandelle.

Ce livre n’est donc pas facile, mais nous espérons qu’empreintde mystère, il engendrera une discrète poésie. De la complexiténaît le rêve. Ni Stéphane Mallarmé ni Umberto Eco ne nouscontrediront.

La maison Dunod, que nous avons plaisir à remercier ici, s’estengagée à nos côtés pour maintenir, sous une forme attrayante, ladisponibilité de notre texte initial, qui a connu un certain succèsdepuis 1997, avec notamment la reconnaissance de l’Académiedes Sciences,(1) une traduction anglaise,(2) et une traductionchinoise.(3)

Pour cette édition nous tenons évidemment à exprimer notregratitude tous ceux qui nous ont aidé dès 1997 : Jean-Paul Allouche,Jean-Philippe Anker, Michel Balazard, Daniel Barlet, Régis dela Bretèche, Éric Charpentier, Hédi Daboussi, Cécile Dartyge,Jean-Marc Deshouillers, Jean-Claude Fort, Andrew Granville,Jerzy Kaczorowski, Bernard Landreau, Pierre Marchand, GérardMathieu, Jean-Louis Nicolas, Emmanuel Pedon, Patrick Sargos,Jacques Sicherman, André Sef, Jie Wu, et Paul Zimmermann.

1. Prix Paul Doistau-Émile Blutet de l’information scientifique 1999.2. The prime numbers and their distribution, Student mathematical library 6, AmericanMathematical Society, 20003. Les nombres premiers, Mathematics series for graduate students 9, TsinghuaUniversity Press, 2007.

xvi

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

À cette liste, il convient à présent d’ajouter Vitaly Bergelson, DanielGoldston, Guillaume Hanrot, Charles Mozzochi, János Pintz, Jia-Yan Yao et Cem Yıldırım pour leurs précieux conseils. Régis de laBretèche, Cécile Dartyge, et Jie Wu se sont à nouveau amicalementet efficacement mobilisés pour améliorer la présente édition.

Nancy et Bordeaux, mai 2010,G. T. & M. M.F.

xvii

Notations et conventions

Nous indiquons ici les principales notations et conventions utiliséesdans l’ensemble de l’ouvrage. Celles qui n’apparaissent que dansun chapitre ou un paragraphe sont définies localement.

La lettre N désigne l’ensemble des entiers naturels {1, 2, . . .}et P celui des nombres premiers. Les ensembles des entiersrelatifs, des nombres réels et des nombres complexes sont désignésrespectivement par Z, R, et C. La lettre p, avec ou sans indicedésigne toujours un élément de P. On écrit a | b (resp. a � b) poursignifier que a divise (resp. ne divise pas) b et pν‖a indique quepν | a et pν+1 � a.

Le pgcd de deux entiers a, b est noté (a, b). Lorsque (a, b) = 1,on dit que a et b sont premiers entre eux. Le nombre d’élémentsd’un ensemble fini A est désigné, selon les circonstances, par |A| ou∑

a∈A 1. On désigne par P+(a) (resp. P−(a)) le plus grand (resp.le plus petit) facteur premier d’un entier a ∈ N, avec la conventionP+(1) = 1, P−(1) = ∞.

Le logarithme népérien est noté ln.(1) Les itérés ln ln, ln ln ln,etc., sont notés ln2, ln3, etc. La constante d’Euler γ est définiecomme la limite

γ = limN→∞

(∑n�N

1/n − ln N).

On a γ ≈ 0, 577215664. Il est à noter, cependant, que noussuivrons l’usage traditionnel en désignant également par γ, auchapitre II, la partie imaginaire d’un zéro générique non trivial dela fonction zêta de Riemann. Aucune confusion ne sera à craindre.

1. ln a est donc, pour a � 1, l’aire du domaine plan limité par les axes x = 1, x = a,y = 0 et la courbe y = 1/x. On a, lorsque a est « grand », ln a ∼

∑n�a 1/n.

xix

NOTATIONS ET CONVENTIONS

La partie entière et la partie fractionnaire d’un nombre réel xsont notées respectivement �x� et 〈x〉. Ainsi

�5/3� = 1, 〈−3, 15〉 = 0, 85.

Le signe d’affectation := indique que le membre de gauched’une égalité est défini par celui de droite.

La fonction logarithme intégral est définie par

li(x) :=

∫ x

2

dtln t

(x � 2).

Lorsque la lettre s désigne un nombre complexe, nous définissonsimplicitement ses parties réelle et imaginaire par s = σ + iτ .

Étant données des fonctions f , g , de variable réelle ou complexe,nous employons indifféremment la notation de Landau f = O(g)ou celle de Vinogradov f g pour signifier qu’il existe uneconstante positive C telle que |f | � Cg dans le domaine dedéfinition commun à f et g. Une éventuelle dépendance de Cen fonction d’un paramètre α pourra être indiquée sous la formef = Oα(g), ou f α g. La notation de Landau f = o(g) estutilisée dans son sens habituel de lim f /g = 0.(1)

Nous désignons par fonction indicatrice d’un ensemble A lafonction qui vaut 1 sur A et 0 sur son complémentaire. Enfin,Ck[a, b] désigne l’espace des fonctions k fois continûment dérivablessur l’intervalle [a, b].

Par ailleurs, nous utiliserons souvent la manipulation suivantepour estimer une moyenne pondérée par des coefficients complexesan (n ∈ N) d’une somme aux valeurs entières d’une fonctionf ∈ C1[1, x] :∑

1�n�x

anf (n) =∑

1�n�x

an

{f (x) −

∫ x

nf ′(t) dt

}= f (x)

∑1�n�x

an −∫ x

1f ′(t)

{ ∑1�n�t

an

}dt.

1. Ainsi O(1) désigne une quantité bornée alors que o(1) dénote une quantité qui tendvers 0.

xx

Chapitre 1

La genèse :d’Euclide à Tchébychev

1. Introduction

Compter, c’est d’abord compter sur soi. Au sens figuré, biensûr, mais aussi au sens propre : compter sur ses doigts, sur sespieds, sur ses épaules, sur ses genoux, etc. L’étymologie des nomsde nombres fait en effet apparaître qu’ils sont des vestiges delangues très anciennes dans lesquelles ils désignaient les différentesparties du corps. Archétypes de notre représentation du monde,les nombres font, au sens le plus fort, partie de nous. À tel pointque l’on peut légitimement se demander si l’objet d’étude del’arithmétique n’est pas l’esprit humain lui-même. De là, naît uneétrange fascination : comment ces nombres, que nous portons siprofond, engendrent-ils des énigmes aussi redoutables ? Parmi cesmystères, celui des nombres premiers est sans doute l’un des plusanciens et des plus résistants. Notre objectif dans ce petit livreest d’initier le lecteur à quelques-unes des méthodes inventées parl’homme pour appréhender cette récalcitrante intimité. Puisse-t-ilmesurer notre ignorance à l’aune de ces arcanes imbriqués et enconcevoir un insatiable appétit de connaissance.

1

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Il y a, fondamentalement, deux manières de conjuguer les entiers.On peut les ajouter et les multiplier. Mais alors que, par l’addition,on peut retrouver chaque entier fixé à l’avance à l’aide d’entiersplus petits, on s’aperçoit rapidement que, pour la multiplication,il est nécessaire d’introduire, de-ci de-là, des éléments nouveaux,irréductibles à ceux qui les précèdent. Ces éléments sont appelésdes nombres premiers et, depuis la nuit des temps, l’humanitécherche à préciser le « de-ci de-là »...

L’ensemble des nombres premiers débute donc ainsi :2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53,59, 61, 67, 71, 73, 79, 83, 89, 97, 101, . . ., 571, . . .

Il y a près de vingt-trois siècles, Euclide démontrait l’infinitudede l’ensemble des nombres premiers. D’une grande beauté et d’unegrande simplicité, sa preuve, avec les notations modernes, tient enquatre caractères :

n! + 1.

En effet, ce nombre n’est divisible par aucun entier d telque 2 � d � n ; il ne possède donc que des facteurs premiersexcédant n. Cela établit l’existence d’au moins un nombre premierplus grand que toute limite fixée à l’avance.

Pour tout nombre réel x > 0, on note π(x) le nombre desnombres premiers p qui ne dépassent pas x, soit

π(x) :=∑p�x

1.(1)

Le résultat d’Euclide signifie que π(x) tend vers l’infini avec x. Leproblème se pose donc d’étudier la vitesse de croissance de cettefonction.

Il faut attendre Euler, au dix-huitième siècle, pour qu’unevéritable percée soit faite dans ce domaine. Il découvre la formule

1. Cette écriture signifie simplement que l’on compte 1 pour chaque nombre premiern’excédant pas x. La notation peut sembler étrange à première vue, mais elle a fait sespreuves, notamment parce qu’elle se prête à diverses manipulations analogues à cellesdes intégrales.

2

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

fondamentale

ζ(σ) := 1 +12σ

+13σ

+ · · ·

=1

1 − 1/2σ

11 − 1/3σ

11 − 1/5σ

· · · (σ > 1),

qui relie une somme étendue à tous les entiers à un produit infiniportant sur tous les nombres premiers. La formule n’est pas valablepour σ = 1, mais Euler n’hésitait pas à lui donner le sens suivant(1)∏

p

(1 − 1/p

):=

(1 − 1/2

)(1 − 1/3

)(1 − 1/5

)· · · = 0.

Sachant que ln(1−1/p) est de l’ordre de −1/p, Euler en concluaitque la somme des inverses des nombres premiers diverge :∑

p

1p

:=12

+13

+15

+17

+111

+ · · · = ∞.

Carl Friedrich Gauss(1777–1855)

Ce calcul sera justifié et précisé au § 7.Gauss (1792), puis Legendre (1798,

1808) conjecturent que l’on a, lorsquex tend vers l’infini,

π(x) ∼ x/ ln x.(2)

Quelques décennies plus tard, en 1852,Tchébychev établit une forme faible decette conjecture : il existe des constantesstrictement positives a et b telles quel’on ait

ax/ ln x < π(x) < bx/ ln x (x � 2).

1. Qu’en langage moderne on pourrait qualifier de prolongement par continuité.2. Il est utile de garder à l’esprit que cela équivaut à la validité de la formule asymptotiquepn ∼ n ln n, où pn désigne le n-ième nombre premier.

3

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Pafnouti Tchébychev(1821–1894)

Numériquement, le résultat constitueun argument très convaincant en faveurde la conjecture de Gauss-Legendre :pour x assez grand, on peut choisira = 0,921 et b =1,106.

Un petit détour est nécessaire pourdécrire le progrès suivant, dû à Riemann.

Le lecteur a sans doute, sinon uneconnaissance précise, du moins unecertaine idée de ces nombres parti-culiers, qualifiés d’« imaginaires » parDescartes, et inventés par les mathématiciens italiens du XVe sièclepour résoudre les équations de degré 3 et 4. Toute l’histoire consisteà admettre l’existence de racines carrées de nombres négatifs et àconstater que le calcul formel fonctionne. Ainsi, selon Cardan, sil’on note i =

√−1, les solutions de l’équation x(10 − x) = 40

sont 5 ± i√

15 : par exemple

(5 + i√

15)(5 − i√

15) = 25 − (i√

15)5

= 25 − i215 = 25 + 15 = 40.

Le trouble vient de ce qu’on sait depuis toujours que le carré d’unnombre réel est nécessairement positif, et donc qu’il n’existe aucunnombre réel dont le carré soit négatif. Descartes, Newton et Bombelliconsidéraient que l’apparition de ces nombres comme solutionsd’équations signifiait que le problème était en réalité impossible.

René Descartes(1596–1650)

Mais, en terre de mathématiques,l’interdiction peut être contournée sanscontrevenir aux règles de la logique.À la suite de Wallis et Gauss, lesmathématiciens ont trouvé un espacenouveau dans lequel les nombres réelset imaginaires pouvaient cohabiter pai-siblement : il suffisait de penser à intro-duire une dimension supplémentaire

4

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

pour l’univers des nombres — une révolution. À la droitenumérique, où les nombres réels sont rangés à la queue-leu-leu, ona substitué un pré carré où la longueur était mesurée à l’aune dunombre réel 1, et la largeur à celle du nombre imaginaire i. Dansce nouveau monde, un nombre est une combinaison du type

a + ib

où a et b sont réels. Sous cette forme, aucune simplification n’estpossible, mais le calcul suit les règles ordinaires, compte tenu de laloi i2 = −1 : par exemple

(a + ib)2 = a2 − b2 + 2iab.

L’univers des combinaisons a+ib de nombres réels et imaginairesest désigné comme le champ des nombres complexes, habituellementnoté par la lettre C. Dans C, on peut additionner, soustraire, diviser,multiplier selon les lois usuelles. On dit que C est un corps.

Le corps C des nombres complexes offre une surprise de taille :non seulement toutes les équations polynomiales à coefficientsréels y ont des solutions, mais il en va de même des équationsà coefficients complexes. Ainsi, l’équation x3 + 2i = 0 a poursolutions

i 3√

2, − 12

3√

2√

3 − i 12

3√

2, 12

3√

2√

3 − i 12

3√

2.

Riemann (1859) exploite l’idée géniale de prolonger la fonctionzêta

ζ(s) =∑n�1

n−s

en une fonction de la variable complexe. Cela permet de donnerun sens à ζ(s) même hors du domaine de convergence de la sérieet, comme le démontre Riemann, l’étude du prolongement seprête remarquablement bien à la déduction de renseignementsasymptotiques concernant π(x).

5

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Bernhard Riemann(1826–1866)

Enfin, en 1896, Hadamard et LaVallée-Poussin, s’appuyant l’un etl’autre sur les travaux de Riemann,démontrent indépendamment le théo-rème des nombres premiers

π(x) ∼ x/ ln x (x → ∞).

Jacques Hadamard(1865–1963)

Charles de La Vallée-Poussin(1866–1962)

Ce livre est un peu l’histoire de cette aventure. Nous verronsqu’elle n’est pas terminée.

2. Une brève histoire de ce qui va suivre

2.1. Les lettres et les mots

Comme annoncé dans l’avant-propos, ce paragraphe, ainsi quetous ceux qui portent le même titre aux chapitres suivants, inviteà une promenade initiatrice ouvrant sur la suite du chapitre.

La raison essentielle de l’intérêt des mathématiciens pour lesnombres premiers est qu’ils constituent un alphabet (infini)permettant d’attribuer un nom unique à chaque nombre entier :ainsi le « nom » de 12 est 2·2·3, et celui de 2010 est 2·3·5·67. Dansce dictionnaire à jamais inachevé, chaque mot possède un sensexclusif et toutes les combinaisons de lettres constituent des mots.

6

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

C’est d’ailleurs précisément pour cette raison que le nombre 1 (quisatisfait à la règle de n’être divisible que par lui-même et par 1) n’estpas considéré comme un nombre premier par les mathématiciens :s’il l’était, il y aurait une infinité de mots, ne différant que par lenombre des 1 y apparaissant, pour représenter chaque nombre entier.

Euclide(∼330 –∼275)

Aussi naturelle qu’elle paraisse être,la preuve de cette correspondance uni-voque et exhaustive entre les nombresentiers et les produits de nombrespremiers n’est pas une évidence : com-ment peut-on être certain que la seulemanière d’obtenir 48613 en multi-pliant entre eux deux entiers plusgrands que 1 consiste à combiner173 et 281 ? C’est au mathématiciend’Alexandrie (sans doute) d’origine grec Euclide que l’on doit lapremière démonstration rigoureuse.

Gauss a généralisé l’énoncé. Sa démonstration, reposant sur unrésultat de Bachet datant de 1624, est encore celle qui est la pluscommunément utilisée pour démontrer le résultat d’Euclide.

Une version imagée de cette preuve est la suivante : supposonsque vous pariez à pile ou face avec un ami selon la règle suivante :« tu me donnes x euros à chaque fois que je gagne, et je te donne yeuros lorsque c’est toi qui gagnes » Le théorème est alors le suivant :si y est premier et si x n’est pas multiple de y, il existe toujours unesuite de gains et pertes conduisant à un solde de 1 euro. Exemple :si vous recevez 20 euros à chaque gain et donnez 17 euros à chaqueperte, il vous restera exactement 1 euro après 6 gains et 7 pertes.

2.2. Des horloges particulières

On peut déduire de ce qui précède le résultat suivant, dont nousdonnons ici encore une formulation analogique. Supposons quele cadran d’une pendule soit gradué de telle sorte qu’une heure(c’est-à-dire un tour complet) corresponde à un nombre premier p

7

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

de minutes. Alors pour tout nombre a de minutes ne correspondantpas à un nombre entier d’heures, le nombre ap−1, une fois reportésur la pendule, aboutira à exactement une minute après l’heurepile. Exemple : p = 13, 2p−1 = 212 = 315 × 13 + 1, soit 315tours complets et une minute.

Ce phénomène est en fait plus général : pour tout nombre bde minutes ne correspondant pas à un nombre exact d’heures,on pourra trouver un exposant c tel que la puissance ac coïncideavec b sur le cadran de l’horloge. Il se trouve que le calcul de cconnaissant a et b est extrêmement difficile, alors que celui de ac

est très peu coûteux en temps de calcul. Ce mécanisme constituedonc un verrou facile à fermer et difficile à ouvrir : c’est le principe(très simplifié) des méthodes de cryptographie modernes.

Un autre champ d’étude, également dû à Gauss, consiste àse demander, parmi des graduations de l’horloge, lesquelles sontdes carrés parfaits — autrement peuvent être obtenus en faisantparcourir a2 graduations à l’aiguille — et lesquelles n’en sontpas. Surprise : alors qu’il existe 10 carrés parfaits jusqu’à 100, onconstate que sur l’horloge avec 101 graduations, il y a 50 carrés ! Cephénomène se révèle général : sur les horloges à nombre premier,essentiellement une graduation sur deux est un carré parfait.

Une grande découverte de Gauss, connue sous le nom de loide réciprocité quadratique, consiste à donner une formule simplepermettant de décider si un nombre premier q est un carré surl’horloge à p minutes dès que l’on sait si p est ou non carré surl’horloge à q minutes.

Les nombres premiers, d’apparence si irrégulière, renfermentd’incroyables symétries.

2.3. Compter les nombres premiers

L’un des mystères les plus captivants concernant les nombrespremiers consiste à évaluer leur nombre π(x) dans l’intervalle[2, x]. Comme indiqué au paragraphe précédent, il est assez facile

8

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Leonhard Euler(1707–1783)

de montrer que π(x) devient arbitrai-rement grand lorsque x croît indéfini-ment. Mais à quelle vitesse ?

Le génial Euler a donné une versionquantitative du résultat d’Euclide surl’infinitude de l’ensemble des nombrespremiers : la somme des inversesdes nombres premiers dans l’intervalle[2u, 2v] est proche de celle des inversesdes nombres entiers dans l’intervalle[u, v]. Exemple :∑100<n�200

1n≈ 0,70065, 0,70064 <

∑2100<p�2200

1p

< 0,70066.

Adrien-Marie Legendre(1752–1833)

Ératosthène de Cyrène(∼276 –∼194)

Cette formule constitue un soutienheuristique majeur pour le théorèmedes nombres premiers, conjecturé parLegendre et Gauss, et qui permetd’approcher la taille de π(x) ou, cequi revient au même, celle du n-ièmenombre premier en fonction de nseulement. Nous y reviendrons.

Une autre approche quantitativede l’ensemble des nombres premiersconsiste à produire des tables. Latechnique la plus ancienne est due àÉratosthène, qui propose de commen-cer par cocher, dans l’ensemble desentiers de 1 à N , tous les multiplesde 2 : le premier nombre non coché,soit 3, est premier ; on coche ensuitetous les multiples de 3 non déjà cochés ;le premier nombre non coché est 5, quiest premier, etc.

9

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Cette méthode, pratique pour produire des tables de taillemodeste, trouve rapidement ses limites lorsque l’on cherche àla formaliser en vue d’une approche théorique. Il fallut attendreTchébychev et l’année 1852 pour voir apparaître des techniquesde comptage des nombres premiers fournissant des évaluationsasymptotiques numériques effectives. Tchébychev utilise astucieu-sement des outils bien connus des analystes, comme la formulede Stirling, datant de 1730, et démontre le postulat de Bertrand(1845), stipulant essentiellement qu’entre un entier et son doublese place toujours au moins un nombre premier.

C’est ensuite Franz Mertens qui, au trois-quarts du XIXe siècle,reprend le flambeau de la course à la conjecture de Gauss-Legendre.L’une de ses formules, très surprenante, est passée à la postérité : àl’instar du résultat d’Euler mentionné plus haut, il montre qu’uneconstante bien connue des mathématiciens, portant égalementle nom d’Euler et apparaissant naturellement dans l’étude dela somme des inverses des nombres entiers, scelle une formulebasique concernant les nombres premiers. Le lien structurel entreles nombres premiers et les nombres entiers possède décidémentde multiples facettes.

2.4. Le crible

La méthode d’Ératosthène est trop belle pour être à ce pointinefficace. C’est sans doute ce que se disait in petto le mathématiciennorvégien Viggo Brun dans les années 1920 lorsqu’il a mis aupoint sa méthode, consistant à remplacer la formule exacte ducrible par une formule approchée plus maniable. Ce faisant, il adécouvert beaucoup plus : trouver les nombres premiers par uneméthode de crible, autrement dit chercher la non-divisibilité enétudiant la divisibilité, met en œuvre des principes très générauxqui s’appliquent largement au-delà de la théorie des nombrespremiers. Son plus grand succès a concerné les nombres premiersdits jumeaux, comme 41 et 43 ou 107 et 109, parce que leurécart est le plus petit possible. Alors que la série des inverses des

10

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

nombres premiers diverge, Brun a montré que la série des inversesdes nombres premiers jumeaux est convergente, autrement dit quela somme

13

+15

+15

+17

+111

+1

13+

117

+1

19+ · · · + 1

107+

1109

+ · · ·

reste en dessous d’une valeur fixe même lorsque l’on étend lasommation à tous les couples de nombres premiers jumeaux.

La théorie du crible est aujourd’hui une branche à part entièrede l’arithmétique. Elle a contribué efficacement à ses succès récents,comme le théorème de Goldston, Pintz et Yıldırım sur les petitsécarts entre nombres premiers consécutifs — cf. § 3.6.

3. Décomposition canonique

Un nombre premier est un nombre entier p > 1 qui ne possèdeaucun diviseur d satisfaisant à 1 < d < p. On notera que 1 n’estpas premier et que 2 est le seul nombre premier pair.

Ainsi que nous l’avons signalé dans le paragraphe précédent,la situation centrale des nombres premiers en arithmétique estjustifiée par le fait que chaque entier n > 1 se décompose de manièreunique, à l’ordre des facteurs près, en un produit de nombres premiers

n =

k∏j=1

pjνj .

L’existence de la décomposition est presque évidente : il suffitde raisonner par récurrence. Si la propriété est vraie pour toutentier < n et si n n’est pas premier, alors n possède des diviseursd ∈ ]1, n[. Pour chacun d’entre eux, on peut factoriser n sous laforme n = dm avec m = n/d ∈ ]1, n[. L’hypothèse de récurrenceappliquée à d et m fournit alors le résultat souhaité pour n.

La question de l’unicité est beaucoup moins facile. Elle nécessitele premier théorème d’Euclide : si un nombre premier p divise unproduit ab, alors il divise a ou b. Admettons cela pour un instant.

11

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Alors, si n possède deux décompositions en produits de facteurspremiers, disons n =

∏kj=1 pj

νj et n =∏�

i=1 qiσi , chaque pj est un

qi et réciproquement. En particulier k = � et, quitte à réordonnerles facteurs, nous en déduisons que pj = qj pour 1 � j � k.Supposons par exemple ν1 > σ1. Alors m = n/pσ1 posséderaitdeux décompositions correspondant à des ensembles distincts denombres premiers, ce qui contredirait la première partie de ladémonstration.

La preuve moderne du premier théorème d’Euclide passe par lastructure des idéaux de l’ensemble Z des entiers relatifs. On ditqu’un sous-ensemble non vide I de Z en est un idéal s’il est stablepar soustraction et par multiplication par un entier quelconque,en d’autres termes :

(x ∈ I , y ∈ I) ⇒ x − y ∈ I , (x ∈ Z, y ∈ I) ⇒ xy ∈ I .

Il est facile de constater que les ensembles de multiples

αZ = {αm : m ∈ Z}

sont des idéaux de Z. Plus surprenante est la réciproque : toutidéal I de Z est un ensemble de multiples I = αZ. En effet, unidéal I non réduit à {0} contient des éléments positifs : l’une oul’autre des propriétés de la définition impliquent que I est stablepar l’application x �→ −x. Soit α le plus petit élément positifde I . Alors αZ ⊂ I . Réciproquement, pour tout β ∈ I , on peuteffectuer la division euclidienne β = αq + r avec 0 � r < α. Orαq ∈ I , donc r = β −αq ∈ I . D’après la propriété de minimalitéde α, il faut que r = 0 et β = αq ∈ αZ.

Nous sommes maintenant en mesure d’établir le premier théo-rème d’Euclide. Soient a, b, p tels que p | ab et p � a. L’ensembleaZ+ pZ de toutes les combinaisons linéaires ax + py avec x, y ∈ Zest un idéal αZ de Z. Cet idéal contient a et p, donc α | a etα | p. Cette dernière condition implique α = 1 ou α = p et laseconde éventualité est exclue puisque p � a. On a donc α = 1,

12

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

d’où aZ + pZ = Z. En particulier, il existe x, y ∈ Z tels que

ax + py = 1.(1)

En multipliant les deux membres de cette égalité par b, il suitb = abx + pby = p{(ab/p)x + by}, d’où p | b, ce qu’il fallaitdémontrer.

4. Congruences

La notion de congruence est due à Gauss. Soit m un nombre entier� 1. On dit que deux nombres entiers x et y sont congrus modulom si la différence x − y est divisible par m. On note dans ce cas

x ≡ y (mod m).

L’ensemble des entiers congrus à un entier donné a s’appelle la classede a, notée a. On dit qu’un élément de a est un représentant de a.Chaque classe possède un unique représentant dans l’ensemble{0, 1, . . . , m − 1}, et le représentant d’un entier quelconque n estalors égal à son reste dans la division par m. L’ensemble des classesd’équivalence est noté Z/mZ,(2) et l’on peut vérifier que, pour tousentiers a, b, les classes a + b et ab ne dépendent que des classesrespectives de a et b. On peut donc munir Z/mZ d’une additionet d’une multiplication définies par

a + b = a + b, a b = ab.

Ces opérations(3) confèrent à Z/mZ une structure d’anneaucommutatif unitaire : autrement dit, les règles de calcul sont

1. Cette assertion porte le nom de théorème de Bachet (1624). Elle est souvent attribuéeà tort à Bézout.2. Z/mZ est donc en bijection naturelle avec tout intervalle d’entiers de longueur m,par exemple {0, 1, . . . , m − 1}.3. Il est d’usage d’omettre les barres de surlignement pour désigner les classes de Z/mZ.Il est également fréquent que, même lorsqu’ils sont en fait relatifs aux classes, les calculssoient présentés en termes des représentants dans Z. Le signe d’égalité est alors remplacépar celui de congruence et on ajoute aux relations formulées la mention (mod m).

13

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

les mêmes que dans Z. Cependant, ces règles ne s’étendent pasà la division : Z/mZ n’est en général pas intègre, c’est-à-dire quele produit de deux éléments non nuls peut être nul. Par exemple,2 × 3 = 0 dans Z/6Z. On désigne par (Z/mZ)∗ l’ensemble deséléments inversibles de Z/mZ, c’est-à-dire l’ensemble des classes apour lesquelles l’équation a x = 1 possède une solution. La fonctionindicatrice d’Euler, traditionnellement notée ϕ(m), est définie par

ϕ(m) = |(Z/mZ)∗|.(1)

Nous reviendrons plus loin sur les propriétés de cette fonction,mais nous pouvons observer immédiatement que pour chaque entierm � 1, ϕ(m) est égal au nombre des entiers a, 1 � a � m, qui sontpremiers à m.

Soit, en effet, N (m) ce nombre. On a ϕ(m) � N (m)puisque ax ≡ 1 (mod m) implique (a, m) = 1. Réciproquement,si (a, m)=1, alors, en appliquant le théorème de Bachet à tous lesfacteurs premiers (comptés avec multiplicité) de m et en faisantle produit des relations ax + py = 1 correspondantes, on obtientaX + mY = 1 pour des entiers convenables X , Y . Cela impliquebien a ∈ (Z/mZ)∗.

Une conséquence importante de cette application du théorèmede Bachet est que, pour tout nombre premier p, l’ensemble Z/pZ estun corps, autrement dit : pour tout entier a non multiple de p, laclasse de a est inversible dans Z/pZ. Cela résulte immédiatementde la démonstration précédente puisque a �≡ 0 (mod p) équivautà (a, p) = 1. En particulier, Z/pZ est intègre(2) et ϕ(p) = p − 1pour tout nombre premier p. Nous verrons au § 8 que l’on a plusgénéralement

ϕ(n) = n∏p|n

(1 − 1/p)

pour tout entier n � 1.

1. Rappelons que nous désignons par |A| le nombre d’éléments d’un ensemble fini A.2. Voir p. 14.

14

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

De ce qui précède, on déduit encore le résultat fondamentalqu’une équation polynomiale à coefficients entiers de degré d

P(x) ≡ 0 (mod p)

possède au plus d racines distinctes dans Z/pZ.

Supposons, en effet, que l’équation possède k racines distinctesx1, . . . , xk. On voit en écrivant P(x) = P(x)−P(x1) et en utilisantde manière systématique l’identité

xj − xj1 = (x − x1)

∑0�i<j

xi1xj−1−i (1 � j � d),

que l’on peut écrire P(x) ≡ (x − x1)a1Q1(x) (mod p), où a1 � 1,

et Q1(x) est un polynôme de degré d − a1, dont x1 n’est pas racine.Ainsi x2 doit être racine de Q1(x). En itérant le procédé, on obtient

P(x) ≡∏

1�j�k

(x − xj)aj Qk(x) (mod p),

où Qk est un polynôme sans racine dans Z/pZ et dont le coefficientdu terme de plus haut degré est le même que celui de P(x). Celaimplique bien que k �

∑1�j�k aj � d .

Soient p un nombre premier, et a un entier non multiplede p. Considérons l’application x �→ ax dans (Z/pZ)∗. C’est uneinjection, donc, puisque l’ensemble est fini, une bijection. Il suit∏

x∈(Z/pZ)∗

x =∏

x∈(Z/pZ)∗

ax = ap−1∏

x∈(Z/pZ)∗

x,

d’où

ap−1 ≡ 1 (mod p) (a ∈ (Z/pZ)∗).

15

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Cette importante identité est connue sous le nom de petit théorèmede Fermat.(1) On peut d’ailleurs la généraliser facilement au casde l’anneau (Z/mZ)∗ pour m quelconque : si a ∈ (Z/mZ)∗,l’application x �→ ax permute les éléments de (Z/mZ)∗. Onobtient avec les mêmes calculs (en utilisant cette fois que le produitd’éléments inversibles de (Z/mZ)∗ est encore inversible)

aϕ(m) ≡ 1 (mod m) (a ∈ (Z/mZ)∗).

C’est la célèbre formule d’Euler.Soit n un nombre entier impair. Nous verrons au paragraphe

suivant que le calcul numérique de 2n−1(mod n) est rapide mêmepour de grandes valeurs de n. Si cette quantité n’est pas égale à 1,alors n n’est pas premier. Si elle vaut 1, cela n’implique pas que nsoit premier, mais les exceptions, appelées nombres pseudo-premiersen base 2, sont rares. Cette remarque est à la base des tests modernesde primalité.

Le petit théorème de Fermat n’a pas à proprement parler deréciproque.(2) On dit qu’un nombre entier n > 1 est un nombrede Carmichael si n est composé (i.e. non premier) et vérifiean−1 ≡ 1 (mod n) pour tout a premier avec n. Le plus petitnombre de Carmichael est 561. Alford, Granville et Pomeranceont démontré en 1992 qu’il existe une infinité de nombres deCarmichael.

Une autre conséquence du fait que Z/pZ est un corps est lethéorème de Wilson (1770, dans un article de Waring) :

p premier ⇔ (p − 1)! + 1 ≡ 0 (mod p).

1. Par opposition au fameux grand théorème de Fermat, selon lequel l’équationxn + yn = zn n’a pas de solution en entiers non nuls x, y, z dès que n � 3. Cettesibylline assertion datant approximativement de 1638 a été récemment démontrée parWiles et Taylor (1994)... mais c’est une tout autre histoire.2. Cependant Lucas (1891) a montré que si (a, n) = 1, an−1 ≡ 1 (mod n) eta(n−1)/q �≡ 1 (mod n) pour tout facteur premier q de n − 1, alors n est premier.Ce résultat est utilisé pour produire de grands nombres premiers.

16

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

La condition est suffisante : si q|p et 1 � q < p, de sorte queq|(p − 1)!, elle implique q|1, d’où q = 1. Elle est aussi nécessaire :chaque terme x du produit

(p − 1)! ≡∏

x∈(Z/pZ)∗

x (mod p)

possède un inverse x′ modulo p et l’on a x = x′ si, et seulementsi, x ≡ 1 (mod p) ou x ≡ p − 1 (mod p). En regroupant lestermes de façon à associer chaque élément x à son inverse x′

lorsque x �= x′, on obtient bien que le produit est congru à1 × (p − 1) ≡ −1 (mod p).

5. Intermezzo cryptographique : systèmes à clefspubliques

L’intérêt des pouvoirs civils et militaires pour les nombres premierss’est considérablement accru, depuis une trentaine d’années, enraison de la mise au point de nouvelles méthodes de cryptographieoù les mathématiques (et en particulier celles des nombres premiers)jouent un rôle déterminant.

Avec le formidable développement de l’informatique et la néces-sité d’assurer la confidentialité de transmissions de toutes natures,les enjeux de ces applications sont économiquement considérables.L’implacable loi de la rentabilité imposant de promouvoir larecherche dans ce domaine, les résultats, y compris théoriques, ontrapidement suivi la mise en place des moyens, et les tests de primalité,les algorithmes de factorisation, les méthodes d’engendrement denombres premiers et autres élaborations conceptuelles ad hoc, ontfleuri sur les campus à l’ombre des machines rutilantes.

Rien de moral dans tout cela, bien sûr, mais peut-être une(double) moralité à déduire : les crédits font, effectivement,progresser la science et, si les avancées ont été aussi performanteslorsqu’une rentabilité immédiate était en vue, que ne peut-onespérer de dotations, même plus faibles, pour une recherchefondamentale à moyen ou long terme ?

17

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Nous nous contenterons ici de décrire succinctement le « systèmeRSA »(1) qui fournit une technique simple et pratiquement inviolablede codage.

Considérons un réseau d’individus {I1, I2, . . . , In} qui veulentcommuniquer entre eux de manière secrète (messages codés illisiblespar d’autres que le ou les destinataires) et/ou authentifiée (messageséventuellement lisibles par tous mais infalsifiables). Le systèmeRSA consiste à attribuer à chaque membre Ij du réseau un couplede nombres premiers (pj, qj) — c’est-à-dire un entier nj = pjqj

produit de deux nombres premiers — et un entier cj premierà ϕ(nj) = (pj − 1)(qj − 1). Le succès de la confidentialité dusystème repose sur le fait qu’en l’état actuel des moyens de calcul ilest assez facile de produire de « grands » nombres premiers (doncde pourvoir les membres du réseau en pj et qj) mais qu’il estquasiment impossible de factoriser un entier de la taille du carréde ces nombres premiers (donc de restituer pj et qj à partir de nj).À l’heure où ce livre est écrit, on peut considérer que des nombrespremiers de l’ordre de 10100 sont effectivement « grands » en cesens particulier.

Le réseau se dote d’un annuaire (public) où chaque nom Ij estassocié à nj et cj. Cependant, seul Ij, qui connaît la factorisationde nj est à même de trouver l’inverse dj de cj modulo ϕ(nj).(2)

Un message est un entier M n’excédant pas la taille (essentielle-ment commune) des nj, ou, ce qui revient au même, une successionde tels entiers : il suffit par exemple de remplacer chaque lettre par

1. Par référence à Rivest, Shamir et Adleman, dont l’article de 1978 marque un tournantcapital dans le domaine.2. Le calcul de l’inverse est numériquement très rapide, et ne nécessite qu’un nombred’opérations de l’ordre du nombre de chiffres. Considérons, en toute généralité, deuxentiers a et b tels que 1 � a < b et (a, b) = 1. Si q1 est l’entier le plus proche de b/aalors r1 := b − aq1 est tel que |r1| � a/2. De même, il existe un entier q2 tel quer2 := a− r1q2 = a(1 + q1q2)− bq2 vérifie |r2| � a/4. On itère le procédé en écrivantrj+1 = rj−1 − rjqj+1, |rj+1| � a/2j+1. Après au plus (ln 2a)/ ln 2 étapes on parvientà rk+1 = 0, donc rk|rk−1. On vérifie facilement que cela implique que rk|(a, b), doncrk = ±1. Or rk est, par construction, une combinaison linéaire de a et b. On a donctrouvé des entiers u et v tels que au+bv = ±1. L’inverse de a modulo b vaut u ou b−u.

18

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

son rang dans l’alphabet et de concaténer les entiers à deux chiffresainsi obtenus.

Lorsque, disons, I1 veut envoyer un message codé à I2, il luiadresse M2 = Mc2(mod n2), c’est-à-dire le plus petit entier positif≡ Mc2 (mod n2). Lorsque I2 reçoit M2 il lui suffit de calculerMd2

2 ≡ M (mod n2), d’après la formule d’Euler.(1) Il peut doncainsi déchiffrer le message de I1. Personne d’autre n’est en mesurede le faire car d2 est (en pratique) incalculable à partir des donnéesde l’annuaire.

Lorsque I1 veut envoyer un message authentifié M à I2, il luiadresse M1 = Md1(mod n1). Ainsi I2 (et en fait n’importe quel autremembre du réseau) peut calculer Mc1

1 ≡ M (mod n1) (toujours grâceà la formule d’Euler), mais le message est bien authentifié car lefait que cette procédure de décodage fournisse un résultat cohérentatteste d’un codage que seul I1 était en mesure d’effectuer.

Lorsque I1 veut envoyer un message à la fois crypté et authentifiéà I2, et si, par exemple, n1 < n2, il lui adresse M12 = Mc2

1 (mod n2).Ainsi I2 peut déchiffrer le message en calculant successivementMd2

12 ≡ M1 (mod n2) et Mc11 ≡ M (mod n1) — l’authentification

étant assurée par le simple fait que cette seconde procédure fournisseun résultat lisible.

Il reste à observer que le calcul de grandes puissances Mc moduloun entier n à N chiffres (avec donc, actuellement, N ≈ 200) nenécessite pas d’outils informatiques très sophistiqués. En effet, lecalcul de M2 modulo n correspond à la multiplication de deuxnombres à N chiffres, et fournit évidemment un résultat à Nchiffres. Cela implique que Mc correspond à k multiplications dedeux nombres à N chiffres si c = 2k, et donc, en utilisant l’écritureen base deux c =

∑0�j�k εj2j (avec εj = 0 ou 1), à au plus k N

multiplications dans le cas général. Avec les ordinateurs actuels, etpour des valeurs de N n’excédant pas quelques centaines, le codageest quasiment instantané.

1. On a c2d2 ≡ 1 (mod ϕ(n2)), donc Md22 ≡ M (mod n2) si (M , n2)=1. On peut

montrer que cette relation persiste même si (M , n2) > 1.

19

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

6. Résidus quadratiques

Soit p un nombre premier impair. Considérons l’application

q : (Z/pZ)∗ → (Z/pZ)∗

définie par q(x) = x2. Alors q est un homomorphisme multiplicatif,c’est-à-dire que l’on a identiquement

q(xy) = q(x)q(y).

Comme l’équation q(x) = 1 possède exactement deux solutions, àsavoir 1 et p − 1 (on pourrait aussi dire ±1 car p − 1 = −1dans (Z/pZ)∗), on voit que si l’équation q(x) = a possèdeune solution, disons x1, elle en possède exactement deux, x1 etp − x1. Un tel nombre a est appelé résidu quadratique modulo p. Ildécoule de ce qui précède qu’il y a exactement 1

2(p − 1) résidusquadratiques modulo p. En effet, si Qp dénote l’ensemble desrésidus quadratiques, alors les |Qp| sous-ensembles à deux élémentsq−1{a} = {x ∈ (Z/pZ)∗ : q(x) = a} (a ∈ Qp) constituent unepartition de (Z/pZ)∗, d’où p − 1 = |(Z/pZ)∗| = 2|Qp|.

Considérons alors l’homomorphisme multiplicatif

f : (Z/pZ)∗ → {−1, 1}

défini par f (x) = x(p−1)/2. Le petit théorème de Fermat impliqueque f (a) = 1 pour tout a de Qp et comme l’équation polynomialef (x) = 1 possède au plus 1

2(p − 1) solutions dans (Z/pZ)∗, onvoit que Qp est exactement l’ensemble de ces racines. Autrementdit, f (a) vaut 1 si a est résidu quadratique modulo p, et vaut −1sinon. On exprime habituellement cette propriété en termes dusymbole de Legendre :

(ap

):=

{1 si a ∈ Qp,

−1 si a /∈ Qp.

20

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Pour tout a ∈ (Z/pZ)∗, on a(ap

)≡ a(p−1)/2 (mod p).

Lorsqu’on applique ce résultat au cas a = −1, on obtient que−1est résidu quadratique modulo p si, et seulement si, p ≡ 1 (mod 4).Sous cette condition, il existe donc deux entiers m et x tels quepm = x2 + 1. Girard a énoncé en 1632 et Fermat a démontré en1654 qu’un tel nombre premier p est somme de deux carrés. Lacondition est donc nécessaire et suffisante puisqu’une somme dedeux carrés est congrue à 0, 1 ou 2 modulo 4.

Montrons le théorème de Girard–Fermat. Étant donné unnombre premier p tel que p ≡ 1 (mod 4), posons N =

⌊√p⌋

et donnons-nous une solution x de l’équation x2 ≡ −1 (mod p).Parmi les (N + 1)2 > p nombres u + vx avec 0 � u, v � N , deuxau moins ont la même classe résiduelle modulo p. Par différence,nous en déduisons que la congruence a ≡ bx (mod p) possède unesolution non triviale en entiers a, b tels que max(|a|, |b|) <

√p.

Cela implique a2 ≡ x2b2 ≡ −b2 (mod p), d’où p | a2+b2. Comme0 < a2 + b2 < 2p, on a bien p = a2 + b2.

Euler a prouvé que

(2p

)= (−1)(p

2−1)/8 (p > 2)

et Gauss a rigoureusement établi une propriété remarquableénoncée par Legendre : si p et q sont des nombres premiers impairs,ils ont même caractère quadratique l’un modulo l’autre sauf s’ilssont tous deux ≡ 3 (mod 4), auquel cas c’est l’inverse qui a lieu.C’est la fameuse loi de réciprocité quadratique. En formule :(p

q

)(qp

)= (−1)(p−1)(q−1)/4 (p > 2, q > 2).

21

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

7. Retour sur l’infinitude de l’ensembledes nombres premiers

La preuve du théorème d’Euclide donnée au § 1 peut être rendueeffective, c’est-à-dire qu’elle peut fournir une majoration explicitedu n-ième nombre premier. Il suffit pour cela de remplacer, dansl’argument, n! par

∏1�j�n pj. On obtient ainsi

pn � 1 +∏

1�j<n

pj,

d’où par une récurrence élémentaire

pn � exp(2n−1) (n � 1).

Un autre raisonnement très simple fournit une estimation bienmeilleure. Considérons les n plus petits nombres premiers

p1 < p2 < · · · < pn.

Chaque entier m � pn s’écrit de manière unique sous laforme m =

∏nj=1 pj

νj . Si t est l’unique nombre entier tel que2t � pn < 2t+1, il y a, pour chaque indice j, au plus t + 1 choixpossibles de νj. Le nombre total de valeurs possibles pour m estdonc � (t + 1)n. Or, il y a (trivialement !) exactement pn � 2t

entiers m n’excédant pas pn. Donc 2t � (t + 1)n. Cette inégalitéimplique t � n2 − 1 dès que n � 5. On en déduit

pn � 2n2(n � 1).

La preuve d’Euler est plus précise encore, et fournit de fait unrésultat en un certain sens optimal. Elle s’appuie également surl’unicité de la décomposition d’un nombre entier en produit denombres premiers. En remarquant que chaque entier n est aussidécomposable de manière unique sous la forme n = qm2, où q est

22

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

sans facteur carré excédant 1,(1) on peut écrire (en désignant par lalettre q un entier générique sans facteur carré)∑

n�x

1n

=∑q�x

1q

∑m�

√x/q

1m2

�∑q�x

1q

∑m�1

1m2

·

Maintenant, on observe que

∑m�1

1m2

� 1 +∞∑

m=2

( 1m − 1

− 1m

)= 2,

puisque la dernière somme est « télescopique », et que∑q�x

1q

�∏p�x

(1 +

1p

)� exp

{∑p�x

1/p}

,

où la première inégalité s’obtient en développant le produit en p,et la seconde en utilisant la majoration classique 1 + u � eu avecu = 1/p. En insérant encore la minoration∑

n�x

1n

�∑n�x

∫ n+1

n

dtt

� ln x,

et en prenant les logarithmes, on déduit de ce qui précède∑p�x

1p

� ln2 x − ln 2 (x � 2).(2)

Cela établit le théorème d’Euclide sous une forme forte : la série desinverses des nombres premiers diverge. Comme nous le verrons parla suite, la minoration trouvée fournit le bon ordre de grandeur(et même un équivalent asymptotique) pour la somme

∑p�x 1/p.

1. On a en fait q =∏

p2ν+1‖n p.

2. Rappelons que ln2 signifie ln ln.

23

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

En effet, on peut montrer que le théorème des nombres premierséquivaut à la relation asymptotique

pn ∼ n ln n (n → ∞).

Un calcul standard permet alors d’en déduire que l’on a∑p�x

1p∼ ln2 x

lorsque x → ∞.

8. Le crible d’Ératosthène

Connu depuis l’Antiquité, le crible d’Ératosthène est une méthodepour compter le nombre Nm(x) des entiers n n’excédant pas x etqui sont relativement premiers à un nombre fixé m.

La version naïve consiste à écrire la liste des entiers n � x et àbarrer successivement les multiples des différents facteurs premiersde m. Les nombres restants sont ceux qui sont comptés dans Nm(x).

Pour obtenir une formule générale, on peut raisonner commesuit. Soit p1, . . . , pk la suite (finie) des facteurs premiers distinctsde m. On calcule Nm(x) par récurrence sur k en observant que lecas k = 0 est trivial : on a N1(x) = �x� pour tout x > 0. Posonsm0 = 1 et mj := p1 · · · pj (1 � j � k). Pour 0 � j < k, les seulsentiers n comptés dans Nmj(x) et non comptés dans Nmj+1(x) sontde la forme pj+1n � x avec (n, mj) = 1. En d’autres termes, on a

Nmj(x) − Nmj+1(x) = Nmj(x/pj+1).Ainsi

Nm1(x) = N1(x) − N1(x/p1) = �x� − �x/p1� ,

Nm2(x) = Nm1(x) − Nm1(x/p2)

= �x� − �x/p1� − �x/p2� + �x/p1p2� ,

et ainsi de suite. On obtient finalement

Nm(x) =∑d |m∗

(−1)ω(d) �x/d�

24

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

où m∗ désigne le noyau sans facteur carré de m (soit m∗ =∏k

j=1 pj)et où ω(d) désigne le nombre des facteurs premiers distincts de d(noter qu’en particulier ω(1) = 0). On donne un aspect pluscanonique encore à cette formule en introduisant la fonction deMöbius

μ(d) =

{(−1)ω(d) si d est sans facteur carré > 1,

0 dans le cas contraire.

On obtient alors la formule de Legendre (1808) du cribled’Ératosthène :

Nm(x) =∑d |m

μ(d) �x/d� .

Lorsque l’on choisit m =∏

p�√x p, seuls sont comptés dans

Nm(x) le nombre 1 et les nombres premiers p de l’intervalle ]√

x, x].Donc Nm(x) = π(x) − π(

√x) + 1 et l’on obtient

π(x) = −1 + π(√

x) +∑

P+(d)�√x

μ(d) �x/d� .(1)

On observera que la somme en d est finie puisqu’il y a au plus2π(

√x) entiers d sans facteur carré tels que P+(d) � √

x. Ce résultatmontre que la fonction de Möbius et les nombres premiers sontintimement liés. Nous aurons l’occasion de revenir, aux Chapitres 2et 4, sur cette interdépendance.

Une autre application de la formule de Legendre est le calcul dela fonction d’Euler

ϕ(n) = Nn(n),

rencontrée au § 4. Nous obtenons dans ce cas

ϕ(n) =∑d |n

μ(d)n/d = n∏p|n

(1 − 1/p),

où la seconde égalité est obtenue en développant le dernier membre.

1. On rappelle que P+(d) désigne le plus grand facteur premier de d avec la conventionP+(1) = 1.

25

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

9. Les théorèmes de Tchébychev

Les premiers progrès significatifs concernant l’évaluation deπ(x) sont dus à Tchébychev (1852). Il n’utilise pas le cribled’Ératosthène, mais une forme faible de la formule de Stirling,(1) àsavoir

ln n =∑

1�m�n

ln m = n ln n − n + O(ln n) (n � 2).

Cela découle directement de l’estimation suivante, valable pourm � 1,

0 �∫ m+1

m(ln t) dt − ln m

=

∫ m+1

mln( t

m

)dt �

∫ m+1

m

( tm

− 1)

dt =1

2m.

En sommant pour m = 1, 2, . . . , n−1 et en utilisant le fait qu’uneprimitive de ln t est t ln t − t, on obtient bien la formule annoncée.

L’idée de Tchébychev consiste essentiellement à exploiter ladécomposition du nombre n! en produit de facteurs premiers.Pour chaque m on peut écrire

ln m =∑pν |m

ln p,

la somme étant étendue à tous les couples (p, ν) tels que pν | mavec p premier et ν � 1. En remplaçant dans l’expression de ln n!et en intervertissant les sommations, il suit

ln n! =∑

1�m�n

ln m =∑pν�n

ln p∑

1�m�npν |m

1

=∑pν�n

ln p �n/pν� .

1. Démontrée en 1730 : on a n! ∼ nne−n√

2πn (n → ∞).

26

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Cela suggère d’introduire la fonction

Λ(d) :=

{ln p si ∃ ν � 1 : d = pν ,

0 dans le cas contraire.

Cette fonction a été étudiée par le mathématicien allemand vonMangoldt à la fin du dix-neuvième siècle et porte aujourd’hui sonnom. Avec cette notation, nous déduisons de ce qui précède laformule asymptotique∑

d�n

Λ(d) �n/d� = n ln n − n + O(ln n) (n � 2).

Désignons par B(n) le membre de gauche et posons B(x) = B(�x�)pour tout x > 0. Nous allons utiliser notre estimation de B(x)pour établir un encadrement de la fonction sommatoire de Λ,

ψ(x) =∑d�x

Λ(d).

Nous verrons par la suite que cela implique très facilement unencadrement de même qualité pour π(x).

Nous exploitons l’idée originale de Tchébychev, mais sous uneforme rudimentaire qui fournit un résultat numériquement moinsprécis quoique de même nature. Posons

χ(u) = �u� − 2 �u/2� (u > 0).

Alors χ est une fonction 2-périodique qui vérifie

χ(u) =

{0 si 0 � u < 1,

1 si 1 � u < 2.

Nous allons maintenant calculer de deux manières la quantité

B2(x) = B(x) − 2B(x/2).

27

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

D’une part on a

B2(x) = x ln x−x−2{ 12x ln( 1

2x) − 12x} + O(ln x)

= x ln 2 + O(ln x),

et d’autre part

B2(x) =∑d�x

Λ(d)χ(x/d).

De cette dernière expression, on déduit, compte tenu de la propriétéde χ indiquée plus haut,

ψ(x) − ψ(x/2) � B2(x) � ψ(x).

La majoration fournit donc immédiatement une minoration deψ(x), soit

ψ(x) � x ln 2 + O(ln x) (x � 2).

La minoration de B2(x) est utilisée de manière inductive : on a

ψ(x)�B2(x) + ψ(x/2) �B2(x) + B2(x/2) + ψ(x/4)

� · · · �∑

0�j�k

B2(x/2j) + ψ(x/2k+1).

Ici k est un entier arbitraire. Choisissons

k = K (x) := �(ln x)/ ln 2� ,

de sorte que ψ(x/2k+1) = 0. Il suit

ψ(x) �∑

0�j�K (x)

{x ln 22j

+ O(ln x)}

� 2x ln 2 + O((ln x)2).

À fins de référence ultérieure, nous rassemblons les estimationsobtenues dans un énoncé formel.

28

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Théorème 9.1 (Tchébychev) On a pour x � 2

x ln 2 + O(ln x) � ψ(x) � x ln 4 + O((ln x)2).

Comme annoncé, nous pouvons déduire aisément de cerésultat une information comparable relative à π(x). On aψ(x) =

∑pν�x ln p où la somme porte sur tous les couples (p, ν)

avec p premier et ν � 1. Pour chaque p fixé, il y a exactement�ln x/ ln p� valeurs admissibles de ν, donc

ψ(x) =∑p�x

⌊ln xln p

⌋ln p.

Grâce à l’encadrement �u� � u < �u� + 1 � 2 �u� (u � 1), ilsuit d’abord

ψ(x) � π(x) ln x � 2ψ(x),

puis, en utilisant la majoration du Théorème 9.1,

π(x) ln x − ψ(x) =∑p�x

(ln x −

⌊ln xln p

⌋ln p

)�

∑p�√

x

ln p +∑

√x<p�x

ln(x/p)

� ψ(√

x) +∑

√x<p�x

∫ x

pdt/t

= O(√

x) +

∫ x

√x

π(t)t

dt xln x

·

On peut donc finalement énoncer que

π(x) = ψ(x)/ ln x + O(x/(ln x)2

)(x � 2),

de sorte que le Théorème 9.1 implique le corollaire suivant.

Corollaire 9.2 On a lorsque x tend vers l’infini

{ln 2 + o(1)} xln x

� π(x) � {ln 4 + o(1)} xln x

·

29

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Les résultats de Tchébychev étaient à vrai dire plus précis. Aulieu de la fonction χ(u) employée dans la preuve ci-dessus, ilutilisait la fonction

χ1(u) = �u� − �u/2� − �u/3� − �u/5� + �u/30�

qui est 30-périodique et satisfait à χ1(u) = 1 pour 1 � u < 6.Cela lui a permis de prouver l’encadrement asymptotique

{c1 + o(1)} xln x

� π(x) � {c2 + o(1)} xln x

(x → ∞)

avecc1 = ln

(21/231/351/530−1/30

)≈ 0,92129,

c2 = 65c1 ≈ 1,10555.

Comme c2 < 2c1, cela implique en particulier queπ(2n − 3) > π(n) pour n assez grand. En explicitant uneversion effective de ses estimations, Tchébychev a pu prouverque cette inégalité stricte persiste pour tout n > 3, confirmantainsi une conjecture fameuse connue sous le nom de postulat deBertrand (1845) : pour tout entier n > 3, il y a au moins un nombrepremier p tel que

n < p < 2n − 2.

Il est à noter que le choix plus simple

χ2(x) := �x� − �x/2� − 2 �x/3� + �x/6�

conduit également à une preuve du postulat de Bertrand, maisavec des constantes c1 et c2 légèrement moins bonnes.

Une autre conséquence, indiquée par lui-même, du travail deTchébychev est l’encadrement

lim infx→∞

π(x)x/ ln x

� 1 � lim supx→∞

π(x)x/ ln x

,

autrement dit : si le rapport π(x) ln x/x tend vers une limite, cettelimite est 1.

30

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Cela résulte de la formule asymptotique

B(x) =∑d�x

Λ(d) �x/d� = x ln x − x + O(ln x)

qui est à la base de la preuve de Tchébychev. En remplaçant �x/d�par x/d + O(1) et en utilisant l’estimation ψ(x) x, on obtient∑

d�x

Λ(d)/d = ln x + O(1) (x � 1).

En observant maintenant que

∑d�x

Λ(d)

d=∑d�x

Λ(d)

∫ ∞

d

dtt2

=ψ(x)

x+

∫ x

1

ψ(t)t2

dt,

on déduit de ce qui précède que∫ x

1

ψ(t)t2

dt = ln x + O(1) (x � 1).

Soit alors α = lim supx→∞ π(x) ln x/x. On a aussi

α = lim supx→∞

ψ(x)/x

puisque, comme nous l’avons vu plus haut,

ψ(x) = π(x) ln x + O(x/ ln x).

Pour chaque ε > 0, il existe donc un x0 = x0(ε) tel queψ(t) � (α + ε)t pour tout t � x0(ε). D’où∫ x

1

ψ(t)t2

dt �∫ x0

1

ψ(t)t2

dt + (α + ε)

∫ x

x0

dtt

� (α + ε) ln x + Oε(1).

31

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Cela implique 1 � α + ε et donc α � 1 puisque ε est arbitraire.On raisonne semblablement pour

β = lim infx→∞

π(x) ln x/x.

La preuve du second résultat de Tchébychev est ainsi complétée.Lorsque Tchébychev publia ses travaux en 1852, il pouvait

sembler que la conjecture de Gauss–Legendre

π(x) ∼ x/ ln x (x → ∞)

était à portée de main. Il fallut pourtant attendre 44 ans pourprouver, grâce aux idées entièrement différentes de Riemann, lethéorème des nombres premiers. La preuve élémentaire,(1) héritièrede l’approche de Tchébychev, ne devait, quant à elle, pas voir lejour avant près d’un siècle.

10. Les théorèmes de Mertens

Dans la continuation immédiate de Tchébychev, Mertens a établi,avec des outils analytiques de même degré de sophistication, desformules asymptotiques(2) pour des sommes portant sur des nombrespremiers. Les deux théorèmes mentionnés dans ce paragraphedatent de 1874.

Le résultat connu sous le nom de premier théorème de Mertensest l’estimation∑

p�x

ln pp

= ln x + O(1) (x � 1).

Nous avons montré au paragraphe précédent la validité de cetteformule lorsque le membre de gauche est remplacé par la somme

1. On dit qu’une preuve est élémentaire si les outils déployés sont construits avec lesmêmes éléments que la question posée, ici l’analyse réelle. Voir le § 4.1.2. C’est-à-dire des évaluations avec terme principal et terme d’erreur, le second étantasymptotiquement négligeable devant le premier.

32

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

∑d�x Λ(d)/d . Or, la différence entre cette somme et celle qui

nous intéresse maintenant vaut∑pν�x, ν�2

ln ppν

�∑

p

ln pp(p − 1)

1.

Le résultat est donc acquis.Le second théorème de Mertens est connu sous le nom de

formule de Mertens : on a∏p�x

(1 − 1/p)−1 = eγ ln x + O(1) (x � 1),

où γ désigne la constante d’Euler.

La preuve de ce résultat nécessite plusieurs étapes. On commencepar évaluer∑

p�x

1p

=∑p�x

ln pp

∫ ∞

p

duu(ln u)2

=

∫ x

2

∑p�u

ln pp

duu(ln u)2

+1

ln x

∑p�x

ln pp

·

Posons R(u) =∑

p�u(ln p)/p−ln u (u � 2). Le premier théorèmede Mertens énonce que R(u) est une fonction bornée. Il découledonc du calcul précédent que∑

p�x

1p

=

∫ x

2

duu ln u

+

∫ x

2R(u)

duu(ln u)2

+ 1 +R(x)ln x

= ln2 x + a + O(

1ln x

)avec

a =

∫ ∞

2R(u)

duu(ln u)2

+ 1 − ln2 2 ≈ 0,2614972128.

33

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Nous allons voir que cette formule est équivalente à celle deMertens, à la valeur près de la constante a. Partant, elle est parfoiségalement désignée sous le nom de second théorème de Mertens.(1)

On a e−1/p(1 − 1/p)−1 = 1 + O(1/p2). Il découle donc de cequi précède que∏

p�x

(1 − 1/p)−1 =∏p�x

e1/pe−1/p(1 − 1/p)−1 = b ln x + O(1)

avec b = ea∏

p e−1/p(1 − 1/p)−1.Il reste à calculer la constante b. C’est la partie la plus difficile

de la démonstration, mais aussi la plus stimulante, puisque, sansconteste, c’est l’occurrence de la constante d’Euler qui suscite icicuriosité et intérêt. Le calcul repose sur la fameuse formule d’Eulerévoquée dans l’introduction∑

n�1

1/nσ =∏

p

(1 − p−σ)−1 (σ > 1).

Il est clair que les deux membres sont convergents. Lorsque l’ondéveloppe le produit fini∏

p�x

(1 − p−σ)−1 =∏p�x

∑ν�0

p−νσ

on obtient, grâce à l’unicité de la décomposition en produit defacteurs premiers, la somme

∑P+(n)�x n−σ, étendue à tous les

entiers dont le plus grand facteur premier n’excède pas x. Cettesomme vérifie évidemment∑

n�x

n−σ �∑

P+(n)�x

n−σ �∑n�1

n−σ.

On obtient donc la formule d’Euler en faisant tendre x vers l’infini.

1. Notamment dans le Chapitre 4, où nous faisons spécifiquement référence à la formulede Mertens lorsque la valeur de la constante eγ est nécessaire, et au second théorème deMertens lorsque seule l’estimation de

∑p�x 1/p est utile.

34

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Maintenant, on a classiquement

∑n�1

1nσ

=∑n�1

∫ n+1

n

dttσ

+ O(

1nσ

− 1(n + 1)σ

)=

∫ ∞

1

dttσ

+ O(1) =1

σ − 1+ O(1).

On déduit donc de la formule d’Euler et de notre évaluation duproduit

∏p�x(1 − 1/p)−1 que

b = limh→0+

∏p�exp(1/h)

1 − p−1−h

1 − p−1

∏p>exp(1/h)

(1 − p−1−h).

Un calcul de routine, reposant sur l’estimation ln(1+u) = u+O(u2)(|u| � 1

2) et l’inégalité 1 − p−h � h ln p, fournit alors

ln b = limh→0+

{A(h) − B(h)}

avec

A(h) =∑

p�exp(1/h)

1 − p−h

p=

∑p�exp(1/h)

hp

∫ p

1

dtt1+h

= h∫ exp(1/h)

1

∑t<p�exp(1/h)

1p

dtt1+h

,

et

B(h) =∑

p>exp(1/h)

p−1−h = h∑

p>exp(1/h)

1p

∫ ∞

p

dtt1+h

=

∫ ∞

exp(1/h)

∑exp(1/h)<p�t

1p

dtt1+h

·

35

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

À ce stade, nous utilisons l’évaluation précédemment établie dessommes

∑p�x 1/p sous la forme

∑u<p�v

1p

=∑

ln u<n�ln v

1n

+ O( 1

ln 2u

)(1 � u � v).

En remplaçant dans les expressions obtenues pour A(h) et B(h) eten remontant les calculs, nous obtenons lorsque h → 0+

A(h) =∑

n�1/h

1 − e−hn

n+ O

(h ln(1/h)

),

B(h) =∑

n>1/h

e−hn

n+ O(h).

Ainsi

A(h) − B(h) =∑

n�1/h

1n−∑n�1

e−hn

n+ o(1)

= ln(1/h) + γ + ln(1 − e−h) + o(1)

= γ + o(1).

Cela implique bien que b = eγ et termine la preuve de la formulede Mertens.

11. Le crible de Brun et le problème des nombrespremiers jumeaux

Bien que largement postérieur à Tchébychev, le crible combina-toire de Brun, développé entre 1917 et 1924, appartient à lamême sphère d’influence. Il fournit dans un cadre très général desestimations de même nature que celles de Tchébychev.

36

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

La motivation de Brun est de rendre utilisable la formule deLegendre pour le crible d’Ératosthène, qui, sous sa forme basique,comporte trop de termes pour autoriser des calculs flexibles.Considérons par exemple le cas des nombres premiers

π(x) − π(√

x) + 1 =∑

P+(d)�√x

μ(d) �x/d� .

Si nous estimons �x/d� par x/d + O(1), nous obtenons

π(x) − π(√

x) + 1 = x∏

p�√x

(1 − 1

p

)+ O

(2π(

√x)).

D’une part, le terme d’erreur est exponentiellement plus grandque le terme principal ; d’autre part la formule de Mertens nousmontre que ce terme principal est équivalent à 2e−γx/ ln x, et n’estdonc pas asymptotiquement égal à la valeur conjecturée.

Brun parviendra essentiellement à surmonter ces deux difficultés.Sa méthode fournit, dans de nombreux cas, une véritable formuleasymptotique ; dans les autres, elle produit des inégalités optimalesà une constante multiplicative près.

L’idée de base est simple. Il s’agit de remplacer dans la formuledu crible d’Ératosthène

Nm(x) =∑

n�x, (n,m)=1

1 =∑d |m

μ(d) �x/d�

la fonction de Möbius par une fonction s’annulant plus souventet fournissant cependant une majoration ou une minoration pourNm(x).

Lorsqu’on interprète, dans le membre de droite de la formule deLegendre, �x/d� comme le nombre des entiers t � x/d et qu’onordonne la somme double selon les valeurs de n = td , on obtient

Nm(x) =∑d |m

∑t�x/d

μ(d) =∑n�x

∑d |(n,m)

μ(d).

37

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Regroupons maintenant, dans la somme intérieure, les valeursde d ayant le même nombre de facteurs premiers. PosantK = ω((n, m)), il suit

∑d |(n,m)

μ(d) =K∑

k=0

(−1)k

(Kk

)= (1 − 1)K

=

{1 si K = 0, i.e. (n, m) = 1,

0 si K > 0, i.e. (n, m) > 1.

On voit ainsi que la formule du crible se ramène à celle dubinôme. Cela fournit la clef de la méthode de Brun : au lieud’utiliser le développement complet de (1 − 1)K , il a recours aucalcul de la somme partielle∑

k��

(−1)k

(Kk

)= (−1)�

(K − 1

)(� � 0, K � 1).

On obtient ainsi∑d |m

μ1(d) �x/d� � Nm(x) �∑d |m

μ2(d) �x/d�

pour toutes fonctions μ1, μ2 définies par

μ1(d) =

{μ(d) si ω(d) � 2r + 1,0 si ω(d) > 2r + 1,

μ2(d) =

{μ(d) si ω(d) � 2s,0 si ω(d) > 2s,

où r et s sont des paramètres entiers arbitraires.La méthode, qui pose un difficile et profond problème d’op-

timisation, a été développée et raffinée, notamment par Rosser,Halberstam, Richert, puis par Iwaniec, qui lui a donné sa formequasi définitive.

38

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Il nous entraînerait largement hors du cadre de cet ouvragede développer plus avant la théorie du crible combinatoire.Contentons-nous de donner une application simple.

Théorème 11.1 Soient M ∈ N, N ∈ N∗ et A un ensembled’entiers inclus dans l’intervalle ]M , M + N ]. On suppose que, pourchaque nombre premier p, A est exclu de w(p) classes résiduellesmodulo p et que w(p) 1. Alors on a

|A| N∏p�N

(1 − w(p)

p

).

Dans certaines circonstances, le crible peut également fournirdes bornes inférieures. Une situation standard de ce type est cellede l’évaluation du nombre des entiers n’excédant pas x et sansfacteur premier � y. On obtient que

Φ(x, y) :=∑

n�x, P−(n)>y

1 ∼ x∏p�y

(1 − 1

p

)uniformément pour x → ∞ et (ln y)/ ln x → 0.

Brun a développé dès 1919 une spectaculaire application de saméthode au problème fameux des nombres premiers jumeaux. Ondit que deux nombres premiers impairs (p, q) sont jumeaux siq = p + 2, autrement dit si p et q sont aussi proches que le permetleur état de nombres premiers. Ainsi

(3, 5), (5, 7), (11, 13), (17, 19), (29, 31), (41, 43), (59, 61)

sont des couples premiers gémellaires.Le Théorème 11.1 a pour conséquence immédiate la majoration

π2(n) n/(ln n)2,

39

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

pour le nombre π2(n) des couples de nombres premiers jumeauxn’excédant pas n. Brun avait initialement obtenu une estimationtrès légèrement moins précise mais cependant suffisante pourimpliquer que la série des inverses des nombres premiers jumeauxconverge — une manière saisissante de mettre en évidence larareté des nombres premiers jumeaux dans l’ensemble de tous lesnombres premiers. On a en effet, notant J l’ensemble des nombrespremiers jumeaux,∑

p∈J

1p

=∑n�2

π2(n) − π2(n − 1)

n=∑n�2

π2(n)

n(n + 1)·

Le raisonnement probabiliste heuristique suggère que l’ensembleJ est infini et que la majoration de Brun est pratiquement optimale.Essentiellement, on peut supposer que la probabilité pour qu’unnombre entier de taille n choisi au hasard soit premier est 1/ ln n.Les nombres n et n + 2 ne sont pas indépendants, mais on peutsimuler le hasard en prétendant que les différentes conditions decongruence modulo les nombres premiers p � n se comportent demanière statistique. Pour que (n, n+2) soit un couple de nombrespremiers jumeaux, il faut et il suffit que n soit exclu d’une classemodulo 2 et, pour chaque nombre premier p avec 2 < p � √

n,de deux classes modulo p. S’il y avait parfaite indépendance, onobtiendrait une probabilité

12

∏2<p�√

n

(1 − 2

p

).

Cependant, nous savons que les grands nombres premiers (del’ordre d’une puissance de n) ne sont pas indépendants puisquel’on a, d’après le théorème des nombres premiers et la formule deMertens,

π(n)/n ∼ 12eγ

∏p�√

n

(1 − 1/p) ∼ 1/ ln n.

40

LA GENÈSE : D’EUCLIDE À TCHÉBYCHEV

Cela incite à introduire dans le calcul précédent un facteur correctif( 1

2eγ)2 — une fois 12eγ pour chaque nombre premier — et à

conjecturer, avec Hardy et Littlewood, que le nombre π2(n) decouples de nombres premiers jumeaux n’excédant pas n vérifie

π2(n)

n∼ ( 1

2eγ)2 12

∏2<p�√

n

(1 − 2

p

)∼ C

(ln n)2,

avec C := 2∏

p>2

(1 − 1/(p − 1)2

)≈ 1,320323.

La constante C est connue sous le nom de constante des nombrespremiers jumeaux. Par des méthodes de crible, Jie Wu a montré en2004 que l’on a pour n assez grand

π2(n) � 3,4 Cn

(ln n)2·

Jie Wu

41

Chapitre 2

La fonction zêta de Riemann

1. Introduction

Riemann n’a écrit qu’un seul article sur la théorie des nombres,publié en 1859. Ce mémoire a bouleversé définitivement lepaysage de la discipline. L’approche spécifique de la répartitiondes nombres premiers qui y est développée, à la fois simple etrévolutionnaire, consiste à faire appel à la théorie de Cauchy desfonctions holomorphes, alors relativement récente.(1)

La théorie de Cauchy est traditionnellement enseignée dans lesseconds cycles universitaires, et il n’est pas question d’exposer icine serait-ce que les rudiments de ce vaste domaine de l’analysemoderne. Nous nous contentons d’indiquer que l’objet central estcelui de fonction analytique d’une variable complexe, autrement ditune fonction f (s) (s ∈ C) dont les variations locales « ressemblent »à celles d’un polynôme.

Ainsi, pour tout entier naturel m � 0, une fonction analytiquesatisfait à une approximation du type

f (s0 + w) ≈ a0 + a1w + a2w2 + · · · + amwm

1. La formule intégrale de Cauchy, clef de voûte de la théorie, date de 1825.

43

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

lorsque s0 est un point où f est bien définie et w est un nombrecomplexe assez petit, i.e. assez proche de l’origine. En termesconsacrés, on dit que f développable en série entière

f (s) =∑n�0

an(s − s0)n

au voisinage de tout point s0 où elle est définie.Le saut qualitatif entre l’analyse réelle et l’analyse complexe

provient d’une propriété fondamentale découverte par Cauchy : enchaque point, la valeur d’une fonction analytique peut être calculéeen effectuant la « moyenne » de ses valeurs en des points voisins.Bien entendu, il faut définir une notion adaptée de voisinageet expliquer comment on calcule la moyenne. C’est là que lareprésentation géométrique des nombres complexes trouve sonutilité la plus éclatante : sans entrer dans une description rigoureuse,on peut dire que les points à prendre en compte dans le calcul dela moyenne peuvent être choisis de manière à constituer dans leurensemble toute courbe entourant le point sélectionné. Tournezautour de 0 selon un cercle, un rectangle, un triangle ou unpolygone à 17 côtés, vous obtiendrez toujours f (0), pour peu quevous ayez défini la moyenne selon les règles de l’art.

Formellement, on dit que cette moyenne est obtenue grâce à uneintégrale curviligne, le long d’une courbe fermée du plan complexe.

Ce procédé très puissant est aussi très souple car il autorise, souscertaines conditions, des déformations du chemin d’intégrationqui facilitent l’approximation de l’intégrale.

Riemann a compris très rapidement que la fonction zêta d’Euler

ζ(σ) := 1 +12σ

+13σ

+14σ

+ · · · ,

déjà présentée au Chapitre 1 (voir p. 3) et qui actualise le lienstructurel entre les entiers et les nombres premiers, pouvait êtreprolongée en une fonction analytique de la variable complexes �= 1, et partant bénéficier de la liberté de manœuvre octroyée parla théorie de Cauchy.

44

LA FONCTION ZÊTA DE RIEMANN

Dans la suite de ce chapitre, nous nous attachons à décrireplus avant ce contexte et l’apport révolutionnaire de Riemann à lathéorie analytique des nombres.

2. Une brève histoire de ce qui va suivre

Le calcul numérique suggère facilement les deux formules suivantes

1 + 14 + 1

9 + 116 + 1

25 + · · · = π2/6

(1 − 14)(1 − 1

9)(1 − 125)(1 − 1

49) · · · = 6/π2.

Dans la somme, apparaissent les inverses des carrés des entiers ;dans le produit, ce sont les inverses des carrés des nombres premiersqui entrent en jeu.

Ces formules ne sont évidemment pas dues au hasard. On peutles justifier sans trop d’effort à l’aide du théorème fondamental del’arithmétique, qui énonce qu’un nombre entier s’écrit de manièreunique comme le produit de nombres premiers : pour un carré, ilfaudra simplement élever les facteurs premiers au carré. On a parexemple

11 − 1

4

= 1 + 122 + 1

24 + 126 + · · ·

de sorte que

11 − 1

4

11 − 1

9

11 − 1

25

=(1 + 1

22 + 124 + · · ·

)(1 + 1

32 + 134 + · · ·

)(1 + 1

52 + 154 + · · ·

)= 1 + 1

22 + 132 + 1

52 + 122·32 + · · ·

Lorsque le produit de gauche est étendu à tous les carrés de nombrespremiers, tous les carrés des entiers apparaissent dans la somme dedroite.

Dans cette formule, le fait que les nombres soient élevés au carré estcontingent : on pourrait remplacer, formellement, l’exposant 2 parn’importe quel nombre réel, mais, pour des raisons de convergence,les deux membres n’ont de sens que si cet exposant est > 1.

45

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

L’idée de Riemann consiste à étendre le champ de la variableau plan complexe. Dans un premier temps, les mêmes raisons deconvergence imposent de se limiter au demi-plan σ = �e s > 1.

Augustin-Louis Cauchy(1789–1857)

Cependant, Cauchy a montré queles fonctions analytiques de la variablecomplexe possèdent une qualité extra-ordinaire : lorsque deux fonctionscoïncident sur un ensemble suffisam-ment dense, elles coïncident partout.Une telle propriété est totalement endéfaut pour les fonctions de variableréelle ; même indéfiniment dérivable(c’est-à-dire infiniment « lisse »), rienn’empêche une telle fonction d’êtrenulle sur l’intervalle [0, 1] de vivreindépendamment sa vie sur la demi-droite ]1,∞[. Mais lorsqu’unefonction analytique est nulle sur le segment [0, 1], elle estidentiquement nulle.

Cette découverte étonnante possède un corollaire non moinsremarquable. Supposons que nous disposions de deux formulesdépendant d’un nombre complexe s et ayant respectivement unsens lorsque s décrit deux parties distinctes du plan complexe. Si,en outre, ces deux parties ont une intersection assez « dense »,et si les valeurs produites par les deux formules coïncident surcette intersection, nous pouvons les considérer comme définissant,chacune dans son domaine, une fonction unique.

Les mathématiciens désignent ce phénomène comme le prolon-gement analytique.

Cela ouvre des possibilités jusque-là insoupçonnées : on peut,par exemple, établir une propriété concernant les valeurs d’unefonction à l’infini en ne travaillant que sur le disque unité —allumer une bougie à Rome sans quitter Paris : vous en aviez rêvé,Cauchy l’a rendu possible !

46

LA FONCTION ZÊTA DE RIEMANN

Riemann a apporté à la théorie des nombres ce merveilleuxcadeau : prolonger la fonction zêta d’Euler au plan complexe toutentier, privé seulement du point s = 1.

Il a ensuite montré que les zéros de cette fonction, autrementdit les points du plan complexe où elle s’annule, jouent un rôleessentiel dans la répartition des nombres premiers. Mieux : il ya une correspondance précise entre la situation des zéros dans leplan et le comportement asymptotique de la fonction π(x) quidénombre les nombres premiers n’excédant pas x.

Ainsi, comme nous le verrons plus loin, prouver que la fonctionζ(s) ne s’annule pas sur la droite σ = �e s = 1 équivaut à établirla conjecture de Gauss–Legendre

π(x) ∼ x/ ln x (x → ∞).

L’hypothèse de Riemann est probablement le plus célèbre desproblèmes ouverts en mathématiques : elle affirme que, si ζ(s) = 0et 0 < σ < 1, alors σ = 1

2 , c’est-à-dire que, dans la bande verticale(appelée aussi bande critique)

B := {s : 0 < σ < 1},

tous les zéros sont alignés sur la droite σ = 12 .

La conséquence essentielle de cette hypothèse est qu’elle permetd’estimer π(x) avec une erreur « essentiellement » de l’ordre de

√x.

Nous donnerons plus loin une formulation plus précise de cetteassertion et une expression du terme principal de l’approximation,qui nécessite des notions mathématiques plus élaborées. Cependant,l’essentiel est là : le mystère de la répartition de nos si concrets etsi familiers nombres premiers se cache tout entier dans la manièredont sont disposés les zéros d’une certaine fonction analytiquedans le plan complexe.

Avant d’aller plus loin et d’expliciter, avec les outils mathé-matiques nécessaires, la situation décrite plus haut, donnons unexemple simple de fonction analytique dont les zéros sont répartissur une droite.

47

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

On apprend en classe de Terminale la formule dite de Moivre :

eiτ = cos τ + i sin τ (τ ∈ R).

On en déduit, pour s := σ + iτ , que

f (s) := es − 1 = eσ cos τ − 1 + ieσ sin τ.

L’équation f (s) = 0 équivaut donc à eσ cos τ = 1 et eσ sin τ = 0,d’où e2σ{(cos τ)2+(sin τ)2} = e2σ = 1, donc σ = 0, et τ = 2kπ(k ∈ Z).

Ainsi, les zéros de f (s) sont régulièrement disposés sur l’axeimaginaire, de 2π en 2π.

3. Produit eulérien

Comme souligné plus haut, l’idée fondamentale de Riemannconsiste à étendre la formule d’Euler (cf. § 1.10, p. 34) à la variablecomplexe. Il pose ainsi

ζ(s) :=∑n�1

n−s =∏

p

(1 − p−s

)−1

pour tout nombre complexe s de partie réelle σ > 1.(1) La série dumembre de gauche est absolument convergente, et, par conséquent,sa somme ζ(s) est analytique dans le demi-plan σ > 1. Laconvergence du produit infini du membre de droite est égalementabsolue et ne pose aucun problème. L’égalité des deux membres,que l’on peut voir comme la formule de base de la théorie analytiquedes nombres, peut être établie de deux manières différentes : soiton étend la preuve du Chapitre 1 au cas d’une variable complexe,soit on utilise la formule d’Euler d’argument réel en faisant appelau principe du prolongement analytique décrit au § 2.

1. Ici et dans toute la suite de ce chapitre nous posons systématiquement s = σ + iτ .

48

LA FONCTION ZÊTA DE RIEMANN

Nous avons vu au chapitre précédent qu’en faisant tendre svers 1 dans la formule d’Euler réelle, on obtient la divergence dela série

∑p 1/p, et même l’évaluation quantitative plus précise(1)

∑p�x

1/p = ln2 x + a + o(1),

où a est une constante adéquate (cf. p. 33).La formule d’Euler complexe possède la conséquence spécifique

remarquable que ζ(s) �= 0 pour tout nombre complexe s dudemi-plan σ > 1 : cela découle immédiatement de la convergencedu produit infini, dont aucun facteur ne s’annule dans cette région.

L’importance de la localisation des zéros de ζ(s) apparaîtra plusloin. Pour l’heure, contentons-nous de remarquer que la formuled’Euler implique immédiatement

log ζ(s) =∑

p

log( 1

1 − p−s

)=∑

p

1ps

+ h(s) (σ > 1)

où h(s) =∑

p

∑ν�2 1/νpνs est une série convergente dans le

demi-plan σ > 12 .(2) Or, nous verrons que la fonction ζ(s) est

prolongeable en une fonction analytique dans un domaine plusgrand que le demi-plan de convergence σ > 1. Au vu de la formuleprécédente, les zéros de ζ(s) (i.e. de son prolongement) dans ledemi-plan σ > 1

2 sont également des valeurs remarquables (le termeconsacré est celui de singularités) du prolongement analytique dela série

∑p p−s. Il s’avère que, grâce à la théorie des fonctions

1. Équivalente à la formule de Mertens (cf. § 1.10), elle-même établie grâce à la formuled’Euler réelle.2. Ici et dans la suite nous utilisons librement l’existence d’un prolongement complexede la fonction logarithme satisfaisant à la propriété suivante : étant donnés un nombreréel α > 0 et une fonction analytique f (s), sans zéro pour �e s > α et réellepositive pour s ∈]α, +∞[, alors log f (s) est défini dans le demi-plan �e s > α ety vérifie �e log f (s) = ln |f (s)|. Le lecteur néophyte pourra se contenter d’admettreque, moyennant certaines précautions qui seront toujours prises dans la suite, ceprolongement satisfait aux règles de calcul usuelles.

49

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

holomorphes, la localisation de ces singularités est essentiellementéquivalente à l’élucidation du comportement asymptotique de lafonction de comptage π(x). Nous reviendrons amplement sur cepoint capital.

Avant de poursuivre notre étude des liens entre la fonctionzêta de Riemann et la répartition des nombres premiers, signalonsquelques autres conséquences remarquables de la formule d’Euler.

On a clairement pour σ > 1

ζ(s)−1 =∏

p

(1 − p−s

).

Lorsque l’on développe le produit infini (la preuve donnée auChapitre 1 de la formule d’Euler s’étend mutatis mutandis à cecadre), on obtient

ζ(s)−1 = 1 −∑

p

p−s +∑p<q

(pq)−s −∑

p<q<r

(pqr)−s + · · ·

où p, q, r, . . . désignent des nombres premiers. Ainsi seuls desentiers sans facteur carré apparaissent dans cette sommation, et,pour un tel entier n, le coefficient de n−s vaut ±1 selon que lenombre de facteurs premiers de n est pair ou impair. En d’autrestermes, on a

ζ(s)−1 =∑n�1

μ(n)n−s (σ > 1)

où μ(n) est la fonction de Möbius, déjà rencontrée au Chapitre 1— cf. p. 25.

Semblablement, on peut écrire

ζ(s)2 =∑

��1,m�1

�−sm−s =∑n�1

τ(n)n−s (σ > 1)

où τ(n) est le nombre de décompositions de n sous la forme �m,c’est-à-dire le nombre de diviseurs de n. Cette relation est un casparticulier de convolution des fonctions arithmétiques, que nousdécrivons plus en détail au Chapitre 4.

50

LA FONCTION ZÊTA DE RIEMANN

Par dérivation logarithmique, la formule d’Euler fournit

−ζ ′(s)ζ(s)

=∑

p

∑ν�1

ln ppνs

=∑n�1

Λ(n)

ns

où Λ(n) est la fonction de von Mangoldt déjà introduite auChapitre 1 (§ 1.9, p. 27).

On voit ainsi que les fonctions arithmétiques de la théorieélémentaire des nombres premiers apparaissent naturellementcomme des coefficients de séries dérivées de ζ(s) par des transfor-mations analytiques simples. Cela illustre à nouveau le rôle centralde la fonction zêta dans la théorie analytique des nombres.

4. Prolongement analytique

Ainsi que nous l’avons signalé plus haut, l’intérêt majeur de consi-dérer ζ(s) comme fonction d’une variable complexe est que l’onpeut en étendre la définition au delà du domaine de convergencede la série. Les renseignements relatifs au prolongement peuventensuite être utilisés dans le cadre de la théorie générale des fonctionsanalytiques, en particulier pour l’évaluation d’intégrales curvilignes.

Nous allons tout d’abord étendre la définition de ζ(s) au demi-plan σ > 0. Une manipulation très simple est suffisante. On apour σ > 1

ζ(s) =∑n�1

n−s =∑n�1

s∫ ∞

n

dtts+1

= s∫ ∞

1

(∑n�t

1) dt

ts+1

= s∫ ∞

1

�t�ts+1

dt =s

s − 1− s

∫ ∞

1

〈t〉ts+1

dt,

où �t� désigne la partie entière du nombre réel t et 〈t〉 sa partiefractionnaire.

Comme 〈t〉 ∈ [0, 1[, la dernière intégrale converge pour σ > 0.Le membre de droite définit donc un prolongement de ζ(s) audemi-plan σ > 0 privé du point s = 1. Ce prolongement est

51

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

analytique (la théorie nous apprend qu’il suffit pour cela que ce soitune fonction dérivable de s), donc, d’après le principe mentionnédans l’introduction, il est uniquement déterminé. Autrement dit,toute autre méthode d’extension de la définition de ζ(s) (et il y ena de nombreuses !) aurait conduit à la même fonction.

Une des propriétés les plus frappantes et les plus importantesdécouvertes par Riemann est l’existence d’une équation fonctionnellepour la fonction zêta, de la forme

ζ(s) = χ(s)ζ(1 − s) (0 < σ � 1)

où χ est définie au moyen de certaines fonctions classiquesde l’analyse et possède un sens pour toute valeur complexe de snon égale à un entier positif impair. Nous expliciterons plusloin χ(s). L’essentiel est d’abord de constater que, puisque latransformation s �→ 1 − s possède le point s = 1

2 pour centrede symétrie, l’équation fonctionnelle permet (grâce au principedu prolongement analytique) de définir ζ(s) dans le demi-planσ � 1

2(1) dès lors que l’on en connaît la valeur pour σ � 1

2 . Or,nous venons précisément de définir ζ(s) pour σ > 0 : l’équationfonctionnelle fournit donc le prolongement de ζ(s) au plan complexetout entier.

Il existe beaucoup de démonstrations différentes de l’équationfonctionnelle de zêta. L’une des plus limpides, que nous présentonsici, repose sur la formule de Poisson qui énonce que, si l’on définitla transformée de Fourier d’une fonction f intégrable sur R par

f (x) =

∫ +∞

−∞f (y)e−2πixy dy,

on a ∑n∈Z

f (n) =∑n∈Z

f (n)

1. Sauf, a priori, s = 0, mais la valeur ζ(0) s’obtient aisément par passage à la limite.

52

LA FONCTION ZÊTA DE RIEMANN

pour toute fonction f dérivable sur R et vérifiant certainesconditions de décroissance.(1)

Il est très facile de vérifier que les conditions d’application de laformule sommatoire de Poisson sont satisfaites par f (x) = e−πux2

pour chaque valeur du paramètre positif u. On a alors

f (x) = e−πx2/uu−1/2.

On obtient ainsi que la fonction ϑ : ]0,∞[→]0,∞[ définie par laformule

ϑ(u) :=∑n∈Z

e−πn2u

satisfait à l’équation fonctionnelle

ϑ(1/u) =√

u ϑ(u) (u > 0).(2)

Nous verrons plus loin comment cette identité implique à sontour l’équation fonctionnelle de la fonction zêta.

La fonction χ(s) intervenant dans l’équation fonctionnelle deζ(s) est définie (à l’aide de la fonction Γ d’Euler sur laquelle nousreviendrons dans un instant) par la formule

χ(s) = 2sπs−1 sin( 12πs)Γ(1 − s),

de sorte que l’on a finalement

ζ(s) = 2sπs−1 sin( 12πs)Γ(1 − s)ζ(1 − s) (s �= 0, 1).

Ici, la fonction sinus représente en fait le prolongementanalytique de la fonction trigonométrique usuelle et est définiecomme somme de la série

sin z :=∑n�0

(−1)nz2n+1

(2n + 1)!

qui converge pour tout z ∈ C.

1. On peut montrer, par exemple, que la formule de Poisson est valable si∑

n∈Zf (n)

converge et si∑

n∈Zf ′(n + x) converge uniformément pour x ∈ [0, 1].

2. La fonction ϑ(u) est connue sous le nom de fonction thêta de Jacobi.

53

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La fonction Γ(s) a été découverte par Euler, qui l’a initialementdéfinie par la formule

Γ(s) =1s

∏n�1

(1 + 1/n)s

1 + s/n(s ∈ C, s �= 0,−1,−2, . . .).

C’est une fonction omniprésente en analyse mathématique, où elleest la seule à pouvoir contester la position dominante du coupleinfernal constitué de l’exponentielle et du logarithme. Elle possèdede nombreuses définitions équivalentes. La plus fréquemmentutilisée dans l’enseignement moderne est

Γ(s) =

∫ ∞

0xs−1e−x dx,

qui a l’inconvénient de n’avoir a priori de sens que pour σ > 0mais permet facilement, grâce à une banale intégration par parties,d’établir l’équation fonctionnelle

sΓ(s) = Γ(s + 1),

qui, à son tour, fournit le prolongement analytique.

En particulier, Γ(n + 1) = n!, ce qu’on exprime parfois endisant que la fonction Γ interpole la factorielle. Parmi les autrespropriétés classiques de la fonction Gamma, mentionnons encorela jolie formule des compléments

Γ(s)Γ(1 − s) = π/ sin(πs)

et la non moins esthétique formule de duplication de Legendre

Γ(s)Γ(s + 12) =

√π 21−2sΓ(2s).

Après ces préliminaires, il est facile d’établir l’équation fonction-

nelle de ζ(s) selon une méthode indiquée par Riemann lui-même.On commence par observer qu’un simple changement de variable

54

LA FONCTION ZÊTA DE RIEMANN

(soit x = πn2y) dans l’intégrale de définition de Γ( 12 s) fournit,

pour σ > 0,

Γ( 12 s)π−s/2n−s =

∫ ∞

0ys/2−1e−πn2y dy (n = 1, 2, . . .).

Pour σ > 1, on peut sommer cette identité sur toutes les valeursentières positives de n. On obtient

ζ(s)Γ(

12 s)π−s/2 =

∫ ∞

0ϑ1(y)ys/2−1 dy,

où l’on a posé ϑ1(y) := 12(ϑ(y) − 1).

Maintenant, nous scindons l’intégrale au point y = 1 eteffectuons le changement de variable z = 1/y pour évaluer lacontribution de l’intervalle 0 � y � 1. L’équation fonctionnellede ϑ fournit∫ 1

0ϑ1(y)ys/2−1 dy =

1s(s − 1)

+

∫ ∞

1ϑ1(z)z−(s+1)/2 dz.

En reportant dans la formule initiale, il suit

ζ(s)Γ(

12 s)π−s/2 =

1s(s − 1)

+

∫ ∞

1ϑ1(x){x−(s+1)/2 + xs/2−1} dx.

On a ϑ1(x) = O(e−πx), une majoration plus que suffisante pourassurer la convergence uniforme de l’intégrale précédente surtout domaine borné de C. Cela définit une fonction analytiquede s, manifestement invariante par la transformation s �→ 1 − s.On en déduit ipso facto le prolongement à C � {0, 1} de lafonction ζ(s)Γ

(12 s)π−s/2 en une fonction invariante par cette

même transformation : c’est l’équation fonctionnelle cherchée,que l’on ramène sans peine à la forme annoncée grâce aux formulesdes compléments et de duplication.

Ce résultat, d’une grande beauté, est aussi très riche de consé-quences. Nous n’en indiquons que quelques-unes.

55

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Faisons d’abord, dans la formule

ζ(s) = χ(s)ζ(1 − s),

tendre s vers 2n + 1, où n est un entier positif. Le membre degauche tend vers la valeur finie ζ(2n + 1), alors que le module dufacteur χ(s) tend vers l’infini — comme l’atteste, par exemple, ladéfinition d’Euler de Γ(s). Cela n’est possible que si ζ(1− s) tendvers 0. Nous avons donc établi que la fonction ζ(s) s’annule auxpoints −2,−4,−6, . . ., qu’on appelle les zéros triviaux de ζ(s).

L’équation fonctionnelle fournit aussi que le point s = 1 estla seule singularité de zêta dans tout le plan complexe. Cela résulteimmédiatement de la validité de cette assertion pour le demi-planσ � 1

2 , en remarquant que les seules singularités de χ(s) sont lesentiers positifs impairs. En effectuant un développement limitéde l’équation fonctionnelle au voisinage de l’origine, on obtientfacilement que ζ(0) = −1

2 et, un peu moins facilement,(1) que

ζ ′(0) = −12 log 2π.

Une troisième conséquence de l’équation fonctionnelle concernele calcul de ζ(2n) pour n � 1. Il faut pour cela faire appel à unrésultat auxiliaire, issu d’une autre méthode de prolongementanalytique de ζ(s), qui précise que les valeurs ζ(−2n− 1) (n � 0)sont des nombres rationnels. Plus précisément, notant Bn le n-ièmenombre de Bernoulli,(2) on a

ζ(−2n − 1) = − B2n+2

2n + 2(n � 0).

1. Ce calcul fait en particulier appel à la formule de Stirling citée en note p. 26.2. Les nombres de Bernoulli sont définis par le développement de Taylor

xex − 1

=∑n�0

Bnxn

n!·

On a B1 = − 12 , B2 = 1

6 , B4 = − 130 , B6 = 1

42 , . . . , et B2n+1 = 0 pour tout n � 1.

56

LA FONCTION ZÊTA DE RIEMANN

En reportant dans l’équation fonctionnelle, on obtient

ζ(2n) = (−1)n−122n−1 B2n

(2n)!π2n (n � 1).

Ainsi

ζ(2) =∑n�1

1n2

= 16π

2, ζ(4) =∑n�1

1n4

= 190π

4, etc.

On sait depuis Lindemann (1882) que le nombre π esttranscendant, c’est-à-dire qu’il est non seulement irrationnel maisn’annule aucun polynôme à coefficients entiers non identiquementnul.(1) En particulier, tous les nombres ζ(2n) sont donc transcendants.

La nature arithmétique des nombres ζ(2n+1) pose un problèmeouvert. À la suite du résultat de Roger Apéry, qui a montré en1978 que ζ(3) est irrationnel,(2) Tanguy Rivoal a établi en 2000que ζ(2n + 1) est irrationnel pour une infinité de valeurs de n.Cependant ces valeurs de la fonction zêta continuent de braver lasagacité des spécialistes... et la curiosité des amateurs !

5. La droite σ = 1 et le théorème des nombrespremiers

Une fonction analytique f (s) a nécessairement un comportementlocal simple, puisqu’elle est, au voisinage de chaque point, trèsbien approchable par un polynôme. En particulier, si f (s0) = 0,

1. Lindemann a ainsi montré que la quadrature du cercle (c’est-à-dire la construction,avec pour seuls instruments la règle et le compas, d’un carré de surface égale à celle ducercle de rayon unité, soit π) est impossible. Il a de ce fait apporté une réponse négativeà un problème posé par les Grecs et plus de deux fois millénaire.2. Apéry donne en particulier la jolie formule

ζ(3) = 52

∑n�1

(−1)n−1

n3(2n

n

) ·

57

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

alors on a, pour une constante c et un entier k � 1 convenables,

f (s) ∼ c(s − s0)k (s → s0).

Nous avons vu au § 4 que ζ(s) est prolongeable en une fonctionanalytique dans C�{1} et que le comportement de cette fonctionest également simple au voisinage de la singularité s = 1, puisquel’on a

ζ(s) ∼ 1/(s − 1) (s → 1).

En considérant la relation issue du produit eulérien

log ζ(s) =∑

p

p−s + h(s) (σ > 1)

où h(s) est une fonction analytique dans le demi-plan σ > 12 ,

on déduit donc qu’au voisinage de s = 1 la fonction log ζ(s)« ressemble » à log{1/(s−1)}, et partant que sa dérivée se comportecomme −1/(s − 1). Autrement dit, on a

Z(s) := −ζ ′(s)ζ(s)

=∑n�1

Λ(n)

ns∼ 1

s − 1

lorsque s tend vers 1 en restant dans le demi-plan σ > 1.Hadamard et La Vallée-Poussin ont établi indépendamment

en 1896 que la fonction ζ(s) ne s’annule pas sur la droite σ = 1,ce que l’on peut interpréter comme le fait que l’approximation deZ(s) par 1/(s − 1) reste valable, en un sens faible, tout le long de ladroite σ = 1. Ainsi que nous allons le voir immédiatement, celaimplique le théorème des nombres premiers sous la forme

π(x) ∼ x/ ln x (x → ∞).

Commençons par une justification heuristique, à laquelle lelecteur peu familiarisé avec les techniques avancées de l’analysepourra se limiter. Rappelons la définition de la fonction deTchébychev

ψ(x) =∑n�x

Λ(n).

58

LA FONCTION ZÊTA DE RIEMANN

Nous avons établi au Chapitre 1 (§ 1.9, p. 29) la formule asymp-totique

π(x) =ψ(x)ln x

{1 + O

( 1ln x

)}(x → ∞).

Donc le théorème des nombres premiers équivaut à

ψ(x) ∼ x (x → ∞).

Cela signifie que la fonction Λ se comporte en moyenne commela fonction 1. Or, les séries en s(1) associées à ces fonctions sontrespectivement Z(s) et ζ(s). Observons maintenant que la fonctionζ(s) est régulière en tout point s �= 1 alors que

Z(s) = − d log ζ(s)/ ds = −ζ ′(s)/ζ(s)

possède une singularité non seulement en s = 1 mais aussien tout zéro de ζ(s). Ainsi, l’absence de zéro de ζ(s) sur ladroite σ = 1 signifie que les fonctions Z(s) et ζ(s) sont demême nature dans le demi-plan fermé σ � 1. Ce renseignementétaie donc bien qualitativement l’hypothèse que Λ et 1, partantψ(x) =

∑n�x Λ(n) et �x� =

∑n�x 1, se comportent de manière

similaire.

Techniquement, le lien entre une série de série de Dirichlet

F (s) :=∑n�1

ann−s

et la fonction sommatoire de ses coefficients

A(x) =∑

1�n�x

an

est fourni par une classe de formules appelées formules de Perron.Dans le cas qui nous occupe, et conformément à l’argument

1. Communément désignées sous le nom de séries de série de Dirichlet.

59

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

heuristique précédemment développé, il est naturel d’introduire lasérie

F (s) = Z(s) − ζ(s) =∑n�1

Λ(n) − 1ns

·

Une formule de Perron adaptée au problème peut alors s’écrire,avec s = σ + iτ ,∫ x

0(ψ(y) − �y�) dy =

12π

∫ +∞

−∞

F (s)x1+s

s(1 + s)dτ (σ > 1).

Sous l’hypothèse que ζ(s) ne s’annule pas pour σ = 1,le nombre F (s) tend, lorsque σ → 1+, vers une limitefinie F (1 + iτ) pour toute valeur de τ ∈ R : on aF (1 + iτ) = −ζ ′(1 + iτ)/ζ(1 + iτ) − ζ(1 + iτ) si τ �= 0, etla propriété persiste pour τ = 0 puisque ζ(s) et Z(s) sont toutesdeux, dans un voisinage de s = 1, de la forme 1/(s − 1) + h(s),où h(s) est analytique.

Nous admettons alors que l’on peut passer à la limite sous lesigne d’intégration dans la formule de Perron : cela est aisémentjustifié en pratique sous l’hypothèse que |ζ(1 + iτ)| ne devientpas trop petit lorsque |τ | → ∞ et toutes les preuves du faitque cette quantité ne s’annule pas fournissent effectivement cerenseignement — avec d’ailleurs une grande marge de sécurité.Nous obtenons ainsi∫ x

0(ψ(y) − �y�) dy =

x2

∫ +∞

−∞

F (1 + iτ)xiτ

(1 + iτ)(2 + iτ)dτ.

Le membre de droite peut être réécrit sous la forme

x2 f(− ln x

)avec f (τ) :=

F (1 + iτ)

2π(1 + iτ)(2 + iτ)·

60

LA FONCTION ZÊTA DE RIEMANN

Or un résultat classique d’analyse de Fourier, connu sous le nom delemme de Riemann–Lebesgue, stipule que la transformée de Fourierd’une fonction intégrable tend nécessairement vers 0 à l’infini.(1)

Nous avons donc obtenu∫ x

0(ψ(y) − �y�) dy = o(x2) (x → ∞),

d’où ∫ x

0ψ(y) dy = 1

2x2 + o(x2) (x → ∞).

Une manipulation très simple, reposant sur la croissance de lafonction ψ, permet alors de conclure. Pour tout ε > 0, on déduiten effet de ce qui précède que

12x2− 1

2x2(1 − ε)2 + o(x2) =

∫ x

x(1−ε)

ψ(y) dy � εxψ(x)

�∫ x(1+ε)

xψ(y) dy = 1

2x2(1 + ε)2 − 12x2 + o(x2),

d’où, en divisant par εx,

(1 − 12ε)x + o(x) � ψ(x) � (1 + 1

2ε)x + o(x).

Comme ε peut être choisi arbitrairement petit, on obtient bien laconclusion requise, sous la forme ψ(x) ∼ x.

Nous avons donc montré comment l’absence de zéro de ζ(s) surla droite σ = 1 implique le théorème des nombres premiers. Il està noter que la réciproque peut également être établie facilement. Si

ζ(1 + iτ0) = 0

1. Le lecteur pourra s’en convaincre aisément dans le cas des fonctions en escalier. Lecas général s’en déduit en observant (ou en admettant !) que la transformée de Fourierd’une fonction intégrable peut être rendue uniformément proche de la transforméed’une fonction en escalier.

61

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

l’analyticité de ζ(s) fournit immédiatement, pour un nombre entierm � 1 et une constante c �= 0 convenables, le développement

ζ(s) = c(s − 1 − iτ0)m + · · ·

au voisinage de s0 = 1 + iτ0, d’où

limσ→1+

(σ − 1)Z(σ + iτ0) = −m.

Par ailleurs, une simple intégration par parties permet d’écrire

Z(s) =s

s − 1+ s

∫ ∞

1

(ψ(y) − y

) dyys+1

(σ > 1),

d’où l’on déduit, sous l’hypothèse ψ(y) ∼ y (y → ∞) et en posants = σ + iτ0,

(σ − 1)|Z(s)| � (σ − 1)|s|{ 1|τ0|

+

∫ ∞

1o(y−σ) dy

}= o(1)

lorsque σ → 1+. Cela implique m = 0 et contredit ainsil’existence d’un zéro sur la droite σ = 1.

Il nous reste à montrer que ζ(s) ne s’annule pas sur la droiteσ = 1. Les preuves initiales de Hadamard et La Vallée-Poussinsont d’apparences assez différentes mais reposent toutes deux sur unargument de même nature, à savoir que la relation ζ(1 + iτ0) = 0impliquerait que 1 + 2iτ0 soit une singularité de ζ(s). En effet,ainsi que nous l’avons vu au § 3, on a pour σ > 1

log ζ(s) =∑

p

p−s + O(1)

donc

ln |ζ(s)| =∑

p

cos(τ ln p)pσ

+ O(1).

Si cette quantité tend vers −∞ lorsque τ = τ0 et σ → 1+, elledoit le faire au moins comme ln(σ − 1) puisque ζ est analytique.

62

LA FONCTION ZÊTA DE RIEMANN

Or, le comportement de la fonction zêta sur l’axe réel nous apprendque ∑

p

1pσ

∼ ln( 1

σ − 1

).

Cela signifie que les cos(τ0 ln p) sont majoritairement prochesde −1, c’est-à-dire que les nombres τ0 ln p sont majoritairementproches de π modulo 2π. Mais alors les nombres 2τ0 ln p devraientêtre majoritairement proches de 0 modulo 2π, de sorte que

limσ→1+

|ζ(σ + 2iτ0)| → ∞,

ce qui contredit la continuité de ζ(s) en s = 1 + 2iτ0.Mertens (1898) a formalisé l’argument précédent sous une

forme particulièrement limpide en introduisant l’identité trigono-métrique

3 + 4 cos ϑ + cos 2ϑ = 2(1 + cos ϑ)2 � 0 (ϑ ∈ R).

Lorsqu’on applique, comme le fait La Vallée-Poussin dans unmémoire subséquent, cette inégalité pour ϑ = τ0 ln pν et que l’onsomme sur toutes les valeurs de p et ν � 1 après avoir multipliépar ν−1p−σν , on obtient, compte tenu de ce qui précède,

3 ln |ζ(σ)| + 4 ln |ζ(σ + iτ0)| + ln |ζ(σ + i2τ0)| � 0

d’où|ζ(σ)|3|ζ(σ + iτ0)|4|ζ(σ + i2τ0)| � 1.

Si 1 + iτ0 était un zéro de ζ(s), on devrait avoir par analyticité|ζ(σ + iτ0)| ∼ c(σ − 1) lorsque σ → 1+, avec une constanteconvenable c � 0.(1) Compte tenu de la régularité de ζ(s) en

1. Si c = 0, nous interprétons la relation précédente comme

|ζ(σ + iτ0)| = o(σ − 1),

ce qui n’altère pas le raisonnement qui suit.

63

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

s = 1 + 2iτ0, le membre de gauche de l’inégalité précédentedevrait donc être O(σ − 1), et en particulier tendre vers 0, ce quicontredit le fait qu’il doive constamment demeurer � 1.

6. L’hypothèse de Riemann

Nous avons vu au paragraphe précédent que l’absence de zérode ζ(s) sur la droite σ = 1 suffit « essentiellement » à établirle théorème des nombres premiers.(1) Les preuves originales deHadamard et La Vallée-Poussin peuvent facilement être renduesquantitatives. Par des calculs standard et sans introduire d’idéenouvelle, elles fournissent que tout zéro � = β + iγ de ζ(s) satisfait

β � 1 − c/(ln |γ|)9

pour une constante convenable c > 0.(2) Dès 1898, La Vallée-Poussin, en utilisant d’ailleurs un théorème de factorisation desfonctions analytiques dû à Hadamard, a amélioré ce résultat en

β � 1 − c/ ln |γ|.

Cela fournit une majoration effective pour le terme d’erreurdu théorème des nombres premiers. Une technique classiqued’intégration complexe permet en effet de déduire facilement del’estimation précédente que l’on a, pour une constante convenablea > 0,

ψ(x) = x + O(

xe−a√

ln x),

π(x) = li(x) + O(

xe−a√

ln x).

1. La restriction vient du fait que nous avons également dû supposer que |ζ(1+ iτ)| neprend pas de trop petites valeurs lorsque |τ | → ∞. Ikehara a montré en 1931 qu’aucuneminoration n’est en réalité nécessaire et a fourni un cadre général où l’on peut déduirestricto sensu le théorème des nombres premiers de l’absence de zéro d’abscisse 1 sansintroduire d’information supplémentaire.2. On peut vérifier numériquement que, si ζ(β + iγ) = 0, alors |γ| > 14.

64

LA FONCTION ZÊTA DE RIEMANN

La fonction li(x), ou logarithme intégral, est définie dans lesNotations et conventions. On a bien sûr

li(x) ∼ x/ ln x (x → ∞),

donc π(x) ∼ li(x), mais l’approximation est en réalité de bienmeilleure qualité puisque le terme d’erreur est O

(x/(ln x)k

)pour

tout k > 0. Cela confirme en particulier une conjecture de Gaussqui, dans la première moitié du dix-neuvième siècle(1) et sur lafoi des tables de nombres premiers alors disponibles, avait précisél’intuition de Legendre en émettant l’hypothèse que le logarithmeintégral constituait une excellente approximation de la loi deraréfaction des nombres premiers.

Ainsi, l’absence de zéro de ζ(s) sur la droite σ = 1 fournitdéjà une très bonne évaluation asymptotique de π(x). Dans sonmémoire de 1859, Riemann émet l’opinion que beaucoup plus estvrai, à savoir que tous les zéros non triviaux de ζ(s) sont situés surl’axe de symétrie σ = 1

2 .(2)

Cette conjecture, connue sous le nom d’hypothèse de Riemann, n’atoujours pas été résolue aujourd’hui, malgré les efforts conjuguésde centaines de mathématiciens. Elle est riche d’implications danstoutes les branches de la théorie des nombres et possède desgénéralisations dans de nombreux domaines des mathématiques.

Pour bien comprendre l’incidence de l’hypothèse de Riemannsur la loi de répartition des nombres premiers, il faut introduireun nouvel outil, également décrit par Riemann, et connu sous lenom de formules explicites de la théorie des nombres.

Il s’agit ici de pousser jusqu’à sa limite naturelle la description dela fonction ψ(x) — une formule analogue, mais plus compliquée,est valable pour π(x) — en termes des zéros de ζ(s). Qu’une telle

1. Dans une lettre datant de 1849, en réponse à une question de l’astronome etmathématicien suisse Encke.2. Gram a montré dès 1903 que les 15 premiers zéros (i.e. les 15 zéros de plus petitesordonnées positives) sont bien d’abscisse 1

2 . On sait aujourd’hui qu’il en va de mêmepour plus d’un milliard de zéros.

65

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

entreprise soit seulement possible peut surprendre. On peut lajustifier a priori en observant que la théorie de Hadamard permetde définir essentiellement une fonction analytique par ses zéros etses singularités. Dans le cas de ζ(s) on a

ζ(s) =eAs

2(s − 1)Γ( 12 s + 1)

∏�

(1 − s/�)es/�

avec A = ln(2π) − 1 − 12γ

(1) et où le produit porte sur tous leszéros non triviaux de ζ(s). Les éventuels zéros multiples(2) sontrépétés avec leur ordre de multiplicité, et l’on peut montrer que leproduit infini converge absolument. Comme la fonction zêta, à sontour, définit complètement ψ(x), il est raisonnable de rechercherun lien direct entre ψ(x) et la suite des zéros de ζ(s).

La formule explicite est

ψ(x) = x − limT→∞

∑|m �|�T

x�

�− ζ ′(0)

ζ(0)− 1

2 ln(1 − x−2),

où la somme porte sur les zéros non triviaux � de ζ(s), avec la mêmeconvention que précédemment concernant les racines multiples.La formule n’est valable sous cette forme que si x n’est pas unepuissance d’un nombre premier, mais on peut montrer que l’on asans restriction sur x

ψ(x) = x −∑

|m �|�T

x�

�− ζ ′(0)

ζ(0)− 1

2 ln(1 − x−2) + RT (x),

avec, notant 〈〈x〉〉 := minp,ν�1 |x − pν |,

RT (x) x(ln xT )2

T+

x ln xx + T 〈〈x〉〉 ·

1. Ici γ désigne la constante d’Euler.2. On conjecture généralement que tous les zéros sont simples.

66

LA FONCTION ZÊTA DE RIEMANN

Au vu des formules explicites, il n’est pas très surprenant quela taille du terme d’erreur du théorème des nombres premiers soitliée au nombre

Θ := supζ(�)=0

�e �,

qui satisfait 12 � Θ � 1 à cause de la symétrie des zéros autour de

l’axe σ = 12 , résultant de l’équation fonctionnelle. On a en fait

ψ(x) = x + O(xΘ(ln x)2),

π(x) = li(x) + O(xΘ ln x).

Réciproquement, on peut montrer que le nombre Θ est la borneinférieure de l’ensemble des nombres réels ϑ tels que

π(x) − li(x) = O(xϑ).

Ainsi l’hypothèse de Riemann équivaut à la majoration asympto-tique

(∀ ε > 0) π(x) = li(x) + Oε(x1/2+ε),

ou encore à l’égalitéΘ = 1

2 ·Hardy a établi en 1914 que la fonction ζ(s) possède une infinité

de zéros sur la droite critique σ = 12 . Toute majoration du type

Θ � 1 − δ avec δ > 0 serait une nouvelle fantastique dans lemonde de l’arithmétique.

Une énergie considérable a été déployée pour élucider lesmystères de la fonction zêta de Riemann. Donnons une idéedes progrès les plus significatifs accomplis depuis les travaux deHadamard et La Vallée-Poussin en mentionnant, parmi beaucoup,deux classes de résultats.

D’une part, à la suite du théorème de Hardy, on a cherché àaffiner les minorations quantitatives du nombre des zéros situéssur la droite critique. De tels résultats doivent être mesurés à l’aunede la formule suivante annoncée par Riemann et rigoureusement

67

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

établie par von Mangoldt : notant traditionnellement � = β + iγun zéro non trivial générique de ζ(s), on a pour T → ∞,

N (T ) := |{� : ζ(�) = 0, 0 < γ � T}| ∼ T2π

lnT2π

·

Cela étant, Selberg a montré en 1942 que l’on a, pour une constanteconvenable c > 0,

N0(T ) := |{� : ζ(�) = 0, β = 12 , 0 < γ � T}| � cN (T )

pour tout T > 0, établissant ainsi qu’une proportion positive deszéros non triviaux de ζ(s) sont situés sur la droite critique σ = 1

2 . Cefut un grand choc, assorti d’un certain tapage médiatique, lorsqueLevinson annonça en 1974 que c > 1

3 . Le dernier record en dateest dû à Conrey (1989) : c > 2

5 .

Dans l’autre direction, la région sans zéro de La Vallée-Poussina été étendue par Vinogradov et Korobov qui ont montréindépendamment en 1958 que l’on a, pour tout zéro non trivialde ζ(s),

β � 1 − c0/{(ln |γ|)2/3(ln2 |γ|)1/3}pour une constante absolue convenable c0 > 0.(1) La conséquencesur le terme d’erreur est l’estimation

π(x) = li(x) + O(xe−c1(ln x)3/5/(ln2 x)1/5)

,

où c1 est une constante absolue strictement positive.Toutes les améliorations subséquentes de la méthode de Vino-

gradov–Korobov, spectaculaires pour certaines applications, ontune signification marginale dans ce problème, où l’on peut lesinterpréter comme portant essentiellement sur la valeur de laconstante positive c1.

1. Voir note 2, p. 64.

68

LA FONCTION ZÊTA DE RIEMANN

7. Conséquences arithmétiquesdes renseignements sur les zéros

À côté de l’application phare à la taille du terme d’erreur dans lethéorème des nombres premiers, les renseignements sur les zérossont susceptibles de nombreuses répercussions arithmétiques, dontcertaines ne concernent d’ailleurs pas directement les nombrespremiers.

Nous nous bornons à mentionner ici deux champs d’applica-tions.

La première concerne les théorèmes dits d’oscillation, qui ontpour objet de fournir une limitation théorique à la qualité du termereste d’une formule asymptotique. Phragmén (1891) et Landau(1905) ont montré que l’existence de singularités de séries de sériede Dirichlet permet d’obtenir effectivement des théorèmes de cetype. Il nous entraînerait trop loin de décrire leur méthode, maisnous pouvons facilement en expliciter certaines conséquences dansle cas de la fonction zêta.(1) Nous emploierons la notation

f (x) = Ω±(g(x))

pour signifier qu’il existe une constante c > 0 et une suite réelle{xn}∞n=1 telle que xn → ∞ et

f (x2n) > c∣∣g(x2n)

∣∣, f (x2n+1) < −c∣∣g(x2n+1)

∣∣.L’existence d’au moins un zéro dans la bande critique 0 < σ < 1implique grâce au théorème de Phragmén–Landau que

π(x) = li(x) + Ω±

(√xln x

).

Littlewood a montré que l’on peut améliorer ce résultat en

π(x) = li(x) + Ω±

(√x ln3 xln x

).

1. Ce sont donc bien les zéros de ζ(s) qui apparaissent ici, en tant que singularités delog ζ(s), qui « ressemble » fort à

∑p p−s.

69

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Beaucoup d’autres théorèmes d’oscillation sont liés à la localisationdes singularités de fonctions analytiques. L’un des plus célèbresest celui de Hardy relatif à la fonction τ(n), égale au nombre desdiviseurs de n. Dirichlet a montré (cf. § 4.3, p. 122) que l’on a∑

n�x

τ(n) = x(ln x + 2γ − 1) + O(√

x)

et c’est un des grands problèmes ouverts de la théorie analytiquedes nombres que de déterminer avec précision la taille du termed’erreur. En considérant le prolongement analytique de la série∑

n

τ(n)e−s√

n/√

n,

Hardy a montré en 1915, par une méthode beaucoup plus sophisti-quée qu’une simple application du théorème de Phragmén–Landaumais reposant sur un principe semblable, que l’on a∑

n�x

τ(n) = x(ln x + 2γ − 1) + Ω±(x1/4).

On conjecture que le terme d’erreur du problème de Dirichlet esteffectivement O(x1/4+ε) pour chaque ε > 0.

Une seconde classe d’applications arithmétiques de la connais-sance des zéros de la fonction ζ(s) est celle de la localisationd’entiers soumis à certaines contraintes multiplicatives dans depetits intervalles.

Considérons le cas exemplaire des nombres premiers. Lethéorème des nombres premiers implique immédiatement la formeforte du postulat de Bertrand

π(x + y) > π(x),

pour y = εx, x > x0(ε), où ε est un nombre positif arbitrairementpetit. Le terme d’erreur de La Vallée-Poussin fournit la validité durésultat pour

y = xe−c√

ln x

70

LA FONCTION ZÊTA DE RIEMANN

avec une constante positive convenable c, et l’hypothèse deRiemann autorise le choix y = C

√x(ln x)2 avec C assez grande.

Cependant, il est naturel de conjecturer que l’on peut prendrey = xε pour tout ε > 0. Un tel résultat ne découle pasdirectement de l’hypothèse de Riemann et doit donc être attaquépar des méthodes spécifiques. Les formules explicites décrites auparagraphe précédent sont une approche possible et déjà fructueuse.

Nous avons en effet, d’après les résultats indiqués plus haut,

ψ(x + y) − ψ(x) = y +∑|γ|�T

x� − (x + y)�

�+ O

(x ln2 xT

)si 1 � T � x et, par exemple, x est un demi-entier. À ce stade lastratégie est évidente : choisir T assez grand et majorer la sommesur les zéros pour montrer que ψ(x + y) − ψ(x) est proche de y,ou, à tout le moins � 1

2y pour x, y assez grands.La réalisation de ce programme nécessite deux ingrédients :

il faut savoir, d’une part, que les parties réelles β des zéros nepeuvent pas s’approcher trop de la valeur 1, et, d’autre part, ilfaut pouvoir majorer le nombre des zéros � pour lesquels 1 − βa une taille « intermédiaire ». La majoration β � 1 − c/ ln |γ| deLa Vallée-Poussin est à peine trop faible pour remplir la premièrecondition : toute majoration du type

β � 1 − c/(ln |γ|)1−a

avec a > 0 est suffisante. On peut donc en particulier faireappel aux théorèmes de Vinogradov et Korobov. Le secondrenseignement fait partie des théorèmes de densité, dont l’objetest de majorer le nombre

N (σ, T ) = |{� : ζ(�) = 0, σ � β � 1, 0 < γ � T}|

de zéros dont l’écart à la droite critique est contrôlé. Ingham amontré en 1940 que

N (σ, T ) T 3(1−σ)/(2−σ)(ln T )5

71

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

pour 12 � σ � 1. En améliorant cette estimation pour la bande

34 � σ � 1, Huxley a montré (1972) que l’intervalle ]x, x + xc]contient {1 + o(1)}xc/ ln x nombres premiers pour tout c > 7

12 etx > x0(c). Il est à noter que ce résultat est bien plus fort quece que l’on aurait pu déduire de notre connaissance actuelle dela répartition globale des nombres premiers. Des progrès ont étéaccomplis plus récemment dans cette direction à la suite d’unarticle d’Iwaniec & Jutila (1979) qui obtinrent, pour tout c > 5

9et x assez grand, l’existence d’au moins un nombre premier dansl’intervalle ]x, x + xc] en introduisant dans la technique, à côtédes renseignements analytiques concernant la fonction zêta deRiemann, des développements modernes de la théorie du criblelinéaire. Le meilleur résultat en date est dû à Baker, Harman &Pintz (2001), qui prouvent que

π(x + y) − π(x) � 9y/(100 ln x) (x > x0)

pour y = x0,525.

72

Chapitre 3

Répartition stochastiquedes nombres premiers

1. Introduction

Un des aspects remarquables de la répartition des nombres premiersest cette tendance à la régularité globale et à l’irrégularité locale.Les nombres premiers se comportent comme les gaz parfaitschers aux physiciens. Appréhendée d’un point de vue externe,la distribution est — pour ainsi dire — déterministe, mais dès quel’on cherche à décrire la situation en un point donné, on constatedes fluctuations statistiques comme dans un jeu de hasard où l’onsait qu’en moyenne les faces équilibreront les piles mais où, àaucun moment, on ne peut prédire le coup suivant. Les nombrespremiers occupent tout l’espace (entendez : le hasard) disponible,c’est-à-dire compatible avec la contrainte drastique qui pèse sureux : engendrer la suite ultra-régulière des nombres entiers.

Cette idée est sous-jacente dans la plupart des conjecturesconcernant les nombres premiers : tout ce qui n’est pas trivialementinterdit est en fait réalisé.

Dans ce chapitre, nous allons énoncer les principaux résultatsétablis à l’appui de cette «philosophie », et en présenter les méthodes.

73

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

2. Une brève histoire de ce qui va suivre

Divisez un nombre impair par 4 : le reste sera évidement 1 ou 3.Comme tous les nombres premiers sauf 2 sont impairs, on obtientainsi deux classes de nombres premiers, ceux qui ont un reste 1 etceux qui ont un reste 3 dans la division par 4.

Conformément à notre modèle statistique des nombres premiers,il est logique de supposer que chacune de ces deux classes comporteà peu près autant d’éléments, ce que confirme l’expérience. Il y a,par exemple, 609 nombres premiers n’excédant pas 10000 dontle reste vaut 1, alors que, dans le même intervalle, 620 donnent lereste 3.

Les nombres positifs ou nuls dont le reste dans la divisionpar q vaut r sont exactement les entiers de la forme r + qm(m = 0, 1, 2, . . .). Ils forment ce que l’on appelle une progressionarithmétique de premier terme r et de raison q : on passe d’un termeau suivant en ajoutant la raison. Dans la suite, nous convenons denoter r + qN une telle progression arithmétique.

Cette question de bonne répartition des nombres premiersdans les progressions arithmétiques a intrigué les mathématicienspendant de longs siècles ; malgré de spectaculaires avancées, ellecontinue de le faire.

Il est facile, par exemple, de montrer l’infinitude de l’ensembledes nombres premiers dans chacune des progressions arithmétiques1 + 4N et 3 + 4N.(1) Mais même un résultat en apparence aussipeu ambitieux devient délicat lorsque l’on généralise le problèmeen remplaçant la division par 4 par une autre. Si l’on choisitla raison 11, tous les restes de 1 à 10 sont envisageables, alorsque si l’on divise par 10, seuls 1, 3, 7 et 9 persistent. Commentprouver alors qu’il existe une infinité de nombres premiers dont ledéveloppement décimal se termine par le chiffre 7 ou dont le restedans la division par 11 est 4 ?

1. Voir le § 3.

74

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Peter Gustav Lejeune-Dirichlet(1805–1859)

C’est le mathématicien allemandDirichlet, grand admirateur de Gausset fin connaisseur de la langue fran-çaise, qui a résolu la question vers1840. Il a pour cela inventé un outilsplendide de simplicité et d’efficacité :les caractères, qui portent aujourd’huison nom. Nous détaillons le conceptau paragraphe suivant. Pour l’heure,contentons-nous de signaler que lescaractères sont des applications définiessur l’ensemble des entiers naturels età valeurs complexes, qui respectent la structure multiplicative,autrement dit qui vérifient

f (mn) = f (m)f (n) (m � 1, n � 1),

et permettent cependant de repérer les nombres entiers d’uneprogression arithmétique fixée.

Dirichlet a non seulement établi l’existence d’une infinité denombres premiers dans toute progression arithmétique admissible,mais il a montré qu’elles contiennent toutes approximativementle même nombre d’éléments. Ce théorème profond vient à l’appuide notre conception de la nature aléatoire des nombres premiers :en l’absence d’objection structurelle, l’équirépartition prévaut.

La question de la bonne répartition des nombres premiersdans les progressions arithmétiques peut être généralisée d’unefaçon différente. Supposons donné un nombre irrationnel α. Alorstous les nombres αp (p ∈ P) sont également irrationnels. Si lespropriétés statistiques des nombres premiers sont indépendantes deα (et nous n’avons a priori aucune raison de penser le contraire), ilest donc logique de conjecturer que les parties fractionnaires(1) 〈αp〉sont statistiquement bien réparties dans l’intervalle [0, 1[ : après

1. La fonction partie fractionnaire est définie p. xx.

75

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

tout, un nombre irrationnel n’est jamais qu’une limite de rationnelset, lorsque α = a/q, p = r + mq, n’a-t-on pas 〈αp〉 = 〈ar/q〉 ?

Nous verrons au § 7 que les nombres premiers se comportenteffectivement de manière essentiellement aléatoire au regard de cecritère comme des précédents.

Ben Green et Terence Tao

Une autre version de l’adage selon lequel les nombres premiersempruntent toutes les formes qui ne sont pas trivialement interditesa été rendue effective par un résultat récent dû à Ben Green etTerence Tao (2004) : pour tout entier k, on peut trouver uneprogression arithmétique de k termes entièrement composée denombres premiers. La démonstration, dont nous donnons unaperçu sommaire(1) au § 4, est un impressionnant mélange deméthodes issues de la théorie des nombres, la théorie ergodique,l’analyse harmonique, la géométrie discrète et la combinatoire.

Un aspect fascinant du caractère aléatoire de la suite des nombrespremiers concerne les grandes et les petites différences entresnombres premiers consécutifs.

Il y a π(N ) ∼ N/ ln N nombres premiers n’excédant pasN , donc l’écart moyen est ln N ; mais y a-t-il beaucoup d’écarts< 1

2 ln N ou > 2 ln N ?Le mathématicien suédois Harald Cramér a imaginé vers 1936

un modèle statistique reposant sur une hypothèse d’indépendancedu caractère de primalité des nombres entiers dans leur ensemble.

1. Inspiré des présentations de Host (2005) et Kra (2005).

76

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Bien sûr, n et n + 1 ne sont (presque) jamais simultanémentpremiers, et il en va de même de n et 3n+1. Cependant, le modèleest pertinent pour beaucoup de questions et suggère par exempleque les plus grands écarts entre nombres premiers de taille N sontde l’ordre de (ln N )2. Nous énoncerons au § 5 une version plusprécise de cette conjecture.

Harald Cramér(1893–1985)

Les meilleurs résultats obtenus à cejour par les arithméticiens sont encoretrès éloignés de la conjecture de Cramér.

En ce qui concerne les petits écarts,le modèle statistique prévoit égalementune répartition harmonieuse : parexemple, le nombre des écarts comprisentre a ln N et b ln N serait proche de(e−b − e−b)π(N ).

Cette dernière conjecture impliqueen particulier que, pour toutε > 0, une proportion positive desnombres premiers pn � N vérifiepn+1 − pn � ε ln N .

Un tel résultat a longtemps été considéré comme hors deportée. Cependant, Goldston, Pintz et Yıldırım l’ont démontrérigoureusement en 2005. Nous donnerons quelques idées sur leurapproche au § 6.

3. Progressions arithmétiques

Soient a et q des nombres entiers premiers entre eux. Il n’y a,a priori, aucun obstacle à l’existence d’une infinité de nombrespremiers p ≡ a (mod q). Il est même raisonnable, en l’absenced’information contraire, de supputer que les nombres premiers serépartissent équitablement entre les ϕ(q) classes possibles.(1)

1. Voir le Chapitre 1, p. 14, pour la définition de la fonction d’Euler q → ϕ(q).

77

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Posant

π(x; a, q) := |{p � x : p ≡ a (mod q)}|,

cette hypothèse d’équirépartition nous conduit donc naturellement,compte tenu du théorème des nombres premiers, à la conjecture

π(x; a, q) ∼ xϕ(q) ln x

(x → ∞).

Ce problème, qui possède une histoire propre passionnante,parallèle à celle de l’étude de la loi de répartition des nombrespremiers, a été finalement résolu en 1896 par La Vallée-Poussin,en combinant sa méthode d’attaque du théorème des nombrespremiers (reposant fortement, comme on l’a vu au Chapitre 2,sur les idées de Riemann) avec des outils spécifiques forgés parDirichlet dans la première moitié du dix-neuvième siècle.

Le premier pas dans cette direction consiste à d’établir rigou-reusement l’existence d’une infinité de nombres premiers p danschaque progression admissible a (mod q), avec (a, q) = 1.

Considérons par exemple le cas a = 3, q = 4. On étend sanstrop de difficulté la preuve d’Euclide. Supposons, en effet, qu’il n’yait qu’un nombre fini de nombres premiers, disons p1 =3, . . . , pr,de la forme 4m + 3. Comme un produit d’entiers de la forme4m+1 est encore de ce type, le nombre n = 4p1 · · · pr −1 possèdeau moins un facteur premier p ≡ 3 (mod 4). On a manifestementp �= pj (1 � j � r), ce qui fournit la contradiction souhaitée.

Le cas de la progression p ≡ 1 (mod 4) est un peu plusdélicat mais relève encore d’une technique similaire. S’il n’y aqu’un nombre fini de nombres premiers, disons p1 = 5, . . . , pr ,de la forme 4m + 1, alors tout facteur premier p du nombren = 4(p1 · · · pr)

2 + 1 est tel que −1 est résidu quadratiquemodulo p. D’après ce que nous avons vu au § 1.6 (p. 21), cela

78

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

implique p ≡ 1 (mod 4), ce qui est suffisant puisque p ne peut pasfaire partie de la liste des pj.(1)

On pourrait imaginer que ce type d’approche, qui présupposel’existence d’un polynôme à coefficients entiers dont les valeursaux arguments entiers sont divisibles par une infinité de nombrespremiers de la progression requise, est généralisable à touteprogression arithmétique admissible. Il n’en est rien : Ram Murtya établi en 1988 qu’une preuve « euclidienne » de l’infinité denombres premiers de la forme a+mq est possible si, et seulement si,on a a2 ≡ 1 (mod q). Il en va ainsi, par exemple, de la progression4 (mod 15), mais pas de la progression 2 (mod 7).

C’est Dirichlet qui, en 1837, a fourni la solution générale dece problème.(2) Son point de départ était la preuve d’Euler del’infinitude de l’ensemble des nombres premiers, dont nous avonsvu au § 1.7 qu’elle fournissait également la divergence de la série∑

p 1/p.Considérons d’abord, pour simplifier l’exposé, le cas d’une

progression a (mod q) avec q premier et 1 � a < q. Dirichlet intro-duit des fonctions arithmétiques, χ : N → C, désignées sous lenom de caractères, qui sont périodiques de période q, complètementmultiplicatives,(3) et dont une combinaison linéaire convenable estla fonction indicatrice de la progression n ≡ a (mod q).

La construction des caractères de Dirichlet est subordonnéeau fait que la structure de l’ensemble (Z/qZ)∗ est cyclique : il

1. Ainsi l’ensemble 4N contient une infinité de nombles de la forme p + 1 et uneinfinité de nombres de la forme p − 1. Par des techniques différentes et beaucoup plussophistiquées, Sárközy d’une part, Kamae & Mendès France d’autre part, ont établi en1978 que la propriété persiste lorsque l’on remplace 4N par un ensemble-différenceD := {aj − ak : j � 0, k � 0}, où {an}∞n=0 est une suite strictement croissanted’entiers vérifiant an � n.2. À strictement parler, la preuve de Dirichlet n’était complète que dans le cas d’uneraison q égale à un nombre premier. Le cas général était subordonné à la « formule desclasses » que Dirichlet ne devait établir qu’en 1839/40.3. C’est-à-dire qu’elles vérifient identiquement χ(mn) = χ(m)χ(n) lorsque m, nparcourent N.

79

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

existe au moins un élément g, appelé racine primitive, dont lespuissances gj décrivent (Z/qZ)∗ tout entier. Étant donnée uneracine primitive g modulo q, fixée une fois pour toutes, on peutdonc associer à chaque entier n premier à q un unique entier� = �(n) de {1, . . . , q − 1} tel que n ≡ g� (mod q). Pour chaqueb (0 � b � q − 2), on pose alors

χb(n) = e2πib�(n)/(q−1),

et l’on étend la définition de χb en posant χb(n) = 0 si q | n. Onconstruit donc ainsi ϕ(q) = q − 1 caractères distincts.(1)

Le caractère χ0, égal à la fonction indicatrice de l’ensemble desentiers premiers à q, joue un rôle particulier. On le désigne sous lenom de caractère principal.

La multiplicativité des caractères découle immédiatement dufait que

n1n2 ≡ g�(n1)g�(n2) ≡ g�(n1)+�(n2) (mod q)

si (n1n2, q) = 1, d’où χ(n1n2) = χ(n1)χ(n2) — une propriétéqui persiste trivialement si q | n1n2.

Il est facile de montrer que l’on a pour tout entier a premier à q∑0�b�q−2

χb(a)χb(n) =

{q − 1 si n ≡ a (mod q),0 si n �≡ a (mod q).

C’est clair si n ≡ a (mod q) ; dans le cas contraire, il suffitd’observer que le membre de gauche est la somme des termes d’uneprogression géométrique. Cette relation, communément désignéeformule d’orthogonalité des caractères, fournit la combinaison linéairementionnée plus haut qui permet de repérer les entiers d’uneprogression a (mod q).

Cela étant, Dirichlet introduit les séries

L(s, χ) :=∑n�1

χ(n)n−s

1. Il est clair que c’est le nombre maximal.

80

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

associées aux caractères χ = χb définis plus haut. On montrefacilement que ces séries convergent absolument dans le demi-planσ > 1, où elles vérifient l’analogue de la formule d’Euler(1)

L(s, χ) =∏

p

(1 − χ(p)p−s)−1.

En particulier,

L(s, χ0) =∏p � q

(1 − p−s)−1 = (1 − q−s)ζ(s).

Par dérivation logarithmique, il suit, toujours lorsque σ > 1,

−L′

L(s, χ) =

∑p

χ(p) ln pps − χ(p)

=∑

p

∑ν�1

χ(pν) ln ppνs

=∑n�1

χ(n)Λ(n)

ns·

En multipliant cette relation par χ(a) et en sommant sur χ = χb,nous obtenons la formule fondamentale(2)

(3.1)∑

n≡a (mod q)

Λ(n)

ns=

1q − 1

∑0�b�q−2

χb(a)−L′(s, χb)

L(s, χb)·

Lorsque s → 1+ par valeurs réelles, le membre de gauche vaut∑p≡a (mod q)

ln pps

+ O(1),

et le travail de Dirichlet a essentiellement consisté à montrer que,dans cette circonstance, le membre de droite tend vers l’infini.

1. Voir le Théorème 3.1 (p. 120) pour une démonstration complète.2. Pour la commodité du lecteur, rappelons que Λ est la fonction de von Mangoldt —§ 1.9, p. 27.

81

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Le terme correspondant à b = 0 dans la somme en b de (3.1)vaut

−ζ ′(s)ζ(s)

− ln qqs − 1

=1

s − 1+ O(1),

donc il suffit d’établir que chacun des autres termes tend versune limite finie lorsque s → 1+. Il est commode de remarquer,à ce stade, que, lorsque b �= 0, les séries L(σ, χb), absolumentconvergentes pour σ > 1, sont convergentes pour σ > 0. Celaprovient du fait que l’application n �→ b�(n), induit trivialementune injection de (Z/qZ)∗ dans lui-même, et donc, puisquel’ensemble est fini, une bijection. On en déduit en particulierque∑

1�n�q

χb(n) =∑

0�r�q−2

e2πir/(q−1) = 0 (1 � b � q − 2),

et, au vu de la décroissance de n �→ n−σ, la convergence de L(σ, χb)découle du classique critère d’Abel.(1)

Nous pouvons donc finalement énoncer que l’hypothèseL(1, χb) �= 0 (1 � b � q − 2) implique que toute progressionarithmétique a + qN avec (a, q) = 1 contient une infinité denombres premiers. Plus précisément, il découle de ce qui précèdeque, si les nombres L(1, χ) sont non nuls, on a∑

p≡a (mod q)

ln ppσ

=1

(q − 1)(σ − 1)+ O(1) (σ → 1+).

Par intégration en σ sur [α, 2] avec α > 1, on en déduit encoreque ∑

p≡a (mod q)

1pα

=1

q − 1ln( 1

α − 1

)+ O(1) (α → 1+).

1. Le critère d’Abel est rappelé au § 4.2, p. 117. Un argument analytique un peu plussophistiqué permet de montrer en fait la convergence de L(s, χb) dans le demi-plancomplexe σ > 0.

82

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Cette relation implique à son tour la divergence de la série∑p≡a (mod q)

1/p.

On voit ainsi que l’approche de Dirichlet pour les nombrespremiers en progressions arithmétiques est quantitativement demême nature que celle d’Euler pour l’ensemble de tous les nombrespremiers.

Il reste à établir que L(1, χb) �= 0 pour 1 � b � q − 2.L’analyse du problème montre rapidement que le cas où χb est

réel (i.e. b = 12(q − 1)) est plus profond et doit être considéré

séparément.Lorsque b �= 1

2(q − 1), on a χ2b �= χ0 et l’astuce de Mertens,

consistant à utiliser la positivité du polynôme trigonométrique3 + 4 cos ϑ+ cos 2ϑ pour montrer que ζ(1 + iτ) �= 0, fonctionneencore. En effet, en écrivant χb(p) = e2πiϑp et en notant que ledéveloppement eulérien de L(σ, χb) fournit la formule

ln L(σ, χb) =∑

p, ν�1

χb(p)νp−σν/ν (σ > 1),

on obtient que 3 ln ζ(σ)+4�e ln L(σ, χb)+�e ln L(σ, χ2b) � 0,

d’où

ζ(σ)3|L(σ, χb)|4|L(σ, χ2b)| � 1.

Puisque χ2b = χ2b �= χ0, la série L(s, χ2

b) est convergente ens = 1. Si L(1, χb) = 0, on en déduit que le membre de gauche estO(ζ(σ)3(σ−1)4) = O(σ−1) lorsque σ → 1+, ce qui contreditl’inégalité pour σ assez proche de 1.

Le cas b = 12(q−1) est notablement plus délicat. On a alors, avec

la notation du symbole de Legendre introduite au § 1.6 (p. 20),

χb(n) = χ(n) =(n

q

).

83

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La démonstration originale de Dirichlet est fondée sur le calculdes sommes de Gauss

G(n) :=∑

1�m�q−1

(mq

)e2πimn/q.

En effectuant le changement de variable consistant à sommer selonles valeurs de � = mn modulo q, on obtient en effet

G(n) = G(1)χ(n) (n � 1).(1)

Cela permet d’exprimer L(1, χ) comme une combinaison linéairefinie des nombres χ(n) pour 1 � n � q. Dirichlet obtenait ensuitela non nullité de L(1, χ) en faisant appel, d’une part, au calcul deG(1) et, d’autre part, à des formules établies par Gauss dans sontravail sur les polynômes cyclotomiques.

Nous n’emprunterons pas cette voie historique, et procéderonsde manière élémentaire et purement analytique en observant quel’on a

f (n) :=∑d |n

χ(d) =∏pν‖n

∑0�j�ν

χ(p)j =∏pν‖n

1 − χ(p)ν+1

1 − χ(p)� 0,

ainsi que l’on peut le déduire du simple fait que χ(p) ne prendque les valeurs 0 et ±1. On a de plus f (n2) � 1 pour tout entiern � 1. Cela implique, pour tout σ avec 0 < σ � 1,

F (σ) :=∑n�1

f (n)e−σn �∑

1�m�1/√

σ

e−1 � 16√

σ.

Par ailleurs, revenant à la définition de f , on peut aussi écrire

F (σ) =∑d�1

χ(d)∑m�1

e−σmd =∑d�1

χ(d)

eσd − 1·

1. La formule n’est initialement valable que lorsque (n, q) = 1. Elle persiste dans le cascontraire puisqu’alors G(n) = 0.

84

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

En invoquant une fois encore la convergence de la série L(1, χ) eten introduisant la fonction décroissante

ϑσ(d) :=1

σd− 1

eσd − 1,

il suit

F (σ) =L(1, χ)

σ−∑d�1

ϑσ(d)χ(d).

Par la règle de convergence d’Abel,(1) la série en d est ϑσ(1) 1lorsque σ → 0+. On a donc obtenu, pour une constanteconvenable A > 1,

L(1, χ) � σF (σ) − Aσ � 16

√σ − Aσ.

En choisissant convenablement σ (e.g. σ = 1144A−2), on obtient

bien que L(1, χ) > 0.Cette méthode a été étendue par Dirichlet au cas d’un module q

quelconque. Lorsque q = pν et p est un nombre premier impair,le groupe (Z/qZ)∗ est encore cyclique et l’on définit simplementles ϕ(q) caractères modulo q par

χb(n) := e2πib�(n)/ϕ(q) (0 � b � ϕ(q) − 1).

Le cas où q = 2ν est un peu plus compliqué : on pose

χb1,b2(n) = e2πi{b1�1(n)/2+b2�2(n)/2ν−2},

où �1(n) et �2(n) sont définis par la relation

n ≡ (−1)�1(n)5�2(n) (mod 2ν),

avec b1 = 0 ou 1, et 0 � b2 < 2ν−2. Dans la situation génériqued’un module q qui est le produit de puissances de nombres premiersdistincts, on forme simplement les produits des caractères relatifs à

1. Rappelée au § 4.2, p. 117.

85

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

ces différentes puissances. L’analyse précédente peut être étenduesans difficulté majeure et conduit à l’estimation quantitative∑

p�xp≡a (mod q)

1p∼ ln2 x

ϕ(q)(x → ∞).

La méthode de Dirichlet peut sans encombre être insérée danscelle de Riemann, menée à terme par Hadamard et La Vallée-Poussin. L’argument crucial d’absence de zéro sur la droite σ = 1doit bien entendu être étendu à toutes les fonctions L(s, χ), cequi peut être établi avec des moyens analogues à ceux que nousavons décrits plus haut pour traiter le cas du seul point s = 1.Cela conduit naturellement à la formule asymptotique annoncéeau début de ce paragraphe pour la fonction π(x; a, q).

Les développements plus récents ont surtout visé à préciserl’uniformité en q d’un tel résultat. Siegel a montré en 1936 que,pour chaque ε > 0, il existe une constante Cε > 0 telle queL(1, χ) � Cε/qε pour tout caractère χ non principal modulo q.On en déduit le théorème de Siegel–Walfisz : pour toute constanteA > 0, il existe une constante c = c(A) > 0 telle que l’on aituniformément pour x � 3, (a, q) = 1, 1 � q � (ln x)A,

π(x; a, q) =π(x)ϕ(q)

+ O(

xe−c√

ln x)

=li(x)ϕ(q)

+ O(

xe−c√

ln x).

Malheureusement la constante Cε du théorème de Siegel n’est pas« effective », autrement dit pas effectivement calculable si on donneà ε une valeur trop petite.(1)

Cela induit une semblable ineffectivité pour la constante c duthéorème de Siegel–Walfisz, qui n’est pas calculable si A � 1.Les meilleurs résultats effectifs connus reposent sur la théoriedes formes quadratiques réelles et la formule du nombre des

1. En l’état actuel des connaissances, on ne sait pas majorer numériquement Cε siε < 1

2 .

86

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

classes, due à Dirichlet. Des estimations de qualité très légèrementinférieure peuvent être obtenues, beaucoup plus simplement, parvoie analytique, grâce à l’inégalité de Pólya–Vinogradov (1918),stipulant que l’on a, pour tout caractère χ non principal modulo q,

maxx�1

∣∣∣∑n�x

χ(n)∣∣∣ � 2

√q ln q.

Les deux approches ne fournissent une formule asymptotique pourπ(x; q, a) que lorsque q � (ln x)A avec A < 2.

Ces questions d’ineffectivité sont pour le moins insolites. Nousnous proposons maintenant de lever un coin du voile. L’explicationrepose sur l’existence hypothétique d’un spectre ricanant nommé« zéro de Siegel » qui hante et épouvante cette partie de la théorieanalytique des nombres.

L’affaire mérite qu’on s’y attarde un instant. Les régions sanszéro connues pour les fonctions L(s, χ) sont essentiellement dutype

Dq = {s : σ � 1 − c/ ln(3 + q|τ |)}sauf pour au plus un caractère de module q, disons χ1, qui est réel ettel que L(s, χ1) possède au plus un unique zéro dans Dq, égalementréel, que nous désignerons par β1. Lorsque l’on évalue les sommes

ψ(x; χ) :=∑n�x

χ(n)Λ(n)

par intégration complexe, l’éventuel zéro de Siegel induit unecontribution supplémentaire égale à −xβ1/β1, de sorte qu’ontrouve finalement∑

n�xn≡a (mod q)

Λ(n) =x

ϕ(q)− χ1(a)xβ1

β1ϕ(q)+ O

(xe−c

√ln x)

uniformément pour, disons, q � e√

ln x, et où la constante positivec est effectivement calculable. L’estimation (ineffective) de Siegel

L(1, χ1) � Cε/qε

87

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

permet, par un simple calcul d’accroissements finis, de « repousser »le zéro au delà du point 1 − C2ε/q2ε (par exemple), et partantde traiter cette contribution comme un terme d’erreur lorsqueq�(ln x)A, quitte à choisir ε < 1/2A.

On conjecture bien entendu que le zéro de Siegel n’existe pas etqu’en fait les fonctions L(s, χ) ont, à l’instar de la fonction ζ(s),tous leurs zéros non triviaux sur la droite critique σ = 1

2 . C’estl’hypothèse de Riemann généralisée. Le cas échéant, elle fourniraitl’estimation

π(x; a, q) =li(x)ϕ(q)

+ O(√

x ln x)

uniformément pour x � 3, q � 1, (a, q) = 1.

Cette évaluation, bien que reposant sur une hypothèse très forte,ne fournit qu’un piètre résultat lorsque q � √

x. On peut espérerqu’elle est améliorable en moyenne, voire pour « presque tous » lesmodules q — en un sens à préciser. Dans cette voie de recherche,le meilleur résultat connu actuellement est le théorème de Bombieri& Vinogradov (1965) qui énonce que, pour toute constante A > 0,on a uniformément pour x � 3, Q � 1,∑

q�Q

max(a,q)=1

E(x; a, q) x(ln x)A

+√

x Q(ln Qx)4,

où l’on a posé E(x; a, q) := max3�y�x |π(y; a, q) − li(y)/ϕ(q)|.Ce résultat permet de « contourner » l’hypothèse de Riemann

généralisée dans nombre d’applications. Si l’on pouvait remplacerle terme Q(ln Qx)4 par

√Q (Qx)ε,(1) cela fournirait un succédané

supérieur à l’original dans bien des circonstances.

1. C’est la conjecture d’Elliott–Halberstam.

88

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

4. Le théorème de Green et Tao

Parmi toutes les conjectures relatives aux nombres premiers, l’unedes plus simples stipule que cette suite contient des progressionsarithmétiques arbitrairement longues. Comme indiqué dansl’avant-propos, la suite de 10 termes

199, 409, 619, 829, 1039, 1249, 1459, 1669, 1879, 2089

est un exemple de progression arithmétique (de raison 210) entière-ment composée de nombres premiers.

Un raisonnement probabiliste élémentaire vient à l’appui decette hypothèse : si un nombre entier de taille N est premier avecprobabilité approximativement 1/ ln N , la probabilité que

n, n + q, . . . , n + (k − 1)q

soient simultanément premiers est proche de 1/(ln N )k lorsque,disons, N < q � 2N et (n, q) = 1. Ainsi, le raisonnementstatistique suggère l’existence de ≈ N 2/(ln N )k progressions arith-métiques de longueur k dont tous les termes sont des nombrespremiers de taille N .

Le théorème de Green et Tao, qui fournit également une borneeffective (très grande) pour la valeur minimale N = Nk en deçàde laquelle nous sommes certains de trouver k nombres premiersen progression arithmétique, répond à une question ancienne,pour laquelle très peu de résultats partiels étaient connus : seul unthéorème de van der Corput (1939) correspondant à k = 3 étaitprécédemment disponible dans cette direction.

Deux autres conjectures toujours ouvertes impliquent le résultat :celle des nombres premiers jumeaux généralisée de Hardy etLittlewood (cf. chap. 5, p. 148) et celle d’Erdos et Turán (1936) selonlaquelle tout ensemble d’entiers dont la série des inverses divergecontient des progressions arithmétiques arbitrairement longues.

Étant donnée une fonction f : (N∗)r → C, notons

EN (f ) :=1

N r

∑1�n1,...,nr�N

f (n1, . . . , nr)

89

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

la moyenne de ses valeurs sur les N r premiers r-uples de nombresentiers. Posons encore

fk(m, n) :=∏

0�j<k

f (n + mj).

Un célèbre théorème de Szemerédi (1975) s’énonce, dans sa versionfinie, sous la forme suivante : si δ > 0 et k ∈ N∗ sont donnés, si N estun nombre entier assez grand, et si f = 1A est la fonction indicatriced’un ensemble d’entiers tel que EN (f ) > δ, alors EN (fk) > c(δ, k)pour une constante convenable c(δ, k) > 0, ne dépendant ni de f , nide N .(1)

Cela signifie en particulier qu’un ensemble d’entiers assezdense contient nécessairement des progressions arithmétiquesarbitrairement longues.

Le premier travail de Green et Tao a consisté à étendre lechamp de cet énoncé à des fonctions f plus générales. Une étapesignificative avait préalablement été franchie par Gowers (2001),grâce à une approche reposant sur la démonstration ergodique(2)

de Furstenberg (1982) du théorème de Szemerédi : le résultat restevalable pour toute fonction f à valeurs dans [0, 1].

Green et Tao prouvent ensuite que l’énoncé de type Szemerédipersiste si, pour chaque N , on a

0 � f (n) � νN (n) (1 � n � N )

où νN est une fonction de poids dite «pseudo-aléatoire» en ce sensqu’elle vérifie

EN (νN ) = 1 + o(1) (N → ∞)

et d’autres conditions de bon comportement statistique.(3)

1. Il est à noter que EN (f ) est évalué avec r = 1, alors que l’on choisit évidement r = 2pour calculer EN (fk).2. La théorie ergodique est une théorie mathématique née dans les années 1930 etreposant sur une hypothèse fondamentale de nature statistique.3. Ces conditions portent sur les produits de formes linéaires et sur les corrélations.Donner les définitions précises nous entraînerait largement hors des limites de cetopuscule.

90

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

C’est la démonstration de cette généralisation qui occupe la plusgrande partie de l’article de Green et Tao.

Les deux auteurs établissent ensuite l’existence d’un poidspseudo-aléatoire et d’une fonction f satisfaisant aux conditionsprécédentes et tels que f soit nulle hors de l’ensemble P desnombres premiers.

Cette seconde partie, qui participe d’une approche plus classiquede la théorie analytique des nombres, repose sur des techniques decrible voisines de celles qui sont exposées au § 6 infra. Nous n’endirons pas plus.

5. Le modèle de Cramér

S’il est souvent difficile de répondre aux questions les plus naturellesconcernant les nombres premiers, il est parfois malaisé de se fairemême une idée de ce que devrait être la réponse exacte. Ayant étudiéla répartition des nombres premiers depuis les années 1920, Craméra proposé à la fin des années 1930 une méthode simple et fascinantepour forger des conjectures sur les nombres premiers : la suite desnombres premiers se comporte comme une suite aléatoire soumise à lamême contrainte de croissance. Formalisons un peu. Le théorèmedes nombres premiers nous indique que la probabilité pour qu’unentier de taille n soit premier est proche de 1/ ln n.(1) Désignant par{Xn}∞n=2 une suite de variables aléatoires indépendantes prenantles valeurs 0 et 1 avec

P(Xn = 1) = 1/ ln n (n � 3), (2)

la suite aléatoire

(3.2) S := {n � 2 : Xn = 1}

1. La quantité 1/ ln n apparaît naturellement ici comme la dérivée en x = n de li(x).2. On peut poser, par exemple, P(X2 = 1) = 1 pour fixer les idées, cette valeurn’ayant en fait pas d’influence notable. Ici et dans la suite, nous utilisons la lettre Ppour désigner la probabilité.

91

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

constitue donc pour Cramér un modèle stochastique de la suitedes nombres premiers.

En termes plus intuitifs, on peut considérer le dispositif suivant.On dispose d’une suite infinie (ou d’un très grand nombre) d’urnesnumérotées, disons U3, U4, etc. L’urne Un contient une uniqueboule blanche et environ ln n boules noires. On tire au hasard uneboule de chaque urne et l’on affecte l’entier n à la suite S si la bouleissue de Un est blanche. La suite S modélise les nombres premiers.Bien entendu, pour chaque tirage particulier la suite S posséderades propriétés spécifiques qui la différenciera considérablementde la suite P de tous les nombres premiers. Cependant, si unepropriété s’avère suffisamment insistante pour être réalisée presquesûrement lorsque l’on multiplie les tirages, on conjecturera avecCramér qu’elle est également partagée par P.

Étant donné un ensemble d’entiers A, désignons par πA(x) lecardinal de A ∩ [1, x]. Lorsque S est défini par (3.2), πS(x) estdonc la variable aléatoire égale au nombre des entiers n n’excédantpas x et tels que Xn = 1. Ainsi πS(x) est un modèle aléatoirede π(x) = πP(x), et il est facile de montrer que l’on a presquesûrement (i.e. avec probabilité 1)

πS(x) = li(x) + ϑS(x)

√2x

ln2 xln x

où ϑS(x) oscille asymptotiquement entre −1 et 1.C’est une première confirmation, éclatante, de la pertinence du

modèle de Cramér : Littlewood a montré(1) que l’on a

ϑP(x) = Ω±(

ln3 x/√

ln x ln2 x)

inconditionnellement, et l’hypothèse de Riemann implique

ϑP(x) = O((ln x)3/2/(ln2 x)1/2

).

Une autre conséquence du modèle de Cramér concernela différence entre les nombres premiers consécutifs. Posons

1. Voir le § 2.7, p. 69.

92

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

dn := pn+1 − pn, où pn désigne le n-ième nombre premier. Onremarque incidemment que la suite {dn}∞n=1 est non bornée puisqueles nombres k! + j (2 � j � k) sont tous composés. On a∑

n<N

dn = pN − 2 ∼ N ln N (N → ∞),

d’après le théorème des nombres premiers, donc

lim infn→∞

dn/ ln n � 1 � lim supn→∞

dn/ ln n.

Maintenant, puisque la probabilité pour qu’un entier m de]pn, 2pn] soit premier est proche de 1/ ln pn, la probabilité Pn,k

de l’événement dn � k satisfait, sous réserve d’indépendance, à

Pn,k ≈ (1 − 1/ ln pn)k ≈ e−k/ ln n.

Lorsqu’on choisit k = k(n) = δ(ln n)2, on obtient doncPn,k(n) ≈ n−δ, de sorte que la série

∑n Pn,k(n) diverge pour δ < 1

et converge pour δ > 1. Un résultat classique de la théorie desprobabilités, le lemme de Borel–Cantelli, permet d’en déduire queles nombres premiers aléatoires du modèle de Cramér satisfont à

lim supn→∞

dn/(ln pn)2 = 1.

L’assertion légèrement plus faible

dn (ln pn)2

est célèbre sous le nom de conjecture de Cramér.

On peut encore utiliser le modèle de Cramér pour prévoir lecomportement de la fonction π(x) dans les petits intervalles.

En utilisant le fait bien connu que la loi binomiale converge verscelle de Poisson,(1) on obtient facilement que, posant y = λ ln x,

1. Si les Xn (1 � n � N ) sont des variables aléatoires de Bernoulli, indépendantes etde même loi P(Xn = 1) = 1−P(Xn = 0) = λ/N , et si l’on pose SN :=

∑1�n�N Xn,

alors on a, lorsque N → ∞ et λ reste fixé, lim P(SN = k) = e−λλk/k!.

93

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

on a avec probabilité 1

|{x � ξ : πS(x + y) − πS(x) = k}| ∼ ξe−λ λk

k!(ξ → ∞).

Gallagher a montré en 1966 que la relation précédente esteffectivement réalisée pour S = P sous réserve de la validitéd’une forme forte de la conjecture des nombres premiers jumeauxgénéralisée.(1)

Ainsi le modèle de Cramér semble être en cohérence à la foisavec l’hypothèse de Riemann (cas des intervalles longs) et avec laconjecture des nombres premiers jumeaux (cas des intervalles trèscourts : y = λ ln x). Il ne faut cependant pas trop demander : lemodèle de Cramér prévoit que p et p + 2 (voire p et p + 1 !) sontsimultanément premiers avec probabilité 1/(ln x)2, et n’intègredonc pas la conjecture de Hardy & Littlewood mentionnée auChapitre 1 (§ 1.11, p. 41).

Il n’est pas difficile de voir que le modèle de Cramér impliqueque l’on a presque sûrement

πS(x + y) − πS(x) = li(x + y) − li(x) + O(√

y) ∼ y/ ln x

dès que y/(ln x)2 → ∞, avec y � x. En 1943, Selberg apartiellement confirmé la validité du modèle sur ce point enmontrant, sous l’hypothèse de Riemann, qu’avec de telles valeursde y on a, pour presque tous les entiers x,

π(x + y) − π(x) ∼ y/ ln x.

Cependant, à la surprise générale, Maier a prouvé en 1985que si y = (ln x)α avec α > 2, cette relation n’est pas satisfaitelorsque x → ∞. Il a en fait établi l’existence d’une constanteδ = δ(α) > 0 telle que chacune des inégalités

π(x + y) − π(x) ><(1 ± δ)

yln x

(y = (ln x)α

),

soit vérifiée pour une infinité de valeurs entières de x.

1. Voir le Chapitre 5.

94

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Ce résultat, qui représente la première réfutation du modèlede Cramér, mérite quelques développements. Il est fondé sur ladisparité, déjà constatée au Chapitre 1, entre le terme principal ducrible d’Ératosthène et la taille réelle de la fonction π(x).

Entrons un peu dans les détails. Le langage des probabilités, etnotamment celui des probabilités conditionnelles(1) sera particuliè-rement bien adapté à notre propos. Rappelons la notation P−(n)pour le plus petit facteur premier d’un entier n, avec la conventionP−(1) = ∞. Nous avons vu au Chapitre 1, comme conséquencedu crible de Brun, que l’on a (cf. § 1.11, p. 39)

Φ(x, z) :=∑

n�x, P−(n)>z

1 ∼ x∏p�z

(1 − 1/p)

si x → ∞ et z = xo(1). Lorsque z → ∞ sous cette dernièrecondition, on peut donc énoncer que l’on a, pour un entier n detaille x,

P(n ∈ P | P−(n) > z

)∼ P(n ∈ P)

P(P−(n) > z)

∼ 1/ ln x∏p�z(1 − 1/p)

∼ eγ ln zln x

,

où la dernière équivalence résulte de la formule de Mertens (§ 1.10,p. 33).

En sommant cette relation sur les Φ(x + y, z) − Φ(x, z) entiersn ∈]x, x + y] tels que P−(n) > z, il est donc naturel de supputerque

π(x + y) − π(x) ∼ eγ ln zln x

{Φ(x + y, z) − Φ(x, z)}.

Cela étant, posons M :=∏

p�z p. Comme la conditionP−(n) > z est déterminée par la classe de congruence de n

1. Nous noterons P(A | B) la probabilité de l’événement A sachant que B est réalisé.

95

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

modulo M , on a, si x ≡ 0 (mod M),

Φ(x + y, z) − Φ(x, z) = Φ(y, z).

À ce stade, Maier utilise un résultat asymptotique classique(1)

concernant la fonction Φ(y, z) et qui précise le « changement dephase » entre le comportement de type crible (où les différentesconditions de divisibilité modulo les nombres premiers p � zsont asymptotiquement indépendantes) et le comportement detype π(x) (où un facteur correctif 1

2eγ doit être introduit pourtenir compte de la dépendance) : on a, uniformément pouryε � z � √y, y = zu,

Φ(y, z) ∼ yω(u)

ln z,

où ω désigne la fonction de Buchstab, définie comme l’uniquesolution continue sur [2,∞[ de l’équation différentielle auxdifférences

(uω(u))′ = ω(u − 1) (u > 2)

avec la condition initiale uω(u) = 1 (1 � u � 2).On a clairement limu→∞ ω(u) = e−γ , puisque la formule

précédente doit recouvrir celle du crible de Brun lorsque z est« petit ». Il s’avère, ainsi que l’a établi Iwaniec, que ω(u) oscilleindéfiniment autour de sa limite : en fait ω(u) − e−γ change designe au moins une fois dans chaque intervalle de longueur 1.

En rassemblant nos estimations, nous obtenons donc la conjec-ture suivante, dont les raisonnements heuristiques qui précèdentconstituent en fait une ébauche de démonstration,

π(x + y) − π(x) ∼ eγω(u)y

ln x

(x ≡ 0 (mod M), y = zu

).

Il reste, formellement, à choisir z = ln x et u égal à un extremumde ω pour obtenir le théorème de Maier.

1. Dû au mathématicien soviétique A.A. Buchstab, dans les années trente.

96

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Pour établir rigoureusement son résultat, Maier introduit unélégant argument de moyennes croisées qu’il nous entraînerait troploin de décrire dans cet opuscule. Nous nous contentons d’indiquerqu’il repose de manière cruciale sur la régularité de la répartitiondes nombres premiers dans les progressions arithmétiques.(1)

Le théorème de Maier, qui a été étendu de diverses manières,(2)

nous incite à amender le modèle de Cramér, en remplaçant l’heu-ristique P(n ∈ P) = 1/ ln n par

P(n ∈ P | P−(n) > z) =1

ln n

∏p�z

(1 − 1/p)−1 (z ≈ ln n).

Un tel modèle modifié se trouve ainsi en cohérence à la foisavec la conjecture des nombres premiers jumeaux généralisée etl’hypothèse de Riemann. Il laisse supposer que la conjecture deCramér forte

lim supn→∞

dn/(ln pn)2 = 1

est fausse et doit être remplacée par

lim supn→∞

dn/(ln pn)2 = 2e−γ.

Les meilleurs résultats qualitatifs connus concernant les varia-tions de dn sont celui de Rankin (1938),

lim supn→∞

dn

ln pn ln2 pn ln4 pn/(ln3 pn)2> 0,

et celui de Goldston, Pintz et Yıldırım (2005),

lim infn→∞

dn/ ln pn = 0,

améliorant le résultat historique d’Erdos (1940), stipulant que lalimite inférieure ci-dessus est < 1.

1. Voir le § 3 supra.2. Notamment, par Friedlander, Granville, Hildebrand et Maier, pour fixer des limitesinattendues aux domaines de validité des théorèmes de type Siegel–Walfisz et Bombieri–Vinogradov.

97

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

6. Le théorème de Goldston, Pintz et Yıldırım

Nous nous proposons ici de revenir sur la démonstration du résultatde Goldston, Pintz et Yıldırım concernant les petits écarts entrenombres premiers. Comme annoncé au paragraphe précédent, cestrois auteurs ont établi en 2005 que, pour tout ε > 0, l’inégalité

(3.3) dn < ε ln n

a lieu pour une infinité d’entiers n. Cette avancée majeure dansnotre compréhension des nombres premiers a ensuite été raffinée :dès 2007, les trois coauteurs ont établi la relation

lim infn→∞

dn√ln n(ln2 n)2

< ∞.

Nous allons à présent décrire le principe de la preuve de larelation (3.3), sans toutefois entrer dans les détails calculatoires.

Pour N ∈ N, posons IN :=]N , 2N ]. L’idée initiale consiste àchercher une fonction arithmétique positive ou nulle F telle que

(3.4) SN :=∑n∈IN

R(n)F (n) > QN :=∑n∈IN

F (n) (N → ∞)

avecR(n) :=

∑1�h�H

1P(n + h).

Dan Goldston, János Pintz et Cem Yıldırım (2005)

98

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

En effet, (3.4) implique l’existence d’un p ∈ ]N , 2N + H ] telque p# − p � H , où p# désigne le nombre premier suivantimmédiatement p.

Il est tentant de choisir F (n) := R(n), ou F (n) := 1{R(n)�k}(n)pour un entier k bien choisi. Cependant, dans le premier cas,l’évaluation du membre de gauche de (3.4) reviendrait à résoudre,au moins en moyenne, la conjecture des nombres premiers jumeauxgénéralisée, alors que, dans le second cas, on a affaire à unesous-somme de la précédente — un problème a priori plus difficile.

Il est donc nécessaire de rechercher une fonction F moinsrestrictive. Pour atteindre notre but, il est néanmoins natureld’imposer

F (n) � 1{R(n)�k}(n),

par exemple sous la forme

(3.5) F (n) � g(n; H) :=∏

1�j�k

1P(n + hj)

lorsque H := {h1, . . . , hk} est un sous-ensemble de [1, H ]∩N.(1)

Or, le crible de Selberg, dont la première version date de 1947,fournit une méthode pour minimiser la quantité QN lorsque Fappartient à une certaine classe et sous la contrainte (3.5). L’idéede Selberg, très simple et très efficace, consiste à chercher F sousla forme

F (n; H) :=( ∑

d |P(n;H)

λd

)2

où l’on a posé P(n; H) :=∏

h∈H(n + h) =∏

1�j�k(n + hj), etoù la fonction d �→ λd vérifie

λ1 = 1, λd = 0 (d > R).

1. Nous verrons qu’il s’avérera en fait nécessaire d’introduire plusieurs tels ensemblesH afin de tirer avantage d’un effet de moyenne.

99

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Si R � N , on voit que seul d = 1 intervient dans la sommelorsque g(n; H) = 1, d’où (3.5), puisque F (n; H) � 0 pour toutentier n.

Avec ces notations, QN = QN (H) est une forme quadratiquedes variables λd (1 � d � R). Le calcul de minimisation effectuépar Selberg montre que le choix

(3.6) λd := μ(d)

(ln+ R/d

ln R

)k

,

où l’on a posé ln+ x = max(0, ln x), est proche de l’optimum.On obtient ainsi, grâce à un calcul classique faisant intervenir

les sommes de fonctions multiplicatives,

(3.7) QN (H) ∼ S(H)k!N

(ln R)k,

avec la notation traditionnelle

(3.8) S(H) :=∏

p

(1 − νH(p)

p

)(1 − 1

p

)−k

où νH(p) désigne le nombre de résidus distincts occupés par leséléments de H modulo p. On note que νH(p) = k dès que p > H ,ce qui assure la convergence du produit.

Il reste à évaluer SN = SN (H). En ignorant les termesd’erreur issus du théorème des nombres premiers en progressionsarithmétiques, nous pouvons écrire

TN (H) :=∑n∈IN

1P(n + h)F (n; H)

≈∑

1�h�H

∑1�d ,t�R

λdλt�([d , t]; h,H)Nϕ([d , t]) ln N

où �(m; h,H) désigne le nombre de classes résiduelles a modulom telles que (a + h, m) = 1 (pour assurer la compatibilité de la

100

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

condition n + h ∈ P) et −a ∈ H (mod m), et où le facteur ln Ndu dénominateur prend en compte le fait que la sommation portesur des nombres premiers translatés (n + h ∈ P). On a donc

�(p; h,H) = νH∪{h}(p) − 1 (p � R)

et�(m; h,H) =

∏p|m

�(p; h,H)

lorsque m est un entier sans facteur carré.Cette technique prometteuse doit en fait être légèrement

modifiée pour conduire à la conclusion souhaitée SN > QN . Eneffet, le choix (3.6) pour les λd minimise bien QN (H) et donc aussi∑

H QN (H), mais notre problème consiste en réalité à maximiserle rapport (∑

H

SN (H))/(∑

H

QN (H)).

Le remède est cependant à portée de main. En posant

λd := μ(d)( ln+ R/d

ln R

)k+r

où r est un paramètre entier positif, et en utilisant le résultat deGallagher (1976) ∑

H⊂[1,H ]|H|=k

S(H) ∼(

Hk

),

nous obtenons d’une part, par un raisonnement analogue à celuiqui conduit à (3.7),

∑H⊂[1,H ]|H|=k

QN (H) ∼ H k(k + 2r)!Nk!(ln R)k+2r

101

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

et d’autre part∑H⊂[1,H ]|H|=k

SN (H) ∼ H k(k + 2r)!Nk!(ln R)k+2r ln N

(H+

2k(2r + 1) ln R(r + 1)(k + 2r + 1)

).

De plus, ces évaluations sont uniformes, pour tout k fixé, dèsque H ln N et R � N 1/4−ε, cette dernière restrictionprovenant essentiellement des conditions de validité du théorèmede Bombieri–Vinogradov énoncé p. 88.

En choisissant H := η ln N , où η est un paramètre positifarbitrairement petit, ε assez petit, R :=

⌊N 1/4−ε

⌋, k assez grand

et r := �√

k�, nous obtenons bien∑H⊂[1,H ]|H|=k

SN (H) >∑

H⊂[1,H ]|H|=k

QN (H)

pour N assez grand.

7. Équirépartition modulo unL’étude de l’adéquation de la répartition des nombres premiersavec le modèle stochastique de Cramér peut être poursuivie etgénéralisée en analysant la distribution des nombres premiers relati-vement à d’autres types de mesures. Le domaine de l’équirépartitionmodulo un, qui constitue une branche à part entière de la théoriedes nombres, fournit à cet égard un vaste champ d’investigations.

Une suite {un}∞n=1 à valeurs dans [0, 1[(1) est dite équirépartiemodulo 1 si chaque sous-intervalle de [0, 1[ reçoit asymptotique-ment une quote-part équitable des valeurs de un, en d’autres termessi l’on a pour tous α, β avec 0 � α < β < 1,

limN→∞

(1/N )|{n � N : α < un � β}| = β − α.

(Une telle suite est donc dense dans [0, 1[.) Plus généralement, ondit qu’une suite {un}∞n=1 à valeurs réelles est équirépartie modulo 1

1. Il serait plus exact de parler ici du tore R/Z, mais nous n’aurons pas l’usage de cettesubtilité conceptuelle.

102

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

si la suite 〈u1〉 , 〈u2〉 , . . . de ses parties fractionnaires satisfait à lacondition précédente.

Le résultat de base de la théorie est le critère d’équirépartitiond’Hermann Weyl (1916) qui énonce que la suite réelle {un}∞n=1 estéquirépartie modulo 1 si, et seulement si, l’une des deux conditionséquivalentes suivantes est réalisée :

(i) limN→∞

1N

∑n�N

f (〈un〉)=∫ 1

0f (x) dx (∀ f ∈ R[0, 1[),

(ii)∑n�N

e2πiνun = o(N ) (N → ∞, ν = 1, 2, . . .),

où, dans (i), nous désignons par R[0, 1[ l’espace des fonctionsintégrables au sens de Riemann sur [0, 1[.

On peut donner rapidement une idée de la démonstration enobservant d’abord que la définition de l’équirépartition modulo 1correspond à la condition (i) pour les fonctions indicatrices d’in-tervalles, dont les combinaisons linéaires permettent d’approcherconvenablement les éléments de R[0, 1[. Ensuite, la condition(ii), qui est clairement un cas particulier de (i), contient en faitle cas général puisque les combinaisons linéaires d’exponentiellesx �→ e2πiνx (ν ∈ Z) permettent d’approcher les fonctions pério-diques continues, et donc aussi les fonctions Riemann-intégrables.

Il est immédiat de déduire du critère de Weyl que la suiten �→ 〈nα〉 est équirépartie modulo 1 pour tout nombre αirrationnel : les sommes d’exponentielles de (ii), qu’on peut cal-culer explicitement puisqu’elles correspondent à des progressionsgéométriques, sont bornées.

Considérons la suite {ln n}∞n=1. La somme trigonométriqueassociée s’écrit

SN =∑n�N

n2πiν = N 2πiν∑n�N

( nN

)2πiν

∼ N 1+2πiν

∫ 1

0x2πiν dx =

N 1+2πiν

1 + 2πiν(N → ∞),

103

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

d’après la théorie de l’intégrale de Riemann. Ainsi SN /N netend pas vers 0, et la suite {ln n}∞n=1 n’est donc pas équirépartiemodulo 1. Nous observons cependant qu’elle est dense modulo 1puisque ln n → ∞ et ln(n + 1) − ln n → 0 lorsque n → ∞.

On peut montrer, grâce à une méthode générale d’estimationde sommes trigonométriques mise au point par van der Corputdans les années vingt, que la suite {αn ln n}∞n=1 est équirépartiemodulo 1 pour tout α �= 0. Cela suggère, au vu du théorèmedes nombres premiers, qu’il en va de même de la suite {αpn}∞n=1lorsque α ∈ R � Q.

Le critère de Weyl nous enseigne que le comportement dessommes d’exponentielles ∑

n�N

e2πiνun

reflète la nature de la répartition de {un}∞n=1 modulo 1. Maispeut-on également y lire le caractère aléatoire de la suite ?

Il est acquis qu’une suite aléatoire est presque sûrementéquirépartie modulo 1. Si {Xn}∞n=1 est une suite de variablesaléatoires indépendantes et uniformément réparties sur [0, 1[,(1) laloi du logarithme itéré des probabilités fournit même l’estimationpresque sûre

lim supN→∞

|∑

n�N e2πiνXn|√

2N ln2 N= 1 (ν �= 0).

Cela suggère que le comportement de sommes d’exponentiellesportant sur les nombres premiers, et en particulier celui de

SN (α) :=∑n�N

e2πiαpn ,

contient une information capitale sur la nature stochastique de larépartition des nombres premiers.

1. En d’autres termes, P(Xn � z) = z (0 � z � 1).

104

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Non seulement la validité de l’estimation SN (να) = o(N )pour tout entier ν �= 0 équivaut à l’équirépartition de {αpn}∞n=1modulo 1, mais encore la qualité de l’évaluation effective nouspermet, le cas échéant, de préciser si ce résultat d’équirépartitiondoit être interprété comme un signe de régularité déterministe oud’irrégularité aléatoire pour la suite {pn}∞n=1.

En effet, une suite {un}∞n=1 peut être équirépartie modulo 1pour plusieurs raisons fondamentalement distinctes. Nous avonsvu plus haut que le caractère aléatoire en est une. Considérons,à l’opposé, le cas de la suite {nα}∞n=1 avec α irrationnel. Lessommes d’exponentielles sont alors aussi petites que possible, etl’équirépartition provient de la parfaite régularité de la suite n �→ n.D’une manière générale, si le nombre irrationnel α est approchépar un rationnel réduit a/q, la partie fractionnaire 〈unα〉, lorsqueun ∈ Z, est proche de rn/q où rn est le reste de aun modulo q.Dans le cas de la suite un = n, ces restes décrivent uniformémentles entiers de 0 à q − 1, et cela explique l’équirépartition.

Bien entendu, une suite peut aussi être très régulière sans pourautant être équirépartie modulo 1 : la suite nulle est un exempletrivial et nous avons mentionné plus haut le cas moins évident dela suite {ln n}∞n=1.

(1)

L’argument d’approximation des irrationnels par des rationnelsprésenté plus haut pour justifier l’équirépartition modulo 1 de lasuite {nα}∞n=1 (α ∈ R � Q) peut à l’évidence être transposé à lasuite {αpn}∞n=1 : on fait maintenant appel au théorème de Dirichletqui assure, pour tout q, une bonne répartition des pn dans lesclasses de congruences admissibles modulo q.(2) L’équirépartitionde la suite {αpn}∞n=1 a été essentiellement établie par Vinogradov(1937) dans sa démonstration que tout entier impair assez grand

1. Le défaut d’équirépartition tient alors à la lenteur de croissance, qui imprime à lasuite un caractère « stationnaire », même modulo 1.2. Cet argument heuristique n’est valable que dans les cas « non pathologiques » et doitêtre utilisé avec précaution : Meijer & Sattler (1972) ont construit une suite d’entiers{un}∞n=1 qui est bien répartie modulo q pour tout q mais telle que {unα}∞n=1 ne soitéquirépartie modulo 1 pour presque aucun α.

105

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

est somme d’au plus trois nombres premiers — ce qui constitue,encore aujourd’hui, le pas le plus significatif vers la conjecture deGoldbach.(1) La preuve, dont l’objectif est donc d’établir la relationasymptotique

SN (α) = o(N ) (N → ∞)

pour tout irrationnel α fixé, se scinde naturellement en deux selonla taille du dénominateur q � QN d’une approximation a/q de αtelle que (a, q) = 1, |α− a/q| � 1/qQN ,(2) où QN = N/(ln N )A

pour une constante A arbitrairement choisie.Si q � (ln N )A, on peut faire appel au théorème de Siegel–

Walfisz pour estimer

SN (a/q) =∑

1�b�q

e2πiab/qπ(pN ; b, q).

Grâce à l’identité de Ramanujan∑

1�b�q(b,q)=1

e2πiab/q = μ(q), il suit

SN (a/q) =Nμ(q)

ϕ(q)+ O

(N e−c

√ln N

).

Posant β := α − a/q et Rn := Sn(a/q) − nμ(q)/ϕ(q), on endéduit

SN (α) =∑n�N

e2πiβpn{Sn(a/q) − Sn−1(a/q)}

=∑n�N

O( 1ϕ(q)

)+∑n�N

e2πiβpn{Rn − Rn−1}.

1. Voir le Chapitre 5, p. 152.2. L’existence de a/q est assurée par un théorème classique de Dirichlet établi grâce auprincipe des tiroirs.

106

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

La première somme en n est clairement N/ϕ(q). La secondevaut ∑

n<N

Rn{e2πiβpn − e2πiβpn+1} + RN e2πiβpN

∑n<N

|Rn| |β|(pn+1 − pn) + |RN |

N e−c√

ln N( pN

qQN+ 1

) N

q,

de sorte que, finalement,

SN (α) N/ϕ(q).

Cette majoration est pleinement acceptable puisque l’irrationalitéde α implique que q, donc aussi ϕ(q), tend vers l’infini avec N .

Si q > (ln N )A, la technique précédente est rendue caduquepar notre ignorance de la répartition des nombres premiers dansles progressions arithmétiques, et il faut recourir à un argumentindirect global. L’idée essentielle consiste à introduire une identitécombinatoire (analogue à celle du crible d’Ératosthène) permettantd’exprimer SN (α) au moyen de sommes du type∑

m

∑n

ambne2πimnα,

où m et n sont des entiers ordinaires, astreints à parcourir certainsintervalles, et am, bn sont des fonctions arithmétiques de taillescontrôlées.

Il existe à ce jour trois familles d’identités fournissant desdécompositions utilisables dans ce contexte, dont les versionsinitiales sont dues respectivement à Vinogradov (1937), Vaughan(1977) et Daboussi (1996).

Il nous entraînerait trop loin de décrire ici les formulescorrespondantes. Nous nous contenterons d’indiquer que les deuxdernières ont permis une considérable simplification de la méthodede Vinogradov, ainsi du reste qu’une amélioration des bornes

107

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

obtenues. La méthode de Vaughan, par exemple, fournit, dès que|α − a/q| � 1/q2, (a, q) = 1,

SN (α) (ln N )4{

N/√

q + N 4/5 +√

Nq}.

Choisissant A = 2B + 8, et donc QN = N/(ln N )2B+8, nouspouvons ainsi énoncer que l’on a, pour toute constante B > 0,

SN (α) N/ϕ(q) + N/(ln N )B,

où a/q est une approximation rationnelle de α telle que q � QN ,(a, q) = 1, |α − a/q| � 1/qQN .

Bien qu’à notre connaissance aucun résultat de minoration de|SN (α)| ne soit connu, on conjecture généralement que la suite{αpn}∞n=1 est plus aléatoire que déterministe et partant que l’ordrede grandeur de SN (α) est usuellement comparable à

√N . La

majoration issue de la méthode de Vaughan fournit certainement,pour tout ε > 0, une borne Oε(N 4/5+ε) lorsque les « bonnes »approximations rationnelles de α ont de « grands » dénominateurs— ce qui est le cas de presque tous les nombres réels, et en particulierdes nombres réels algébriques.(1)

8. Vision géométrique

En l’absence de résultats complets sur la répartition modulo 1des nombres premiers, on peut soutenir l’intuition par desconstructions géométriques. Étant donnée une suite u := {un}∞n=1de nombres réels, on construit une ligne polygonale L(u) dontles sommets successifs sont les points zN (N � 0) définis dans leplan complexe par

zN :=∑

1�n�N

e2πiun (N � 0).

On note que chaque côté de L(u) est de longueur unité.

1. Rappelons qu’un nombre réel est dit algébrique s’il est racine d’un polynôme àcoefficient entier. Un nombre qui n’est pas algébrique est dit transcendant. Ainsi

√2

est algébrique alors que π et e sont transcendants.

108

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

D’après le critère de Weyl, si la suite u est équirépartie modulo 1, ona zN = o(N ), donc la courbe L(u) ne s’éloigne pas trop rapidementde l’origine. La visualisation de L(u) illustre en quelque sorte laqualité de la répartition modulo 1, et pourra mettre en évidence desphénomènes cachés ou difficiles à établir directement par le calcul.

Considérons la suite {nα}∞n=1 avec α ∈ R � Q. Nous savonsqu’il y a équirépartition modulo 1. Les premières valeurs de lasuite réduite sont les suivantes (pour α =

√2).

n 1 2 3 4 5 6 7 8 9

103⟨n√

2⟩

414 828 242 555 71 485 899 313 727

Les points un semblent remplir l’intervalle [0, 1[ de façondense. De fait, l’allure de L(u) est extrêmement structurée, cequi conforte notre analyse du paragraphe précédent selon laquellel’équirépartition de {nα}∞n=1 est de nature déterministe.

Ainsi qu’on peut le montrer aisément, L(u) est une « étoile » àune infinité de branches. Elle est dense dans la couronne centrée aupoint 1

2(−1 + i/ tan πα) dont les cercles limites ont pour rayonsrespectifs 1/|2 tan πα| et 1/|2 sin πα| — voir Figure 1. L’alluregénérale ne dépend que faiblement de la valeur de α.

Figure 1∑200n=1 e2iπn

√2

109

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Dans le cas de la suite {αn ln n}∞n=1, la lecture des valeurs prisesdonne, plus encore que pour la suite précédente, l’impression d’unengendrement aléatoire. Cependant la courbe L(n �→ αn ln n) estremarquablement bien structurée, ainsi que l’atteste la Figure 2,sur laquelle on a tracé, pour α =

√2, les 104 premiers côtés.

-30

-20

-10

0

10

20

30

40

50

60

-80 -60 -40 -20 0 20 40

Figure 2∑10000n=1 e2iπ

√2n ln n

L’aspect spiralé est facile à interpréter : à cause de la faiblecroissance de ln n, la courbe se comporte localement comme lacourbe associée à {nαN}∞n=1 où αN ≈ α ln N (mod 1) pour n detaille N . La courbe se présente donc comme une succession decouronnes, liées par des portions quasi rectilignes, correspondantaux valeurs de N telles que αN ≈ 0 (mod 1).

La courbe L(n �→ α �n ln n�), qui pourrait a priori ressemblerplus encore à L(n �→ αpn), présente le même type de structureque la précédente : voir la Figure 3.

L’expérimentation fait immédiatement apparaître un phé-nomène de nature profondément différente pour la courbeL(n �→ αpn) — cf. Figure 4.

Les spirales ont disparu et la comparaison avec une suite aléatoire(Figure 5) est assez frappante. On retrouve ainsi, malheureusementsans pouvoir le démontrer, que les nombres premiers semblentoccuper tout le hasard qui leur est imparti.

110

RÉPARTITION STOCHASTIQUE DES NOMBRES PREMIERS

Figure 3∑10000n=1 e2iπ

√2�n ln n

Les théories du chaos nous enseignent que certains phénomènessont instables. Une faible variation dans les données initialesprovoque de formidables différences de comportement final.La situation est analogue ici. Les paramètres de la répartitionglobale des nombres premiers ne permettent pas d’en décrire lesirrégularités locales.

Figure 4∑10000n=1 e2iπ

√2pn

111

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

-10

0

10

20

-30

-30

-40

-50

-60

-60 -40 -20 0 20 40 60

Figure 5∑10000n=1 e2iπ

√2 aléa(n)

112

Chapitre 4

Une preuve élémentairedu théorème des nombres

premiers

1. Introduction

Après les preuves du théorème des nombres premiers, en 1896, parHadamard et La Vallée-Poussin, les mathématiciens ont cherchéà élucider les rapports entre la théorie des fonctions de variablecomplexe et celle de la répartition des nombres premiers, qui faita priori partie de l’arithmétique élémentaire.

Ainsi que nous l’avons vu au Chapitre 2, la preuve analytiquerepose de manière essentielle sur l’absence de zéro de la fonction zêtade Riemann sur la droite σ = 1. En outre, les théorèmes taubériens(1)

1. Ainsi nommés par référence au mathématicien autrichien A. Tauber qui a établi en1897 une réciproque du théorème d’Abel sur la continuité radiale de la somme d’unesérie entière en tout point de convergence : si limn nan = 0 et si

limx→1−

∑n�0

anxn = �,

alors∑

n�0 an converge et est de somme �. Hardy & Littlewood ont montré en 1913

que la condition nan > −K (K > 0) est suffisante.

113

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

développés par Wiener au début des années 1930, et notammentle célèbre théorème d’Ikehara (1931), fournissent un cadre généraldans lequel le théorème des nombres premiers et l’assertion surles zéros de ζ(s) apparaissent de manière éclatante comme despropositions équivalentes. Cela a induit l’idée qu’en un certainsens la théorie des fonctions analytiques était plus « profonde » quel’analyse réelle et qu’il était hautement improbable, pour ne pasdire impossible, de parvenir au théorème des nombres premiers(1)

par de simples manipulations d’inégalités.Ainsi, le théorème des nombres premiers apparaissait comme

irréductible, pour sa démonstration, au cadre naturel dans lequelon pouvait l’énoncer — une frustration qui engendrait bien desspéculations méta-mathématiques !

Ce fut donc un grand choc lorsqu’en 1949 Erdos et Selberg pro-duisirent une preuve élémentaire,(2) mais certainement astucieuseet nullement facile, du théorème des nombres premiers — rendantipso facto caduques toutes les considérations sur les profondeursrelatives des méthodes de l’analyse complexe et de l’analyse réelle.

L’outil essentiel est ici la formule asymptotique∑p�x

(ln p)2 +∑pq�x

ln p ln q = 2x ln x + O(x),

aujourd’hui célèbre sous le nom d’identité de Selberg.Cette relation peut être vue comme une sorte de formule de

Stirling de degré supérieur : au lieu d’employer la fonction de vonMangoldt Λ(n) qui vérifie∑

d |n

Λ(d) = ln n (n � 1),

1. Sous forme « minimale » : pn ∼ n ln n ou π(x) ∼ x/ ln x , où pn désigne le n-ièmenombre premier et π(x) le nombre des indices n tels que pn � x.2. Au sens où elle n’utilise pratiquement aucun outil sophistiqué d’analyse à l’exceptiondes propriétés du logarithme.

114

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Atle Selberg (1917–2007)

on introduit une nouvelle fonction Λ2(n) satisfaisant à∑d |n

Λ2(d) = (ln n)2 (n � 1)

et l’on évalue sa fonction sommatoire à partir d’un calcul approchéélémentaire (et facile !) de

∑n�x(ln n)2. La procédure est semblable

à celle employée au § 1.9 pour estimer la valeur moyenne de Λ(n)— autrement dit, obtenir l’encadrement de Tchébychev, cf. p. 29 —à partir d’une forme faible de la formule de Stirling, i.e. l’évaluationde la valeur moyenne de ln n. Le gain (capital) dû à l’introductionde l’exposant 2 est que la technique produit ici directement uneformule asymptotique.

En utilisant l’identité de Selberg, Erdos a prouvé élémentairementque le rapport pn+1/pn de deux nombres premiers consécutifs tendvers 1. Il a même établi que, pour tout δ > 0 et x > x0(δ) il existeentre x et x + δx au moins c(δ)x/ ln x nombres premiers, où c(δ)est une constante positive ne dépendant que de δ.

Cela fournissait le pendant local de la régularité globale miseen évidence par la formule de Selberg, et il n’est guère surprenant,du moins a posteriori, qu’une preuve élémentaire du théorème

115

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Paul Erdos (1913–1996)

des nombres premiers ait pu résulterde la conjonction de ces deux informa-tions : Selberg effectua la liaison finaledeux jours seulement après qu’Erdoslui ait communiqué sa preuve des deuxrésultats cités plus haut. Quelque tempsplus tard, les deux mathématicienssimplifièrent ensemble l’argument. Lanouvelle preuve n’utilisait plus directement le résultat d’Erdosmais reposait fondamentalement sur les mêmes idées.

Ces idées sont présentes, sous une forme ou une autre, danstoutes les démonstrations élémentaires du théorème des nombrespremiers, et, sur ce plan, la preuve que nous présentons dans ce cha-pitre ne fait pas exception. On peut dire grosso modo qu’il s’agit demettre en évidence des équations ou des inéquations fonctionnelles.La signification profonde d’une équation/inéquation fonctionnelleest celle d’une tendance lourde à la régularité : l’espace analytiqueest soumis à un champ structurant, qui impose un comportementrégulier à toute solution située dans son domaine d’attraction. Latechnique nécessaire consiste alors à montrer que des estimationspréliminaires (souvent grossières) sont suffisantes pour imposeraux quantités étudiées d’appartenir au domaine d’attraction requis.

Hédi Daboussi

Nous nous proposons ici de four-nir au lecteur une démonstration élé-mentaire complète et autonome duthéorème des nombres premiers. Nousavons choisi de présenter la preuve deDaboussi (1984), qui n’est ni la pre-mière historiquement, ni la plus courte,ni celle qui conduit au meilleur résultateffectif, ni même celle qui fournit leplus vaste champ de généralisations.(1)

1. Notons cependant que, comme l’a montré Daboussi lui-même, la méthode s’étendsans difficulté majeure au cas des progressions arithmétiques.

116

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Il reste que nous avons, pour ce parti pris, des motivations d’ordreesthétique, initiatique et heuristique.

Esthétique d’abord, parce que la preuve conjugue avec raffine-ment idées raisonnables et actes de foi — au chapitre desquels nousrangeons, bien entendu, le principe de départ, qui n’est pleinementjustifiable qu’a posteriori.

Initiatique ensuite, car cette preuve fournit un merveilleuxprétexte à une exploration discursive du paysage actuel de la théorieanalytique des nombres : convolutions de fonctions arithmétiques,crible, solutions d’équations différentielles aux différences — laplupart des outils du chercheur moderne de la discipline sontprésents sous une forme rudimentaire qui les rend accessibles aunéophyte.

Heuristique enfin, car l’idée sous-jacente (à savoir que l’on peutconstruire un modèle multiplicativement pertinent de l’ensembledes nombres entiers en omettant tous les nombres premiers assezgrands) est riche d’enseignements, et de promesses, aptes à fairevibrer notre petite cosmogonie personnelle de la méta-philosophiearithmétique.

2. Intégration par parties

La sommation d’Abel est la manipulation élémentaire qui consiste àexprimer une somme finie de produits, disons S =

∑M<n�N anbn,

en fonction des sommes partielles de l’un des termes, par exempleAn =

∑M<k�n ak. De l’identité an = An − An−1, on déduit en

effet que

S =∑

M<n�N−1

An(bn − bn+1) + AN bN .

Ce procédé permet d’étudier la convergence des séries oscillantes.On en déduit en particulier le critère d’Abel : si la suite {an}n�1 està sommes partielles bornées et si la suite {bn}n�1 décroît vers 0,alors la série

∑n anbn converge et son reste de rang N est O(bN ).

117

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Il est très utile d’avoir à disposition une version effective dela sommation d’Abel adaptée à la situation, fréquente dans lesapplications, où {an}n�1 est une suite à caractère arithmétiquedont la fonction sommatoire est connue de manière approchéeet où {bn}n�1 est une suite de nature analytique, par exemplebn = b(n) où b est une fonction régulière.

Lemme 2.1 Soient w, x ∈ R et {an}n�1 une suite complexesatisfaisant à∑

w<n�t

an = E(t) + O(R(t)) (w � t � x)

où E ∈ C1[w, x] et R : [w, x] → R+ est une fonction monotone.Pour toute fonction b : [w, x] → C continue et de classe C1 parmorceaux, on a

(4.1)∑

w<n�x

anb(n) =

∫ x

wE ′(t)b(t) dt + O(R1(x))

avec

R1(x) = |E(w)b(w)| + |R(x)b(x)| +∫ x

w|R(t)b′(t)| dt.

Démonstration. Posons A(t) =∑

w<n�t an. Le membre de gauchede (4.1) vaut

b(x)A(x) −∑

w<n�x

an

∫ x

nb′(t) dt = b(x)A(x) −

∫ x

wA(t)b′(t) dt.

Le résultat indiqué en découle en remplaçant dans la dernièreintégrale A(t) par E(t) + O(R(t)) et en intégrant par parties lacontribution du terme principal E(t). �

118

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

3. Convolution des fonctions arithmétiques

Une fonction arithmétique est tout simplement une suite à valeurscomplexes f : N∗ → C. La convolution(1) des fonctions arith-métiques est l’opération qui au couple (f , g) permet d’associer lanouvelle fonction h = f ∗ g définie par

f ∗ g(n) =∑d |n

f (d)g(n/d).

Cette opération correspond au produit ordinaire des séries de sériede Dirichlet : on a formellement∑

n�1

f ∗ g(n)

ns=∑n�1

f (n)

ns

∑n�1

g(n)

ns

et il est facile de vérifier que cette égalité formelle possède un sensanalytique dès que les trois séries sont absolument convergentes.(2)

La fonction zêta de Riemann ζ(s) est la série de série de Dirichletassociée à la fonction arithmétique 1, définie par 1(n) = 1 (n � 1),et son carré ζ(s)2 est associé à la fonction nombre de diviseurs

τ(n) = 1 ∗ 1(n) =∑d |n

1.

Il est facile de vérifier que la fonction

δ(n) :={ 1 si n = 1,

0 si n > 1,

1. Également appelée convolution de Dirichlet.2. Cette condition peut être affaiblie de diverses manières. Il est, par exemple, suffisantque l’une des deux séries associées à f ou g soit absolument convergente, l’autre étantsemi-convergente, pour que la série associée à f ∗ g converge et ait pour somme leproduit des deux séries initiales.

119

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

est un élément neutre pour la convolution et que l’ensemble desfonctions arithmétiques muni de l’addition ordinaire et du produitde convolution est un anneau commutatif unitaire intègre.(1)

Les fonctions multiplicatives sont les fonctions arithmétiques quirespectent la structure multiplicative de N, i.e. celles qui vérifient

f (1) = 1, f (n) =∏pν‖n

f (pν) (n > 1).

Une définition équivalente consiste à imposer

f (1) �= 0, et f (mn) = f (m)f (n) dès que (m, n) = 1.

Les fonctions multiplicatives constituent un sous-groupe du groupedes éléments inversibles pour la convolution. Ainsi la fonctionnombre de diviseurs τ = 1 ∗ 1 est multiplicative. Comme unepuissance de nombre premier pν possède ν + 1 diviseurs, on endéduit que

τ(n) =∏pν‖n

(ν + 1).

L’importance cruciale des fonctions multiplicatives en théorieanalytique des nombres tient essentiellement au théorème suivant.

Théorème 3.1 Soit f une fonction multiplicative. Alors la série desérie de Dirichlet F (s) =

∑n�1 f (n)/ns est absolument convergente

si et seulement s’il en va de même de la série∑

p

∑ν�1 f (pν)/pνs.

Lorsqu’il en est ainsi, on a le développement en produit eulérienconvergent

F (s) =∏

p

∑ν�0

f (pν)

pνs·

1. On peut aussi montrer qu’il est factoriel, autrement dit toute fonction arithmétiquepeut se décomposer en produit d’un élément inversible et d’éléments premiers, avecdécomposition unique au facteur inversible près. Une fonction arithmétique f estinversible si, et seulement si, l’on a f (1) �= 0.

120

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Démonstration. Observons tout d’abord que la convergence absoluede la somme double, qui est une conséquence triviale de celle deF (s), implique la convergence du produit infini

M :=∏

p

(1 +

∑ν�1

∣∣∣∣ f (pν)

pνs

∣∣∣∣).

Réciproquement, sous l’hypothèse que la série double convergeabsolument, nous pouvons écrire pour x � 1∑n�x

∣∣∣∣ f (n)

ns

∣∣∣∣ �∑

P+(n)�x

∣∣∣∣ f (n)

ns

∣∣∣∣ =∏p�x

(1 +

∑ν�1

∣∣∣∣ f (pν)

pνs

∣∣∣∣) � M .

Cela montre bien que la série F (s) est absolument convergente.La majoration∣∣∣∣∑

n�1

f (n)

ns−∏p�x

∑ν�0

f (pν)

pνs

∣∣∣∣ =

∣∣∣∣ ∑P+(n)>x

f (n)

ns

∣∣∣∣ �∑n>x

∣∣∣∣ f (n)

ns

∣∣∣∣implique alors, en faisant tendre x vers l’infini, la formule dudéveloppement eulérien. �

Lorsqu’on applique le théorème précédent à la fonction f = 1,on retrouve la formule d’Euler, déjà rencontrée aux Chapitres 1et 2.

Le principe de l’hyperbole, dû à Dirichlet, est un procédécommode pour évaluer la fonction sommatoire d’un produit deconvolution.

L’utilisation éponyme est liée à la fonction nombre de diviseursτ = 1 ∗ 1, dont la fonction sommatoire∑

n�x

τ(n) =∑uv�x

1

dénombre exactement le nombre de points à coordonnées entièressitués dans le premier quadrant ouvert et sous l’hyperbole équilatèreuv = x.

121

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Théorème 3.2 (Principe de l’hyperbole) Soient f , g deuxfonctions arithmétiques, de fonctions sommatoires respectives

F (x) :=∑n�x

f (n), G(x) :=∑n�x

g(n).

On a pour 1 � y � x∑n�x

f ∗ g(n)

=∑n�y

g(n)F(x

n

)+

∑m�x/y

f (m)G( x

m

)− F

(xy

)G(y).

Démonstration. Le membre de gauche s’écrit encore∑md�x

f (m)g(d)

=∑

md�x, d�y

f (m)g(d) +∑

md�x, d>y

f (m)g(d)

=∑d�y

g(d)F (x/d) +∑

m�x/y

f (m) {G(x/m) − G(y)} .

Cela implique immédiatement le résultat annoncé, en développantle dernier terme. �

L’application historique de cette méthode est la célèbre formulede Dirichlet∑

n�x

τ(n) = x{ln x + 2γ − 1} + O(√

x).

Le théorème précédent appliqué avec y =√

x et f = g = 1 (doncF (x) = G(x) = �x�), montre en effet que le membre de gauchevaut

2∑

m�√x

�x/m� −⌊√

x⌋2

= 2∑

m�√x

x/m − x + O(√

x).

122

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

On conclut en appliquant le résultat classique∑m�z

1m

= ln z + γ + O(1

z

)avec z =

√x.

4. La fonction de Möbius

Nous avons déjà rencontré la fonction de Möbius, notée μ, dansla formule du crible d’Ératosthène (§ 1.8). Nous la redéfinissonsici (afin de garantir l’autonomie de ce chapitre) comme l’inversede convolution de la fonction 1, soit

1 ∗ μ = δ ou encore∑d |n

μ(d) ={

1 si n = 1,0 si n > 1.

L’existence de l’inverse est garantie par le fait que les fonctionsmultiplicatives forment un sous-groupe de l’ensemble des fonctionsarithmétiques inversibles. La multiplicativité nous permet, pour lecalcul de cet inverse, de nous restreindre aux puissances de nombrespremiers.(1) La relation de convolution 1 ∗ μ = δ fournit alors, deproche en proche, μ(p) = −1 et μ(pν) = 0 pour ν � 2. On adonc, pour un entier générique n de décomposition canoniquen =

∏kj=1 pj

νj ,

μ(n) =

{(−1)k si νj = 1 (1 � j � k),0 si maxj νj � 2.

Comme on peut le vérifier sans peine, la fonction Λ de vonMangoldt rencontrée au Chapitre 1 (p. 27) satisfait à la relationde convolution Λ ∗ 1 = ln. En convolant par μ, on obtient

Λ = μ ∗ ln .

On peut aussi vérifier que Λ = −(μ ln) ∗ 1.

1. On a μ(1) = 1 par définition puisque l’inverse de convolution d’une fonctionmultiplicative est encore multiplicative.

123

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Plus généralement, on peut rassembler les propriétés algébriquesde la fonction de Möbius dans l’énoncé suivant.

Théorème 4.1 (Inversion de Möbius)(a) Soient f et g des fonctions arithmétiques. Les deux propriétés

suivantes sont équivalentes

(i) g(n) =∑d |n

f (d) (n � 1)

(ii) f (n) =∑d |n

g(d) μ(n/d) (n � 1).

(b) Soient F et G des fonctions complexes définies sur [1, +∞[. Lesdeux conditions suivantes sont équivalentes

(iii) F (x) =∑n�x

G(x/n) (x � 1)

(iv) G(x) =∑n�x

μ(n)F (x/n) (x � 1).

Démonstration. Le point (a) exprime directement l’équivalencedes relations g = f ∗ 1 et f = g ∗ μ. Établissons par exemplel’implication (iii) ⇒ (iv), la réciproque étant analogue. Pour x � 1,nous avons∑

n�x

μ(n)F (x/n) =∑n�x

μ(n)∑

m�x/n

G(x/mn)

=∑k�x

G(x/k)∑mn=k

μ(n).

Par définition de μ, la somme intérieure vaut δ(k). Cela impliquebien (iv). �

En appliquant le Théorème 4.1 pour G(x) ≡ 1, on obtient∑n�x

μ(n) �x/n� = 1 (x � 1).

124

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Cela montre que

supx∈R

∣∣∣∣∑n�x

μ(n)

n

∣∣∣∣ � 1

et suggère que limx→∞∑

n�x μ(n)/n = 0. Nous verrons au para-graphe suivant que cette relation est élémentairement équivalenteau théorème des nombres premiers.

PosonsM(x) :=

∑n�x

μ(n).

Par interversion de sommations, on a pour a > 0, b > 0,∫ b

aM(x)

dxx2

=M(a)

a− M(b)

b+

∑a<n�b

μ(n)

n

de sorte que

(4.2) supa,b∈R+

∣∣∣∣∣∫ b

aM(x)

dxx2

∣∣∣∣∣ � 4.

Nous ferons un usage crucial de cette majoration au cours de ladémonstration élémentaire du théorème des nombres premiers.

Remarque. La définition du produit de convolution en termes deproduit ordinaire de séries de série de Dirichlet permet de retrouverimmédiatement que l’on a

∑n�1 μ(n)/ns = 1/ζ(s) pour σ > 1

et en particulier, ∑n�1

μ(n)/n2 = 6/π2,

puisque ζ(2) = π2/6 (cf. § 2.4, p. 57). Le théorème suivantpermet d’interpréter ce nombre comme la probabilité que deuxentiers choisis au hasard soient premiers entre eux.

Théorème 4.2 Désignons par G(x, y) le nombre des couples d’en-tiers (m, n) tels que 1 � m � x, 1 � n � y, (m, n) = 1. Alors

125

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

la relation asymptotique G(x, y) ∼ (6/π2)xy a lieu lorsque x et ytendent vers l’infini. Plus précisément, on a en posant z := min(x, y)

G(x, y) = xy{ 6

π2+ O

( ln zz

)}(x, y � 2).

Démonstration. Grâce à la relation de convolution δ = 1 ∗ μ, onpeut écrire

G(x, y) =∑

m�x, n�y

δ ((m, n)) =∑d�z

μ(d)⌊ x

d

⌋ ⌊ yd

⌋= xy

∑d�z

μ(d)

d 2+ O

((x + y)

∑d�z

1d

)= xy

{ 6π2

+ O(1

z+(1

x+

1y

)ln z

)}.

5. Valeur moyenne de la fonction de Möbiuset théorème des nombres premiers

Nous avons vu au Chapitre 1 que la fonction de von MangoldtΛ = μ ∗ ln est fortement liée à la fonction caractéristique desnombres premiers et possède une fonction sommatoire

ψ(x) =∑n�x

Λ(n),

qui, comme il a été établi p. 29, satisfait à

ψ(x) ∼ π(x) ln x (x → ∞).

Il est donc naturel de se demander si la valeur moyenne deμ(n) possède une interprétation simple dans le cadre de l’étudeasymptotique des fonctions de Tchébychev π(x), ψ(x), c’est-à-dire dans le domaine de la répartition des nombres premiers. Lethéorème suivant, dû à Landau (1909), répond complètement àcette question.

126

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Théorème 5.1 Les assertions suivantes sont élémentairement équi-valentes :

(i) ψ(x) ∼ x (x → ∞),

(ii) M(x) :=∑

n�x μ(n) = o(x) (x → ∞),

(iii)∑

n�1 μ(n)/n = 0.

Remarques. Seule l’implication (ii) ⇒ (i) sera utilisée dans la preuvedu théorème des nombres premiers. Ainsi que le lecteur pourrale constater aisément, ce n’est pas la partie la plus difficile de ladémonstration. L’assertion (iii) signifie bien entendu que la sériefigurant au membre de gauche converge et est de somme nulle.Démonstration. L’implication (iii) ⇒ (ii) résulte d’une simpleintégration par parties. Supposons, en effet, que

m(x) :=∑n�x

μ(n)/n = o(1) (x → ∞).

En appliquant le Lemme 2.1 avec w = 1, E(t) = 0 et

R(t) = supy�t

|m(y)|,

nous obtenons,

M(x) xR(x) +

∫ x

1R(t) dt = o(x).

Pour prouver l’implication (ii) ⇒ (i), nous établissons d’abordune identité de convolution pour la fonction Λ − 1, dont nousdevons montrer qu’elle possède une fonction sommatoire o(x).On a

Λ − 1 = (ln−τ) ∗ μ = (ln−τ + 2γ1) ∗ μ − 2γδ

= f ∗ μ − 2γδ,

où la fonction f := ln−τ + 2γ1 satisfait à

F (x) :=∑n�x

f (n) = O(√

x),

127

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

d’après la formule de Dirichlet établie au § 3 et l’évaluationclassique∑

n�x

ln n = x ln x − x + O(1 + ln x) (x � 1).

Nous allons montrer que

H(x) :=∑n�x

f ∗ μ(n) = o(x)

en utilisant l’estimation précédente pour F (x) et en faisant appelau principe de l’hyperbole (Théorème 3.2). Pour chaque y > 2fixé, on peut en effet écrire

H(x) =∑

n�x/y

μ(n)F(x

n

)+∑m�y

f (m)M( x

m

)− F (y)M

(xy

).

Sous l’hypothèse (ii), il suit donc, pour chaque y fixé,

lim supx→∞

∣∣∣H(x)x

∣∣∣ � lim supx→∞

1x

∑n�x/y

∣∣∣F(xn

)∣∣∣ lim sup

x→∞

1x

∑n�x/y

√xn 1

√y·

Comme y peut être choisi arbitrairement grand, cela implique bienque H(x) = o(x).

Il reste à établir l’implication (i) ⇒ (iii). Nous utiliserons lamajoration

|m(x)| � 1

prouvée au paragraphe précédent. Nous remarquons d’abord quela formule d’inversion de Möbius μ ∗ 1 = δ implique∑

md=n

μ(m)

md=

δ(n)

n= δ(n) (n � 1)

128

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

d’où, par sommation pour n � x,∑m�x

μ(m)

m

∑d�x/m

1d

= 1 (x � 1).

En évaluant la somme intérieure, il vient

1 =∑m�x

μ(m)

m

{ln( x

m

)+ γ + O

(mx

)}= m(x)(ln x + γ) − G(x) + O(1),

où l’on a posé

G(x) :=∑m�x

μ(m) ln mm

·

Il nous suffit donc d’établir que l’on a

G(x) = o(ln x) (x → ∞).

À cette fin, nous utilisons la relation de convolution

μ ln = −Λ ∗ μ = (1 − Λ) ∗ μ − δ,

dont nous omettons la vérification, qui est facile. Posant

P(x) := �x� − ψ(x) =∑n�x

(1 − Λ(n)) = o(x),

on peut donc écrire

G(x) + 1 =∑j�x

(P(j) − P(j − 1)

j

)m(x

j

)=∑j�x

P(j)(m(x/j)

j− m (x/(j + 1))

j + 1

)+ o(1)

=∑j�x

P(j)j

{mj(x) +

1j + 1

m( x

j + 1

)}+ o(1),

129

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

avec mj(x) := m(x/j)−m (x/(j + 1)). Donnons-nous alors, pourchaque ε > 0, un nombre entier j0(ε) tel que |P(j)| � εj pourj > j0(ε). En utilisant la majoration supt |m(t)| � 1 et l’inégalitétriviale

|mj(x)| �∑

x/(j+1)<n�x/j

1n,

il suit

|G(x) + 1| � 3∑

j�j0(ε)

|P(j)|j

+ 2ε∑n�x

1n

+ o(1),

d’où lim supx→∞ |G(x)|/ ln x � 2ε. Comme ε est arbitrairementpetit, cela montre bien que

G(x) = o(ln x)

et achève la démonstration du théorème. �

On peut obtenir d’autres formulations équivalentes à celles duThéorème 5, par exemple

(iv)∑n�x

Λ(n)/n = ln x − γ + o(1) (x → ∞).

L’implication (iv) ⇒ (i) découle directement du Lemme 2.1, etnous omettons les détails. Pour montrer la réciproque, on utilise ànouveau la fonction

f = ln−τ + 2γ1.

On a∑n�x

Λ(n) − 1n

=∑kd�x

f (k)

kμ(d)

d− 2γ

=∑

d�x/y

μ(d)

dL( x

d

)+∑k�y

f (k)

km(x

k

)− L(y)m

(xy

)− 2γ,

130

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

avec

L(z) :=∑k�z

f (k)

k= C + O

( 1√z

)(z � 1).

Cette dernière relation est établie, pour une constante convenableC , par sommation d’Abel en utilisant l’estimation

F (z) √

z.

En faisant tendre x puis y vers l’infini, on obtient, grâce à (iii),∑n�x

Λ(n) − 1n

= −2γ + o(1),

d’où la conclusion souhaitée.

6. Entiers sans grand ou sans petit facteur premier

Dans la théorie analytique moderne, les ensembles d’entiers

S(x, y) := {n � x : P+(n) � y},T (x, y) := {n � x : P−(n) > y},

jouent des rôles de plus en plus importants. La source de cephénomène réside principalement dans le fait que, pour y donné,chaque entier n � x peut être décomposé de manière uniquesous la forme d’un produit n = ab avec a ∈ S(x, y), b ∈ T (x, y).On exploite ensuite cette factorisation avec l’idée générale que lenombre a se comporte essentiellement comme un entier ordinaire,alors que b possède les caractéristiques d’un nombre premier.

En d’autres termes, S(x, y) et T (x, y) constituent respectivementdes modèles simplifiés de l’ensemble des entiers et de celui desnombres premiers n’excédant pas x.

La démonstration élémentaire du théorème des nombres pre-miers que nous allons présenter fait appel aux propriétés de basede ces ensembles. Nous notons

Ψ(x, y) := |S(x, y)|, Φ(x, y) := |T (x, y)|.

131

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La plupart des estimations qui suivent s’expriment de manièrenaturelle en fonction de la quantité

u := (ln x)/ ln y.

Nous adopterons systématiquement cette notation.Nous ferons dans la suite un usage intensif (et parfois implicite)

de la propriété suivante : pour tout y � 2 la série∑P+(n)�y

1nσ

=∏p�y

(1 − 1

)−1

est convergente dès que σ > 0. Cela découle immédiatement duThéorème 3.1, puisque la somme double∑

p�y

∑ν�1

1pνσ

=∑p�y

1pσ − 1

est finie.

Théorème 6.1 On a

Ψ(x, y) xe−u/2 (x � 1, y � 2).

Démonstration. Nous pouvons supposer y � 11 puisque dans lecas contraire S(x, y) est réduit aux nombres de la forme 2α3β5γ7δ

n’excédant pas x, d’où

Ψ(x, y) (ln x)4 (y < 11).

Maintenant, donnons-nous un paramètre positif α et considé-rons la fonction multiplicative fα définie par fα(pν) = pαν si p � yet fα(pν) = 0 dans le cas contraire. Si n > x3/4 et n ∈ S(x, y), ona fα(n) > x3α/4, donc

Ψ(x, y) � x3/4 + x−3α/4∑n�x

fα(n).(1)

1. Le principe très simple de cette inégalité, consistant à majorer une fonction indicatricepar un multiple constant d’une fonction multiplicative a été employé par Rankin dansce contexte précis. Les arithémticiens y réfèrent souvent sous le nom de «méthode deRankin».

132

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Choisissons α = 2/(3 ln y), de sorte que

x−3α/4 = e−u/2 et x3/4 � xe−u/2.

Nous allons montrer que la somme en n est O(x), ce qui suffitpleinement à fournir l’estimation annoncée.

L’idée essentielle consiste à introduire la fonction multiplicativepositive ou nulle gα définie par gα(pν) = pνα(1 − p−α) si p � yet gα(pν) = 0 si p > y, et à remarquer que fα � gα ∗ 1. En fait(gα ∗ 1)(n) = nα = fα(n) si P+(n) � y et, dans le cas contraire,(gα ∗ 1)(n) � 1 > fα(n) = 0. On a donc∑

n�x

fα(n) �∑n�x

∑d |n

gα(d) =∑d�x

gα(d)⌊ x

d

⌋,

après interversion de sommations. Il en résulte que la somme àmajorer n’excède pas∑

P+(d)�y

gα(d)xd

= x∏p�y

∑ν�0

gα(pν)

pν·

On a gα(pν)/pν = pνα(1−p−α)/pν � α(e2/3/p)ν ln p et e2/3 < 2.La somme en ν vaut donc 1 + O(α ln p/p). Le premier théorèmede Mertens (cf. p. 32) implique alors que le produit en p est borné,ce qui achève la démonstration. �

Théorème 6.2 On a pour x � 1, y � 2,

Φ(x, y) = x∏p�y

(1 − 1

p

)+ O

(xe−u/2 ln y

).

Démonstration. Par la formule d’inversion de Möbius, la quantité∑d |n, P+(d)�y μ(d) vaut 1 ou 0 selon que l’entier n appartient ou

non à T (x, y). En sommant pour n � x et en intervertissant lessommations, on obtient

Φ(x, y) =∑

d�x, P+(d)�y

μ(d) �x/d� .

133

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La formule annoncée en découle en remplaçant �x/d� par(x/d) + O(1) pour d � x et en notant que le Théorème 6.1permet, par intégration par parties (cf. le Lemme 2.1), d’obtenirla majoration ∑

d>x, P+(d)�y

μ(d)/d e−u/2 ln y.

Bien entendu, l’estimation du Théorème 6.2 n’est utile quepour des valeurs de y sensiblement plus petites que x : il faut que

y � x{1/2+o(1)}/ ln2 x

pour que l’on puisse déduire du Théorème 6.2 une majorationmeilleure que l’inégalité triviale Φ(x, y) � x. Cette limitation nesera toutefois nullement un handicap dans la perspective où nousnous plaçons. Nous n’utiliserons en fait que des valeurs bornéesde y.

SoitM(x, y) :=

∑n∈S(x,y)

μ(n).

Conformément au principe exposé plus haut de modéliser{n : n � x} par S(x, y), la méthode de Daboussi a pour pointde départ un résultat liant le comportement de M(x) à celui deM(x, y).

Proposition 6.3 Pour chaque y � 2 fixé, on a :

lim supx→∞

|M(x)|x

�∏p�y

(1 − 1

p

)∫ ∞

1

|M(x, y)|x2

dx.

Démonstration. Le Théorème 6.1 implique la convergence de l’inté-grale. Décomposons canoniquement chaque entier n n’excédant

134

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

pas x sous la forme n = ab avec a ∈ S(x, y), b ∈ T (x, y). On aalors nécessairement (a, b) = 1 donc μ(n) = μ(a)μ(b). Il suit

M(x) =∑

b∈T (x,y)

μ(b)M(x/b, y),

et donc

|M(x)| �∑

b∈T (x,y)

|M(x/b, y)|

=∑n�x

|M(n, y)|{

Φ(x

n, y)− Φ

( xn + 1

, y)}

.

Utilisons maintenant l’approximation du Théorème 6.2 pourévaluer l’expression entre accolades, en notant Πy le produit en p.La contribution du terme principal est∑

n�x

|M(n, y)|x∫ n+1

nΠy

dtt2

� xΠy

∫ ∞

1

|M(t, y)|t2

dt.

Cette majoration est bien compatible avec le résultat annoncéet il reste seulement à montrer que la contribution destermes d’erreur est o(x). Cette contribution vaut exactementR :=

∑n�x |M(n, y)|Rn avec

Rn := Φ(x

n, y)− Φ

( xn + 1

, y)− xΠy

∫ n+1

n

dtt2

,

de sorte que le Théorème 6.2 implique, pour tout entier N � x,∑N<n�x

Rn (x/N )1−ε(y) ln y,

où l’on a posé ε(y) = 1/(2 ln y). En observant que

|M(n, y)| − |M(n − 1, y)|

135

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

est majoré en valeur absolue par la fonction indicatrice de S(x, y),une simple sommation d’Abel fournit alors

R (ln y)∑

n∈S(x,y)

(x/n)1−ε(y) (ln y)2x1−ε(y).

Cela termine la démonstration de la Proposition 6.3. �

Il s’agit maintenant de montrer que la borne supérieureobtenue pour lim sup |M(x)|/x tend vers 0 quand y → ∞. Cetteestimation, qui constitue le cœur de la méthode, nécessite lesdéveloppements qui suivent.

7. La fonction de Dickman

On appelle fonction de Dickman l’unique fonction continue� : [0,∞[→ R, dérivable sur ]1,∞[, telle que{

�(v) = 1 (0 � v � 1),v�′(v) + �(v − 1) = 0 (v > 1).

Cela définit bien � de manière récursive : pour tout entier k � 1et v ∈ [k, k + 1[, on a

�(v) = �(k) −∫ v

k�(t − 1)

dtt·

Les principales propriétés de la fonction de Dickman sontrassemblées dans l’énoncé suivant. Nous rappelons (cf. § 2.4) ladéfinition de la fonction Γ d’Euler et l’équation fonctionnelle

vΓ(v) = Γ(v + 1),

de sorte que Γ(n + 1) = n! pour tout entier n � 0. On note enparticulier la relation asymptotique

ln Γ(v) ∼ v ln v (v → ∞).

136

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Théorème 7.1 On a :

(i) v�(v) =

∫ v

v−1�(w) dw (v � 1)

(ii) �(v) > 0 (v � 0)(iii) �′(v) < 0 (v > 1)(iv) �(v) � 1/Γ(v + 1) (v � 0).

Démonstration. Le point (i) est une conséquence immédiate del’équation différentielle aux différences et des conditions initialesde la définition de �. En effet, les deux membres de (i) ont mêmedérivée pour v > 1 et même valeur en v = 1.

Montrons (ii). Soit τ := inf{v : �(v) = 0}. Si τ est fini,alors τ > 1 puisque � est continue et satisfait à �(v) = 1 pour0 � v � 1. Par (i), on peut donc écrire

0 = τ�(τ) =

∫ τ

τ−1�(w) dw.

La continuité de � implique alors que le membre de droite de cetteégalité est strictement positif — d’après la définition même de τ .Cela montre que τ n’est pas fini, d’où (ii).

Le point (iii) découle immédiatement de (ii) et de l’équationfonctionnelle satisfaite par �.

Nous établissons (iv) par récurrence sur k := �v�. La propriétéest satisfaite pour k = 0 puisque �(v) = 1 (0 � v � 1). Si k � 1,on déduit de (i), (ii), (iii) et de l’hypothèse de récurrence que l’on a

�(v) =1v

∫ v

v−1�(w) dw � �(v − 1)

v� 1

vΓ(v)=

1Γ(v + 1)

·

Les solutions d’équations différentielles aux différences, commela fonction de Dickman, interviennent dans les problèmes dethéorie des nombres parce qu’elles sont des versions continuesde quantités arithmétiques qui vérifient des équations analogues

137

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

discrètes. La fonction de Dickman est ainsi liée à la fonctionΨ(x, y) que nous avons rencontrée au paragraphe précédent. Enclassant les entiers n de S(x, y) selon la taille de leur plus grandfacteur premier (i.e. en écrivant n = mp avec P+(m) � p � y) onobtient immédiatement l’équation de Buchstab :

Ψ(x, y) = 1 +∑p�y

Ψ(x/p, p) (x � 1, y � 1).

L’analogie entre l’équation de Buchstab et l’équation différentielleaux différences définissant la fonction de Dickman fournit leprincipe du théorème suivant.

Théorème 7.2 Soit ε > 0. On a uniformément pour 1 � xε � y,u = (ln x)/ ln y,

Ψ(x, y) = x�(u){

1 + O( 1

ln(2x)

)}.

Démonstration. Introduisons, pour chaque entier k � 1, la quantité

Δk(x) := supy�x1/k

|Ψ(x, y) − x�(u)|.

Nous devons montrer que Δk(x) x/ ln(2x) pour tout k fixé :le résultat annoncé en découlera pour le choix k := �1/ε� + 1.

On a trivialement Δ1(x) 1 puisque Ψ(x, y) = �x� poury � x et �(u) = 1 pour 0 � u � 1. On raisonne ensuite parrécurrence sur k. L’équation de Buchstab fournit pour chaqueentier k � 1, lorsque x1/(k+1) � y < x1/k,

Ψ(x, x1/k

)− Ψ(x, y) =

∑y<p�x1/k

Ψ(x/p, p).

En remarquant que x/p � pk pour tout p > x1/(k+1), on en déduitque

Δk+1(x) � Δk(x) + xRk(x) +∑

x1/(k+1)<p�x1/k

Δk(x/p)

138

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

avec

Rk(x) := supk�u�k+1

∣∣∣�(k) − �(u) −∑

y<p�x1/k

1p�( ln x

ln p− 1

)∣∣∣.La dernière somme en p relève du Lemme 2.1 d’intégration parparties. Le second théorème de Mertens (cf. p. 34) nous permeten effet d’appliquer ce résultat avec

E(t) = ln2 t − ln2 y, R(t) = 1/ ln(2t).

Il suit, après changement de variable t = x1/v,∑y<p�x1/k

1p�( ln x

ln p− 1

)=

∫ u

k

�(v − 1)

vdv + Ok

( 1ln(2x)

),

d’où, compte tenu de l’équation fonctionnelle satisfaite par �,

Rk(x) k 1/ ln(2x).

Cette estimation fournit immédiatement l’évaluation souhaitéepour Δk+1(x) en reportant dans l’inégalité de récurrence lamajoration

Δk(x) k

{1 (k = 1)x/ ln(2x) (k � 2).

�Une conséquence inattendue du théorème précédent consiste

en une preuve arithmétique de la formule∫ ∞

0�(v) dv = eγ,

où γ désigne la constante d’Euler. Le point de départ est l’identité

S(y) :=∏p�y

(1 − 1

p

)−1

=∑

P+(n)�y

1n

=

∫ ∞

1

Ψ(x, y)x2

dx.

139

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La formule de Mertens (cf. p. 33) fournit d’une part l’évaluation

S(y) = eγ ln y + O(1) (y → ∞).

D’autre part, le Théorème 7.2 permet d’écrire pour tout entierk � 1 fixé∫ yk

1

Ψ(x, y)x2

dx = (ln y)∫ k

0�(u) du + Ok(1)

alors que le Théorème 6.1 procure la majoration∫ ∞

yk

Ψ(x, y)x2

dx ∫ ∞

yk

e−u/2 dxx

e−k/2 ln y.

Il suit

eγ =

∫ k

0�(u) du + Ok(1/ ln y) + O

(e−k/2

).

La formule annoncée en découle en faisant tendre y puis k versl’infini.

8. La preuve de Daboussi, revisitée

Soitα := lim sup

x→∞|M(x)|/x.

On a 0 � α � 1 et nous devons établir que α = 0. D’après laProposition 6.3, on a

α �∏p�y

(1 − 1

p

){I1(y) + I2(y)

}avec

I1(y) :=

∫ y

1

|M(x)|x2

dx, I2(y) :=

∫ ∞

y

|M(x, y)|x2

dx.

140

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

Michel Mendès France& Hédi Daboussi vers 1990

Nous allons montrer que pour toutβ > α, on a

lim supy→∞

I1(y)/ ln y � βδ,

lim supy→∞

I2(y)/ ln y � β(eγ − 1),

où δ = δ(α) est une quantité< 1 si α > 0. En reportant dansnotre inégalité pour α et en faisanttendre y vers l’infini, cela impliqueque α � e−γ{βδ + β(eγ − 1)}.Comme β peut être choisiarbitrairement proche de α, ilsuit α � α{1 − e−γ(1 − δ)}, etfinalement α = 0.

L’inégalité annoncée pour I1(y) résulte simplement de l’estimation

sup1�a�b

∣∣∣ ∫ b

aM(x)

dxx2

∣∣∣ � 4

obtenue au § 4. En effet, nous allons voir que l’estimation requise alieu pour δ := 1− 1

16α2 � 15

16 . Considérons à cette fin un nombreréel x0 = x0(β) tel que |M(x)| � βx pour tout x � x0. Pourchaque y � x0, on peut scinder l’intervalle [x0, y[ en un nombrefini de sous-intervalles à bornes entières [xj, xj+1[ (0 � j � J) àl’intérieur desquels M(x) est de signe constant. Comme M(x) està valeurs entières et varie par sauts de ±1, on a certainement, pour0 < j � J ,

M(xj) = 0,

Tj :=

∫ xj+1

xj

|M(x)|x2

dx =

∣∣∣∣ ∫ xj+1

xj

M(x)x2

dx

∣∣∣∣ � 4.

141

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Maintenant, remarquons que, pour xj � x � xj+1, on a

|M(x)| = |M(x) − M(xj)| � x − xj.

Posant λj = ln(xj+1/xj), et effectuant le changement de variablex = txj dans l’intégrale, il suit

Tj � T ∗j := min

(4,

∫ exp λj

1min(β, 1 − 1/t)

dtt

).

Nous allons prouver que T ∗j � βδλj, ce qui suffit pleinement à

établir le résultat souhaité concernant I1(y). Si βλj � 8, on a

T ∗j � 4 � 1

2βλj � βδλj.

On peut donc supposer βλj < 8. Grâce à l’inéga-lité 1 − 1/t � ln t, on obtient alors

T ∗j �

⎧⎨⎩∫ exp λj

1ln t

dtt

= 12λ

2j � 1

2βλj, si λj � β,

β(λj − 12β) � (1 − 1

16β2)βλj, si λj > β,

la seconde majoration étant obtenue en scindant l’intégrale àt = eβ. Nous avons donc T ∗

j � βδλj en toute circonstance, etcela fournit la majoration annoncée pour I1(y).

L’inégalité relative à I2(y) est une conséquence facile du résultatsuivant.

Lemme 8.1 Soient ε > 0, β > α. On a uniformément pour1 � xε � y, u = (ln x)/ ln y,

|M(x, y)| � βx�(u){

1 + O( 1

ln(2x)

)}.

Admettons momentanément cet énoncé et déduisons-en l’estima-tion requise. Grâce à la majoration triviale |M(x, y)| � Ψ(x, y) et

142

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

au Théorème 6.1, il suit en effet, pour tout entier k � 1,∫ yk

y

|M(x, y)|x2

dx � β{ln y + Ok(1)}∫ k

1�(u) du,∫ ∞

yk

|M(x, y)|x2

dx (ln y)∫ ∞

ke−u/2 du

e−k/2 ln y.

En faisant tendre y puis k vers l’infini, cela implique immédiatement

lim supy→∞

I2(y)/ ln y � β(eγ − 1),

puisque ∫ ∞

1�(u) du =

∫ ∞

0�(u) du − 1 = eγ − 1.

Démonstration du 8.1. Nous employons une technique analogueà celle de la preuve du Théorème 7.2 en observant que M(x, y)satisfait aussi une équation fonctionnelle. L’idée consiste à exploitercette relation sous la forme d’une inéquation qui permet, au prixd’un affaiblissement du terme d’erreur, de propager la majoration

|M(x, y)| � β�(u)x + O(1),

initialement valable pour y � x, à tout domaine y � xε. Toutefois,on ne peut utiliser directement l’équation de Buchstab(1)

M(x, y) = 1 −∑p�y

M(x/p, p − 1)

car la majoration de récurrence qui en résulte, à savoir

|M(x, y)| � |M(x, x1/k)| +∑

y<p�x1/k

|M(x/p, p − 1)|,

n’a pas x�(u) pour solution asymptotique.

1. La preuve de cette identité est semblable à celle de l’équation de Buchstab pourΨ(x, y) établie p. 138 : il suffit ici de classer les entiers selon leur plus petit facteurpremier.

143

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

On contourne cette difficulté technique en évaluant la sommepondérée∑

n∈S(x,y)

μ(n) ln n =∑p�y

∑m∈S(x/p,y)

p � m

μ(mp) ln p

= −∑p�y

{M(x/p, y) + O(x/p2)} ln p

= −∑p�y

M(x/p, y) ln p + O(x).

Observant par ailleurs que∣∣∣∣ ∑n∈S(x,y)

μ(n) ln(x/n)

∣∣∣∣ �∑n�x

ln(x/n) x,

et donc∑

n∈S(x,y) μ(n) ln n = M(x, y) ln x + O(x), on déduit dece qui précède que

M(x, y) ln x = −∑p�y

M(x/p, y) ln p + O(x).

En particulier, il existe une constante absolue C telle que l’on aitpour x � 1, y � 1

|M(x, y)| ln x �∑p�y

|M(x/p, y)| ln p + Cx.

Nous allons utiliser cette inéquation fonctionnelle pour déduirede la majoration

|M(x, y)| = |M(x)| � βx (y � x � x0(β))

une estimation valable pour y � xε. À cette fin, nous introduisonsles quantités

h(v) := |M(yv, y)|/β�(v)yv, h∗(u) := supu0�v�u

h(v),

144

UNE PREUVE ÉLÉMENTAIRE DU THÉORÈME DES NOMBRES PREMIERS

où u0 = u0(β) = ln x0(β)/ ln y. Notre hypothèse peut doncencore s’exprimer sous la forme simple

h∗(1) � 1,

alors que l’énoncé du lemme équivaut à

h∗(u) � 1 + Ok(1/ ln y) (1 � u � k).(1)

Considérons des nombres réels u ∈ [1, k] et v ∈ [u0, u].Appliquée avec x = yv, notre inéquation fonctionnelle pour|M(x, y)| fournit, après division par β�(v)yv ln yv,

h(v) �∑

p�y, yv/p>x0

h∗(u − vp)�(v − vp) ln pp�(v) ln yv

+∑

p�y, yv/p�x0

|M(yv/p, y)| ln pβ�(v)yv ln yv

+C

β�(v) ln yv,

où l’on a posé vp := (ln p)/ ln y. Notons que M(yv/p, y) = 0 sip > yv. Le premier théorème de Mertens permet de majorer laseconde somme en p par∑

yv/x0�p�yv

ln pβp�(v) ln yv

1v�(v) ln y

·

Nous avons donc montré l’existence d’une constante K (β) telleque

h(v) �∑p�y

h∗(u − vp)�(v − vp) ln ppv�(v) ln y

+K (β)

v�(v) ln y·

À ce stade, nous utilisons le fait que h∗(u) est une fonctioncroissante de u. Posant

Sϑ :=∑p�yϑ

�(v − vp) ln pv�(v)p ln y

(0 � ϑ � 1),

1. Le résultat souhaité découle formellement de cette évaluation avec k := 1/ε�+ 1.

145

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

nous déduisons de l’inégalité précédente que

h(v) � h∗(u)S 12+ h∗(u − 1

2){S1 − S 12} +

K (β)

v�(v) ln y·

Nous pouvons évaluer Sϑ grâce au Lemme 2.1 en posant

ap = (ln p)/p ln y, b(t) = �(v − ln t/ ln y)/v�(v).

Le premier théorème de Mertens fournit la formule asymptotique∑p�yt ap = t + O(1/ ln y), et l’on obtient

Sϑ = r(ϑ) + Ok(1/ ln y),

avec

r(ϑ) :=1

v�(v)

∫ ϑ

0�(v − t) dt.

On déduit du Théorème 7.1(i) que r(1) = 1 et la décroissancede la fonction � implique r( 1

2) � 1 − r( 12), soit r( 1

2) � 12 . En

reportant dans l’inégalité liant h(v), h∗(u) et h∗(u − 12) et en

prenant le supremum en v, il suit pour k � 1 et 1 � u � k

h∗(u) � h∗(u − 12) + Ok(1/ ln y).

Une application inductive de cette inégalité fournit finalement

h∗(u) � h∗(1) + Ok(1/ ln y) � 1 + Ok(1/ ln y),

ce qu’il fallait démontrer. �

146

Chapitre 5

Les grandes conjectures

Si la théorie des nombres premiers doit une large part de sonpouvoir de fascination aux mystères dont elle demeure parsemée,elle avance surtout grâce aux conjectures qui, au fil des siècles, ontforgé notre philosophie de l’objet et précisé les contours des buts àatteindre.

À tout seigneur tout honneur. Nous avons déjà mentionné, auChapitre 2, l’hypothèse de Riemann, dont une forme élémentaireéquivalente est

(∀ ε > 0) π(x) = li(x) + O(x1/2+ε).

On sait qu’un tel résultat, s’il est vérifié, serait optimal et que ladifférence

Δ(x) = π(x) − li(x)

change de signe infiniment souvent et possède des oscillations« comparables » à

√x.(1) Le premier changement de signe est

certainement supérieur à 1010 et, ainsi que l’a montré te Riele(1986), inférieur à 7 × 10370.

1. Voir le 2.7, p. 69.

147

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

On peut cependant se demander quelle est la fréquence de cesoscillations. Un raisonnement heuristique sur la base d’un modèlede type Cramér laisse supposer que, pour tout X assez grand, il y aau moins un changement de signe dans chaque intervalle ]X , 2X ].Le meilleur résultat connu dans cette direction, dû à Kaczorowski(1985), établit cette hypothèse en moyenne : pour une constanteconvenable c > 0, il y a au moins c log X changements de signedans l’intervalle [2, X ].

À l’appui de la philosophie du « tout ce qui est possible se réalise »,nous avons déjà mentionné, au § 1.11 (p. 41) la conjecture desnombres premiers jumeaux. En 1923, Hardy & Littlewood ontproposé la généralisation suivante : pour tous k-uples d’entierspositifs ou nuls {aj}k

j=1, {bj}kj=1 ayant la propriété que le polynôme

P(ξ) =∏

1�j�k

(ajξ + bj)

ne s’annule identiquement modulo p pour aucun nombre premierp, il existe une infinité de nombres entiers n tels que les nombresajn + bj (1 � j � k) soient simultanément premiers. C’est laconjecture des nombres premiers jumeaux généralisée.(1)

On peut facilement étendre le calcul heuristique présenté au§ 1.11 pour fournir un équivalent asymptotique de la formeCx/(log x)k pour le nombre des nombres premiers du type indiquén’excédant pas x. Ainsi, cette conjecture contient, sous une formequantitative,(2) à la fois le théorème de Dirichlet sur les progressionsarithmétiques et la conjecture des nombres premiers jumeaux.

Cette extension a été placée par Schinzel & Sierpiski en 1958dans un cadre plus général encore qui lui confère un statut quasidéfinitif. Leur conjecture, connue sous le nom d’hypothèse Hs’énonce comme suit.

1. La conjecture classique des nombres premiers jumeaux correspond donc à k = 2,avec (a1, b1) = (1, 0), (a2, b2) = (1, 2).2. La forme qualitative est due à Dickson (1904).

148

LES GRANDES CONJECTURES

Hypothèse H. Soit {Qj(ξ)}kj=1 une suite finie de polynômes irréduc-

tibles à coefficients entiers. On note �(p) le nombre de racines modulo pdu polynôme Q(ξ) :=

∏kj=1 Qj(ξ). Alors le nombre πQ(x) d’entiers

n � x tels que |Qj(n)| soit premier pour 1 � j � k satisfait à larelation asymptotique

πQ(x) = {CQ + o(1)} x∏

1�j�k

1log |Qj(x)|

(x → ∞),

où l’on a posé

CQ :=∏

p

(1 − �(p)

p

)(1 − 1

p

)−k.

On peut montrer grâce à une généralisation adéquate duthéorème des nombres premiers dans les extensions algébriques deQ, que le produit définissant CQ converge.

Le cas trivial où Q(n) possède des facteurs fixes (i.e. où Q(n)est divisible par un nombre premier fixe pour tout n) est couvertpar l’énoncé puisqu’alors CQ = 0.

Lorsque Q(ξ) =∏

h∈H(ξ + h) où H est un ensemble fini denombres entiers, on reconnaît

CQ = S(H),

tel que défini en (3.8) p. 100.La théorie moderne du crible(1) fournit pour πQ(x) des majo-

rations du « bon » ordre de grandeur, c’est-à-dire une expressiondu type conjecturé, mais avec une constante éventuellement plusgrande que CQ .(2) Pour les bornes inférieures, il faut se contenter

1. Voir en particulier l’ouvrage de Halberstam & Richert Sieve methods, Academic Press1974.2. C’est par exemple le cas pour la quantité (3.7) p. 100, qui constitue une majorationdu nombre des k-uples de nombres premiers de la forme (n + h1, . . . , n + hk) lorsqueH := {h1, . . . , hk} est un système admissible. Compte tenu de la limitation en Rimposée par le théorème de Bombieri–Vinogradov, on constate que la majorationexcède l’équivalent asymptotique conjecturé d’un facteur 2kk! + o(1).

149

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

de remplacer πQ(x) par le nombre des entiers n � x pour lesquelsQ(n) ne possède (au plus) qu’un nombre borné K > k de facteurspremiers. Dans le cas de k = 4 polynômes linéaires, par exemple,on peut choisir K = 15.

Il est particulièrement agaçant de ne pas savoir s’il existe ounon une infinité de nombres premiers de la forme n2 + 1 — uneconséquence très affaiblie du cas le plus simple de l’hypothèse Haprès celui des polynômes de degré 1.

Plusieurs voies ont été explorées pour aborder ce problème parune variante moins difficile.

On a cherché des minorations pour le plus grand facteur premierP+(Q(n)) de valeurs polynomiales. Ainsi Deshouillers & Iwaniec(1982), améliorant un résultat de Hooley, ont montré que l’on aP+(n2 + 1) > n6/5 infiniment souvent. Heath-Brown (1999) aobtenu un résultat qualitativement comparable pour P+(n3 + 2).Dans le cas d’un polynôme irréductible Q(n) de degré arbitraire,la meilleure estimation connue est celle de Tenenbaum (1990),améliorant un résultat d’Erdos et Schinzel et fournissant, pour uneinfinité de valeurs de n, la minoration

P+(Q(n)) > n exp{(log n)α}

dès que α < 2 − log 4 ≈ 0,6137.

Paul Erdos & Gérald Tenenbaum vers 1990

150

LES GRANDES CONJECTURES

La principale difficulté inhérente au problème de trouver desnombres premiers dans les suites polynomiales est due à la vitesse decroissance : il n’y a que O(

√x) valeurs d’un polynôme quadratique

dans les entiers � x, et ce nombre est trop faible pour queles techniques actuellement disponibles permettent d’exhiber unnombre premier parmi ces valeurs.(1)

Piatetski-Shapiro (1953) a proposé de rechercher des nombrespremiers dans la suite {�nc�}∞n=1 avec c > 1, c /∈ N, ce qui fournitun champ d’investigation continu entre le cas des polynômeslinéaires (Dirichlet) et celui des polynômes quadratiques (hypo-thèse H ). Il a obtenu une formule asymptotique pour c < 12/11.Le record actuel pour l’existence d’une infinité de nombres premiersp = �nc� est dû à Rivat et Wu (2001), avec c = 243/205.

Une voie analogue consiste à rechercher des nombres premiersdans les valeurs de polynômes à plusieurs variables, disons du type

Q(n1, . . . , nk) =∑

1�j�k

ajndj

j .

Il s’agit alors de rendre la quantité b =∑

1�j�k 1/dj, qui estcomparable à 1/c dans le problème de Piatetski-Shapiro, aussipetite que possible. Friedlander & Iwaniec (1996) sont parvenus àune réponse positive pour le polynôme n2

1 + n42, ce qui représente

une avancée tout à fait remarquable dans ce domaine. Heath-Brown(1999) a pu traiter le cas Q(n1, n2) := n3

1+2n32, avec donc b = 2/3.

Dans les deux situations, les auteurs fournissent même une formuleasymptotique pour le cardinal des nombres premiers de la formeindiquée n’excédant pas x.

Une vieille conjecture concernant la répartition des nombrespremiers affirme que la fonction x �→ π(x) est sous-additive, end’autres termes que

π(x + y) � π(x) + π(y) (x � 2, y � 2).

1. La difficulté est comparable à celle du problème des nombres premiers � x dansune progression arithmétique de raison q � √

x. Il est d’ailleurs intéressant de noterque c’est précisément la limite issue de l’hypothèse de Riemann généralisée.

151

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Cette inégalité est asymptotiquement raisonnable au vu duthéorème des nombres premiers, et Montgomery & Vaughanont effectivement établi en 1973 que l’on a

π(x + y) � π(x) + 2π(y) (x � 2, y � 2).

Cependant la sous-linéarité est probablement fausse : Hensley &Richards ont montré, également en 1973, qu’elle est incompatibleavec la conjecture des nombres premiers jumeaux généralisée, etl’opinion générale est largement en faveur de cette dernière.

Une autre conjecture ultra-célèbre, émise par Goldbach en 1742dans deux lettres adressées à Euler, peut être vue comme duale dela conjecture des nombres premiers jumeaux. Au lieu de considérerles différences p− q de nombres premiers (et de conjecturer que laplus petite valeur pour laquelle il n’y a pas d’obstruction évidenteest atteinte infiniment souvent) on forme les sommes p + q et l’onconjecture que, puisque la seule contrainte manifeste est que cesnombres soient pairs (lorsque p et q sont des nombres premiers> 2), tous les nombres pairs sont effectivement représentablesainsi. La conjecture de Goldbach est donc que tout nombre pair > 2est somme de deux nombres premiers, ce qui implique trivialementque tout nombre impair > 5 est somme de trois nombres premiers.

Le nombre Rk(n) de représentations d’un entier naturel n sousla forme

n =∑

1�j�k

pj

Hugh L. Montgomery Robert C. Vaughan

152

LES GRANDES CONJECTURES

satisfait évidemment à

Rk(n) =

∫ 1

0

(∑p�n

e2πiαp)k

e−2πiαn dα.

On voit ici apparaître la somme trigonométrique SN (α) étudiée au§ 3.7 avec N = π(n). Nous savons que SN (α) est pratiquementde l’ordre de N lorsque α possède une « bonne » approximationrationnelle avec un « petit » dénominateur, et que SN (α) = o(N )dans le cas contraire. Ces observations ont conduit Hardy &Littlewood, dans les années 1920, à évaluer asymptotiquementl’intégrale en mettant en évidence une contribution dominanteissue des voisinages des nombres rationnels à petits dénominateurs.C’est la fameuse méthode du cercle, dont les applications enarithmétique ne se comptent plus.(1) I.M. Vinogradov a ainsimontré en 1937, comme conséquence de ses estimations sur SN (α),que tout nombre impair assez grand est effectivement somme detrois nombres premiers et que presque tout nombre pair est sommede deux nombres premiers : le nombre d’exceptions n’excédantpas x est o(x), et Montgomery& Vaughan (1975) ont améliorécette estimation en O(x1−δ) pour un δ > 0 convenable.

En utilisant une méthode de crible,(2) le mathématicien chinoisChen Jing-Run a montré en 1973 que tout entier pair assez grandest représentable sous la forme p + P2 où p est premier et P2 estun entier ayant au plus deux facteurs premiers.

Tant par le résultat de Chen que celui de Vinogradov, onpourrait croire proche la solution complète de la conjecture deGoldbach. Mais il y a loin de la coupe aux lèvres : la présence detrois variables au lieu de deux est, dans chacune des deux méthodes,une contrainte essentielle, et les spécialistes s’accordent pour penserque le plus dur reste à faire.

1. Voir le livre de R.C. Vaughan, The Hardy–Littlewood method, Cambridge UniversityPress, 1981.2. En fait une version pondérée du crible de Selberg, cf. l’ouvrage cité plus haut deHalberstam & Richert.

153

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

La répartition dans les progressions arithmétiques fait évidem-ment partie des grandes questions qui restent à élucider sur lesnombres premiers. Nous avons déjà mentionné (§ 3.3, p. 88),l’hypothèse de Riemann généralisée aux fonctions L(s, χ) et laconjecture d’Elliott–Halberstam qui impliquerait, en moyenne,une plus grande régularité encore.

L’estimation du plus petit nombre premier, disons P(a, q), dansla progression p ≡ a (mod q) est une question fine et difficileparticipant de la même problématique. Un argument probabilistesuggère que la quantité

P∗(q) := max(a,q)=1

P(a, q)

est de l’ordre de ϕ(q)(log q)2 alors que l’hypothèse de Riemanngénéralisée fournit P∗(q) q2+ε pour tout ε > 0. Linnik (1944)a établi l’existence d’une constante L telle que P∗(q) qL etHeath-Brown (1992) a montré que l’on peut choisir L � 11/2.

Au chapitre des problèmes d’irrégularité de répartition, il fautmentionner une curieuse conjecture de Tchébychev affirmantqu’en un certain sens il y a plus de nombres premiers de la forme4m + 3 que de la forme 4m + 1, ce qui est effectivement fortementsuggéré par les tables.

Cette affirmation ne peut être prise en un sens trop strictpuisqu’il est possible d’établir, avec des moyens analogues àceux employés par Littlewood pour étudier les oscillations deπ(x)−li(x), que la différence π(x; 1, 4)−π(x; 3, 4) change de signeinfiniment souvent. Cependant, Tchébychev a émis l’hypothèseque, si l’on note

T (σ, χ) :=∑p>2

(−1)(p−1)/2e−σp

alorslim

σ→0+T (σ, χ) = −∞.

154

LES GRANDES CONJECTURES

Un tel résultat confirmerait effectivement la prépondérance, en unsens assez subtil, des nombres premiers du type 4m + 3. Hardy &Littlewood ont montré en 1918 que cela découlerait de l’hypothèsede Riemann pour la fonction L associée à l’unique caractère nontrivial modulo 4, soit

L(s, χ) =∑n�0

(−1)n

(2n + 1)s·

Landau avait remarqué dès 1918 que, plus généralement, la formuleexplicite pour π(x; a, q) fait apparaître un premier terme résiduelpositif occasionnellement prépondérant si a est non-résidu quadra-tique modulo q. Sous l’hypothèse de Riemann généralisée, laprésence de ce terme suffit à impliquer la conjecture de Tchébychev.

Landau (1918) a également établi la réciproque : si L(s, χ)possède un zéro dans le demi-plan σ > 1

2 , alors

lim supσ→0+

T (σ, χ) = +∞ et lim infσ→0+

T (σ, χ) = −∞.

Les résultats modernes sur ce problème vont tous dans ladirection sinon d’une réfutation de l’hypothèse de Tchébychev, dumoins dans celle de l’existence de limitations à la prépondérance decertaines classes de résidus sur d’autres. Par exemple, Kaczorowski amontré en 1991 que, si N (X ; a, q) désigne, pour (a, q) = 1, a �= 1,le nombre des entiers x � X tels que π(x; a, q) � π(x; 1, q), alorson a, sous l’hypothèse de Riemann généralisée pour les fonctionsL de module q,

c1X � N (X ; a, q) � (1 − c2)X (X � X0),

avec des constantes positives convenables c1 et c2.

La plupart des autres problèmes profonds et non résolus relatifsaux nombres premiers concernent leur présence dans les suitesrares.

Nous avons déjà mentionné le cas des valeurs polynomiales,mais les conjectures sur le comportement statistique des nombres

155

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

premiers conduisent à des hypothèses beaucoup plus hardiesencore.

Les nombres de la forme 2m + 1 ont, depuis longtemps, intriguéles arithméticiens, amateurs et professionnels. L’idée sous-jacenteest qu’en translatant un entier, tel que 2m, de structure multiplica-tive très éloignée de celle d’un nombre premier, on devrait obtenirun entier sinon premier du moins d’une structure voisine. Il estfacile de constater que 2m + 1 ne peut être premier que si m estlui-même une puissance de 2,(1) et Fermat a conjecturé que tousles nombres Fn = 22n

+ 1 sont premiers. Cette hypothèse, fondéesur le raisonnement heuristique précédent qui tend à « accroître »la probabilité que Fn soit premier, est contraire au raisonnementstatistique puisque l’espérance naïve du nombre de valeurs den � N telles que Fn soit premier est

∑n�N 1/ log Fn 1.

Euler a observé en 1732 que F5 est divisible par 641 et l’on saitaujourd’hui que Fn est composé pour 5 � n � 21. On conjectureque tous les Fn sont composés à partir d’un certain rang, mais onne sait pas montrer qu’une infinité d’entre eux sont composés.

Semblablement, 2m − 1 ne peut être premier que si m estlui-même premier. Les nombres de la forme

Mp := 2p − 1

sont appelés nombres de Mersenne, d’après le nom de celui quia donné en 1644 une liste (partiellement inexacte) des valeursde p � 257 pour lesquelles Mp est premier. Lucas a trouvé uneméthode pour tester la primalité des nombres de Mersenne quisert encore à produire de grands nombres premiers — commecelui cité dans l’avant–propos.

On ignore s’il existe une infinité de nombres premiers deMersenne, mais l’argument probabiliste suggère une réponsepositive. Hooley (1976) a fourni une preuve conditionnelle que, sib est un entier impair avec |b| > 1, le nombre πb(x) de valeurs de

1. Si m = kp avec p > 2, on a 2m + 1 = (2k + 1)∑

0�j�p−1(−1)j2kj .

156

LES GRANDES CONJECTURES

n � x telle que 2n + b ∈ P satisfait πb(x) = o(x). Il a égalementétabli, inconditionnellement, un résultat analogue concernant lesnombres premiers de Cullen, i.e. de la forme Kn := n2n + 1 : on al’estimation |{n � x : Kn ∈ P}| = o(x).

La liste de conjectures présentée ici est bien entendu loin d’êtreexhaustive. Certains problèmes mentionnés précédemment dans letexte, comme la conjecture de Cramér, n’ont pas été rediscutés dansce chapitre. D’autres questions, comme celles d’origine algébrique,ne sont pas abordées. On se consolera en observant que l’entrepriseest par nature illimitée : les nombres premiers, le lecteur l’auracompris, sont énigmes avant toute autre chose.

157

Lectures complémentaires

Z.I. Borevitch & I.R. Chafarevitch, 1967. Théorie des nombres,Gauthier–Villars, Paris.

H. Cohen, 1993. A course in computational algebraic number theory,Graduate Texts in Mathematics 138, Springer, New York,Heidelberg, Berlin.

H. Davenport, 1980. Multiplicative number theory, seconde éditionrévisée par H. L. Montgomery, Springer, New York, Heidelberg,Berlin.

J.-P. Delahaye, 2000. Merveilleux nombres premiers, coll. Pour lascience, Belin, Paris.

H.M. Edwards, 2003. Riemann’s Zeta Function, Dover Publica-tions Inc.

P.D.T.A. Elliott, 1979. Probabilistic number theory : mean valuetheorems, Grundlehren der Math. Wiss. 239, Springer-Verlag,New York, Berlin, Heidelberg.1980. Probabilistic number theory : central limit theorems, Grund-lehren der Math. Wiss. 240, Springer-Verlag, New York, Berlin,Heidelberg.

H. Halberstam & H.-E. Richert, 1974. Sieve methods, LondonMathematical Society Monographs 4, Academic Press, London,New York, San Francisco.

R.R. Hall & G. Tenenbaum, 1988. Divisors, Cambridge Tractsin Mathematics 90, Cambridge University Press.

G.H. Hardy & E.M. Wright, 2006. Introduction à la théorie desnombres, préface de Catherine Goldstein, traduction de FrançoisSauvageot, Vuibert.

A.E. Ingham, 1990. The distribution of prime numbers, préface deR.C. Vaughan, Cambridge University Pres.

A. Ivic, 2003. The Riemann Zeta-Function : Theory and Applications,Dover Publications Inc.

159

LECTURES COMPLÉMENTAIRES

M. Kac, 1972. Statistical independence in probability, analysisand number theory, Carus Mathematical Monographs 12,Mathematical Association of America, John Wiley & Sons.

N. Koblitz, 2000. Algebraic aspects of cryptography, 2e édition,Springer-Verlag, Berlin, Heidelberg.

A.J. Menezes, P.C. van Oorschot & S.A. Vanstone, 2001.Handbook of Applied Cryptography, 5e édition, CRC Press,2001.

H.L. Montgomery & R.C. Vaughan, 2007. Multiplicative numbertheory, I. Classical theory, Cambridge Studies in AdvancedMathematics 97, Cambridge University Press, Cambridge.

I. Niven, H. S. Zuckerman, H. L. Montgomery, 1991. Anintroduction to the theory of numbers, John Wiley New York,Chichester, Brisbane, Toronto, Singapore, xiii+527 pp.

P. Ribenboim, 2000. Nombres premiers : mystères et records, PressesUniversitaires de France.

G. Robin, 1991. Algorithmique et cryptographie, SMAI, coll. Ellipses.P. Samuel, 1967. Théorie algébrique des nombres, Hermann, Paris.J.-P. Serre, 1968. Corps locaux, Hermann, Paris.G. Tenenbaum, 2008. Introduction à la théorie analytique et

probabiliste des nombres, troisième édition, coll. Échelles, Belin,592 pp.

E.C. Titchmarsh, 1951. The theory of the Riemann zeta-function,(seconde édition, révisée par D. R. Heath-Brown en 1986)Oxford University Press.

R.C. Vaughan, 1997. The Hardy-Littlewood Method, CambridgeTracts in Mathematics 125, Cambridge University Press.

160

Index

Abel, Niels, 113critère de convergence, 82, 85,

117sommation, 117, 118, 131, 136

Adleman, Len, 18Alain, Aspect, xiiAlford, William Robert, 16Allouche, Jean-Paul, xvianalytique

fonction, 43, 44, 46–49, 51,55, 57, 58, 60, 62, 64, 66,70, 114

prolongement, 5, 44, 46, 48,49, 51–56, 70

Anker, Jean-Philippe, xvianneau

commutatif unitaire, 13, 120factoriel, 120intègre, 14, 120

Apéry, Roger, 57asymptotique (formule), 32

Bachet, Claude-Gaspard, 7, 13, 14Baker, Roger C., 72Balazard, Michel, xvibande critique, 47, 69Barlet, Daniel, xviBergelson, Vitaly, xviiBernoulli, Jacques

nombres, 56variables, 93

Bertrand, Josephpostulat, 10, 30, 70

Bohr, Niels, xiiBombelli, Rafaele, 4Bombieri, Enrico, 88, 97, 102, 149Borel, Émile, 93Borel–Cantelli (lemme), 93Borevitch, Zenon Ivanovitch, xivde la Bretèche, Régis, xviBrun, Viggo, 10, 11, 36–40, 95, 96Buchstab, Aleksandr Adolfovich, 96,

138

Cantelli, Francesco, 93caractère

de Dirichlet, 79orthogonalité, 80principal, 80

Cardan, Jérôme, 4Carmichael, Robert Daniel, 16Cauchy, Augustin-Louis, 43, 44, 46cercle (méthode), 153Chafarevitch, Igor Rostilavovitch,

xivCharpentier, Éric, xviChen, Jing Run, 153clef publique, 17compléments (formule), 54, 55congruence (définition), 13conjecture

de Goldbach, 106, 152, 153

161

INDEX

Conrey, J. Brian, 68convolution

de Dirichlet, 117, 119inverse de —, 123

Copenhagueécole de —, xii

corps, 5van der Corput, Johannes

Gualtherus, 89, 104Cramér, Harald, 76, 77, 91–95, 97,

102, 148, 157crible, xiv, 10, 11, 39, 41, 72, 91,

96, 117, 149, 153combinatoire, 36, 39d’Ératosthène, 10, 24–26, 37,

38, 95, 107, 123de Brun, 36, 95, 96de Selberg, 99, 153

critère d’Abel, 82, 85, 117critique

bande, 47, 69droite, 67, 68, 71, 88

Cullen, James, 157

Daboussi, Hédi, xvi, 107, 116, 134,141

Dartyge, Cécile, xviDelahaye, Jean-Paul, xvdensité (théorèmes de —), 71Descartes, René, 4Deshouillers, Jean-Marc, xvi, 150Dickman, Karl

fonction, 136–138Dirichlet, Peter G. Lejeune-, 75, 78,

79, 86, 87, 106, 122, 128caractères, 79convolution, 119

principe de l’hyperbole, 121problème, 70progressions arithmétiques, 75,

79, 81, 83–85, 105, 148,151

séries L, 80, 84division euclidienne, 12droite critique, 67, 68, 71, 88duplication (formule), 54, 55

Eco, Umberto, xviEinstein, Albert, xiiElliott, Peter D.T.A., xv, 88, 154Encke, Johann Franz, 65ensemble de multiples, 12équation

différentielle aux différences,117, 137, 138

fonctionnelle, 116, 143polynomiale, 15, 20

équation fonctionnellepour Γ, 54, 136pour �(u), 137, 139pour ϑ(u), 53, 55pour ζ(s), 52–57, 67

équirépartition modulo 1, 102–105critère de Weyl, 103, 104

équirépartition modulo 1critère de Weyl, 109

Ératosthène, 9, 10, 24, 107Erdos, Paul, xiii, 89, 97, 114–116,

150ergodique, 90Euclide, 2, 7, 9, 11, 12, 22, 23, 78

162

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

Euler, Leonhard, 2, 3, 9, 10, 19, 21,22, 34, 47, 50, 53, 54, 56,77, 79, 83, 136, 152, 156

constante, xix, 33, 66, 139fonction Γ, 53, 54, 136fonction indicatrice, 14, 25formule (résidus inversibles),

16, 19formule du produit, 34, 35, 48,

49, 51, 81, 121

Fermat, Pierre de, 21, 156grand théorème de —, 16petit théorème de —, 16, 20

Fields (Médaille), xivfonction

analytique, 43, 44, 46–49, 51,55, 57, 58, 60, 62, 64, 66,70, 114

arithmétique, 119multiplicative, 120, 123, 132,

133formule

asymptotique (définition), 32de duplication, 54, 55de Perron, 59, 60des classes, 86des compléments, 54, 55

formules explicites, 65–67, 71, 155Fort, Jean-Claude, xviFourier, Joseph

transformation, 52, 61Friedlander, John, 97, 151Furstenberg, Hillel, 90

Gallagher, Patrick X., 94, 101

Gauss, Carl Friedrich, xii, 3, 4, 7–10,13, 21, 32, 47, 65, 75, 84

Girard, Albert, 21Goldbach, Christian

conjecture, 106, 152, 153Goldston, Daniel, xiii, xvii, 11, 77,

97, 98Gowers, W. Thimoty, 90Granville, Andrew, xvi, 16, 97Green, Ben, xiii, 76, 89–91

Hadamard, Jacques, xii, 6, 58, 62,64, 66, 67, 86, 113

Halberstam, Heini, 38, 88, 149,153, 154

Hall, Richard R., xvHanrot, Guillaume, xviiHardy, Godfrey H., 41, 67, 70, 89,

94, 113, 148, 153, 155Harman, Glyn, 72Heath-Brown, D. Roger, 150, 151,

154Hensley, Douglas, 152Hildebrand, Adolf J., 97homomorphisme, 20Hooley, Christopher, 150, 156Host, Bernard, 76Huxley, Martin N., 72hyperbole (principe), 121, 122, 128hypothèse H , 151hypothèse de Riemann, 47, 65, 67,

71généralisée, 88, 151, 154, 155

hypothèse H, 148

idéal de Z, 12Ikehara, Shikao, 64, 114

163

INDEX

ineffectivité, 86, 87inéquation fonctionnelle, 144, 145intégrale curviligne, 44Iwaniec, Henryk, 38, 72, 96, 150,

151

Jacobi, C. Gustavfonction ϑ, 53

jumeauxnombres premiers, xiii, 10, 11,

39–41, 89, 94, 97, 99,148, 152

Jutila, Matti, 72

Kac, Mark, xiiKaczorowski, Jerzy, xvi, 148, 155Kamae, Teturo, 79Koblitz, Neal, xvKorobov, Nikolaï Mikhaïlovich, 68,

71Kra, Bryna, 76

La Vallée-Poussin, Charles de, xii, 6,58, 62–64, 67, 68, 70, 71,78, 86, 113

Landau, Edmund, 69, 70, 126, 155Landreau, Bernard, xviLegendre, Adrien–Marie

symbole, 20, 83Legendre, Adrien-Marie, xii, 3, 4, 9,

10, 21, 25, 32, 37, 47, 54,65

Levinson, Norman, 68Lindemann, Ferdinand, 57Linnik, Yurii Vladimirovich, 154Littlewood, John Edensor, 41, 69,

89, 92, 94, 113, 148,153–155

loi de réciprocité quadratique, xivloi de réciprocité quadratique, 8, 21loi du logarithme itéré, 104Lucas, Édouard, 16, 156

méthode du cercle, 153Maier, Helmut, 94, 96, 97Mallarmé, Stéphane, xvivon Mangoldt, Hans, 68

fonction Λ, 27, 81, 114, 123,126

Marchand, Pierre, xviMathieu, Pierre, xviMendès France, Michel, 79Menezes, Alfred J., xvMersenne, Marin, 156Mertens, Franz, 10, 32–34, 36, 37,

40, 63, 83, 95, 133, 139,145, 146

formule, 33, 34, 49, 140Moivre, Abraham de, 48Montgomery, Hugh L., xv, 152, 153Mozzochi, Charles J., xviiMurty, Marouti Ram, 79

Newton, Isaac, 4Nicolas, Jean-Louis, xvinombre

de Carmichael, 16pseudo-premier, 16sans facteur carré, 23, 25

nombre de diviseurs, 119–121

164

LES NOMBRES PREMIERS, ENTRE L’ORDRE ET LE CHAOS

nombresalgébriques, 108complexes, 5de Bernoulli, 56de Cullen, 157de Mersenne, 156imaginaires, 4irrationnels, 57, 75, 103premiers (définition), 2, 11transcendants, 57, 108

nombres premiersjumeaux, xiii, 10, 11, 39–41,

89, 94, 97, 99, 148, 152noyau

sans facteur carré, 25

van Oorschot, Paul C., xvorthogonalité des caractères, 80oscillation (théorèmes d’—), 69

Pedon, Emmanuel, xviPerron, Oskar

formules d’inversion, 59, 60petits intervalles, 70, 93Phragmén, Edvard, 69, 70Piatetski-Shapiro, Ilya I., 151Pintz, János, xiii, xvii, 11, 72, 77,

97, 98Poisson, Denis

formule sommatoire, 52, 53loi, 93

Pólya, George, 87Pomerance, Carl, 16progression arithmétique, 74prolongement

analytique, 5, 44, 46, 48, 49,51–56, 70

pseudo-aléatoire, 90pseudo-premier, 16

quadrature du cercle, 57

réciprocité quadratique, xivréciprocité quadratique, 8, 21racine primitive, 80racines, 15raison

d’une progression arithmétique,74

Rankin, Robert Alexander, 97, 132résidu, 100

quadratique, 20, 21, 78Ribenboim, Paulo, xvRichards, Ian, 152Richert, Hans-Egon, 38, 149, 153Riemann, Bernhard, 4–6, 32, 43–46,

48, 54, 65, 67, 78, 86fonction zêta, xix, 5, 44, 47,

50–53, 56, 57, 63, 66, 67,69, 72, 113, 119

hypothèse de —, 47, 65, 67,71, 92, 94, 97, 147

hypothèse de — généralisée, 88,151, 154, 155

intégrale, 103, 104Riemann–Lebesgue (lemme), 61Rivat, Joël, 151Rivest, Ronald, 18Rivoal, Tanguy, 57Robin, Guy, xvRosser, J. Barkley, 38RSA (système de cryptographie), 18

Samuel, Pierre, xiv

165

INDEX

Sargos, Patrick, xviSárközy, András, 79Schinzel, Andrzej, 148, 150Selberg, Atle, 68, 94, 99, 100, 114,

116crible, 99, 153identité, 114, 115

Serre, Jean-Pierre, xivShamir, Adi, 18Sicherman, Jacques, xviSiegel, Carl Ludwig, 86, 87, 97, 106

zéro, 87, 88Sierpiski, Wacław, 148Smith, Edson, xisommation d’Abel, 117, 118, 131,

136Stef, André, xviStirling, James

formule, 10, 26, 56, 115Szemerédi, Endre, 90

Tao, Terence, xiii, xiv, 76, 89–91taubériens (théorèmes), 113Tauber, Alfred, 113Tchébychev, Pafnouti, 3, 10, 26, 27,

29–32, 36, 115, 154, 155fonctions de —, 58, 126

te Riele, Herman, 147Tenenbaum, Gérald, xv, 150Turán, Paul, 89

Vanstone, Scott A., xvVaughan, Robert C., xv, 107, 108,

152, 153Vinogradov, Aleksei Ivanovich, 88,

97, 102Vinogradov, Ivan M., xx, 68, 71, 87,

105, 107, 149, 153

Walfisz, Arnold, 86, 97, 106Wallis, John, 4Waring, Edward, 16Weyl, Hermann

critère d’équirépartition, 103,104, 109

Wiener, Norbert G., 114Wilson, John, 16Wu, Jie, xvi, 41, 151

Yao, Jia-Yan, xviiYıldırım, Cem, xiii, xvii, 11, 77, 97,

98

zérode Siegel, 87, 88

zérosnon triviaux de ζ(s), 65, 66, 68,

88triviaux de ζ(s), 56

zêta (fonction), xix, 5, 44, 47,50–53, 56, 57, 63, 66, 67,69, 72, 113, 119

Zimmermann, Paul, xvi

166