0% ont trouvé ce document utile (0 vote)
32 vues117 pages

Rapport Stage M1

Ce rapport de stage explore les corrélations entre fonctions multiplicatives et examine le problème de la discrépance d'Erdos, resté ouvert jusqu'en 2015. Il s'appuie sur des résultats récents de Matomäki et Radziwiłł concernant les moyennes de fonctions multiplicatives et discute des conjectures de Chowla et d'Elliott. Le rapport inclut également une démonstration du problème de la discrépance d'Erdos par Tao.

Transféré par

Loic Fokam
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
32 vues117 pages

Rapport Stage M1

Ce rapport de stage explore les corrélations entre fonctions multiplicatives et examine le problème de la discrépance d'Erdos, resté ouvert jusqu'en 2015. Il s'appuie sur des résultats récents de Matomäki et Radziwiłł concernant les moyennes de fonctions multiplicatives et discute des conjectures de Chowla et d'Elliott. Le rapport inclut également une démonstration du problème de la discrépance d'Erdos par Tao.

Transféré par

Loic Fokam
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ENS de Rennes

Université Rennes 1

Département de Mathématiques
Rapport de Stage

Corrélations entre fonctions multiplicatives

Élève : Encadrant :
Titouan Donnart Pierre-Yves Bienvenu
1
Introduction :

Une heuristique en théorie analytique des nombres stipule que les ensembles de nombres entiers po-

sitifs ne peuvent pas être simultanément structurés de manière additive et multiplicative. La vérification

pratique de cette heuristique est à l’origine d’un grand nombre de problèmes difficiles. Les conjectures

de ce type sont également au moins équivalentes sur le plan conceptuel à l’attente selon laquelle une

fonction multiplicative quelconque se comporte de manière aléatoire sur des ensembles additifs.

Dans ce rapport, nous examinons l’un de ces problèmes qui est resté ouvert jusqu’en 2015 : le problème

de la discrépance d’Erdos. Il s’agit de voir si oui ou non la borne supérieure prise (en module) par les

sommes des éléments d’une suite (f (n))n∈N à valeurs dans {−1, +1} le long de progressions arithmétiques

homogènes est infinie.

Après avoir rappelé divers résultats de base sur la théorie analytique des nombres, nous nous intéres-

serons au point de départ de la preuve du problème de la discrépance d’Erdos : les résultats obtenus par

Matomäki et Radziwiłł en 2014 sur les moyennes de fonctions multiplicatives sur de petits intervalles.

Ces résultats ont bouleversé la recherche en théorie analytique des nombres, et la direction de notre

rapport emprunte seulement l’une des nombreuses conséquences importantes de ces résultats.

Cela nous amènera à discuter de la conjecture de Chowla et d’Elliott, ainsi que des versions dites "en

moyenne" de ces conjectures, qui seront démontrées par les résultats obtenus par Matomäki et Radziwiłł.

Enfin, nous nous intéresserons à la démonstration de Tao du problème de la discrépance d’Erdos.

Je tiens personnellement à remercier chaleureusement mon maître de stage, Pierre-Yves Bienvenu, de

m’avoir fait découvrir ce domaine des mathématiques dont je n’avais presque aucune connaissance avant

ce stage. Je tiens aussi à le remercier pour toute l’aide et toutes les connaissances qu’il m’a apportées

pendant ces deux mois. Je tiens également à remercier l’ensemble du personnel du Trinity College de

m’avoir permis de réaliser ce stage dans un bon cadre. Enfin, je remercie l’ENS de Rennes et le centre

Henri Lebesgue de m’avoir octroyé une bourse pour que je puisse réaliser ce stage à Dublin malgré le

coût très élevé du logement là-bas.

Je tiens enfin à rappeler que cette version constitue une version complète de mes travaux réalisés

pendant mon stage et n’en constitue pas en soi le rapport "officiel". En particulier, il y a un plus grand

risque d’y retrouver des coquilles (voire des erreurs !).

2
3
Table des matières
I Rappels nécessaires 7
I.1 Formule de sommation par parties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2 Théorème d’approximation de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.3 Caractères de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
I.4 Entropie de Shannon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

II Introduction de quelques éléments de la théorie analytique des nombres 11


II.1 Fonctions arithmétiques - fonctions multiplicatives . . . . . . . . . . . . . . . . . . . . . . 11
II.2 Série de Dirichlet d’une fonction arithmétique . . . . . . . . . . . . . . . . . . . . . . . . . 13
II.3 Théorèmes fondamentaux de la théorie analytique des nombres . . . . . . . . . . . . . . . 16
II.3.1 Théorèmes de Mertens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
II.3.2 Le théorème des nombres premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
II.3.3 Le théorème de Hardy-Ramanujan . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
II.4 Entiers friables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

III Un peu de théorie des cribles 23


III.1 Principes généraux de la théorie des cribles . . . . . . . . . . . . . . . . . . . . . . . . . . 23
III.2 Crible de Brun pur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
III.3 Crible de Brun-Hooley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
III.4 Quelques applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

IV Moyennes de fonctions multiplicatives 34


IV.1 Quelques exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
IV.2 Distance prétentieuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
IV.3 Inégalité faible de Halasz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
IV.3.1 Quelques estimations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
IV.3.2 Preuve de l’inégalité faible de Halasz . . . . . . . . . . . . . . . . . . . . . . . . . . 40
IV.4 Théorème de Wirsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

V Moyenne de fonctions multiplicatives sur des petits intervalles : résultats de Ma-


tomäki et Radziwiłł 46
V.1 Exemples et motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
V.2 Quelques résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
V.3 Le théorème de Matomäki-Radziwiłł . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
V.4 Applications directes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
V.4.1 Quelques autres résultats de Matomäki-Radziwiłł . . . . . . . . . . . . . . . . . . . 57
V.4.2 Conséquences sur les entiers friables . . . . . . . . . . . . . . . . . . . . . . . . . . 58
V.4.3 Conséquences sur les signes de fonctions multiplicatives . . . . . . . . . . . . . . . 61

VI Conjecture de Chowla et conjecture d’Elliott 65


VI.1 Un petit raisonnement probabiliste vers la conjecture de Chowla . . . . . . . . . . . . . . 65
VI.2 Conjecture d’Elliott et sa version en moyenne . . . . . . . . . . . . . . . . . . . . . . . . . 66
VI.3 Quelques résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
VI.3.1 Quelques lemmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
VI.3.2 Présentation de la méthode du cercle . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4
i Une introduction à la méthode du cercle . . . . . . . . . . . . . . . . . . . . . . . . . 68
ii Retour à notre problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
VI.3.3 Mise en place de la méthode du cercle . . . . . . . . . . . . . . . . . . . . . . . . . 71
i Preuve dans le cadre des arcs mineurs . . . . . . . . . . . . . . . . . . . . . . . . . . 71
ii Preuve dans le cadre des arcs majeurs . . . . . . . . . . . . . . . . . . . . . . . . . . 73
iii Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
VI.3.4 Une conjecture d’Elliott en moyenne tronquée . . . . . . . . . . . . . . . . . . . . . 76
VI.4 Preuve de la conjecture d’Elliott en moyenne . . . . . . . . . . . . . . . . . . . . . . . . . 79

VII Conjectures de Chowla et d’Elliott en moyenne logarithmique 82


VII.1Moyenne logarithmique de fonctions multiplicatives . . . . . . . . . . . . . . . . . . . . . . 82
VII.2Présentation du résultat principal et réduction du problème . . . . . . . . . . . . . . . . . 82
VII.3Passage à un point de vue probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
VII.4Point de vue entropique et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
VII.4.1 Argument de décrément d’entropie . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
VII.4.2 Quelques conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

VIIIProblème de la discrépance d’Erdös 96


VIII.1Présentation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
VIII.2Quelques remarques sur le problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
VIII.3Forme équivalente du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
VIII.4Application de la conjecture d’Elliott logarithmique . . . . . . . . . . . . . . . . . . . . . 106
VIII.5Preuve de la conjecture d’Erdos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

5
Notations :

— Si A est un ensemble fini on notera |A| son cardinal.


— Si A est une partie de R mesurable (pour la mesure de Lebesgue), on notera mes(A) sa mesure.
— Si A est un ensemble, on notera 1A la fonction indicatrice de A ( 1A (x) = 1 si x ∈ A et est égal à
0 sinon). De plus si S est un énoncé mathématique on notera 1S la fonction qui vaut 1 quand S
est vraie et 0 quand S est fausse. Ainsi on notera par exemple 12|n l’indicatrice des nombres pairs.
— On notera log le logarithme népérien.
— Si x ∈ R, on notera ⌊x⌋ sa partie entière.
⌊x⌋
X X
— Si x ∈ R+ , on notera une somme la somme . Une somme indicée sur p sera toujours une
n⩽x n=0
somme sur les nombres premiers.
— Pour tous m, n ∈ Z, on notera (m, n) leur PGCD.
— On rappelle qu’une fonction f : N → C est dite multiplicative si pour tous m, n premiers entre eux
f (mn) = f (m)f (n), on dit qu’elle est complètement multiplicative si celle égalité est valable pour
tous m, n ∈ N.
— Si f : N → C, on notera Df sa série de Dirichlet qui vérifie pour tous s ∈ C (lorsque cette quantité
est définie) :
+∞
X f (n)
Df (s) = .
n=0
ns

— On notera φ l’indicatrice d’Euler définie par φ(n) = |{1 ≤ k ≤ n; k est premier avec n}|.
— On note µ la fonction de Mobiüs définie par µ(1) = 1,µ(n) = 0 si n possède un facteur carré et
µ(n) = (−1)k si n est le produit de k nombres premiers distincts. Elle est multiplicative.
— On note λ la fonction de Liouville définie par λ(n) = (−1)Ω(n) où Ω(n) désigne le nombre de facteurs
premiers comptés avec multiplicité de l’entier n. C’est une fonction complètement multiplicative.
— On note π la fonction qui à x ∈ R compte le nombre de nombres premiers inférieurs ou égaux à x.
— On adoptera les notations asymptotiques dans deux contextes, un où il n’y a pas de paramètre
asymptotique présent et un où il y en a. Dans le contexte sans paramètre asymptotique, on utilisera
X = O(Y ), X ≪ Y ou Y ≫ X pour noter une estimation de la forme |X| ⩽ CY où C est une
constante fixe.
— Dans certains cas où la constante C dépend de paramètres additionnels comme k on le notera en
indice comme ceci X = Ok (Y ), X ≪k Y ou Y ≫k X.
— Quand il existe un paramètre asymptotique (par exemple x) tous les objets mathématiques pourront
dépendre de ce paramètre (à part contre-indications). On utilisera X = O(Y ), X ≪ Y ou Y ≫ X
pour noter une estimation de la forme |X| ⩽ CY où C est une constante qui peut dépendre d’autre
paramètres tant que ceux-ci sont fixés. On notera aussi X = o(Y ) pour noter une estimation de la
forme |X| ⩽ cY où c est une quantité qui tend vers 0 quand le paramètre asymptotique tend vers
+∞.

Les autres notations apparaissant dans ce rapport seront précisées au fur et à mesure du document.

6
I Rappels nécessaires

I.1 Formule de sommation par parties


L’objectif de cette partie est de présenter la formule de sommation par parties qui va être un résultat
technique classique en théorie analytique des nombres.

Théorème I.1: Formule de sommation par parties

Soit x ∈ R+ , a ∈ N, f : [a, x] → C et g une fonction de classe C 1 ([a, x]). Alors :


 
X X Z x X
f (n)g(n) = f (n)g(x) − g ′ (t)  f (n) dt.
a⩽n⩽x a⩽n⩽x a a⩽n⩽t

De plus, si x ⩾ 2, alors :
 
X X Z x X
f (p)g(p) = f (p)g(x) − g ′ (t)  f (p) dt.
p⩽x p⩽x 2 p⩽t

Démonstration : Par le théorème fondamental de l’intégration, on peut écrire :


 Z x   Z 
f (n) g(x) − g (t)1[n,x] (t) dt .
X X X
′ ′
f (n)g(n) = f (n) g(x) − g (t) dt =
a⩽n⩽x a⩽n⩽x n a⩽n⩽x R

Donc on obtient :
Z
f (n)1[n,x] (t) dt
X X X
f (n)g(n) = f (n)g(x) − g ′ (t)
a⩽n⩽x a⩽n⩽x R a⩽n⩽x
Z
g ′ (t)1[a,x] (t)
X X
= f (n)g(x) − f (n) dt
a⩽n⩽x R a⩽n⩽t
X Z x X
= f (n)g(x) − g ′ (t) f (n) dt
a⩽n⩽x a a⩽n⩽t

Pour obtenir le deuxième point on applique le premier point à la fonction f˜ qui vaut f (p) si p est premier
et 0 sinon. □

I.2 Théorème d’approximation de Dirichlet


Dans deuxième courte sous-partie, on va démontrer le résultat suivant :

Théorème I.2: Théorème d’approximation de Dirichlet

p
Soient θ ∈ R et Q un entier supérieur ou égal à 2. Alors il existe un rationnel tel que :
q

p 1
0<q<Q et θ− ⩽ .
q qQ

7
Démonstration : La preuve est assez rapide et repose essentiellement sur "le principe des tiroirs".
Considérons les Q+1 nombres 0,  1{θ}, {2θ},
 . . . {(Q−1)θ}. Tous ces nombres appartiennent à [0, 1]. Donc
k k+1
au moins un des Q intervalles , pour k ∈ {0, . . . , Q − 1} contient deux de ces nombres. Ainsi
Q Q
il existe des entiers a1 , a2 , b1 , b2 tels que :

1
0 ⩽ a1 < a2 ⩽ Q et |(a1 θ − b1 ) − (a2 θ − b2 )| ⩽ .
Q

Donc en posant q = a2 − a1 ∈ [1, Q − 1] et p = b2 − b1 , on obtient le résultat attendu. □

I.3 Caractères de Dirichlet


Dans cette partie on va s’intéresser de manière purement algébriques aux caractères de Dirichlet, nous
verrons que ce sont des fonctions multiplicatives, objet de base de la théorie des nombres. La théorie des
groupes et des représentations de groupes permettent d’obtenir des résultats importants sur ces fonctions.
Nous n’allons pas démontrer les résultats ici car ce sont plutôt des résultats classiques de cours de L3/M1
sur les représentations de groupes.
Définition I.3
— Soit G un groupe fini abélien. On appelle caractère sur le groupe G, tout morphisme χ : G →
S1.
— Soit q > 0. On appelle caractère de Dirichlet modulo q toute fonction χ : N → C telle qu’il
existe un caractère χ̃ : (Z/qZ)∗ → C tel que :

∀n ∈ N : χ(n) = 1(n,q)=1 χ̃(n mod q).

Deux exemples de base de caractères de Dirichlet sont les suivants :


Définition I.4
— Le caractère de Dirichlet valant 1 sur les entiers premiers avec n et 0 ailleurs est appelé carac-
tère principal modulo n.
— Le caractère de Dirichlet principal modulo 1 (valant 1 sur tous les entiers) est dit caractère
trivial.

Citons pour commencer quelques propriétés de base sur les caractères :

Proposition I.5

Il y a exactement φ(q) caractères de Dirichlet modulo q pour tout q ⩾ 1.

Un premier résultat fondamental pour les caractères de Dirichlet est l’application de la formule d’inversion
de Fourier pour la transformation de Fourier discrète.

8
Théorème I.6: Formule d’inversion de Fourier

Soit q un entier naturel non nul. On a :

1
∀n ∈ N : 1n≡a[q] =
X
χ(a)χ(n),
φ(q)
χ mod q

où la somme est prise sur tous les caractères de Dirichlet modulo q.

I.4 Entropie de Shannon

Définition I.7
Soient X, Y deux variables aléatoires discrètes.
— On appelle entropie de X la quantité H(X) définie par :
 
X 1
H(X) = P(X = x) log .
x atome
P(X = x)

— On définit l’entropie de X conditionnellement à Y par :


X
H(X|Y ) = P(Y = y)H(X|Y = y),
y atome

où :  
X 1
H(X|Y = y) = P(X = x|Y = y) log .
x atome
P(X = x|Y = y)

En fait on appelle dans ce texte l’entropie ce qui est couramment appelé dans la littérature entropie de
Shannon. Cette grandeur est surtout utilisée en théorie de l’information Compléter description. On
notera aussi H(X, Y ) comme l’entropie de Shannon du couple (X, Y ) de variables aléatoires discrètes.

Proposition I.8

Soient X, Y, Z trois variables aléatoires discrètes :


— H(X, Y ) = H(X|Y ) + H(Y ) = H(X) + H(Y |X),
— H(X|Y ) ⩽ H(X),
— H(X, Y ) ⩽ H(X) + H(Y ),
— H(X, Y |Z) ⩽ H(X|Z) + H(Y |Z).

Démonstration :
— Le premier point vient d’un calcul direct.
— On développe l’expression de H(X|Y ) :
 
X 1
H(X|Y ) = P(Y = y)P(X = x|Y = y) log .
x,y atomes
P(X = x|Y = y)

9
 
1
Donc d’après l’inégalité de Jensen appliquée à la fonction concave x ∈ [0, 1] 7→ xlog :
x
! !
X X 1
H(X|Y ) ⩽ P(Y = y)P(X = x|Y = y) log P .
x atome y atome y atome P(X = x|Y = y)

On en déduit le deuxième point par la formule des probabilités totales.


— Le troisième point est une conséquence immédiate des deux autres.
— Le quatrième point se prouve de la même manière.

Définition I.9
Soient X, Y deux variables aléatoires discrètes, on définit leur information mutuelle par :

I(X, Y ) = H(X) + H(Y ) − H(X, Y ) = H(X) − H(X|Y ) = H(Y ) − H(Y |X).

Par la proposition précédente, on remarque que : I(X, Y ) = I(Y, X) ⩾ 0. On peut voir I(X, Y ) comme
la mesure de la non-indépendance de X et Y : plus elle est petite plus les variables aléatoires sont
d’avantage indépendantes (en fait X et Y sont indépendantes si et seulement si I(X, Y ) = 0) et plus elle
est grande pour les variables aléatoires X et Y ne sont pas indépendantes. On termine cette introduction
à l’entropie de Shannon par cette dernière proposition qui nous sera très utile en pratique.

Proposition I.10

Soit X une variable aléatoire discrète prenant au maximum N valeurs. Alors H(X) ⩽ log(N ).

Démonstration : Notons A l’ensemble des valeurs prises  X. On a |A| ⩽ N par hypothèse. D’après
 par
1 1
l’inégalité de Jensen appliqué à encore x ∈ [0, 1] 7→ xlog (en prenant les poids tous égaux à ):
x |A|
  !
X 1 X 1 |A|
H(X) = P(X = x) log ⩽ |A| P(X = x) log P = log(|A|).
P(X = x) |A| y∈A P(X = y)
x∈A x∈A

10
II Introduction de quelques éléments de la théorie analytique des
nombres

II.1 Fonctions arithmétiques - fonctions multiplicatives

Définition II.1
Une fonction f : N → C est appelée une fonction arithmétique.

Définition II.2
Une fonction arithmétique f est dite multiplicative si f est non nulle et si :

∀ m, n ∈ N | (m, n) = 1 : f (mn) = f (m)f (n).

Si la relation précédente tient pour tous les couples (m, n) ∈ N2 , on dit que f est complètement
multiplicative.

Exemples : On va développer ici des exemples de fonctions arithmétiques importantes en théorie


des nombres :
— La fonction "nombre de diviseurs" définie par :

∀n ∈ N : τ (n) = |{d ∈ N : d|n}| .

C’est une fonction multiplicative.


— La fonction d’Euler φ définie par :


∀n ∈ N : φ(n) = (Z/nZ) .

C’est une fonction multiplicative par le théorème chinois.


— La fonction de Möbius µ définie par :

 1 si n = 1,

µ(n) = 0 si n possède un facteur carré,

(−1)k si n est le produit de k nombres premiers distincts.

C’est une fonction multiplicative.


— La foncion de von Mangoldt Λ définie par :
(
ln(p) si n = pk où p est un nombre premier et k ⩾ 1,
Λ(n) =
0 sinon.

Cette fonction arithmétique n’est pas multiplicative. Par exemple Λ(2) = ln(2), Λ(9) = ln(3) mais
Λ(18) = 0.
— Pour tout t ∈ R∗ , on peut définir la fonction complètement multiplicative : n 7→ nit . Cette fonction
jouera un grand rôle plus tard dans notre étude.
Les fonctions multiplicatives sont très utiles parce qu’il suffit de les connaître sur des puissances de
nombres premiers pour les connaître partout.

11
Proposition II.3

Soit f une fonction multiplicative. Alors on a :


Y
f (1) = 1 et f (n) = f (pν ) , ∀n ⩾ 2.
pν ||n

Si de plus, f est complètement multiplicative, alors :


Y ν
f (n) = f (p) , ∀n ⩾ 2.
pν ||n

Les réciproques sont vraies.

Maintenant, on va définir une opération sur l’ensemble des fonctions arithmétiques qui va bien marcher
avec la notion de multiplicativité.
Définition II.4
Soient f, g deux fonctions arithmétiques. On définit la fonction (f ∗ g), appelée, convolution de
Dirichlet de f et g, par :
X n
∀n ∈ N : (f ∗ g)(n) = f (d)g .
d
d|n

On obtient alors une batterie de résultats pas très difficiles à obtenir (moyennant calculs et théorème
chinois) :

Proposition II.5

Soient f, g, h trois fonctions arithmétiques. On a les propriétés suivantes :


— f ∗ g = g ∗ f,
— (f ∗ g) ∗ h = f ∗ (g ∗ h),
— f ∗ (g + h) = f ∗ g + f ∗ h,
— f ∗ δ = f où pour tout n ∈ N : δ(n) = 1n=1 .
Si de plus f et g sont multiplicatives alors (f ∗ g) est multiplicative.

Définition II.6
Soit f une fonction arithmétique. S’il existe une autre fonction arithmétique g telle que f ∗ g = δ,
alors on dit que f est inversible et on appelle g son inverse de Dirichlet. Cet inverse est unique par
la proposition précédente.

Proposition II.7

Soit f : N → C une fonction arithmétique. Alors f est inversible si et seulement si f (1) ̸= 0.

Démonstration :
— Supposons que f est inversible. Alors, il existe g : N → C telle que f ∗ g = δ. En particulier
f (1)g(1) = δ(1) = 1 donc f (1) ̸= 0.

12
— Réciproquement, supposons que f (1) ̸= 0. On va construire l’inverse de Dirichlet par récurrence.
1
Tout d’abord, on pose g(1) = f (1) . Ainsi (f ∗ g)(1) = 1. Puis, fixons n ⩾ 2 et supposons qu’on ait
définit les valeurs de g(1), . . . , g(n − 1) pour que (f ∗ g)(m) = δ(m) pour tout m ∈ {1, . . . , n − 1}.
On pose :
−1 X n
g(n) = f (d)g .
f (1) d
d|m,d>1

Ainsi (f ∗ g)(n) = δ(n) = 0. Donc, f est inversible d’inverse g construit par récurrence.

Proposition II.8

Toute fonction multiplicative est inversible et son inverse de Dirichlet est aussi une fonction multi-
plicative.

Démonstration : Le sens direct est évident car pour toute fonction multiplicative f , f (1) = 1 ̸= 0
et la proposition précédente s’applique. Montrons le sens réciproque. Pour cela, il suffit maintenant, par
unicité de l’inverse, d’exhiber une fonction multiplicative g telle que f ∗ g = δ. Afin de construire g,
posons d’abord g(1) = 1 pour que (f ∗ g)(1) = 1 = δ(1). Puis on fixe un nombre premier p et on va
construire g (pν ) pour tout ν ⩾ 1 par récurrence comme dans la preuve précédente.
Quand ν = 1, on pose g(p) = −f (p), ainsi (f ∗ g)(p) = f (p) + g(p) = 0 = δ(p). Puis fixons ν ⩾ 2 et
 
supposons que l’on a définit g pk tels que (f ∗ g) pk = 0 pour tout k ∈ {1, . . . , ν − 1}. Posons alors :

ν
X
g (pν ) = − f pk g pν−k .
 

k=1

Ainsi (f ∗g)(pν ) = 0. Finalement, on prolonge g à tous les nombres naturels par : g(n) = g (pν ). Par
Q
pν ||n
la proposition II.3 ceci définit bien une fonction multiplicative. De plus, comme f et g sont multiplicative,
d’après II.5 f ∗ g est aussi multiplicative et alors par II.3, on peut écrire :
Y
∀n ⩾ 2 : (f ∗ g)(n) = (f ∗ g) (pν ) .
pν ||n

Or le membre de droite est nul par construction donc pour tout n ⩾ 2 : (f ∗ g)(n) = δ(n) = 0. Donc
f ∗ g = δ. D’où le résultat attendu. □

II.2 Série de Dirichlet d’une fonction arithmétique


Nous allons adopter les notations suivantes, quand un nombre complexe s sera introduit il sera
toujours noté σ + it, réciproquement σ référera toujours à la partie réelle d’un nombre complexe s.
Rappelons qu’avec ces notations |ns | = nσ .
Définition II.9
On appelle série de Dirichlet d’une fonction multiplicative f , la fonction (définie dès que la série
converge) :
+∞
X f (n)
s 7→ F (s) := .
n=1
ns

13
Quand on considérera la série de Dirichlet d’une fonction arithmétique classique on la notera plutôt avec
un D avant, par exemple pour la série de Dirichlet de la fonction de Möbius sera notée : Dµ.

Proposition II.10

Soit f une fonction arithmétique dont a série de Dirichlet converge absolument pour un certain
nombre complexe s0 . Alors pour tout nombre réel r > σ0 , la série F (r) converge absolument.

Démonstration : Soit r > σ0 . Alors :

|f (n)| |f (n)| nσ |f (n)|


r
= σ r
⩽ .
n n n nσ

Le résultat vient directement par comparaison. □

On peut alors définir l’abscisse de convergence absolue d’une fonction arithmétique :


Définition II.11
On appelle abscisse de convergence absolue d’une fonction arithmétique f , le plus petit réel σa
tel que la série de Dirichlet F (σa ) converge absolument.

Proposition II.12

Soit f une fonction arithmétique dont la série de Dirichlet converge simplement pour un certain
nombre complexe s0 . Alors pour tout nombre complexe s tel que σ > σ0 , la série F (s) converge
simplement.

Démonstration : On ne peut pas faire la même preuve que précédemment car la série n’est pas à
termes de signe constant à partir d’un certain rang. Il faut donc y aller de manière plus fine. Pour cela
on fixe s ∈ C tel que σ > σ0 et on va montrer que F (s) converge simplement en montrant que la suite
de ses sommes partielles forme une suite de Cauchy. On remarque d’abord que :
Z N
1 1 du
− = (s − s0 ) .
ns−s0 N s−s0 n us−s0 +1

Par conséquent cela donne par sommation partielle :


Z N
X an X an 1 X an du
= + (s − s0 )
ns s s−s
n N 0
0 ns0 n us−s0 +1
M <n⩽N M <n⩽N M <n⩽N
Z N
X an 1 X an dt
= + (s − s0 ) .
ns0 N s−s0 M M <n⩽t ns0 us−s0 +1
M <n⩽N

|s − s0 |
Donc en notant C := 1 + > 0, on obtient :
σ − σ0

X an X an
⩽ C max .
ns M ⩽a⩽b⩽N ns0
M <n⩽N a<n⩽b

On en déduit que comme les sommes partielles de F (s0 ) sont de Cauchy, alors les sommes partielles de
F (s) sont aussi de Cauchy, donc F (s) converge. □

14
Définition II.13
On appelle abscisse de convergence simple d’une fonction arithmétique f , le plus petit réel σc
tel que la série de Dirichlet F (σc ) converge (simplement).

Il y a un lien entre ces deux abscisses de convergence par la proposition (optimale) suivante :

Proposition II.14

On a :
σc ⩽ σa ⩽ σc + 1.

Démonstration : L’inégalité σc ⩽ σa est évidente car si une série à valeurs complexes converge
absolument alors elle est converge. Pour montrer l’autre inégalité, il suffit de montrer que si F (s0 )
converge pour un certain s0 alors il converge absolument pour tout s ∈ C de partie réelle σ > σ0 + 1.
Si F (s) converge en s0 alors f (n)n−s0 n → +∞ donc il existe n0 ∈ N tel que pour tout n ⩾ n0 :

|f (n)n−s0 | ⩽ 1. Donc pour tout s ∈ C : |f (n)n−s | ⩽ nσ0 −σ . On en déduit que si σ > σ0 + 1 : F (s)
converge absolument. □

On a aussi un critère d’unicité des séries de Dirichlet :

Proposition II.15

Soit F (s) la série de Dirichlet associé à la fonction arithmétique f d’abscisse de convergence σc . Si


F (s) = 0 pour tout s ∈ C tel que σ > σC alors f (n) = 0 pour tout n ∈ N∗ .

Démonstration : Supposons le contraire et soit k l’entier le plus petit tel que f (k) ̸= 0. Soit G(s) =
P+∞
k s n=k f (n)n−s , défini pour σ > σC . Par hypothèse, pour tout σ > σC : G(s) = 0. Or limσ→+∞ G(σ) =
f (k) = 0, ce qui est absurde. D’où le résultat. □

Proposition II.16

Soient f et g deux fonctions arithmétiques. Supposons qu’il existe s tel que F (s) et G(s) convergent
absolument. Alors en notant h = f ∗ g, H(s) converge absolument et H(s) = F (s)G(s).

Démonstration : Par produit de Cauchy de deux séries, H(s) converge absolument et :

X f (a)g(b) X X f (a)g(b) X (f ∗ g)(n)


F (s)G(s) = = = = H(s).
(ab)s n=1
ns n=1
ns
a,b⩾1 a,b⩾1,ab=n

Une astuce d’écriture qui nous sera bien utile, c’est qu’on peut décomposer la série de Dirichlet d’une
fonction multiplicative en produit eulérien :

15
Proposition II.17

Soit f une fonction multiplicative. On a pour tout s ∈ C où la série de Dirichlet converge absolu-
ment : !
+∞
Y X f pk
F (s) = .
p
pks
k=0

Démonstration : On note p1 < . . . , < pk < . . . la suite des nombres premiers écrit en ordre croissant.
Par le théorème de sommation par paquets et le théorème fondamental de l’arithmétique, les calculs
suivants sont bien justifiés :

X f (p1ν1 ) . . . f (pkνk )
F (s) = lim lim
k→+∞ N →+∞ ν ν pν11 s . . . pνkk s
n=p11 ...pkk ,0⩽ν1 ,...,νk ⩽N
+∞
! +∞
!
X f (pν11 ) X f (pν1k )
= lim lim ...
k→+∞ N →+∞
ν1 =0
pν11 s νk =0
pνkk s
+∞ !
Y X f pk
= .
p
pks
k=0

II.3 Théorèmes fondamentaux de la théorie analytique des nombres


II.3.1 Théorèmes de Mertens

Avant de passer au premier théorème de Mertens, on va faire deux remarques importantes pour la
démonstration. Tout d’abord, on a cette relation sur la fonction de Von Mangoldt qui sera centrale dans
les démonstrations des théorèmes de Mertens :
X
∀n ∈ N∗ : log(n) = Λ(d).
d|n

Rappelons enfin l’estimation suivante conséquence directe d’une comparaison série-intégrale :


X
∀x > 0 : log(n) = x log(x) − x + O(log(2 + x)).
2⩽n⩽x

Théorème II.18: Premier théorème de Mertens

Pour tout x ⩾ 1 :
X Λ(n)
= log(x) + O(1),
n
n⩽x

et :
X log(p)
= log(x) + O(1).
p
p⩽x

Démonstration :

16
— Grâce à la remarque précédente, on a en sommant sur N∗ :
X X X
log(n) = Λ(d).
n∈N∗ n∈N∗ d|n

Par notre remarque précédente le membre de gauche se comporte comme x log x + O (x). Pour la
somme double, on change l’ordre de sommation comme suit :

X X X X
Λ(d) = Λ(d) 1.
n∈N∗ d|n d≤x n≤x/d

On obtient donc pour x ⩾ 1 :


 
X Λ(d) X
x log x + O (x) = x +O Λ(d) .
d
d≤x d≤x

Or verra (sans utiliser les résultats qu’on utilise) que pour tout x ∈ R+ :
X
Λ(n) ≪ x.
n≤x

On en déduit le premier point.


— D’après la définition de la fonction de Von Mangoldt :

X Λ(n) X log p X ∞ X log p


= + .
n p j=2
pj
n≤x p≤x 1/j p≤x

log p 1 log p log n


On majore : j
≪ j/2 3/2 pour tout j ⩾ 3, et comme la série de terme général 3/2 converge
p 2 p n
on obtient (en constant que le terme en j = 2 est un O(1) :

X Λ(n) X log p
= + O (1) .
n p
n≤x p≤x

On obtient alors le deuxième point du théorème grâce au premier point juste au dessus.

Théorème II.19: Deuxième théorème de Mertens

Il existe deux constantes c1 , c2 ∈ R telles que pour tout x ⩾ 2 :

X1  
1
= log log(x) + c2 + O .
p log(x)
p⩽x

et :  
X Λ(n) 1
= log log(x) + c1 + O ,
n log(n) log(x)
n⩽x

Démonstration :

17
— Pour le premier point, on utilise d’abord une sommation par parties pour écrire pour tout x ⩾ 2 :

X 1 X log(p)
= log(p)
p p
p⩽x p⩽x
   
X log(p) Z x X
log(p) 1
=  log(x) +   dt.
p
p⩽x 2 p t log2 (t)
p⩽t

On obtient donc par le premier théorème de Mertens appliqué dans l’intégrale :


 
X1 X log(p) Z x Z x 
dt dt
=   log(x) + +O 2
p p 2 t log(t) 2 t log (t)
p⩽x p⩽x
 
X log(p)  
1
=   log(x) + log(log(x)) − log(log(2)) + O .
p log(x)
p⩽x

On en déduit le résultat annoncé en appliquant le premier théorème de Mertens dans la première


somme.
— Pour le deuxième point on va faire comme dans le premier théorème de Mertens, en effet, par
définition de la fonction de Von Mangoldt :

+∞ X
X Λ(n) X log(p) X log(p)
= +
n log(n) p log(p) j=2 j pj log(pj )
n⩽x p⩽x p ⩽x

X1 +∞
1 X 1 X
= + .
p j=2 j j pj
p⩽x p ⩽x

On en déduit donc le deuxième point de la même manière que pour le deuxième point du premier
théorème de Mertens.

Proposition II.20: Formule de Mertens

Il existe une constante C ∈ R telle que pour x → +∞ :


Y 1
1 = C log(x) + O(1).
p⩽x
1− p

En fait on peut avoir un résultat plus fin et montrer que C = exp−γ où γ est la constante d’Euler, mais
ce n’est pas important pour la suite.
X 1 Y e− p1
Démonstration : Tout d’abord par comparaison à la série convergente , le produit
p
p2 p
1 − p1
converge. Ainsi on peut écrire pour tout x ⩾ 2 :
!
Y 1 X1 Y e− p1
1 = exp .
p⩽x
1− p p
p
p⩽x
1 − p1

18
Or d’après le second théorème de Mertens :
!
X1 Y e− p1 Y e− p1
exp = C log(x) + O(1), où on note C = ec1 .
p
p
p⩽x
1 − p1 p
1 − p1

On en déduit le résultat annoncé. □

II.3.2 Le théorème des nombres premiers

On présente maintenant le fameux théorème des nombres premiers ainsi que ses formes équivalentes
qu’on utilisera dans la suite de ce rapport.

Théorème II.21: Théorème des nombres premiers

On a l’équivalent suivant :
x
π(x) ∼ .
x→+∞ log(x)
De manière équivalente on a :

1X 1X
lim λ(n) = lim µ(n) = 0.
x→+∞ x x→+∞ x
n⩽x n⩽x

II.3.3 Le théorème de Hardy-Ramanujan

Proposition II.22: Inégalité de Turan-Kubilius

Soit I ⊂ R un intervalle de longueur au moins 1 et n un entier tiré au sort uniformément dans cet
intervalle. Soit P une partie finie de N ne contenant que des nombres premiers de taille au plus
P ⩾ 2. Alors la variable aléatoire ω = p∈P 1p|n vérifie :
P

P2
ℓ(P) + mes(I)
∀λ > 0 : P(|ω − ℓ(P)| ⩾ λ) ≪ .
λ2

Démonstration : La démonstration ici est importante car on sera ramené dans la suite refaire les
mêmes calculs. La première chose qu’on remarque est :

mes(I)
1d|n =
X X
∀d ∈ N : 1= + O(1).
d
n∈I n∈I/d

Donc  
1 1
P(d|n) = + O .
dmes(I)
   
1 1 1 1
Ainsi pour tout p ∈ P, 1p|n a une espérance égale à + O et une variance O + .
p mes(I) p mes(I)
Et pour tous p1 , p2 ∈ P distincts :
 
1
1p1 |n , 1p2 |n = O

Cov .
mes(I)

19
On en déduit que :

P2
 
P
E[ω] = ℓ(P) + O et Var(ω) ≪ ℓ(P) + .
mes(I) mes(I)

Donc
P2
E[ω 2 ] ≪ ℓ(P)2 + ℓ(P) + .
mes(I)
On en déduit que :

2 P2 ℓ(P)P
E[|ω − ℓ(P)| ] ≪ ℓ(P)2 + ℓ(P) + − ℓ(P)2 +
mes(I) mes(I)
P2
≪ ℓ(P) + .
mes(I)

On obtient donc l’égalité demandée. □

Théorème II.23: Théorème d’Hardy-Ramanujan

Pour tout x suffisamment grand :

1X 2
|ω(n) − log log(x)| ≪ log log(x).
x
n⩽x

Démonstration : On note I = [1, x] pour x suffisamment grand et P == {p, p ⩽ x0,1 }. D’après ??,
on a :
ℓ(P) = log log(x) + O(1).

Donc d’après l’inégalité de Turan-Kubilius :

2 x0,2
E[|ω − ℓ(P)| ] ≪ log log(x) + ≪ log log(x).
x

D’où le théorème d’Hardy-Ramanujan. □

II.4 Entiers friables

Définition II.24
Soit y ⩾ 2. On dit qu’un entier naturel n est y-friable si son plus grand facteur premier n’excède
pas y.

Pour tous x1 , x2 , y ⩾ 2, on notera S(x1 , x2 ; y) l’ensemble des entiers y-friables compris entre x1 et x2 .
L’objectif de cette sous-partie est de présenter un résultat général sur l’asymptotique (quand x tend vers
+∞) du nombre d’entiers compris entre 1 et x qui sont y-friables. Pour cela on va devoir présenter une
fonction spéciale, appelée fonction de Dickman définie par la proposition suivante.

20
Proposition II.25

Il existe une unique fonction continue ρ sur R+ , dérivable sur ]1, +∞[ qui satisfait l’équation diffé-
rentielle suivante :
∀u > 1 : uρ′ (u) + ρ(u − 1) = 0,

ainsi que la condition initiale p ≡ 1 sur [0, 1].

Démonstration : On va procéder par analyse-synthèse. Supposons qu’une telle fonction ρ existe. On


va construire par récurrence une expression de ρ sur les intervalles de la forme [n, n + 1] pour n ∈ N∗ .
— Si n = 1, alors :

∀u ∈]1, 2] : uρ′ (u) + ρ(u − 1) = uρ′ (u) + 1 = 0 car u ≡ 1 sur [0, 1].

Ainsi pour tout u ∈]1, 2] : ρ(u) = 1 − log(u). ρ est bien continue sur ]0, 2[ et dérivable sur ]1, 2].
— Si n = 2, alors :
∀u ∈]2, 3] : uρ′ (u) + 1 − log(u − 1) = 0.
Ru
Ainsi pour tout u ∈]2, 3] : ρ(u) = 1 − log(u) + 2 log(t−1)
t dt. On vérifie facilement que ρ est continue
sur ]0, 3] et dérivable sur ]1, 3].
— On itère ce même procédé (les calculs sont les mêmes mais sont un peu lourds pour rédiger une
récurrence complète) pour obtenir une expression unique de ρ. On vérifie facilement qu’elle vérifie
les conditions demandées.

Le résultat principal de cette partie est le suivant :

Théorème II.26

Uniformément pour x ⩾ y ⩾ 2 :
 
x log(x)
|S(1, x; y)| = xρ(u) + O où u = .
log(y) log(y)

On utilisera ce résultat sous cette forme-ci :

Proposition II.27

Soit ε > 0. On a uniformément en x ⩾ 2 :


 
x
S(1, x; x1/ε ) = xρ(ε) + O .
log(x)

1
Démonstration : C’est une application directe du théorème précédente avec y = x ε . □

Enfin on utilisera un dernier résultat sur les entiers friables (on pourra voir sa preuve dans ([1] , Corollaire
1.3) ) :

21
Proposition II.28

Soient u ⩾ 1 et ε > 0 et soit x suffisamment grand. Alors, le nombre d’entiers dans [1, x] qui n’ont
1
pas de facteur premier pus grand que x u est au plus égal : O u−(1−ε)u x .


22
III Un peu de théorie des cribles

III.1 Principes généraux de la théorie des cribles


Un crible est une technique pour estimer la taille d’un ensemble après qu’on lui ait retiré des éléments
"indésirables". Les propriétés d’indésirabilités peuvent être :
— la division par un nombre premier d’un certain ensemble,
— la divisibilité par un carré parfait (ou par d’autres contraintes multiplicatives)
— l’inclusion dans certaines classes de résidus.
Le principe d’inclusion-exclusion (ou formule du crible de Poincaré) énoncé ci-dessous nous donne une
formule exacte.

Proposition III.1

Soient (Ai )1⩽i⩽n n ensembles quelconques.


 
n
[ n
X X k
\
Ai = (−1)k+1 Ai j  .
i=1 k=1 1⩽i1 <i2 <...<ik ⩽n j=1

Le problème est si on a k propriétés d’indésirabilités, il y aura 2k termes à estimer ce qui est trop. Nos
cribles permettront d’obtenir une bonne estimation du nombre d’éléments désirables en estimant k O(1) .
La construction générale d’un crible est la suivante.
Définition III.2
— Un problème de crible est un espace probabilisé (A, F, P) muni d’une masse totale M et
d’évènements Ap pour tout p premier.
— Une fois un problème de crible posé, on introduit sa fonction de criblage définie pour tout
z ⩾ 2 par :  
\
S(A, z) = M × P  Ap  .
p⩽z

Pour toutes les applications, le problème de crible (qui sera noté par abus A) sera toujours une partie finie
\
de Z munie de la probabilité uniforme et on prendra M = |A|. Ainsi, S(A, z) = Ap . On adoptera la
p⩽z
notation suivante : pour tout d ∈ N sans facteur carré, on notera :
\
Ad = Ap .
p|d

Un premier cas général à étudier est celui où l’on considère les évènements Ap comme indépendants,
Y
dans ce cas on a S(a, z) = M (1 − P(Ap ). En pratique les évènements ne sont pas indépendants mais
p⩽z
jxk x
sont proches de l’être, par exemple pour le crible de Legendre, on a |Ad | = ce qui est proche de
d d
auquel cas les évènements Ad seraient indépendants.

23
Sous des conditions très générales, on va s’appuyer sur ce cas très simple en utilisant la formule
conséquence du principe d’inclusion-exclusion :
X
S(A, z) = µ(d) |Ad | . (III.1)
d∈P(z)

A chaque fois, une fonction complètement multiplicative g à valeurs dans [0, 1[ sauf en 1, sera introduite.
Elle sera choisie telle que |Ad | ≈ M g(d) pour tout d sans facteur carré. Une fois cette fonction introduite,
on va adopter de nouvelles notations :
— On notera X une bonne approximation de M , cela peut être n’importe quoi en fait, mais en pratique
ce sera très proche de M auquel cas on a |Ad | ≈ Xg(d) pour tout d sans facteur carré.
— On notera pour tout d sans facteur carré rd = |Ad | − Xg(d) les restes.
Dans le cas où les évènements sont indépendants, on prend g(p) = Ap et rd = 0. Enfin, on introduit une
dernière notation :
Y
∀z ∈ R : V (z) := (1 − g(p)).
p⩽z

Ainsi avec ces notations on a :


Y
M (1 − P(Ap )) ≈ XV (z).
p⩽z

L’idée fondamentale de Viggo Brun est de remplacer la somme dans III.1 en une somme sur un
nombre de d plus petit en remplaçant l’égalité par un encadrement. Ainsi construire un crible de manière
générale sera de trouver deux suites λ± = (λ±
d ) indicées sur les nombres sans facteur carré (désormais
dans toute cette partie sur les cribles la quantité d sera un nombre sans facteur carré) qui remplacent
µ(d) dans III.1. On va imposer deux conditions à suites Changer les labels en (λ+ ) et (λ− ) :
X
λ+
1 =1 et ∀m > 1 : λ+
d ⩾ 0. (III.2)
d|m

X
λ−
1 =1 et ∀m > 1 : λ−
d ⩽ 0. (III.3)
d|m

On appellera (par abus) les suites λ+ , λ− vérifiant respectivement les conditions III.2 et III.3 borne
supérieure du crible et borne inférieure du crible grâce à la proposition suivante :

Proposition III.3

Soit z ⩾ 2. On suppose l’existence de bornes supérieure et inférieure de crible λ± . Alors pour tout
problème de crible A :
X X
λ−
d |Ad | ⩽ S(A, z) ⩽ λ+
d |Ad | .
d∈P(z) d∈P(z)

De plus, pour toute fonction complètement multiplicative telle que g(p) ∈ [0, 1[ pour tout p ⩽ z, on
a:
X X
λ−
d g(d) ⩽ V (z) ⩽ λ+
d g(d).
d∈P(z) d∈P(z)

Y
Démonstration : Pour ω ∈ A choisi aléatoirement, on note mω = p. Alors, comme λ± vérifient
p⩽z
ω∈Ap

24
III.3 et III.2, on a :
 
X X X
S(A, z) = M P(mω = 1) ⩽ M E  λ+
d
= λ+
d |Ad | et S(A, z) ⩾ λ−
d |Ad | .
d|mω d∈P(z) d∈P(z)

D’où le premier point. Le deuxième point est en fait un cas particulier du premier point. Notons m = π(z),
pk le k-ème nombre premier et A = {0, 1}m . On définit une probabilité en posant :
Y Y
P((v1 , . . . , vm )) = g(pk ) (1 − g(pk )).
k | vk =0 k | vk =1

Posons pour tout k ∈ N∗ : Apk = {(v1 , . . . , vm ) ∈ A : vk = 0}. On a alors pour tout z ⩾ 2 et pour tout
d ∈ P(z) :
Y
S(A, z) = (1 − g(p)) et |Ad | = g(d).
p⩽z

D’où le deuxième point. □

III.2 Crible de Brun pur


Le crible de Brun pur est basé sur une version troncaturée du principe d’inclusion-exclusion.

Lemme III.4

Soit u ⩾ 0. Alors :
k    
u u−1
1u=0 =
X
∀k ∈ N : (−1)r + (−1)k .
r=0
r k

Démonstration : Conséquence immédiate de la formule du binôme de Newton et de la formule du


triangle de Pascal. □

25
Théorème III.5

Soit k un entier positif et posons pour tout d sans facteur carré :


(
µ(d) si ω(d) ⩽ k,
λd =
0 sinon.

Alors λ satisfait III.2 si k est pair et III.3 si k est impair. De plus si ke est pair et ko est impair
alors pour tout problème de crible A et pour tout z ⩾ 2 on a :
X X
µ(d) |Ad | ⩽ S(A, z) ⩽ µ(d) |Ad | .
d∈P(z) d∈P(z)
ω(d)⩽ko ω(d)⩽ke

En particulier pour tout k ∈ N :

X X
S(A, z) − µ(d) |Ad | ⩽ µ(d) |Ad | .
d∈P(z) d∈P(z)
ω(d)⩽k ω(d)⩽k+1

Démonstration : Soit k ⩾ 0 et m ⩾ 0 sans facteur carré. D’après le lemme précédent, pour Y =:


ω(m)−1

k ⩾0:

k  
ω(m)
1m=1 = 1ω(m)=0 =
X
(−1)r + (−1)k Y
r=0
r
k
X X
= (−1)r 1 + (−1)k+1 Y.
r=0 d|m
ω(d)=r
X
= µ(d) + (−1)k+1 Y par définition de la fonction de Möbius,
d|m
ω(d)⩽k
X
= λd + (−1)k+1 Y, par définition de la suite λ.
d|m

Le premier point vient immédiatement. Le deuxième point provient du premier point et du lemme III.3.

Lemme III.6

Soit z ⩾ 2, k ⩾ 0 et g une fonction complètement multiplicative à valeurs dans [0, 1[ sauf en 1.


Alors :
X
µ(d)g(d) = V (z) + (−1)k W,
d∈P(z)
ω(d)⩽k

où :  k+1
X 1 X
0⩽W ⩽ g(d) ⩽  g(p) .
(k + 1)!
d∈P(z) p⩽z
ω(d)⩽k

26
Démonstration : L’égalité provient du théorème précédent appliqué au problème de crible P(Ap ) =
g(p). Il reste à montrer que :
 k+1
X 1 X
g(d) ⩽  g(p) .
(k + 1)!
d∈P(z) p⩽z
ω(d)⩽k

Pour cela, on se rappelle qu’un nombre d ∈ P(z) tel que ω(d) = k + 1 s’écrit sous la forme p1 . . . pk+1 où
pour tout i ∈ {1, . . . , k + 1} pi est nombre premier inférieur où égal à z. L’inégalité cherchée vient alors
directement. □

Proposition III.7

On suppose que pour tout z ∈ R : V (z) > 0. Alors :


 

   
3  X 
S(A, z) = XV (z) + O XV (z) 2 +O
 |rd |
.
 d∈P(z) 
d⩽z
4 log ( V (z)
1
)+1

  
1
Démonstration : En appliquant le théorème III.5 avec k = 4 log , puis par application du
V (z)
lemme III.6 :
 
X  X 
S(A, z) = µ(d) |Ad | + O 
 |Ad |
,
d∈P(z) d∈P(z)
ω(d)⩽k ω(d)=k+1
  
 k+1 
X X  X 
= XV (z) + O  g(p) +O |rd |
.
  
(k + 1)! 
p⩽z d∈P(z)
ω(d)=k+1

1 ek
Or, par concavité de log puis l’inégalité ⩽ k et par définition de k, on a :
k! k
 k+1
X X 1
 g(p) ⩽ k+1
(k + 1)!
 
p⩽z (k + 1)! log V 1(z)
   k+1
e log V 1(z)
⩽ 
k+1
3
≪ V (z) 2 .

Cela donne le résultat attendu (l’estimation de la somme des rd étant triviale). □

Exemple : On va faire ici un premier exemple qui va montrer la puissance d’une méthode de crible
pour l’étude de problèmes arithmétiques. On rappelle qu’on dit qu’un nombre premier p est jumeau si
p + 2 ou si p − 2 est aussi premier. Il existe une conjecture dite des nombres premiers jumeaux qui affirme

27
qu’il en existe une infinité. Cette conjecture n’a toujours pas été démontrée malgré les récentes avancées
en 2013 par en partie Zhang et Maynard.
Modélisons d’abord ceci par un problème de crible. On pose A = [1, x] ∩ N, pour tout p premier :
Ap = {k ∈ A : p|k(k + 2)} et on considère le problème de crible munie de la probabilité uniforme. On
prend X = x et on introduit la fonction complètement multiplicative ρ telle que ρ(2) = 1 et qui vaut 2
sur tous les autres nombres premiers. On introduit la fonction complètement multiplicative g telle que
ρ(p)
pour tout p : g(p) = . Avec ce choix de g, on aura rd suffisamment faible. En effet on a pour tout d
p
sans facteur carré : jxk lxm
ρ(d) ⩽ |Ad | ⩽ ρ(d).
d d
1
Si on prend z = x 16 log log(x) , on a :

|rd | ≪ z 4 log( V (z) )+1 ≪ x 2 +o(1) .


X 1 1

d∈P(z)
d⩽z
4 log ( V (z)
1
)+1

Ainsi par le proposition III.7 et par le troisième théorème de Mertens :


 2
log log(x)
S(A, z) ∼ XV (z) ≍ x .
log(x)

Or S(A, z) compte plus que les nombres premiers jumeaux, il compte en fait le nombre d’entiers k dans
A tels que k(k + 2) n’admette pas de facteurs premiers inférieurs ou égaux à z et cela inclus le cas où k
est un nombre premier jumeau. Ainsi :
 2
log log(x)
Card ({k ⩽ x, k, k + 2 premiers }) ≪ x .
log(x)

On voit ici que cette quantité tend très lentement vers +∞, tellement qu’on a même le résultat suivant.

Proposition III.8
X 1
La série est convergente.
p
p,p+2 premiers

Démonstration : Par sommation par parties et par l’exemple précédent on a :


Z x
X 1 1 X 1 X
= 1+ 1 dt,
p x 2 t2
p,p+2 premiers p,p+2 premiers p,p+2 premiers
p⩽x p⩽x p⩽t
 2 Z x  2
log log(x) 1 log log(t)
≪ + dt.
log(x) 2 t log(t)

1
Or l’intégrale ci dessus est convergente par comparaison à , on en déduit que la limite de
t log(t)3/2
X 1
quand x → +∞ est finie d’où le résultat annoncé. □
p
p,p+2 premiers
p⩽x

28
III.3 Crible de Brun-Hooley
Dans cette partie, on va présenter une variante du crible de Brun pur par Hooley qui est simple
d’un point de vue combinatoire et assez puissante quand même pour donner des résultats satisfaisants.
Nous allons ici que nous intéresser à chercher une borne supérieure de crible car ce n’est que ça qui
nous intéresse dans nos applications. On pourra trouver la suite dans [2]. L’idée fondamentale est de
partitionner les nombres premiers inférieurs ou égaux à z en des ensembles P1 , . . . , Pt et d’appliquer le
crible de Brun pur sur chacun des Pi .

Lemme III.9

Soit z ⩾ 2. Partitionnons les nombres premiers inférieurs ou égaux à z en P1 ⊔ . . . ⊔ Pt . Pour tout


i, on introduit une suite λ(i) une borne supérieure de crible. Pour tout d ∈ P(z), on pose :

t
(i)
Y
λ+
d = λdi ,
i=1

où d1 , . . . , dt sont définis par d = d1 . . . dt où pour tout i : si p divise di alors p ∈ Pi . Alors λ+ est


une borne supérieure de crible.

Démonstration : Immédiat par définition d’une borne supérieure de crible. □

Lemme III.10

Soit z ⩾ 2. Partitionnons les nombres premiers inférieurs ou égaux à z en P1 ⊔ . . . ⊔ Pt . Soient


k1 , . . . , kt des entiers pairs. Alors la suite λ+ définie par :
(
µ(d) si ω(dj ) ⩽ kj , ∀1 ⩽ j ⩽ t,
λ+
d =
0 sinon.

est une borne supérieure de crible.

(i)
Démonstration : C’est une application directe du résultat précédent en prenant λd une borne
supérieure de crible de Brun pur (voir partie précédente) avec k = ki pair. □

29
Théorème III.11

Soit A un problème de crible et soit g une fonction complètement multiplicative telle que 0 ⩽ g(p) <
1 pour tout p. Soit z ⩾ 2. Partitionnons les nombres premiers inférieurs ou égaux à z en P1 ⊔. . .⊔Pt .
Y
Soient k1 , . . . , kt des entiers pairs. On note pour tout i ∈ {1, . . . , t} : Pi =: p. Alors :
p∈Pi


S(A, z) ⩽ XV (z)eE + R ,


t k +1
Lj j
 
X Lj 1kj >0 1 Y
E= e où pour tout j ∈ {1, . . . , t} : Lj = log et Vj = (1 − g(p)),
j=1
(kj + 1)! Vj
p∈Pj

et
′ X
R = |rd | .
ω((d,Pj ))⩽kj , 1⩽j⩽t
d∈P(z)

En particulier pour λ+ définie au lemme III.10 :


X
λ+ E
d g(d) ⩽ e V (z).
d∈P(z)

Démonstration : D’après le lemme III.3 et le lemme III.10, on a :


X
S(A, z) ⩽ λ+
d |Ad | ⩽ XU1 . . . Ut + R, (III.4)
d∈P(z)

où pour tout j ∈ {1, . . . , t} :

X t
Y X
Uj = µ(dj )g(dj ) et R = µ(d1 ) . . . µ(dt )rd1 ...dt .
dj |Pj j=1 dj |Pj
ω(dj )⩽kj ω(dj )⩽kj

Or d’après le lemme III.6 et par les inégalités de convexité : g(p) ⩽ − log(1 − g(p)) pour tout p et
1 + x ⩽ ex pour tout x ∈ R, on a pour tout j ∈ {1, . . . , t} :

k +1 k +1 kj +1
! !
Lj j Lj j L j
Uj ⩽ Vj + ⩽ Vj 1 + eLj ⩽ Vj exp eLj .
(kj + 1)! (kj + 1)! (kj + 1)!

Si kj = 0, on a Uj = 1 = Vj Vj−1 = Vj eLj . Ainsi en multipliant l’inégalité ci dessus pour j ∈ {1, . . . , t},


on obtient :
U1 . . . Ut ⩽ V (z)eE .

Donc en introduisant ceci dans III.4, on obtient le résultat annoncé. □

Pour produire une borne supérieure d’utilité plus générale, on va devoir faire une petite hypothèse
supplémentaire sur g. Cette condition est des fois appelée condition d’Iwaniec : on suppose qu’il existe

30
κ ⩾ 0 et B > 0 tels que :
 κ  
Y 1 log(w) B
∀2 ⩽ y ⩽ w ⩽ z : ⩽ exp . (III.5)
1 − g(p) log(y) log(y)
y⩽p⩽w

En pratique, on ne montre pas cette condition directement mais plutôt la suivante, plus simple à démon-
trer :

Proposition III.12

Soit g une fonction complètement multiplicative à valeurs dans [0, 1[ sauf en 1. S’il existe κ ⩾ 0 et
δ > 0 tels que :  
κ
∀p ⩽ z : g(p) ⩽ min ,1 − δ , (III.6)
p
alors g vérifie la condition d’Iwaniec III.5.

On arrive enfin au résultat principal de cette partie :

Théorème III.13

Soit A un problème de crible et soit z ⩾ 2. Soit g une fonction complètement multiplicative à


valeurs dans [0, 1[ sauf en 1. Soient κ0 > 0 et B0 ⩾ 0. On suppose que pour tout κ ⩽ κ0 et pour
tout B ⩽ B0 :
 κ  
Y 1 log(w) B
∀2⩽y⩽w⩽z: ⩽ exp .
1 − g(p) log(y) log(y)
y⩽p⩽w

Alors, on a :
X
S(A, z) ⩽ Oκ0 ,B0 (XV (z)) + |rd | .
d⩽z
µ(d)2 =1

Démonstration : Au vu de l’énoncé, il va falloir qu’on choisisse une partition des nombres premiers
inférieurs ou égaux à z adaptée. Pour cela on décide de poser :

1
∀j ∈ {1, . . . , t} : zj = z 4j−1 et zt+1 = 2,

où t est l’entier maximal tel que zt ⩾ 2. On pose aussi

∀j ∈ {1, . . . , t − 1} : Pj = {p premier : zj+1 < p ⩽ zj } et Pt = {p premier : zt+1 ⩽ p ⩽ zt }.

Afin d’appliquer le théorème III.11, on introduit enfin k1 = 0 et kj = 2j−1 pour tout j ⩾ 2 des entiers
pairs. Il reste maintenant à appliquer ce théorème et étudier les différents termes qui y apparaissent.
— Par hypothèse, g vérifie la condition d’Iwaniec, donc en prenant le logarithme de cette inégalité,
on obtient pour tout j ∈ {1, . . . , t} :

X B B0
Lj := − log(1 − g(p)) ⩽ κ log(4) + ⩽ κ0 log(4) + := L.
log(zj+1 ) log(2)
zj+1 <p⩽zj

31
— De cette estimation, on obtient aussi une de E :

t k +1 t
Lj j Lkj +1
eLj 1kj >0
X X
E= ⩽ eL ⩽ e2L ⩽ e3κ0 +3B0 .
j=1
(kj + 1)! j=1 (kj + 1)!

— On a par définition de P(z) :

′ X X
R = |rd | ≪ |rd | .
ω((d,Pj ))⩽kj , 1⩽j⩽t k k
d⩽z1 1 ...zt t ⩽z
d∈P(z) 2
µ(d) =1

On obtient le résultat demandé en appliquant le théorème III.11 et par les remarques ci-dessus. □

III.4 Quelques applications


On présente pour finir deux résultats généraux que l’on peut obtenir avec le théorème III.13. Ils nous
serviront plusieurs fois dans la suite dans nos estimations.

Proposition III.14

Soit x ⩾ 1 et soit I un intervalle de longueur x et soit P un ensemble de nombres premiers inférieurs


 uneclasse de résidus modulo p de I pour tout p ∈ P alors il restera au
ou égaux à x.Si l’on retire
maximum O |I| p∈P 1 − p1
Q
éléments.

Démonstration : On prend A = I, M = mes(I) = ⌊x⌋ et X = x. Sans perte de généralité, on peut


supposer qu’on enlève à chaque fois la classe de 1 modulo p pour tout p ∈ P. On introduit les évènements
suivants :
Ap = {n ∈ A, n ≡ 1[p]}.

\
Ainsi S(A, x) = Ap compte la quantité demandée. La fonction complètement multiplicative g définie
p∈P
1
par g(1) = 1 et g(p) = vérifie facilement la condition d’Iwaniec par III.6. Ainsi d’après le théorème
p
III.13 :
X
S(A, x) ⩽ O(Xv(x)) + |rd | .
d⩽x,µ(d)2 =1
jxk
Or par le lemme chinois |Ad | = donc |rd | = O(1). On en déduit le résultat annoncé. □
d

Proposition III.15

On note Ξ(x, y, z) le nombre d’entiers n ⩽ x qui n’ont pas de facteurs premiers dans ]y, z]. On a :

x log(y)
Ξ(x, y, z) ≪ .
log(z)

32
Démonstration : La démonstration est identique en prenant I =]y, z] et Ap = {n ∈ A, p|n}. D’après
le théorème III.13, on a :
 
Y  1
 X
S(A, z) = O x 1− + |rd | .
p
p∈]y,z] d⩽x,µ(d)2 =1

On en déduit le résultat recherché car |rd | = O(1) ici aussi et par le troisième théorème de Mertens II.20.

33
IV Moyennes de fonctions multiplicatives

IV.1 Quelques exemples


Étudier directement le comportement d’une fonction arithmétique paraît difficile car le comportement
d’une telle fonction est très souvent erratique.

Par contre si on trace ça moyenne sur [1, x] par rap-

port à x, on obtient quelque chose de plus "classique"

sous sa forme. Par exemple ci-dessous on a tracé

l’évolution de la moyenne de µ2 sur [1, x] en fonc-

tion de x ∈ [1, 1000]. On conjecture que la moyenne


6
de µ2 sur [1, x] converge lorsque x → +∞ vers 2 ,
π
on le montrera à la fin de cette partie.

Cela nous amène à poser la définition suivante :


Définition IV.1
On dit qu’une fonction arithmétique f admet une valeur moyenne si la limite suivante existe.

1X
limf (n).
x→+∞ x
n⩽x

Dans ce cas, on appelle valeur moyenne d’une fonction arithmétique f la valeur de cette limite.

Se ramener à l’étude de la valeur moyenne d’une fonction arithmétique est un raisonnement qui se
rejoint beaucoup à la théorie des probabilités, on construit des objets qui sont plus simples à étudier et
qui permettent de connaître quelques informations sur la loi étudiée (comme on le fait avec les moments
ou la fonction caractéristique d’une variable aléatoire).
En fait, on n’étudie que les valeurs moyennes de fonctions multiplicatives car une fonction arith-
métique est trop malléable pour obtenir un résultat général. En effet, on peut construire une fonction
arithmétique non multiplicative qui n’admet pas de valeur moyenne. Pour cela on pose :

1 s’il existe k ∈ N tel que 22k < x ⩽ 22k+1
f (n) = .
0 s’il existe k ∈ N tel que 22k+1 < x ⩽ 22k+2

On montre facilement que :

1X 1 1X 2
lim inf f (n) = et lim sup f (n) = .
x→+∞ x 3 x→+∞ x 3
n⩽x n⩽x

Pourtant l’étude de la moyenne d’une fonction multiplicative est loin d’être simple, par exemple
connaître le comportement de la valeur moyenne de manière suffisamment précise, on devra faire appel
au théorème des nombres premiers (par exemple pour la fonction µ ou la fonction τ ). On peut cependant
obtenir une estimation correcte de la valeur moyenne sans faire appel à ce théorème. Pour cela on faire

34
appel au résultat suivant appelé "Principe de l’hyperbole" 1 .

Proposition IV.2: Principe de l’hyperbole

Soient f, g deux fonctions arithmétiques, de fonctions sommatoires respectives F, G. On a pour


1⩽y⩽x:
x  
x
X X X X x
(f ∗ g)(n) = g(n)F + (f ∗ g)(n) + f (m)G −F G(y).
n x m y
n⩽x n⩽y n⩽x m⩽ y

Démonstration : On a :
X X
(f ∗ g)(n) = f (m)g(d)
n⩽x md⩽x
X X
= f (m)g(d) + f (m)g(d)
md⩽x,d⩽y md⩽x,d>y
X x X  x 
= g(n)F + f (m) G − G(y) .
d x m
d⩽y m⩽ y

Ceci donne le résultat annoncé. □

Grâce à ce résultat, on va obtenir une estimation de la valeur moyenne de τ . Pour cela on applique

IV.2 avec f = g = 1. et y = x. On obtient :
X X √ 2 X 1 √ 
τ (n) = 2 ⌊x/m⌋ − x = 2x −x+O x .
√ √ m
n⩽x m⩽ x m⩽ x

Donc en utilisant le développement de la série harmonique, on obtient :


X √ 
τ (n) = x(log(x) + 2γ − 1) + O x .
n⩽x

On peut aussi calculer la valeur moyenne de certaines fonctions multiplicatives assez simples par des
techniques encore plus élémentaires.

— Calculons par exemple la valeur moyenne de µ2 , pour cela une technique standard est d’écrire µ2
sous forme de produit de convolution, d’inverser les sommations et ensuite estimer les sommes qui
apparaissent. Pour cela, on décompose tout n ∈ N en un produit canonique n = qm2 où q est égal
au produit des facteurs premiers de n dont l’exposant est impair. Cette décomposition est unique
et µ(q) = 1. On a alors :
X
∀n ∈ N : µ2 (n) = δ(m) = µ(d).
d|m

En effet, la première égalité est évidente et la deuxième vient en montrant d’abord cette égalité
sur les pα où p est premier et α ⩾ 1 puis en utilisant le fait que les deux membres de cette égalité
représentent des fonctions multiplicatives. Donc en remarquant que d|m si et seulement si d2 |n et
1. Le nom de "principe de l’hyperbole" provient d’une interprétation géométrique de celle-ci, pour plus de détails on
pourra aller voir ([3], 1.3.2)

35
par inversion de sommation :
 
X X X µ(d) X 1 √
µ2 (n) = µ(d) x/(d2 ) =
 
x + O x + x .
√ d2 √ d
2
n⩽x d⩽ x d⩾1 d⩾ x

Or, comme la fonction de Möbius est l’inverse de convolution de la fonction 1, on a d’après II.16
(les deux séries sont convergentes) :
  
X µ(d) X 1
   = 1.
d2 d2
d⩾1 d⩾1

X µ(d) 6 2
Donc = . Donc par théorème de sommation de relation de comparaison pour contrôler
d2 π2
d⩾1
le O, on obtient un résultat qui illustre ??.
 
1X 2 6 1
µ (n) = 2 + O √ .
x π x
n⩽x

— On peut, avec cette même méthode (et un peu plus de travail) obtenir cette estimation qu’on
utilisera par la suite.
1X 2
τ (n) ≪ log3 (x). (IV.1)
x
n⩽x

Il arrive même que certaines fonctions multiplicatives n’aient même pas de moyenne, par exemple
n 7→ nit . Montrons que :

1 X it
x 7→ n n’a pas de limite quand x → +∞.
x
n⩽x

En effet d’après la formule de sommation par parties :


x Z x  
X
it it it−1 it+1 it
n = ⌊x⌋ x − it ⌊u⌋ u du = x 1+ + O(1).
n=1 1 it + 1

Ainsi :  
1 X it it it
n ∼ x 1+ .
x x→+∞ it + 1
n⩽x

On en déduit le fait annoncé. En fait, on remarque qu’en module l’équivalent calculé est constant mais
qu’il varie en argument en fonction de x, c’est parce que la fonction n 7→ nit oscille trop. Cette fonction
joue un rôle important dans le cadre général, une fonction multiplicative qui se situera assez loin de
n 7→ nit (dans un sens qu’on définira), alors on pourra "contrôler la valeur moyenne" de cette fonction
multiplicative.

IV.2 Distance prétentieuse


On va introduire une notion de distance entre deux fonctions multiplicatives. Nous allons nous can-
tonner aux fonctions multiplicatives dite 1-bornées c’est à dire des fonctions f : N → C vérifiant pour
P 1 π2
2. On a utilisé ici la formule classique d∈N∗ d2 = 6

36
tout n ∈ N : |f (n)| ⩽ 1. Avant cela, on va avoir besoin du lemme suivant :

Lemme IV.3

Soient u, v, w trois vecteurs d’un espace préhilbertien (H, ⟨. | .⟩ , ∥.∥) de norme inférieure ou égale à
1. Alors, on a l’inégalité suivante :
p p p
1 − ⟨u | w⟩ ⩽ 1 − ⟨u | v⟩ + 1 − ⟨v | w⟩.

Démonstration :
— On va d’abord démontrer ce lemme dans le cas où u, v, w sont de norme égale à 1. On a alors :
p 1
1 − ⟨u | v⟩ = √ ∥u − v∥ .
2

On a évidemment la même relation en remplaçant u ou v par w. On obtient donc l’inégalité


demandée grâce à l’inégalité triangulaire pour ∥.∥.
— Revenons au cas général. On va travailler dans l’espace préhilbertien (H̃, ⟨. | .⟩H̃ , ∥.∥H̃ ) où H̃ =
H × R3 . On pose :
p
ũ = (u, 1 − ∥u∥, 0, 0)
p
ṽ = (u, 0, 1 − ∥v∥, 0)
p
w̃ = (u, 0, 0, 1 − ∥w∥)

Les vecteurs ũ, ṽ, w̃ sont unitaires donc on peut appliquer le point précédent dans H̃ à ces trois
vecteurs : q q q
1 − ⟨u | w⟩H̃ ⩽ 1 − ⟨u | v⟩H̃ + 1 − ⟨v | w⟩H̃ .

On en déduit le résultat annoncé en calculant les produits scalaires apparaissant ci-dessus.


On va maintenant introduire l’objet de ce paragraphe :


Définition IV.4
Soient f, g deux fonctions multiplicatives 1-bornées et fixons un seuil X ∈ R∗+ ∪ {+∞}. La distance
prétentieuse D(f, g; X) entre f et g à l’échelle X est :
v  
u
u X 1 − Re f (p)g(p)
u
D(f, g; X) = t .
p
p⩽X

On va maintenant prouver quelques propriétés de base sur cet objet :

37
Proposition IV.5

Soient f, g, h des fonctions multiplicatives 1-bornées et soit X ⩾ 2. On a les propriétés suivantes :


— D(f, g; X) ⩾ 0 et il y a égalité si et seulement si f = g et |f (p)| = 1 pour tout p premier,
— D(f, g; X) = D(g, f ; X),
— D(f, h; X) ⩽ D(f, g; X) + D(g, h; X).

Avant la preuve de ces résultats, la première chose que l’on remarque est que la distance prétentieuse
n’est pas une distance. Pourtant, elle possède quand même des propriétés appréciables que vérifie une
distance comme l’inégalité triangulaire et la symétrie.
Démonstration :
— Vérifions d’abord que D(f, g; X) est positif. Pour cela, on va vérifier que chaque terme à l’intérieur
de la somme est positif. Soit p premier, on a les majorations suivantes :
 
Re f (p)g(p) = Re(f (p))Re(g(p)) + Im(f (p))Im(g(p))
1 2 2
 1
2 2

⩽ Re(f (p)) + Re(g(p)) + Im(f (p)) + Im(g(p))
2 2
1 2 2

⩽ |f (p)| + |g(p)| ⩽ 1.
2

On en déduit que chaque terme de la somme de D(f, g; X) est bien positif.


— On va maintenant montrer l’équivalence. Si f = g et que |f (p)| = 1 pour tout p alors clairement
D(f, g; X) = 0. Réciproquement, supposons que D(f, g; X) = 0, alors comme tous les termes de la
somme sont positifs, on en déduit que :
 
∀p : Re f (p)g(p) = 1 (∗).

Cela veut donc dire que les majorations du premier point sont en fait des égalités. On en déduit
que :
1 2 2

∀p : Re(f (p))Re(g(p)) = Re(f (p)) + Re(g(p)) .
2
Donc pour tout p : Re(f (p)) = Re(g(p)). De la même manière : Im(f (p)) = Im(g(p)) pour tout p.
On obtient alors que pour tout p premier inférieur ou égal à x : |f (p)| = |g(p)| = 1 et f (p) = g(p).
— On a pour tout p :
 
Re f (p)g(p) = Re(f (p))Re(g(p)) + Im(f (p))Im(g(p)),

qui est symétrique en f et en g. On en déduit que D(f, g; X) = D(g, f ; X).


— On applique le lemme IV.3 à H = D muni du produit scalaire ⟨u | v⟩ = Re(uv), pour tous u, v ∈ D
(tous les termes sont positifs) :
       
1 − Re f (p)h(p) ⩽ 1 − Re f (p)g(p) + 1 − Re g(p)h(p)
r     
+2 1 − Re f (p)g(p) 1 − Re g(p)h(p) .

38
On en déduit en sommant sur p puis par l’inégalité de Cauchy-Schwarz :

2
D(f, h; X)2 ⩽ D(f, g; X)2 + D(g, h; X)2 + 2D(f, g; X)D(g, h; X) = (D(f, g; X) + D(g, h; X)) .

On en déduit l’inégalité triangulaire car chaque distance prétentieuse est positive par le premier
point.

On finit par introduire quelques définitions liées à la distance prétentieuse qui nous seront plutôt
utiles dans les parties suivantes.
Définition IV.6
Pour toute fonction multiplicative g 1-bornée, pour tout Q ⩾ 1 et pour tout X ⩾ 2, on introduit les
quantités suivantes :
M (g; X) = inf D(g, n 7→ nit ; X).
|t|⩽X

M (g; X, Q) = inf M (gχ; X) et M (g; ∞, ∞)inf D(g, n 7→ χ(n)nit , ∞)2 .


χ[q],q⩽Q χ,t

Lorsque M (g; X) est petit alors g "prétend" être n 7→ nit et M (g; X, Q) est petit lorsque g "prétend"
être un caractère de Dirchlet modulo au plus Q tordu de facteur de torsion au plus X.

IV.3 Inégalité faible de Halasz


Le théorème d’Halasz est un des théorèmes fondamentaux sur l’existence de moyennes de fonctions
multiplicatives. Il est difficile à démontrer, c’est pour cela que l’on va se contenter d’un version faible
du théorème d’Halasz qu’on appellera inégalité faible d’Halasz. Même pour une version faible, c’est un
résultat qui nous demandera quelques lemmes préliminaires.

IV.3.1 Quelques estimations

On commence par une inégalité de type Perron (voir ([4], Proposition 3) pour un exemple de preuve) :

Proposition IV.7

Soit f : N → C une fonction arithmétique 1-bornée et x, T ⩾ 1. On suppose que la série de Dirichlet


F (s) converge absolument pour Res ⩾ 1. Alors :
Z T
1X dt 1 T
f (n) ≪ |F (1 + it)| + + .
x −T 1 + |t| T x
n⩾x

La deuxième estimation que nous aurons besoin est la suivante :

39
Proposition IV.8

Soit f : N → C une fonction arithmétique et soit T ⩾ 1. On suppose que F (s) converge absolument
pour Re(s) ⩾ 1. Alors :

|f (n1 )| |f (n2 )|
Z X
2
|F (1 + it)| dt ≪ T .
|t|⩽T n1 n2
n1 ,n2 | log(n2 )=log(n1 )+O ( T1 )

h πi
Démonstration : Par concavité du sinus sur 0, , on a :
2
Z Z  
2 2 t
|F (1 + it)| dt ≪ |F (1 + it)| sin2c dt.
|t|⩽T R 2T

Donc par le théorème de Fubini, on obtient :


 
|f (n1 )| |f (n2 )|
Z Z
2
X t
|F (1 + it)| dt ≪ sin2c eit(log(n1 )−log(n2 ) dt .
|t|⩽T n1 n2 R 2T
n1 ,n2 ∈N

Or on sait que sinc est la transformée de Fourier d’une fonction porte à support dans [−1, 1] et l’intégrale
t

précédente est la transformée de Fourier de f 2 où f : t 7→ sinc 2T . Donc on sait que si log(n1 ) et log(n2 )
1

sont distants de strictement plus que O T , alors l’intégrale sera nulle. On peut donc que ne considérer
dans la somme ci-dessus les couples (n1 , n2 ) ∈ N2 qui vérifie log(n1 ) − log(n2 ) = O T1 ce qui donne le


résultat annoncé. □

IV.3.2 Preuve de l’inégalité faible de Halasz

Théorème IV.9: Inégalité faible de Halasz

Soit f : N → C une fonction multiplicative 1-bornée. Soient T ⩾ 1 et M ⩾ 0 et soit x que l’on


suppose suffisamment grand. Supposons aussi que :

∀ |t| ⩽ T : D(f, n 7→ nit ; x) ⩾ M.

Alors :
1X M 1
f (n) ≪ (1 + M )e− 2 + .
x T
n⩾x

Démonstration : La preuve se fait en plusieurs étapes.


Etape 1 : Pour tout n ∈ N, on décompose f (n) selon la taille des facteurs premiers de n.
1
Soient 0 < ε2 < ε1 ⩽ des paramètres que l’on optimisera plus tard. On dira dans cette preuve qu’un
2
nombre premier p est :
— petit si p ⩽ xε2 ,
— moyen si xε2 < p ⩽ xε1 ,
— grand si xε1 < p ⩽ x.
On peut donc décomposer f en un produit de convolution de 3 fonctions :

∀n ⩽ x : f (n) = (f1 ∗ f2 ∗ f3 )(n),

40
où :
— f1 est la restriction de f aux entiers naturels dont les facteurs premiers tous petits et f1 (1) = 1.
— f2 est la restriction de f aux entiers naturels dont les facteurs premiers tous moyens et f2 (1) = 1.
— f3 est la restriction de f aux entiers naturels dont les facteurs premiers tous grands et f3 (1) = 1.
En effet, pour montrer l’égalité il suffit de la montrer sur les nombres de la forme pν où p est premier
et ν > 1 par multiplicativité de f . On va le montrer quand p est petit, la preuve quand p est moyen ou
grand est identique.
ν
X
(f1 ∗ f2 ∗ f3 ) (pν ) = f1 pλ f2 (pµ ) f3 pν−µ−λ
 

λ,µ=0

= f1 (pν ) f2 (1)f3 (1) = f1 (pν ) = f (pν ) .

En fait, pour pouvoir appliquer les lemmes III.14 et II.28, on va encore décomposer f en écrivant f2 =
δ + f2′ et f3 = δ + f3′ . Ainsi on obtient :

f1 ∗ f2 ∗ f3 = f1 ∗ f2 + f1 ∗ f3′ + f1 ∗ f2′ ∗ f3′ .

Äinsi, on obtient :

1X 1X 1X 1X
f (n) = f1 ∗ f2′ ∗ f3′ (n) + f1 ∗ f2 (n) + f1 ∗ f3′ (n).
x x x x
n⩾x n⩾x n⩾x n⩾x

Etape 2 : On utilise quelques lemmes pour pouvoir avoir une première estimation de la moyenne de
f par rapport aux séries de Dirichlet de f1 , f2′ , f3′ .
Par le même raisonnement que précédemment, f1 ∗ f2 est la restriction de f aux nombres inférieurs
à x dont leurs
 facteurs premiers sont petits ou moyens. Ainsi par la proposition II.28, leur nombre est
1
O e− ε1 x pour x suffisamment grand.
De manière similaire, f1 ∗ f3′ est la restriction de f aux nombres inférieurs à x qui contiennent
 au 
moins un facteur large mais aucun facteur moyen. Donc d’après la proposition III.14, il y en a O εε21 x
pour x suffisamment grand.
Enfin, comme f1 ∗ f2′ ∗ f3′ est à support sur les nombres dont les facteurs premiers ne dépassent pas
x, sa série de Dirichlet associée est absolument convergente pour Re(s) ⩾ 1 et d’après II.16, on a pour
tout s de partie réelle supérieure à 1 3 :

D (f1 ∗ f2′ ∗ f3′ ) (s) = F1 (s)F2′ (s)F3′ (s).

Donc d’après IV.7, pour x suffisamment grand :


Z T
1X 1 1 ε2
f (n) ≪ |F1 (1 + it)| |F2′ (1 + it)| |F3′ (1 + it)| dt + + e− ε1 + .
x −T T ε1
n⩽x

Donc d’après l’inégalité de Cauchy-Schwarz :


sZ sZ
1X 1 1 ε2
+ e − ε1 + .
2 2
f (n) ≪ max |F1 (1 + it)| |F2′ (1 + it)| dt |F3′ (1 + it)| dt +
x |t|⩽T |t|⩽T |t|⩽T T ε1
n⩽x

3. On précise qu’ici F2′ et F3′ désigne la série de Dirichlet associée respectivement à f2′ et f3′ et non pas à la dérivée de
la série de Dirichlet de f2 et f3 respectivement.

41
Etape 3 : On estime les trois facteurs du premier terme.
— Montrons d’abord que pour x suffisamment grand : |F1 (1 + it)| ≪ e−M log(M ) pour tout |t| ⩽ T .

+∞
YX f1 (pj )
F1 (1 + it) =
p j=0
pj(1+it)
+∞
Y X f (pj )
= par définition de f1 ,
x⩽xε2 j=0
pj(1+it)
Y f (p)p−it
≪ 1+ car les termes de plus haut degré sont négligeables,
p
x⩽xε2
 
f (p)p−it 
X  
≪ exp  Re ,
ε2
p
p⩽x

≪ ε2 log(x) exp −D(f, n 7→ nit , xε2 ) par le deuxième théorème de Mertens




≪ e−M log(x) par hypothèse.

— Montrons maintenant que pour x suffisamment grand :


Z
2 ε1
|F2′ (1 + it)| dt ≪ .
|t|⩽T ε22 log(x)

On a d’abord par la proposition IV.8 :

|f2′ (n1 )| |f2′ (n2 )|


Z
2
X
|F2′ (1 + it)| dt ≪ T .
|t|⩽T n1 n2
n1 ,n2 ;log(n1 )=log(n2 +O ( T1 )

  
1
Le terme f2′ (n1 ) s’annule à part si n1 ⩾ xε2 et on a n2 = 1+O n1 , donc on obtient :
T
Z
2
X |f ′ (n1 )| X |f2′ (n2 )|
|F2′ (1 + it)| dt ≪ T 2
.
|t|⩽T ε2
n1 n2
n1 ⩾x n2 =(1+O ( T1 ))n1

Et d’après III.14 et II.20, on a :


X 1
|f2′ (n2 )| ≪ n1 .
T ε2 log x
n2 =(1+O ( T1 ))n1

Donc, par encore la proposition II.20 :


Z
1 Y 1 ε1
|F2′ (1 + it)|2 dt ≪ 1 ≪ .
|t|≤T ε2 log x 1− p
ε22 log x
xε2 <p≤xε1

— De la même manière, on montre que pour x suffisamment grand :


Z
2 1
|F3′ (1 + it)| dt ≪ .
|t|⩽T ε21 log(x)

Etape 4 : On conclut par un bon choix de ε1 et de ε2 :

42
D’après les étapes précédentes, on a pour x suffisamment grand :

1X e−M 1 1 ε2
f (n) ≪ √ + + e − ε1 + .
x ε1 ε2 T ε1
n⩽x

M
Donc en prenant ε1 = 1
M et ε2 = e− 2 , on obtient l’estimation demandée. □

IV.4 Théorème de Wirsing


Le théorème de Wirsing est souvent cité avec celui de Halasz comme celui qui permet de mieux
comprendre les moyennes des fonctions multiplicatives sur des intervalles larges. Il s’énonce comme ceci :

Théorème IV.10: Théorème de Wirsing

Soit f une fonction multiplicative 1-bornée. On pose :

Y f (pν )
X
1
M (f ) = 1− ,
p
p pν
ν⩾0

où le produit infini est considéré comme nul s’il diverge. Alors on a pour x → +∞ :
X
f (n) = x (M (f ) + o(1)) .
n⩽x

Démonstration : On ne va effectuer la preuve que dans le cas où f est une fonction multiplicative
à valeurs dans [0, 1]. Dans le cas général la preuve est bien plus difficile car elle comprend au moins
le théorème des nombres premiers (il suffit d’appliquer le théorème de Wirsing avec f = µ pour le
retrouver). Pour cette preuve on va adopter une preuve quelque peu similaire à la preuve de l’inégalité
faible de Halasz en décomposant f (n) selon la taille des facteurs premiers de n mais ici ce sera un peu
plus simple.
Pour tout y > 2, on introduit les fonctions complètement multiplicatives suivantes αy (p) = 1p⩽y et
βy (p) = 1p>y . De la même manière que dans la preuve de l’inégalité faible d’Halasz, on a :

f = f αy ∗ f βy .

Comme f est à valeurs dans [0, 1], il vient :

f ⩽ f αy ∗ βy := fy .

De plus on pose hy := βy ∗ µ, l’inverse de la fonction multiplicative βy . On montre facilement que :


(
ν −1 si p ⩽ y et ν = 1,
hy (p ) =
0 si p > y ou ν ⩾ 2.
Q
Donc si n > P (y) = p⩽y p alors hy (n) = 0. Ainsi, lorsque x est suffisamment grand, on obtient par

43
développement en produit eulérien :

1X 1 X Y 1

βy (n) = hy (m) ⌊x/m⌋ → 1− .
x x x→+∞ p
n⩽x m⩽P (y) p⩽y

De plus, on écrit :

1X 1 X X f (d)αy (d)  n  X f (d)α (d) d X


y
fy (n) = dβy = βy (m).
x x d d d x x
n⩽x n⩽x d|n d⩽x m⩽ d

f (d)αy (d)
Or la série de terme général , d ⩾ 1 est finie par définition de αy donc par le théorème de
d
convergence dominée :

X X f (d)αy (d) X
lim fy (n) = d⩾1 lim βy (n)
x→+∞ d x→+∞
n⩽x n⩽x
Y 1 X f (pν )

= 1− = M (fy ).
p pν
p⩽y ν⩾0

Donc pour tout y > 2, lorsque x → +∞.

1X
f (n) ⩽ M (fy ) + o(1).
x
n⩽x

Or, y 7→ M (fy ) est décroissante, donc si le produit infini diverge alors M (fy ) tend vers 0 lorsque y → +∞.
Donc si le produit infini diverge alors f possède bien une valeur moyenne qui est nulle.
X 1 − f (p)
Maintenant, supposons que le produit M (f ) converge alors la série converge aussi par
p
p
convexité de l’exponentielle. Or pour tout n ⩾ 1, on a par le lemme ??
Y X
fy (n) − f (n) ⩽ 1 − f (pν ) ⩽ (1 − f (pν )) .
pν ,p>y

Donc en sommant sur n ⩽ x, on obtient :


X XX
fy (n) − f (n) ⩽ (1 − f (pν )) ⌊x/pν ⌋
n⩽x p>y ν⩾1

X  1 − f (p) !
1
⩽x + ,
p>y
p p(p − 1)

X 1
en isolant le premier terme de la somme et en majorant le reste par la série géométrique . Et en
ν>1

tant que reste d’une série convergente, on a :

X  1 − f (p) 1

lim + = 0.
y→+∞
p>y
p p(p − 1)

On en déduit, en faisant tendre x puis y vers +∞, on obtient :

lim M (fy ) ⩽ M (f ).
y→+∞

44
On en déduit donc que si le produit M (f ) converge alors f admet une valeur moyenne qui est égale à
M (f ). □

45
V Moyenne de fonctions multiplicatives sur des petits intervalles :
résultats de Matomäki et Radziwiłł

V.1 Exemples et motivation


L’objectif de cette partie est de s’intéresser à des moyennes sont pas sur des intervalles de la forme
[0, x] quand x → +∞ mais de la forme [x, x + h] quand x → +∞ et h → +∞ aussi lentement que
x→+∞

l’on souhaite. Par exemple, on peut prendre h = x ou h = log(x) ou h = log log(x)...

V.2 Quelques résultats préliminaires

Lemme V.1

Soit (an )n∈N une suite de nombres à valeurs complexes, nulle à partir d’un certain rang. On définit
le polynôme de Dirichlet associé à cette suite par :
X
∀y ∈ R, A(y) = an niy .
n∈N

Soit T ⩾ 1, alors :
2
+∞ +∞ y
!
sin
Z Z
X dx 2 2 T
an = |A(y)| dy.
0 1 1
x π −∞ y
xe− T <n⩽xe T

P
Démonstration : On introduit la fonction f : x ∈ R 7→ 1 1 an . Sa transformée de Fourier
ex− T ⩽n⩽ex+ T
est donnée par :
 
ξ
Z XZ log(n)+ T1 2 sin T
∀ξ ∈ R : fˆ(ξ) = ++∞f (x)e −ixξ
dx = e −ixξ
dx = A(−ξ) .
−∞ log(n)− T1 ξ
n∈N

Or, par le théorème de Plancherel :


Z +∞ Z +∞ 2
2 1
|f (x)| dx = fˆ(ξ) dξ.
−∞ 2π −∞

Et le changement de variable "u = ex " donne :


2
Z +∞ Z +∞
2
X du
|f (x)| dx = an .
−∞ 0 1 1
u
ue− T <n⩽ue T

On en déduit le résultat annoncé. □

46
Lemme V.2

Soit X suffisamment grand et an , A définies comme précédemment. On suppose aussi qu’il existe
deux constantes c1 , c2 telles que an = 0 en dehors de [c1 X, c2 X]. Soit h ∈ 1, c10
 1X 
. Alors :

2
+∞ +∞
c2 h2
Z Z  
X 2 1
an ≪ 2X |A(y)| min 2 2
, 2 dy.
0 c1 −∞ c1 X y
x<n⩽x+h

P
Démonstration : On définit la fonction A : x ∈ R 7→ n⩽x an . Pour tout ν ∈ [2h, 3h], on a par
l’inégalité triangulaire et par l’inégalité de Cauchy-Scwharz :
Z +∞ Z +∞  
2 2 2
|A(x + h) − A(x)| dx ⩽ 2 |A(x + ν) − A(x)| + |A(x + h) − A(x + ν)| dx.
0 0

Donc en intégrant sur [2h, 3h], on obtient :


Z +∞ Z 3h Z +∞ Z 3h Z +∞
2 2 2
|A(x + h) − A(x)| dx ≪ |A(x + ν) − A(x)| dx dν + |A(x + h) − A(x + ν)| dx dν
0 2h 0 2h 0
Z C2 X Z 3h
2
≪ |A(x + ν) − A(x)| dν dx en utilisant l’hypothèse sur la suite an .
C1 X
2 h

Maintenant dans l’intégrale en ν, on fait le changement de variable "δ = x/ν. Ceci nous permet d’obtenir :
6h
Z C2 X Z 3h Z C2 X Z C1 X
2 2
|A(x + ν) − A(x)| dν dx ≪ |A(x(1 + δ)) − A(x)| x dδ dx.
C1 X
2 h C1 X
2
h
C2 X

C22 X 2
 
C1 X
Et avec la majoration x ⩽ valable pour tout x ∈ , C2 X , on obtient finalement :
x 2
!
+∞ C2 X
c2 hX
Z Z
2 dx 2
|A(x + h) − A(x)| dx ≪ 2 max |A(x(1 + δ)) − A(x)| dδ .
0 c1 h
c2 X ⩽δ⩽ C6hX
1
C1 X
2
x

h 6h 2
Soit ⩽δ⩽ . D’après le lemme précédent appliqué avec T = après avoir effectué le
c2 X C1 X √ log(1 + δ)
changement de variable "u = x 1 + δ :
!
C2 X +∞
c22 hX c2 hX
Z Z  
dx 2 2 1 1
max |A(x(1 + δ)) − A(x)| dδ ≪ 2 max |A(y)| min , .
c1 h
c2 X ⩽δ⩽ C6hX
1
C1 X
2
x c1 h
c2 X ⩽δ⩽ C6hX
1
0 T 2 y2

Or :
1 δ2 h2
≪ ≪ .
T2 4 c21 X 2
On en déduit que :
2
+∞ +∞
c2 h2
Z Z  
X 2 1
h an ≪ 2 hX |A(y)| min 2 , dy.
0 c1 −∞ c1 X 2 y 2
x<n⩽x+h

Le fait annoncé arrive directement en divisant cette relation par h. □

47
On donnera le lemme suivant sans démonstration.

Lemme V.3

Pour tout δ > 0, on a uniformément en t ∈ R :


 
X − log(x)
λ(n)nit ≪ x exp 2

,
n⩽x
log(x + |t|) 3
 
X
it π(x) − log(x)
p ≪ + x exp 2 .
1 + |t| log(x + |t|) 3 +δ
p⩽x

Lemme V.4

Pour toute suite de nombres complexes (an )n∈N , on a :

2
Z T X X
it 2
an n dt ≪ (T + N ) |an | .
−T n⩽N n⩽N

Démonstration :
f (t)

Soit f la fonction continue par morceaux définie ci- 1


contre.

t
−T − N −N N T +N
Ainsi on peut écrire :
2 2
Z T X Z X X m
it it
an n dt ⩽ f (t) an n dt = am an F ,
−T n⩽N R n
n⩽N 1⩽m,n⩽N

Z Z
it
où on note F la fonction x 7→ f (t)x dt. On remarque que F (1) = f (t) dt = 2T + N . Un calcul un
R R
peu pénible donne que pour tout x ̸= 1 :

2 sin(T ) 2 cos(N + T ) 1 1
F (x) = − − ≪ .
N log(x)2 N log(x)2 N log(x)2

Donc pour 1 ⩽ m ̸= n ⩽ N , on a :

m  2
1 1 1 m+n N
F ≪ 2 ≪ ≪ .
n N log m n m−n (m − n)2
n

48
On déduit de ces deux points :
2
Z T X X X m
it 2
an n dt ≪ F (1) |an | + am an F
−T n⩽N n
1⩽n⩽N 1⩽m̸=n⩽N
X 2
X 1
≪ (2T + N ) |an | + N |an am | .
(m − n)2
1⩽n⩽N 1⩽m̸=n⩽N

2 2
Le dernier terme étant négligeable devant le premier (par exemple par l’inégalité 2 |ab| ⩽ |a| + |b| pour
tous a, b ∈ C), on en déduit le résultat annoncé. □

Le lemme précédent nous sera très utile pour la suite. On va aussi l’utiliser sous cette forme :

Lemme V.5

Soit T suffisamment grand et 2 ⩽ P ⩽ T . Soit (ap ) une suite indicée sur les nombres premiers à
valeurs dans D. Soit V ⩾ 3 et notons E l’ensemble suivant :
 
 X π(P ) 
E = |t| ⩽ T tel que ap pit ⩾ .
 V 
p⩽P

Alors :
log(T )
|mes(E)| ≪ (V 2 log(T ))1+ log(P ) .

log(T )
Démonstration : Soit k = , ainsi on a P k ⩾ T . On définit les suites (αn )n∈N par la relation
log(P )
suivante :  k
X X
 ap pit  = αn nit .
p⩽P n⩾P k

On voit directement que |αn | ⩽ k! pour tous n ∈ N et aussi que :


 k
X X
|αn | ⩽  |ap | ⩽ π(P )k .
n⩽P k p⩽P

Donc par définition de E et d’après le lemme précédent :

2k
 2k Z T
π(P ) X
|mes(E)| ≪ ap pit dt
V −T p⩽P
X 2
≪ (T + P k ) |αn |
n⩽P k

≪ k!P k π(P )k .

Ainsi :  2k
V
|mes(E)| ≪ k!P k π(P )k .
π(P )
On retrouve l’estimation annoncée par la formule de Stirling et par ??. □

49
Lemme V.6

Soit T suffisamment grand et E un ensemble de mesurable de [−T, T ]. Alors pour toute suite de
nombres complexes (an )n∈N :

2
Z X  √ X
2
an nit dt ≪ N + mes(E) T log(T ) |an | .
E n⩽N n∈N

Démonstration : On note :
2
Z X X
I= an nit et ∀t ∈ [−T, T ] : A(t) = an nit .
E n⩽N n⩽N

On a : Z X Z
X
−it
I= an n A(t) dt ⩽ |an | A(t)n−it dt .
E n⩽N n⩽N E

n
Donc d’après l’inégalité de Cauchy-Schwarz et en utilisant le fait que pour tout n ⩽ N : 2 − ⩾1:
N
! 
Z 2
X 2
X  n
I2 ⩽ |an |  2− A(t)n−it dt  .
N E
n∈N n⩽2N

De plus
Z 2 Z
X  n X  n  i(t2 −t1 )
2− A(t)n−it dt ⩽ A(t1 )A(t2 ) 2− n dt1 dt2 .
N E E2 N
n⩽2N n⩽2N

L’ajout des termes jusqu’à 2N dans la somme précédente nous permet d’utiliser qu’on a pour tout
t ∈ [−T, T ] :
X  n  it N p
2− n ≪ 2 + 1 + |t| log(2 + |t|).
N 1 + |t|
n⩽2N

On obtient donc facilement :


 
X 2
 √ 
I2 ≪  |an | N + mes(E) T log(T ) I.
n⩽N

Ceci donne le résultat annoncé en divisant par I > 0 (sinon ça voudrait dire que la suite (an ) est nulle
mais le résultat est trivial pour celle-ci). □

V.3 Le théorème de Matomäki-Radziwiłł


Le résultat fondamental obtenu par Matomäki et Radziwiłł s’énonce comme ceci.

50
Théorème V.7

Soit f : N → [−1; 1] une fonction multiplicative. Alors il existe des constantes absolues C, C ′ > 1
telles que pour tous 2 ⩽ h ⩽ X et δ > 0 :

1 X 1 X log log(h)
f (n) − f (n) ⩽ δ + C ′
h X log(h)
x⩽n⩽x+h X⩽n⩽2X

 1

log(h) 3 1
pour tous les entiers x ∈ [X, 2X], sauf au plus CX δ + 1 entiers qu’on appellera
δ 2 h 25 δ 2 log(X) 50
exceptions.

Nous n’allons pas le démontrer en généralité mais dans le cas particulier de la fonction de Liouville λ
et en obtenant une borne du nombre d’exceptions moins satisfaisante. Cependant, on retrouve les mêmes
idées générales mais avec un peu moins d’estimations techniques. Le résultat qu’on va démontrer est le
suivant.

Théorème V.8

Pour tout ε > 0, il existe H(ε) tel que pour tout H(ε) < h ⩽ X, on a :

2
Z 2X X
λ(n) ⩽ εXh2 .
X x<n⩽x+h

En admettant d’abord ce résultat et d’après l’inégalité de Markov, on obtient le nombre d’entiers


1
X
x ∈ [X, 2X] tels que λ(n) ⩾ ε 3 h est majoré par ε1/3 X. Ainsi on sait que pour presque tous les
x<n⩽x+h
X
entiers x ∈ [1, 2X] on a l’estimation : λ(n) = o(ψ(X)). pour ψ(X) → +∞ quand X → +∞.
x<n⩽x+ψ(X)
En appliquant directement le théorème V.7 à la fonction de Liouville λ on obtient le même résultat. C’est
en ceci que le théorème V.8 constitue un résultat plus faible que le théorème V.7 obtenu par Matomäki
et Radziwiłł. Passons désormais à la preuve du théorème V.8.

Démonstration : Nous allons faire la démonstration deux fois. La première fois pour obtenir le
résultat relativement rapidement mais avec une borne inférieure pour h un peu trop grande. La deuxième
démonstration reprendra le même cheminement que la première mais en ajoutant quelques estimations
plus fines pour obtenir une borne inférieure pour h plus satisfaisante.
— Première démonstration :
 3

Dans cette première démonstration, on va démontrer le résultat pour h ⩾ exp (log(X)) 4 . On peut
√ √
aussi supposer h ⩽ X : si on prouve le résultat pour h⩽ X alors  on peut en déduire le résultat
3 3
juste pour h ⩾ exp (log(X)) 4 . En effet si H := exp (log(X)) 4 , alors il existe k ∈ N tel que
√ √ Pk √
H − kh ∈ [ x, x + h]. Alors on peut écrire H = i=0 hi avec hi ⩽ X. Et ainsi :

X k−1
X X
λ(n) = λ(n).
x⩽n⩽x+H i=0 x+Pi Pi+1
j=0 hj ⩽n⩽x+ j=0 hj

51

Ainsi si on montre le résultat pour tout h ∈ [H, X], alors on démontrera le résultat dans le cas h ⩾ H.
On va maintenant adopter quelques notations :
— On note P l’ensemble des nombres premiers dans [H, h].
— Pour tout j ∈ N, on note Pj := P ∩ [Pj , Pj+1 ] où on définit pour tout j ∈ N : Pj := 2j H.
 9
 [J
— On pose J := log(h)−(log(h))
10
log(2) , ainsi on a P = Pj .
j=0
— On note ωP l’application ω où on ne considère que les nombres premiers dans P, c’est-à-dire :
X
∀n ∈ N : ωP (n) = 1.
p∈P
p|n

X1
— On note, en référence à II.22 qu’on va utiliser la quantité W (P) = . D’après II.19, on a :
p
p∈P
1
W (P) ∼ log log(h).
10
— Ce choix
 de P  a été fait pour qu’il
 vérifie la condition
 suivante
 : tout élément p ∈ P vérifie
9 2 27
exp log(h) 10 ⩽ p ⩽ h donc exp log(X) 3 ⩽ exp log(X) 40 ⩽ p ⩽ h (en anticipant l’applica-
tion du lemme V.3).
Soit (an )n∈N une suite qui vérifie pour tout y ∈ R :

X J X
X X
A(y) := an niy = λ(p)piy λ(m)miy .
n∈N j=0 p∈Pj X
⩽m⩽ 2X
Pj+1 P j

Il est pas très dur de voir que cette suite vérifie :


— an = 0 pour tout n en dehors de X
 
2 , 4X ,

— an = λ(n)ωP (n) pour tout n ∈ {X, . . . , 2X}.


Par inégalité triangulaire, on a :
 2
Z 2X X
W (P)2  λ(n) dx
X x<n⩽x+h
 2  2
Z 2X X Z 2X X
≪  λ(n)ωP (n) dx +  λ(n)(ωP − W (P)) dx,
X x<n⩽x+h X x<n⩽x+h
2
Z  
2 h 1
≪X |A(y)| min , dy + XW (P)h2 .
R X 2 y2

On a obtenu la dernière estimation en appliquant le lemme V.2 pour le premier terme et l’inégalité
de Turan-Kubilius II.22 pour le deuxième terme. Il nous reste donc à estimer l’intégrale. Pour cela on
va d’abord gérer la contribution des |y| ⩾ X à l’intégrale, pour cela on décomposer cet ensemble en

52
sous-ensembles dyadiques et appliquer V.4 sur chacun de ces sous-ensembles :

h2 1
Z   Z
1
|A(y)| min , dy = |A(y)| dy,
|y|>X X 2 y2 |y|>X y2
+∞ Z
X 2 dy
= |A(y)|
2k X⩽|y|⩽2k+1 X y2
k=0
+∞ Z
1 X 1 2
≪ |A(y)| dy,
X2 22k |y|⩽2k+1 X
k=0
+∞
1 X 2k+1 X + 4X X 2
≪ |an | .
X2 22k
k=0 n⩽4X

Or par définition de la suite (an ) et par l’inégalité de Turan-Kubilius II.22, on a :


X 2
X
|an | ⩽ ωP (n)2 ≪ XW (P)2 .
n⩽4X n⩽4X

On en déduit que :
 2
2X
h2 1 Xh2
Z Z  
X X 2
 λ(n) dx ≪ X + |A(y)| min , dy + .
X W (P)2 |y|⩽X X 2 y2 W (P)
x<n⩽x+h

Xh2
Notons que le premier terme (que l’on vient d’obtenir) est négligeable devant . Il reste donc
W (P)
2
à regarder l’intégrale restante. Pour cela, on utilise l’inégalité de Cauchy-Schwarz dans |A(y)| pour
montrer que :
h2 1
Z  
2
|A(y)| min , dy ≪ W (P) max Ij ,
|y|⩽X X 2 y2 0⩽j⩽J

où pour tout j ∈ {0, . . . , J} :

2 2
X
h2 1
Z X X  
2 iy iy
Ij = (log(Pj )) p λ(m)m min , dy.
−X p∈P X
X 2 y2
j
Pj+1 ⩽m⩽ 2X
P j

Il reste donc à estimer Ij pour tout j. On fixe un tel j et on utilise le lemme V.3 pour dire que :
 
X Pj 1  27 2
 Pj 1 1
piy ≪ + Pj exp −(log(X)) 40 − 3 −δ ≪ + . (V.1)
log(Pj ) 1 + |y| log(Pj ) 1 + |y| log(Pj )
p∈Pj

En utilisant d’abord cette borne pour X ⩾ |y| ⩾ log(Pj ), on obtient :

2 2

h2 1
Z X X  
2 iy iy
(log(Pj )) p λ(m)m min , dy
log(Pj )⩽|y|⩽X p∈P X
X 2 y2
j
Pj+1 ⩽m⩽ 2X
P j

2
Pj2 h2 1
Z X  
≪ λ(m)miy min , dy.
(log(Pj )2 log(Pj )⩽|y|⩽X X
X 2 y2
Pj+1 ⩽m⩽ 2X
P j

53
Or, en faisant en découpant en sous-ensembles dyadiques (de la même manière qu’au dessus) et en
appliquant le lemme V.4, on montre que :
2
Pj2 h2 1 h2
Z X  
iy
λ(m)m min , dy ≪ .
(log(Pj )2 log(Pj )⩽|y|⩽X X
X 2 y2 Pj2
Pj+1 ⩽m⩽ 2X
P j

Pour gérer la contribution |y| ⩽ log(Pj ) à Ij , on utilise le lemme V.3 qui nous dit que :

X X
λ(m)miy ≪ .4
X
Pj (log(X)10
Pj+1 ⩽m⩽ 2X
P j

Ainsi en utilisant l’estimation V.1, on arrive à :

2 2

h2 1 h2
Z X X  
2 iy iy
(log(Pj )) p λ(m)m min , dy ≪ .
|y|⩽log(Pj ) p∈P X
X 2 y2 log(X)−19
j
Pj+1 ⩽m⩽ 2X
P j

h2
Ainsi on obtient que Ij ≪ . Donc en tout :
(log(Pj )2
 2
2X
Xh2
Z X
 λ(n) dx ≪ .
X log log(h)
x<n⩽x+h

 3

On obtient ainsi le théorème demandé pour h ⩾ exp (log(X)) 4 .

— Deuxième démonstration :

On va maintenant affiner un peu plus les arguments pour obtenir le résultat recherché pour h ⩾
10
exp (10(log log(X) 9 ), comme on a déjà montré le résultat dans la première démonstration pour h ⩾
3 10 3
exp(log(X) 4 ), on va supposer que h ∈ [exp (10(log log(X) 9 ), exp(log(X) 4 )]. On garde les mêmes nota-
tions P, Pj , Pj , J, ωP , W (P) qu’à la preuve précédente. Dans la première démonstration, on avait expliqué
notre mauvaise gestion des nombres premiers "grands". On va donc introduire des notations similaires
pour ces entiers. On note :
4 9
— Q, l’ensemble des nombres premiers appartenant à [exp (log(X) 5 ), exp (log(X) 10 )],
4
— Pour tout k : Qk = Q ∩ [Qk , Qk+1 ] où Qk = 2k exp(log(X) 5 ),
 9 4

10 −log(X) 5
— Q = log(X) log(2) ,

— ωQ et W (Q) de manière similaire à ωP et W (P).


De la même manière qu’à la preuve précédente, on va introduire une suite (an )n∈N en posant :
 
X J
X X
∀y ∈ R : A(y) = an niy =  λ(p)piy  Aj (y),
n∈N j=0 p∈Pj

4. L’exposant 10 sur le log n’est pas obligatoire, on le choisi (et le lemme V.3 nous permet de le faire) suffisamment
grand pour qu’à la fin on puisse négliger ce terme.

54

Q X
X X
∀y ∈ R, ∀j ∈ {0, . . . , J} : Aj (y) = λ(q)q iy λ(m)miy .
k=0 q∈Qk X
⩽m⩽ P2X
Pj+1 Qj+1 Q j k

X 
De la même manière qu’à la première preuve, on a an = 0 en dehors de 4 , 8X et pour tout n ∈ [X, 2X],
on a an = λ(n)ωP (n)ωQ (n). Montrons maintenant que :
 
X 1 1
(ωP (n)ωQ (n) − W (P)W (Q))2 ≪ XW (P)2 W (Q)2 + . (V.2)
W (P) W (Q)
X⩽n⩽2X

On aurait envie d’utiliser II.22 mais cela n’est pas possible directement dans notre cas, par contre on
peut adapter sa preuve pour montrer V.2. Pour cela on remarque que :
X
(ωP (n)ωQ (n) − W (P)W (Q))2
X⩽n⩽2X
X X
= (ωP (n)ωQ (n))2 − 2W (P)W (Q) (ωP (n)ωQ (n)) + XW (P)2 W (Q)2
X⩽n⩽2X X⩽n⩽2X
X
≪ (ωP (n)ωQ (n)) − XW (P) W (Q)2 .
2 2

X⩽n⩽2X

Or avec les mêmes manipulations que dans la preuve de II.22 :

1p1 q1 |n 1p2 q2 |n
X X X
(ωP (n)ωQ (n))2 =
X⩽n⩽2X n∈N p1 ,p2
q1 ,q2

1p1 q1 |n + 1p1 q1 q2 |n + 1p1 p2 q1 |n + 1p1 p2 q1 q2 |n ,


X X X X X
=
X⩽n⩽2X p1 =p2 p1 =p2 p1 ̸=p2 p1 ̸=p2
q1 =q2 q1 ̸==q2 q1 =q2 q1 ̸=q2

≪ XW (P)W (Q) + XW (P)W (Q)2 + XW (P)2 W (Q) + XW (P)2 W (Q)2 .

Donc en insérant cette estimation dans l’estimation précédente, on obtient bien V.2. On va pouvoir
reprendre maintenant le même cheminement que dans la première démonstration. Pour cela on pose
pour tout j ∈ {0, . . . , J} :

2
X
h2 1
Z X  
2 iy 2
Ij = (log(Pj )) p |Aj (y)| min , dy.
−X p∈P X 2 y2
j

De la même manière qu’à la première preuve, on obtient :


 2
2X
Xh2
Z X X
 λ(n) dx ≪ max Ij + (V.3)
X W (Q)2 j∈{0,...,J} log log(h)
x<n⩽x+h

Le second terme ici est satisfaisant, on va donc maintenant s’attarder sur l’estimation de Ij . Soit
j ∈ {0, . . . , J} fixé. De la même manière qu’à la preuve précédente, la contribution de |y| ⩽ log(Pj )
est gérée facilement. Il ne reste plus qu’à gérer la contribution de |y| ∈ [log(Pj ), X]. Malheureseument,
X
on ne peut pas appliquer directement le lemme V.3 pour borner piy car ici p peut être inférieur à
p∈Pj
 2

exp log(X) 3 +δ . Pour contrer ce problème, on va encore séparer en deux l’ensemble des |y| ∈ [log(Pj ), X]

55
. Pour cela, on pose :
 
 X Pj 
Ej = y ∈ R : log(Pj ) ⩽ |y| ⩽ X, piy ⩾ .
 (log(Pj ))2 
p∈P|

— Regardons d’abord la contribution des y ̸∈ Ej . On sait que si y ̸∈ Ej alors :

X Pj
piy ⩽
(log(Pj ))2
p∈P|

Donc en appliquant V.4 et le fait que ωQ ≪ W (Q), on obtient que :

2
h2 1 h2 W (Q)2
Z X  
2 iy 2
(log(Pj )) p |Aj (y)| min , dy ≪ .
Ej p∈P X 2 y2 (log(Pj ))2
j

X Pj
— On va maintenant regarder la contribution des y ∈ Ej . Par l’estimation : 1≪ , on a :
log(Pj )
p∈Pj

2
h2 1 Pj2 h2
Z X   Z
2 iy 2 2
(log(Pj )) p |Aj (y)| min , dy ≪ |Aj (y)| dy,
Ej p∈P X 2 y2 X2 Ej
j

2 2
2 Z
h X X
≪ Pj2 W (Q)2 max (log Qk )2 q iy λ(m)miy dy,
X 2 k∈{0,...,Q} Ej q∈Q X
k
Pj+1 Qk+1 ⩽m⩽ P2X
j Qk

où la deuxième ligne a été obtenue avec les mêmes manipulations que dans la preuve précédente.
Ainsi d’après le lemme V.3,
2
h2 1
Z X  
2 iy 2
(log(Pj )) p |Aj (y)| min , dy
Ej p∈P X 2 y2
j

2
Pj2 W (Q)h2
Z X
≪ max Q2 λ(m)miy dy.
(log(Pj )2 X 2 k∈{0,...,Q} k Ej X
Pj+1 Qk+1 ⩽m⩽ P2X
Qj k

10 3
Or comme h ∈ [exp (10(log log(X) 9 ), exp(log(X) 4 )], on a pour ε > 0 : Pj ∈ [log(X)7 , X ε ]. Ainsi
d’après V.5 :
log(X)
1+ log(P 3
mes(Ej ) ≪ (log(Pj ))2 (log(X)) j) ≪ X 7 +ε .

56
Donc d’après le lemme V.6 :
2
Pj2 W (Q)h2
Z X
max Q2 λ(m)miy dy,
(log(Pj )2 X 2 k∈{0,...,Q} k Ej X
Pj+1 Qk+1 ⩽m⩽ P2X
j Qk

Pj2 W (Q)h2 √
 
X X
≪ max Q2 + mes(Ej X log(X) ,
(log(Pj )2 X 2 k∈{0,...,Q} k Qk Pj Pj Qk
W (Q)2 h2
≪ .
(log(Pj ))2

On en déduit que :
2
h2 1 h2 W (Q)2
Z X  
2 iy 2
(log(Pj )) p |Aj (y)| min , dy ≪ .
Ej p∈P X 2 y2 (log(Pj ))2
j

De ces deux estimations, on en déduit de V.3 que :


 2
2X
Xh2
Z X
 λ(n) dx ≪ .
X log log(h)
x<n⩽x+h

  10

On obtient ainsi une nouvelle démonstration du résultat pour h ⩾ exp 10 log log(X) 9 . □

La preuve effectuée par Matomäki et Radziwiłł constitue en soi une généralisation du raisonnement
(en particulier des ingrédients nécessaires pour passer de la première à la seconde preuve).

V.4 Applications directes


V.4.1 Quelques autres résultats de Matomäki-Radziwiłł

Pour les applications on va d’abord présenter les résultats obtenus par Matomäki et Radziwiłł. Le
premier résultat est le théorème V.7. Les autres sont les théorèmes suivants :

Théorème V.9

Soit f : N → [−1, 1] une fonction multiplicative. Alors pour tous 10 ⩽ h ⩽ x :


 2 !
1 X 1 X log log(h) 1
√ f (n1 )f (n2 ) =  √ f (n) + O + 1 .
xh log(2) √ x√ √ log(h) (log(x)) 100
x⩽n
√ 1 n2 ⩽x+h
√ x x⩽n⩽2 x
x⩽n1 ⩽2 x

Pour prouver ces deux résultats, Matomäki et Radziwiłł ont d’abord établi ces mêmes résultats mais
en se restreignant à un espace "dense" S. On va prendre les notations suivantes : soit η ∈]0, 1/6[, on
considère une suite d’intervalles ([Pj , Qj ])j telle que :
p
— Q1 ⩽ exp ( log(X)),
— "les intervalles ne sont pas trop loin l’un de l’autre" c’est-à-dire :

log log(Qj ) η
∀j : ⩽ 2.
log log(Pj−1 ) − 1 j

57
— "les intervalles sont quand même un petit peu espacés" c’est-à-dire :

η
∀j : log(Pj ) ⩾ 8 log(Qj−1 ) + 16 log(j).
j2

On peut très bien construire une suite ([Pj , Qj ])j qui vérifie ces conditions. Par exemple, on peut choisir
p 40
[P1 , Q1 ] tels que exp( log(X)) ⩾ Q1 ⩾ P1 ⩾ log(Q1 ) η , et on construit les autres intervalles en posant :

∀j : Pj = exp (j 4j log(Q1 )j−1 log(P1 )) et Qj = exp (j 4j+2 log(Q1 )j ).


p
On note J l’entier j le plus grand vérifiant Qj ⩽ exp ( log(X)). On note S = SX 5 un ensemble d’entiers
X ⩽ n ⩽ 2X qui ont au moins un facteur premier dans chaque intervalle [Pj , Qj ] pour tout 1 ⩽ j ⩽ J.
Notons que pour tout j ⩽ J, le nombre d’entiers dans [X, 2X] qui n’ont pas de facteur premier dans
log(Pj ) log(P1 )
[Pj , Qj ] est de l’ordre de X =X 2 avec le choix des [Pj , Qj ] précédent d’après la pro-
log(Qj ) j log(Q1 )
position III.15. En conséquence, si Q1 est suffisamment grand devant P1 alors la plupart des entiers de
[X, 2X] appartiennent à S, d’où le fait qu’on l’appelle espace "dense" par abus.

Théorème V.10

Soit f : N → [−1, 1] une fonction multiplicative. Soit S un ensemble comme défini ci-dessus où
η ∈]0, 16 [. Si [P1 , Q1 ] ⊂ [1, h], alors pour tout X > X(η) suffisamment grand :

2
Z 2X 1
1 1 X 1 X (log(h) 3 1
f (n) − f (n) dx ≪ 1 + 1 .
X h X 6 −η log(X) 50
X x⩽n⩽x+h X⩽n⩽2X P1
n∈S n∈S

Théorème V.11

Soit f : N → [−1, 1] une fonction multiplicative. Soit S comme ci-dessus avec η ∈]0, 16 [. Si [P1 , Q1 ] ⊂
[1, h], alors pour tout x > x(η) suffisamment grand :
 2
1
!
1 X  1 X  (log(Q1 ) 6 1
√  √x √
f (n1 )f (n2 ) =   +O
f (n) + .
h x log(2) √ √
1
− η2 1
log(X) 100
x⩽n P112
√ 1 n2 ⩽x+h√ x x⩽n⩽2 x
x⩽n1 ⩽2 x n∈S
n1 ,n2 ∈S

On va maintenant s’intéresser à quelques conséquences intéressantes de ces résultats.

V.4.2 Conséquences sur les entiers friables

Le premier résultat intéressant que l’on peut obtenir sur les entiers friables est un généralisation de
II.27 pour des petits intervalles.

5. On oubliera l’indice X ensuite mais il ne faut pas oublier que cet ensemble dépend de X.

58
Proposition V.12

Soient ψ une fonction qui tend vers +∞ en +∞ et u > 0. Alors pour presque tout x :

1
S(x, x + ψ(x); x u ) ∼ ρ(u)ψ(x).
x→+∞

1
Démonstration : On pose f : N → C la fonction qui vérifie f (n) = 1 si n est x u -friable et 0 sinon.
Par définition et en appliquant V.7 avec h = ψ(x) et X = x, on a :
 
1
X ψ(x) X
′ log log(ψ(x))
S(x, x + ψ(x); x ) =
u f (n) = f (n) + O δ + C .
x log(ψ(x))
x⩽n⩽x+ψ(x) x⩽n⩽2x

Or d’après II.27, on a :  
X x
f (n) = xρ(u) + O .
log(x)
x⩽n⩽2x

On en déduit de ces deux points, l’estimation annoncée. □

Avant Matomäki-Radziwiłł, le résultat suivant n’avait été établi que sous l’hypothèse de Riemann.

Proposition V.13

Soit ε > 0. Il existe une constante C(ε) telle que pour tout x suffisamment grand a :

√ x
S(x, x + C(ε) x; xε ≫ .
log(x)3
a. Dans l’article original, le log(x) est à la puissance −4, on a une borne très légèrement meilleure.

Soit δ une constante strictement positive suffisamment petite, η ∈ 0, 16 et h fixé


 
Démonstration :
mais grand devant δ et η. On va choisir les intervalles
 [P j , Qj ] de la manière
 suivante
 : on pose P1 =h1−δ
j 4j+2 j j 4j j

et Q1 = h et pour tous j ⩾ 2, on pose Pj = exp δ (log(h)) et Qj = exp δ (log(h)) . Ce
choix vérifie bien les conditions précédentes si h est suffisamment grand devant δ et η. En appliquant
V.11 à la même fonction que dans la preuve précédente, on obtient :
 2
  1
!
1 X  1 X  (log(Q1 ) 6 1
√ 1= √ 1 +O + . (V.4)
h x log(2) 1
− η2 1
√  x √x⩽n⩽2√x  log(X) 100
 
x⩽n1 n2 ⩽x+h x P112
√ √
x⩽n1 ⩽2 x n∈S
n1 ,n2 ∈S n,xε -friable
n1 ,n2 xε -friable

Une variante de la proposition III.15 nous dit que pour x suffisamment grand et pour tout j ⩽ J :

√ log(Pj )
 
X 1
1 ⩽ (1 + δ)2 ρ x .
√ √ 2ε log(Qj )
x⩽n⩽2 x
p|n→p̸∈[Pj ,Qj ]
n xε -friable

59
Or par définition n ̸∈ S si, et seulement s’il existe j0 ∈ {1, . . . , J} tel qu’aucun facteur premier p de n
n’appartienne à [Pj0 , Qj0 ], donc :

J
X X X
1= 1.
√ √ √ √
j=1 x⩽n⩽2 x x⩽n⩽2 x
p|n→p̸∈[Pj ,Qj ] n̸∈S
n xε -friable n xε -friable

On en déduit de ces deux points et de II.27 que :

J
√ log(Pj )
   
X 1 X 1
1⩾ρ (1 + o(1)) − (1 + δ)2 ρ x ,
√ √ 2ε j=1
2ε log(Qj )
x⩽n⩽2 x
n∈S
n xε -friable
 
J
δ2
 
1 1 + o(1) − (1 + δ 2 )(1 − δ) −
X
=ρ .
2ε j=2
j2

Et comme on peut prendre δ suffisamment petit, on obtient que :


 
X δ 1
1⩾ ρ .
√ √ 2 2ε
x⩽n⩽2 x
n∈S
n xε -friable

Ainsi en reportant dans V.4 on obtient :


   
1 X 1 1−δ 1 1
√ 1 ≫ δ2 ρ + O h− 12 + 1000 + 1 .
h x log(2) √ 2ε log(x) 100
x⩽n
√ 1 n2 ⩽x+h √ x
x⩽n1 ⩽2 x
n1 ,n2 ∈S
n1 ,n2 xε -friable

Or, pour δ > 0 suffisamment petit et x suffisamment grand, cette dernière quantité est :
 1.01  
1
2 1
− 12 1
+2δ+ 1000 1
≫δ ρ +O h + 1 ,
ε log(x) 100

1 −13

qui est positive si on pose h = ρ ε et toujours avec δ et ε suffisamment petits. Or par l’inégalité de
Cauchy-Schwarz et l’estimation IV.1, on a :
  12
  12
√ X X
τ (n)2  ,
 
x≪
√ 1 
√ √

x⩽n⩽x+h x x⩽n⩽x+h x
n xε -friable
  12
√  12  X
x log(x)3

≪ 
√ 1
 .

x⩽n⩽x+h x
ε
n x -friable

On obtient alors l’estimation recherchée. □

60
V.4.3 Conséquences sur les signes de fonctions multiplicatives

Proposition V.14

Soit f : N → R une fonction multiplicative. Supposons qu’il existe un entier naturel n0 tel que
f (n0 ) < 0 et que f (n) ̸= 0 pour une proportion positive d’entiers n. Alors pour toute fonction ψ
qui tend vers +∞ en +∞, presque tout intervalle de la forme [x, x + ψ(x)] contient un changement
de signe de f

C’est un résultat que l’on considère optimal, car de manière probabiliste on s’attend à ce que pour tout
h > 0, il y ait une proportion positive d’intervalles [x, x+h] de longueur h sur le que f garde le même signe.
En effet, si l’on considère une suite de variables aléatoires (Xn ) i.i.d suivant une loi de Rademacher. Fixons
h ∈ N pour le moment et posons pour tout n ∈ N, l’évènement En := (Xn = Xn+1 = . . . = Xn+h = 1).
1 P
Il est facile de voir que P(En ) = h+1 . Ainsi la série n∈N P (En ) diverge donc d’après le lemme de
2
Borel-Cantelli En a lieu infiniment souvent. 6
Passons maintenant à le preuve du résultat annoncé.
Démonstration : On peut supposer sans perte de généralité que f est à valeurs seulement dans
{−1, 0, +1}. Pour cette preuve, on va admettre le fait suivant 7 :

1 X 1 X  1

Pour g = f ou g = |f | : g(n) = g(n) + O log(X)− 20 +o(1) . (V.5)
X X
X⩽n⩽2X n⩽X
n∈S n∈S

Soit pν0 la plus petite puissance d’un nombre premier tel que f (pν0 ) = −1 (possible par hypothèse). Alors,
en utilisant la multiplicativité de f :
X X X
|f (n)| − f (n) ⩾ |f (n)| − f (n) + |f (pν0 )| − f (pν0 ) = 2 |f (n)| .
n⩽X n⩽ pXν n⩽ pXν
n∈S 0 0
n∈S n∈S
p0 ̸|n p0 ̸|n

Et par le théorème crible 1.4 on obtient :


X
|f (n)| − f (n) ≫ X. (V.6)
n⩽X
n∈S

Or, d’après le théorème V.10 appliqué à g = f ou g = |f | :

2
Z 2X 1
1 1 X 1 X (log(h) 3 1
g(n) − g(n) dx ≪ 1 + 1 .
X h X 6 −η log(X) 50
X x⩽n⩽x+h X⩽n⩽2X P1
n∈S n∈S

6. Il y a ici un léger abus car les En ne sont pas indépendants pour appliquer le lemme de Borel-Cantelli, pour contrer
cela on considère plutôt les évènements E0 , Eh+1 , . . . , En(h+1) , . . . mais cela ne change pas le résultat final.
7. Ce fait vient de différents résultats sur les moyennes sur des intervalles de tailles "moyennes" qu’on a décidé de ne
pas traiter ici. On pourra trouver des éléments de démonstration au lemme 5 de [MatomÃďki2016multiplicative]

61
Donc en utilisant ce résultat, V.5, et par inégalité triangulaire, on montre que :
 2
Z 2X 1
1 1 X (log(h) 3 1
|f (n)| − f (n) ≪ + 1 .

X h (1−δ)( 16 −η )

X x⩽n⩽x+h h log(X) 50

n∈S

On en déduit, par V.6 et par l’inégalité de Markov que :


1
X (log(h) 3 1
|f (n)| − f (n) ≫ hpour tous sauf ≪ + 1 entiersx ∈ [X, 2X].
(1−δ)( 16 −η ) log(X)
x⩽n⩽x+h h 50

n∈S

Donc f est négative sur presque tous les intervalles de la forme [x, x + h]. De la même manière, on peut
montrer que :
1
X (log(h) 3 1
|f (n)| + f (n) ≫ hpour tous sauf ≪ + 1 entiersx ∈ [X, 2X].
(1−δ)( 16 −η ) log(X)
x⩽n⩽x+h h 50

n∈S

Donc f est positive sur presque tous les petits intervalles. Donc presque tous les petits intervalles com-
prennent un changement de signe de f . D’où le corollaire. □

Proposition V.15

Soit f : N → R une fonction multiplicative. Alors f a une proportion strictement positive de


changements de signes si et seulement si il existe n0 ∈ N tel que f (n0 ) < 0 et que f (n) ̸= 0 pour
une proportion strictement positive d’entiers n.

Démonstration : La preuve de ce résultat provient directement de la preuve précédente. □

Proposition V.16

Soit f : N → [−1, 1] une fonction complètement multiplicative telle qu’il existe n0 > 0 tel que
f (n0 ) < 0. Alors pour tout h ∈ N∗ , il existe δ(h) > 0 tel que pour tout x suffisamment grand

1 X
f (n)f (n + h) ⩽ 1 − δ(h).
x
n⩽x

Démonstration : Tout d’abord comme il existe n0 > 0 tel que f (n0 ) < 0 et que f est complètement
multiplicative, on sait que f est non nulle sur n0 N∗ , ainsi f (n) ̸= 0 pour une proportion au moins n10
d’entiers n, donc d’après la proposition précédente on sait qu’il existe une proportion strictement positive
d’entiers n tels que f (n)f (n + 1) ⩽ 0. Donc, en notant δ cette proportion on obtient :
X X
f (n)f (n + 1) ⩽ 1 ⩽ (1 − δ)x.
n⩽x n⩽x
f (n)f (n+1)>0

Or, on a aussi par complète multiplicativité de g :

2
f (n)f (n + 1)f (2n)f (2n + 1)2 f (2(n + 1)) = (f (2)f (n)f (n + 1)f (2n + 1)) ⩾ 0.

62
Donc au moins un de ces trois termes est positif : f (n)f (n + 1), f (2n)f (2n + 1), f (2n + 1)f (2n + 2). Par
conséquent :
X X
f (n)f (n + 1) ⩾ (−1) ⩾ −(1 − δ)x.
n⩽x n⩽x
f (n)f (n+1)<0

De ces deux points on en déduit que :

X
f (n)f (n + 1) ⩽ (1 − δ)x.
n⩽x

δ
Enfin, par inégalités triangulaires successives on obtient le résultat attendu avec δ(h) = 2h pour tout
8
h⩾2 . □

Proposition V.17

Soit f : N → R une fonction complètement multiplicative. S’il existe n0 > 0 tel que f (n0 ) < 0 et
que f (n) ̸= 0 pour une proportion positive d’entiers n alors il existe une constante C > 0 telle que

f change de signe dans l’intervalle [x, x + C x] pour x suffisamment grand.

Démonstration : Sans perte de généralité, on peut supposer que f est à valeurs dans {−1, 0, 1}. Par
hypothèse et par V.15 f ne s’annule pas sur une proportions strictement positive d’entiers n. On pose :

1 X
S± = √ (|f (n1 )f (n2 )| ± f (n1 )f (n2 )).
h x log(2) √
x⩽n
√ 1 n2 ⩽x+h
√ x
x⩽n1 ⩽2 x

Montrons que ces deux quantités sont strictement positives pour x suffisamment grand. D’après V.9,
pour toute fonction multiplicative g : N → [−1, 1] :
 2
 
1 X 1 X 1
√ g(n1 )g(n2 ) = g(n) + O 1 .
h x log(2) √ x √ √ log(h) 100
x⩽n
√ 1 n2 ⩽x+h
√ x x⩽n⩽2 x
x⩽n1 ⩽2 x

Donc en appliquant ce résultat à g = |f | et g = f , on obtient que :


 2  2
 
± 1 X 1 X 1
S = |f (n)| ±  f (n) + O 1 .
x √ √ x √ √ log(h) 100
x⩽n⩽2 x x⩽n⩽2 x

On obtient donc directement que S + est strictement positif pour x suffisamment grand car le premier
terme (positif) est ≫ 1 car f est non nulle sur une proportion strictement positive d’entiers n. Pour
contrôler le signe de S − , on écrit :
  
 
1 1 X 1 X 1
S− = √ (|f (n)| + f (n))  √ (|f (n)| − f (n)) + O 1 .
x x√ √ x√ √ log(h) 100
x⩽n⩽2 x x⩽n⩽2 x

Or en s’inspirant de la preuve de V.14, on montre que ces deux termes (positifs) sont ≫ 1, donc S − > 0
δ 1
8. En fait on obtient δ(h) = h
− x
puis on utilise que x est suffisamment grand pour enlever la dépendance en x.

63
pour x suffisamment grand. Or dire que S + > 0, c’est dire qu’il existe (n1 , n2 ) tel que |f (n1 )f (n2 )| +

f (n1 )f (n2 ) > 0, ce qui est équivalent à l’existence de n ∈ [x, x + h x] tel que |f (n)| + f (n) > 0 car f

est supposée complètement multiplicative. Donc il existe n ∈ [x, x + h x] tel que f (n) > 0. De même

S − > 0 implique qu’il existe m ∈ [x, x + h x] tel que f (m) < 0, d’où le résultat annoncé. □

64
VI Conjecture de Chowla et conjecture d’Elliott

VI.1 Un petit raisonnement probabiliste vers la conjecture de Chowla


Connaître les corrélations à k points de fonctions multiplicatives est étroitement lié problèmes additifs
dans les nombres premiers. On peut par exemple étudier le nombre de facteurs premiers d’un nombre
n par rapport au nombre de facteurs premiers de n + h pour n, h ∈ N, s’intéresser aux corrélations à k
points de la fonction de Liouville est donc une question naturelle.
En supposant la véracité de l’hypothèse de Riemann, la différence entre le nombre de valeurs de n ⩽ x
telles que λ(n) = +1 et le nombre de valeurs de n ⩽ x telles que λ(n) = −1 est approximativement de

l’ordre de O x1/2+ε . Ceci est cohérent avec le comportement d’une suite de variables aléatoires indépen-
dantes de Rademacher Xn (en supposant les valeurs de la fonction de Liouville comme indépendantes),
prenant les valeurs +1 et -1 avec une probabilité égale par le théorème limite central.
Or, par indépendance des ces variables aléatoires, on sait que aussi que pour tout k, n ∈ N∗ , h1 , . . . , hk
des entiers naturels distincts et ε1 , . . . , εk ∈ {−1, +1} : P(Xn+h1 = ε1 , . . . , Xn+hk = εk ) = 2−k . Si les
valeurs de λ sont effectivement essentiellement indépendantes, il est donc raisonnable de penser que les
composantes des vecteurs (λ(n + h1 ), . . . , λ(n + hk )) changent indépendamment lorsque n varie, c’est à
dire :
1
|{n ⩽ x tel que λ(n + h1 ) = ε1 , . . . , λ(n + hk ) = εk }| −−−−−→ 2−k .
x x→+∞

Ceci est lié aux corrélations à k points de la fonction de Liouville par la proposition suivante :

Proposition VI.1

Soient k ∈ N∗ , ε1 , . . . , εk ∈ {−1, +1}, h1 , . . . , hk ∈ N∗ . Les deux propositions sont équivalentes :

1
(i) |{n ⩽ x tel que λ(n + h1 ) = ε1 , . . . , λ(n + hk ) = εk }| −−−−−→ 2−k .
x x→+∞
X x
(ii) λ(n + h1 ) . . . λ(n + hk ) = ox→+∞ (x).
n=1

Démonstration : Dans cette preuve on va adopter la notation suivante, pour S ⊂ {1, . . . , k}, on
Y
posera εS = εj . On va procéder directement par équivalence : la proposition (i) est équivalente à
j∈S

1X
lim
x→+∞ x
1λ(n+h1 )=ε1 . . . 1λ(n+hk )=εk = 2−k .
n⩽x

1 + εj λ(n + hj )
Or comme on a pour tout j ∈ {1, . . . , k} : = 1λ(n+hj )=ε1 , ceci est équivalent à :
2
k
1 XY
lim (1 + εj λ(n + hj )) = 1.
x→+∞ x
j=1n⩽x

C’est-à-dire :
1X X Y
lim εS λ(n + hj ) = 1,
x→+∞ x
n⩽x S⊂{1,...,k} j∈S

65
ce que l’on peut encore réécrire :
X 1X Y
lim εS λ(n + hj ) = 1.
x→+∞ x
S⊂{1,...,k} n⩽x j∈S

Or, ici tous les termes de la somme sur S ⊂ {1, . . . , k} sont positifs donc cette dernière proposition est
équivalente à (ii) (en basculant de l’autre côté de l’égalité le terme associé à S = ∅). De facto, on vient
de prouver l’équivalence entre (i) et (ii). □

C’est sous cette deuxième forme que Sarvadaman D. S. Chowla a émis cette conjecture dans [5].

Conjecture VI.2: (Chowla)

Soient k ∈ N∗ , ε1 , . . . , εk ∈ {−1, +1}, h1 , . . . , hk ∈ N∗ . On a :

x
X
λ(n + h1 ) . . . λ(n + hk ) = ox→+∞ (x).
n=1

C’est toujours à l’heure actuelle une conjecture mais les résultats de Matomäki et Radziwiłł permettent
d’obtenir de nombreuses avancées. On va dans cette partie présenter une version "en moyenne" sur les
paramètres (h1 , . . . , hk ). Dans la partie suivante nous présenterons une autre version en moyenne. Faire
un état des avancées de la recherche de nos jours la-dessus.

VI.2 Conjecture d’Elliott et sa version en moyenne


Une généralisation de la conjecture de Chowla est la suivante, appelée conjecture d’Elliott :

Conjecture VI.3: (Elliott)

Soient g1 , . . . , gk : N → R des fonctions multiplicatives 1-bornées et soient (a1 , . . . , ak , b1 , . . . , bk ) ∈


N2k tels que les (ai , bi ) soient Q-libres deux à deux. On suppose de plus qu’il existe j0 ∈ {1, . . . , k}
tel que M (gj0 ; ∞, ∞) = +∞. Alors :

k
X Y
gj (aj n + bj ) = o(X).
1⩽n⩽X j=1

Cette conjecture affirme que pour tous (ai , bi ) Q-libres deux à deux et pour toutes fonctions multiplica-
tives 1-bornées g1 , . . . , gk , on a l’asymptotique ci-dessus à part si tous les gj prétendent être un caractère
de Dirichlet tordu. Comme la fonction λ de Liouville vérifie l’hypothèse de la conjecture d’Elliott, cette
dernière implique la conjecture de Chowla. Si on veut généraliser ce résultat pour des fonctions multipli-
catives à valeurs complexes il faut remplacer l’hypothèse sur les gj par la suivante 9 :

Il existe j0 ∈ {1, . . . , k} tel que pour tout Q ⩾ 0 : lim M (gj0 ; X, Q) = +∞.


X→+∞

Une première idée pour arriver à un tel résultat est de rechercher une version en moyenne sur des
paramètres de shift. En voici une version quantitative dont la preuve sera l’objet principal de cette
partie.
9. Elles sont d’ailleurs équivalentes dans le cas des fonctions gi à valeurs réelles.

66
Théorème VI.4: Conjecture d’Elliott en moyenne

Soient 10 ⩽ H ⩽ X et A ⩾ 1. Soient g1 , . . . , gk : N → C des fonctions 1-bornées et soient


a1 , . . . , ak , b1 , . . . , bk ∈ N tels que aj ⩽ A et bj ⩽ AX, ∀j ∈ {1, . . . , k}. Soient 1 ⩽ j0 ⩽ k et
supposons que gj0 est multiplicative. Alors on a :

k  
X X Y
2 −M log log(H) 1
gj (aj n + bj + hj ) ≪ A k e 80 + + 1 H k X,
log(H) log(X) 3000
1⩽h1 ,...,hk ⩽H 1⩽n⩽X j=1

 1

où M = M (gj0 ; 10AX, Q) où Q = min log(X) 125 , log(H)20 . En fait on a même légèrement mieux
en enlevant un paramètre :

X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
 
2 −M log log(H) 1
≪A k e 80 + + 1 H k−1 X.
log(H) log(X) 3000

VI.3 Quelques résultats préliminaires


VI.3.1 Quelques lemmes

Lemme VI.5

Soit f : Z → C une fonction à support fini et H ⩾ 0, alors :


 2
2 2
Z Z X X X
f (n)e(αn) dx dα = (H − |h|)2 f (n)f (n + h) .
 

S1 R x⩽n⩽x+H |h|⩽H n∈N

Z
Démonstration : On commence par utiliser l’identité e(nα) dα = 1n=0 pour écrire que :
S1

 2
2
Z Z X
f (n)e(αn) dx dα
 

S1 R x⩽n⩽x+H
Z  Z 
f (n)f (n )f (m)f (m )1n+m−n 1x⩽n,n ⩽x+H dx 1y⩽m,m ⩽y+H dy .
X ′ ′
= ′ ′
−m =0 ′ ′
R R
n,n′ ,m,m′ ∈N

′ ′ ′
En écrivant n = n + h (i.e en faisant le changement de variable h = n − n dans la somme sur n ), on
remarque de le terme de la somme ci-dessus est nul si |h| > H. De plus, ci |h| ⩽ H, on remarque que les

67
deux intégrales écrites ci-dessus valent H − |h|. On obtient alors :
 2
2
Z Z
f (n)f (n + h)f (m)f (m )1m=m′ +h (H − |h|)2
X X ′
f (n)e(αn) dx dα =
 

S1 R x⩽n⩽x+H |h|⩽H

n,m,m ∈N
2
X X
2
= (H − |h|) f (n)f (n + h) .
|h|⩽H n∈N

Lemme VI.6
√ p
Soient 10 < P1 < Q1 ⩽ X et X ⩽ X0 ⩽ X tels que Q1 ⩽ exp( log(X0 )). Alors, pour tout X
suffisamment grand :
log(P1 )
|{1 ⩽ n ⩽ X : n ̸∈ SP1 ,Q1 ,X0 ,X }| ≪ X.
log(Q1 )

Démonstration : D’après la proposition III.15, on sait que pour tout 1 ⩽ j ⩽ J et pour X suffisamment
grand, que le nombre d’entiers n ∈ [1, X] qui ne sont pas divisibles par aucun nombre premier dans
log(Pj ) 1 log(P1 )
[Pj , Qj ] est au plus : X = 2 X. Or, dire que n n’appartient pas à SP1 ,Q1 ,X0 ,X est
log(Qj ) j log(Q1 )
équivalent à dire qu’il existe j ∈ {1, . . . , J} tel que n ne possède aucun facteur premier dans [Pj , Qj ]. On
1
obtient alors par convergence de la série de terme général 2 :
j

J
X 1 log(P1 ) log(P1 )
|{1 ⩽ n ⩽ X : n ̸∈ SP1 ,Q1 ,X0 ,X }| ≪ 2 log(Q )
X≪ X.
j=1
j 1 log(Q1)

D’où le résultat annoncé. □

On termine par un lemme admis qu’on pourra retrouver à partir de ([6], Theorème 3.13).

Lemme VI.7

Le nombre de représentations d’un entier n qui est  un O(P ) sous la forme p1 + p2 − p3 − p4 avec
P3

p1 , p2 , p3 , p4 ⩽ 2P quatre nombres premiers est O .
log(P )4

VI.3.2 Présentation de la méthode du cercle

i Une introduction à la méthode du cercle

Pour certains problèmes d’arithmétique comme étudier l’asymptotique (comme le nombre de façons
d’écrire n comme une somme de s éléments de l’ensemble A), on est ramené à étudier l’asymptotique
de : Z 1
fP (x)s e−nx dx
0

68
où :
P
X j 1k
fP (x) := e(j k x) et P ⩾ nk .
j=1

Pour estimer cette intégrale de manière précise, réfléchissons un peu de manière probabiliste aux
sommes d’exponentielles. Si nous avons une famille de N nombres tirés au sort de manière uniforme
sur le cercle unité et que nous les additionnons, nous nous attendons à ce que la somme soit d’environ

N en module par le théorème limite central. Pour des valeurs suffisamment génériques de x ∈ [0, 1],
la collection de nombres {e(j k x)}1⩽j⩽P devrait "presque" se répartir uniformément sur le cercle unité,
du moins si P est suffisamment grand. Ainsi, pour des valeurs de x suffisamment génériques, nous nous

attendons à ce que fP (x) ∼ P .
Cependant, cela ne peut pas être vrai pour tous les x. Par exemple,

P
X
fP (0) = e(ik · 0) = P,
i=1

Ce qui montre en particulier que nous ne pouvons pas nous attendre à obtenir quelque chose d’utile
en bornant l’intégrale par supx |fP (x)|. Quelques expériences montrent que ce manque d’annulation se
produit assez souvent lorsque x est très proche d’un nombre rationnel avec un petit dénominateur - pas
toujours, mais assez souvent pour être préoccupant. Par exemple, si k = 2, nous constatons que fP (1/2)
est réellement borné, mais fP (1/8) ∼ CP pour une certaine constante non nulle C car les carrés sont
biaisés modulo 8 : la moitié du temps, ils sont égaux à 1 modulo 8, et un quart du temps chacun, ils sont
égaux à 0 et 4 modulo 8.
Formalisons cette intuition de la manière suivante : fixons un petit δ > 0. Définissons (en s’inspirant
du théorème d’approximation de Dirichlet I.2).
 
a
Ma,q = x ∈ R/Z : x − < P −k+δ ,
q
Chacun de ces ensembles est un petit intervalle autour de la fraction a/q. Nous posons

[ [
M= Ma,q .
1⩽q⩽P δ 1⩽a⩽q,(a,q)=1

Il s’agit d’une union de tous les Ma,q tels que a/q est une fraction dans R/Z avec un dénominateur
"petit" (comparé à P ).
Nous appellerons M l’ensemble des arcs majeurs. C’est la région dans laquelle nous nous attendons à
ce que la majeure partie de l’intégrale se trouve. Soit m = [0, 1] − M son complémentaire, qu’on appellera
l’ensemble des arcs mineurs, pour lesquels nous nous attendons à une certaine annulation. Ainsi le déroulé
de la méthode du cercle est toujours la suivante :
Z
— Cas des arcs majeurs : Évaluer fP (x)e−nx dx.
M
Z
— Cas des arcs mineurs : Montrer que fP (x)e−nx dx est petit par rapport à ce qui précède.
m

ii Retour à notre problème

Voyons maintenant comment l’adapter à notre contexte. L’objectif est de démontrer le résultat sui-
vant :

69
Théorème VI.8
 1 1

Soient X, H, W ⩾ 10 tels que (log(H))5 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
 
M (g; X, Q)
multiplicative 1-bornée telle que W ⩽ exp . Soit enfin S = SP1 ,Q1 ,√X,X où P1 =
3
W 200 et Q1 = WH3 . Alors pour tout α ∈ S1 , on a :

Z 1
log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
1 HX.
R x⩽n⩽x+H W4

Nous allons appliquer la méthode du cercle dans un cas plus simple où la fonction g est supposée
complètement multiplicative et duquel on déduira ensuite le théorème VI.8 :

Proposition VI.9
 1 1

Soient X, H, W ⩾ 10 tels que (log(H))5 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
 
M (g; X, W )
complètement multiplicative 1-bornée telle que W ⩽ exp . Soient enfin d ∈ N tel
3
200 H
que d < W et S = SP1 ,Q1 ,√X, X où P1 = W et Q1 = W 3 . Alors pour tout α ∈ S1 , on a :
d

Z 1
1 log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
3 1 HX.
R x x+H d4 W4
d ⩽n⩽ d

Commençons à mettre en place la méthode du cercle. On fixe donc α ∈ S1 et on applique le théorème


H
d’approximation de Dirichlet ?? pour dire qu’il existe (a, q) ∈ Z × N∗ tels que (a, q) = 1, 1 ⩽ q ⩽
W
tels que :
a W 1
α− ⩽ ⩽ 2.
q qH q
On a dit précédemment qu’on allait différentier deux cas, le premier (des arcs majeurs) où α est "proche"
d’être un rationnel et le contraire pour le second (des arcs mineurs). Ici on va quantifier cela avec q. On
dira que α est un arc mineur ci q > W et majeur si q ⩽ W . On montrera dans la partie suivante que
pour toute fonction θ : R → C 1-bornée mesurable dont le support contient [0, X] :
Z 1
1 log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
Si q > W alors : θ(x) 3 1 HX.
R x x+H d4 W4
d ⩽n⩽ d

Z
HX
1S g(n)e(αn) dx ≪
X
Si q < W alors : 1 .
R x x+H dW 4
d ⩽n⩽ d

En combinant ces deux résultats on obtient bien la proposition VI.9.

70
VI.3.3 Mise en place de la méthode du cercle

i Preuve dans le cadre des arcs mineurs

On suppose dans cette partie que q > W . On va montrer que pour toute fonction θ : R → C 1-bornée
mesurable dont le support contient [0, X] que :
Z 1
1 log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
θ(x) 3 1 HX.
R x x+H d4 W4
d ⩽n⩽ d

Soient θ un telle fonction et P l’ensemble des nombres premiers dans [P1 , Q1 ]. Par définition de S, tout
élément de n ∈ S possède au moins un facteur premier dans P. De plus si n = mp pour p ∈ P, alors il y
a autant de nombres premiers dans P divisant n que de  nombres
 premiers dans P divisant m auxquels
X
on ajoute 1p̸|m . Ainsi en notant S l’ensemble des n ∈ 1;

qui ont au moins un facteur premier dans
d
chaque [Pj , Qj ] pour 2 ⩾ j ⩽ J, on obtient la relation :

1S ′ (mp)
1S (n) =
X
.
1
p∈P,m:mp=n p̸|m
+ |{q ∈ P : q|m}|

En effet, cette relation est évidente si n ̸∈ S et on vient de la démontrer quand n ∈ S. Ainsi en utilisant
cette relation et par complète multiplicativité de g, il nous suffit de montrer :

X X 1 ′ (mp)g(m)g(p)e(mpα) Z 1
1 log(H) 4 log log(H)
S
θ(x)1 x ⩽mp⩽ x+H dx ≪ 3 HX.
p∈P m
1p̸|m + |{q ∈ P : q|m}| R d d
d4 W4
1

On va encore simplifier le problème en recouvrant P par des intervalles de la forme [P, 2P ] où P est
une puissance de 2 et P1 ≪ P ≪ Q. On remarque que (la dernière estimation étant obtenue car W est
négligeable devant H) :
 
X 1 log(Q1 )
≪ log ≪ log log(H).
log(P ) log(P1 )
P1 ⩽P ⩽Q1
P =2j

Ainsi, quitte à sommer sur des tels P , il nous suffit de montrer la relation suivante :

X 1 ′ (mp)g(m)g(p)e(mpα) Z 1 log(H) 4
1

θ(x)1 x ⩽mp⩽ x+H dx ≪ 3


X
S
HX.
p∈P m
1p̸|m + |{q ∈ P : q|m}| R d d
1
d 4 W 4 log(P )
P ⩽p⩽2P

Or, on a en regardant si p|m ou non :

X 1 ′ (mp)g(m)g(p)e(mpα) Z
θ(x)1 x ⩽mp⩽ x+H dx
X
S

p∈P m
1 p̸|m + |{q ∈ P : q|m}| R
d d

P ⩽p⩽2P
X 1 ′ (mp)g(m)g(p)e(mpα) Z
θ(x)1 x ⩽mp⩽ x+H dx
X
S

m
1 + |{q ∈ P : q|m}| R
d d
p∈P
P ⩽p⩽2P
1S ′ (mp)g(m)g(p)e(mpα)
Z
θ(x)1 x ⩽mp⩽ x+H dx.
X X
+
1 + |{q ∈ P : q|m}| R
d d
p∈P m, p|m
P ⩽p⩽2P

71
Et on peut contrôler sans trop de difficultés le deuxième terme de la somme :

1S ′ (mp)g(m)g(p)e(mpα)
Z
X HX
θ(x)1 x ⩽mp⩽ x+H dx ≪
X X X X
H≪P H≪ .
1 + |{q ∈ P : q|m}| R
d d dP 2 dP
p∈P m, p|m p∈P X
m⩽ dP
P ⩽p⩽2P P ⩽p⩽2P p|m

Ainsi désormais, il nous suffit de montrer que :

X 1 ′ (mp)g(m)g(p)e(mpα) Z 1 log(H) 4
1

θ(x)1 x ⩽mp⩽ x+H dx ≪ 3


X
S
1 HX.
m
1 + |{q ∈ P : q|m}| R
d d
d 4 W 4 log(P )
p∈P
P ⩽p⩽2P

Or comme pour tous m ∈ N et p ∈ P on a : 1S ′ (mp) = 1S ′ (m)1mp⩽ Xd cette dernière quantité est


contrôlée :
X 1 ′ (mp)g(m)g(p)e(mpα) Z
θ(x)1 x ⩽mp⩽ x+H dx
X
S

m
1 + |{q ∈ P : q|m}| R
d d
p∈P
P ⩽p⩽2P

Z
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx
X X

d d
X p∈P R
m⩽ dP
P ⩽p⩽2P
1
 4 4
  34 Z
X
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx 
 X X 
≪ 
 .
dP 
R
d d
X
m⩽ dP p∈P
P ⩽p⩽2P

Ainsi, il nous suffit désormais de montrer que :


4
Z
log(H)
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx
X X
≪ H 4 XP 3 .
X p∈P R
d d W log4 (P )
m⩽ dP
P ⩽p⩽2P

Maintenant, après développement du module à la puissance 4 :


4
Z
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx
X X
d d
X p∈P R
m⩽ dP
P ⩽p⩽2P
X Z X
≪ G(p1 , p2 , p3 , p4 ) Θ(x1 , x2 , x3 , x4 ) e(m(p1 + p2 − p3 − p4 )α) dx1 dx2 dx3 dx4 .
pi ∈P R X
m⩽ dp
P ⩽pi ⩽2P i
xi i x +H
∀i=1,2,3,4 dpi⩽m⩽ dp
i
∀i=1,2,3,4

où pour tous x1 , x2 , x3 , x4 ∈ R et pour tous p1 , p2 , p3 , p4 ∈ P :

Θ(x1 , x2 , x3 , x4 ) = θ(x1 )θ(x2 )θ(x3 )θ(x4 ) et G(p1 , p2 , p3 , p4 ) = g(p1 )g(p2 )g(p3 )g(p4 ).
  
H 1
On remarque que la somme sur m est un O min , . De plus, cette somme
p ∥p1 + p2 − p3 − p4 ∥
est nulle à part si x1 = O(X) et pour tout i = 2, 3, 4 xi ) xp11pi + O(H). Ainsi l’expression précédente est

72
  
un O XH 3 p1 ,p2 ,p3 ,p4 ⩽2P min H 1
P
p , ∥p1 +p2 −p3 −p4 ∥ . Il nous suffit donc de montrer que :

HP 3
 
X H 1
min , ≪ log(H) .
p ∥p1 + p2 − p3 − p4 ∥ W log(P )4
p1 ,p2 ,p3 ,p4 ⩽2P

 
P3
Or d’après le lemme VI.7, le nombre de termes de la somme est O log(P )4 . Il nous suffit donc de
montrer que :
 
X H 1 log(H)
min , ≪ H, où C est un constante positive quelconque.
p ∥p1 + p2 − p3 − p4 ∥ W
n⩽CP

q 1 1
Or par le principe des tiroirs, on sait qu’il y a au plus points entre 0 et espacés d’au moins . On
2 2 2q
en déduit que :
 
X H 1 H H
min , ≪ + P log(q) + + q log(q).
p ∥p1 + p2 − p3 − p4 ∥ q p
n⩽CP

H H
Or comme W 2 00 = P1 ≪ P ≪ Q1 = et W ⩽ q ⩽ on finit par avoir :
W3 W
     
X H 1 H H H H H H log(H)
min , ≪ + 3 log + 2 + log ≪ H.
p ∥p1 + p2 − p3 − p4 ∥ W W W W 00 W W W
n⩽CP

D’où le résultat attendu.

ii Preuve dans le cadre des arcs majeurs

On va maintenant faire la preuve dans le cas où q ⩽ W , celui des arcs majeurs. En fait on va montrer
ici que :
Z
HX
1S g(n)e(αn) dx ≪
X
1 .
R x x+H dW 4
d ⩽n⩽ d

Par intégration par parties, on a pour tout x ∈ R :

  Z H  
αn W d αn
1S g(n)e(αn) ≪ 1S g(n)e 1S g(n)e
X X X ′
+ dH .
x x+H x x+H
q Hq 0 x x ′
q
d ⩽n⩽ d d ⩽n⩽ d d ⩽n⩽ d +H

 
H ′
Fixons désormais H ∈ 0, et contrôlons :
d

Z  
αn
1S g(n)e
X
dx.
R x x ′
q
d ⩽n⩽ d +H

73
En séparant en classes de résidus modulo q, on voit par inégalité triangulaire que :

Z   X Z  
αn αn
1S g(n)e 1S g(n)e
X X
dx ⩽ dx.
R x x ′
q R ′
q
d ⩽n⩽ d +H
b(modq) x x
d ⩽n⩽ d +H
n≡b[q]

(b, q)
Supposons que n ≡ b[q], on peut écrire q = d0 q0 , b = d0 b0 et n = d0 m où on a posé d0 = et où
n
q0 , b0 et m sont des entiers vérifiant : m ≡ b0 [q0 ]. De plus, comme g est complètement multiplicative et
que d0 ⩽ q ⩽ W ⩽ P1 on a :

1S g(n) = g(d0 )1Sd g(m), où Sd = SP1 ,Q1 ,√X, ddX .


0

De plus orthogonalité des caractères de Dirichlet :

1
1m≡b0 [q0 ] (m) =
X
χ(b0 )χ(m).
φ(q0 )
χ mod q0

Ainsi on obtient :

Z   Z
αn 1
1S g(n)e 1Sd g(m)χ(m) dx
X X X X
dx ⩽
R ′
q φ(q0 ) R ′
x x b mod q χ mod q0
d ⩽n⩽ d +H
x x
dd0 ⩽m⩽ dd +H
d0
0

Z
d0
1Sd g(m)χ(m) dy.
X X X
⩽d
φ(q0 ) R ′
b mod q χ mod q0
y⩽m⩽y+ H
d0

Ainsi en séparant selon l’intégrale en deux, on obtient que :

Z   Z
αn d0
1S g(n)e 1Sd g(m)χ(m) dy
X X X X
dx ≪ d
R ′
q φ(q0 ) y> WX1 0 ′
x x b mod q χ mod q0
d ⩽n⩽ d +H y⩽m⩽y+ H
d0

X ′
+ dq 10
H .
W

X 2X
Il nous reste à estimer l’intégrale pour ⩽y⩽ , pour cela on va procéder comme d’autres fois
W 10 dd0
déjà : on va découper cette intervalle en blocs dyadiques. Pour tout j ∈ {0, . . . , J}, on pose :
$ %
j+
log ( WX1 0 )
log(2) 2X
Xj = 2 , où J est l’entier j maximal tel que Xj ⩽ .
dd0

1
On fixe désormais j ∈ {0, . . . , J}. D’après le théorème ?? avec η = , on a :
20
2   ′  13 
H ′2
Z Xj+1 log d0 1 H
1Sd g(m)χ(m) dy ≪ 
X
−M (gχ;Xj )
e + + Xj .
Xj ′ P16
1 1
− 20 log(Xj )
1 
50 d20
y⩽m⩽y+ H
d 0

74

200 H
Or comme P1 = W , et W ⩾ log(H)5 , on a :
d0
 ′  31
H
log d0 1 1 1
1 1 ≪ et 1 ≪ 5 .
P16 − 20 W 20 log(Xj ) 50 W2

De plus, par le deuxième théorème


 de Mertens
 II.19, on a M (gχ; Xj ) ⩾ M (g; X, W ) − O(1). Et par
M (g; X, W )
hypothèse, on a : W ⩽ exp . On en déduit que :
3

1
e−M (gχ;Xj ) ≪ 5 .
W2

Ainsi on obtient que :


2
Z Xj+1 ′2
1 H
1Sd g(m)χ(m) dy 5 2 Xj .
X
Xj ′ W 2 d0
y⩽m⩽y+ H
d 0

Donc d’après l’inégalité de Cauchy-Scwharz :

Z Xj+1 ′
1 H
1Sd g(m)χ(m) dy
X
5 Xj .
Xj ′ W 4 d0
y⩽m⩽y+ H
d 0

Par conséquent d’après l’inégalité triangulaire on a :

Z   J ′
αn HX d0 H qHX
1S g(n)e
X X X X
dx ≪ 3
+ d 5 Xj ≪ .
R x x ′
q dW j=0
φ(q 0)
b mod q χ mod q0
d0 W 4 dW 5/4
d ⩽n⩽ d +H

Finalement en se rappelant que q ⩽ W , on obtient :

Z Z H
qHX W d qHX HX
1S g(n)e(αn) dx ≪
X ′
+ 5 dH ≪ 1 .
R x x+H
dW 5/4 Hq 0 dW 4 dW 4
d ⩽n⩽ d

D’où la preuve dans le cas des arcs majeurs.

iii Cas général

On va maintenant déduire l’estimation de cette même quantité dans le cas général où la fonction
considérée n’est pas forcément complètement multiplicative, c’est-à-dire du théorème VI.8.
Démonstration : On considère la fonction complètement multiplicative g1 : N → C 1-bornée définie
par pour tout p : g1 (p) = g(p). Comme on l’a déjà vu précédemment, on voit que : g = g1 ∗ h où

h = g ∗ µg1 . De plus pour tout p premier et pour tout j ⩾ 2, h(p) = 0 et h pj ⩽ 2. Avec cette écriture
de g on peut écrire :

Z +∞ Z
1S g(n)e(αn) dx ≪ 1S (dm)g1 (m)e(αdm) dx.
X X X
|h(d)|
R x⩽n⩽x+H d=1 R x x+H
d ⩽m⩽ d

75
On va séparer la somme sur d en deux : occupons-nous d’abord du cas où d ⩾ W .

+∞
HX X |h(d)|
Z
HX
1S (dm)g1 (m)e(αdm) dx ≪
X X X
|h(d)| |h(d)| ≪ 1 3 .
R x+H
d W 4 d=1 d 4
d⩾W x d⩾W
d ⩽m⩽ d

3
Or comme on l’a déjà vu précédemment, la série de Dirichlet de h en converge absolument. On en
4
déduit que :
Z
HX
1S g(n)e(αn) dx ≪
X
1 .
R x⩽n⩽x+H W4

Considérons maintenant le cas où d < W . Dans ce cas d < P1 et alors pour tout m ∈ N on a :
1S (dm) = 1SP1 ,Q1 ,√X, X (m) := 1S ′ (m). Donc en utilisant la proposition dans le cas particulier où g est
d
complètement multiplicative (VI.9) :

Z Z
1S (dm)g1 (m)e(αdm) dx ≪ 1S ′ g1 (m)e(αdm) dx
X X X X
|h(d)| |h(d)|
d<W R x x+H d<W R x x+H
d ⩽m⩽ d d ⩽m⩽ d

+∞ 1
X |h(d)| log(H) 4 log log(H)
≪ 3 1 HX.
d=1
d4 W4

On en conclut que :

Z 1 1
HX log(H) 4 log log(H) log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
1 + 1 HX ≪ 1 HX.
R x⩽n⩽x+H W4 W4 W4

VI.3.4 Une conjecture d’Elliott en moyenne tronquée

On commence par montrer une "conjecture d’Elliott en moyenne tronquée" pour le cas d’une seule
fonction multiplicative. On se ramènera à cette proposition dans la preuve de la "vraie" conjecture
d’Elliott en moyenne tronquée.

Proposition VI.10
 1 1

Soient X, H, W ⩾ 10 tels que (log(H))20 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
 
M (g; X, W )
multiplicative 1-bornée telle que W ⩽ exp . Soit S = SP1 ,Q1 ,√X,X où P1 = W 200 et
3
Q1 = WH3 . Alors on a :
2
HX 2
1S g(n)1S g(n + h) ≪
X X
1 .
1⩽h⩽H 1⩽n⩽X
W5

Démonstration : Tout d’abord d’après le théorème VI.8 et car W ⩾ log(H)20 :

Z 1
log(H) 4 log log(H) HX
1S g(n)e(αn) dx ≪
X
sup 1 HX ≪ 1 .
α∈S1 R x⩽n⩽x+H W 4 W5

76
On en déduit que :
2
H 2X
Z
1S g(n)e(αn) dx ≪
X
sup 1 .
α∈S1 R x⩽n⩽x+H W5

Donc d’après l’identité de Parseval on a :


 2
2
H 3X 2
Z Z
1S g(n)e(αn) dx
X
 dα ≪ .

 1
S1 R x⩽n⩽x+H W5

Ainsi d’après le lemme ??, on obtient que :

X 2
H 3X 2
1S g(n)1S g(n + h) ≪
X X
2
(2H − |h|) 1 .
|h|⩽2H n=1 W5

On en déduit facilement le résultat annoncé. □

Passons maintenant à la conjecture d’Elliott en moyenne tronquée

Théorème VI.11
 1 1

Soient X, H, W, A ⩾ 10 tels que (log(H))20 ⩽ W ⩽ min H 500 , (log(X)) 125 et soient g1 , . . . , gk des
fonctions multiplicatives 1-bornées. On suppose qu’il existe j0 ∈ {1, . . . , k} tel que :
 
M (gj0 ; 10AX, Q)
W ⩽ exp .
3

Soient ensuite a1 , . . . , ak , b1 , . . . , bk tels que pour tout j ∈ {1, . . . , k} aj ⩽ A et bj ⩽ 3AX. Soit enfin

H
S = SP1 ,Q1 ,√10AX,10AX où P1 = W 200 et Q1 = W3 . Alors on a :

k
kA2 H k−1
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪
X X Y
1 X.
1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2
W 20

Démonstration : On remarque d’abord qu’on a la borne triviale suivante :

k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪ H k−1 X.
X X Y

1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2

1 1
Ainsi si W 20 ⩾ kA2 le résultat est trivial, on peut donc supposer désormais que W 20 < kA2 . Un principe
récurrent lors de cette démonstration est d’effectuer des changements d’indices dans les sommes qui vont
apparaître mais sans changer les bornes. Cela va faire apparaître une erreur qui sera contrôlée par le
nombre de termes qui sont apparus multipliée par la borne supérieure de ce qu’il y a dans la somme. De
h
plus, quand le changement d’indice sera de la forme h → , on ignorera les conditions de divisibilité qui
a
apparaîtront.

— Première étape : Se ramener à un cas où les rôles des gj sont symétriques (1 ⩽ j ⩽ k).

77
Si on fait le changement de variable n → n + h1 puis les changements de variables hj → hj − aj h1 on a :

k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y

1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2

k
1S g1 (a1 n + b1 + a1 h1 ) 1S gj (aj n + bj + hj ) + H k−1 H + kH k−2 H X.
X X Y ′ ′

1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2

( ′
)
H
Puis en moyennant sur h1 ∈ 1, . . . , , on arrive à :
A

k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y

1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2



H
k
A XA
kA2
1S g1 (a1 n + b1 + a1 h1 ) 1S gj (aj n + bj + hj ) +
X X Y
≪ ′ 1 H k−1 X.
H j=2
W 20
h1 =1 1⩽h2 ,...,hk ⩽X 1⩽n⩽X

h1
Enfin, par le changement d’indice h1 → , on obtient :
a1

k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y

1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2



H k
A X kA2
1S gj (aj n + bj + hj ) +
X X Y
≪ ′ 1 H k−1 X.
H W 20
h1 =1 1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=1

Ainsi pour montrer la proposition il suffit maintenant de démontrer que :



H k
A
1S gj (aj n + bj + hj ) ≪
X X X Y ′
1 H k−1 H X.
h1 =1 1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=1
W 20

Or on a :

H k
1S gj (aj n + bj + hj )
X X X Y

h1 =1 1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=1


 k−1 k
H
1S gj (aj n + bj + hj ) .
X X Y


H′
1⩽h1 ,...,hk ⩽H 1⩽n⩽X j=1

Donc il suffit maintenant de montrer :


k−1 k ′
A(H )k X

H
1S gj (aj n + bj + hj ) ≪
X X Y
.
H′ W 20
1

1⩽h1 ,...,hk ⩽H ′ 1⩽n⩽X j=1

Nous avons donc obtenu une situation symétrique en les gj . On peut donc supposer désormais que j0 = 1.

78
Par inégalité triangulaire, il suffit de démontrer que :

H k
A
1S gj (aj n + bj + hj ) ≪
X X Y ′
∀h2 , . . . , hk ∈ {1, . . . , H} : 1 H X.
h1 =0 1⩽n⩽X j=1
W 20

k
1S gj (aj n + bj + hj ). Montrons que :
Y
— Deuxième étape : Posons pour tout n ∈ N : G(n) =
j=2

H
A
1S g1 (a1 n + b1 + h1 )G(n) ≪
X X ′
∀h2 , . . . , hk ∈ {1, . . . , H} : 1 H X.
h1 =1 1⩽n⩽X
W 20

Soient h2 , . . . , hk ∈ N. Par une double application de l’inégalité de Cauchy-Scwharz il suffit de montrer


que :
2
A4
1S g1 (a1 n + b1 + h1 )1S g1 (a1 n + b1 + h1 ) ≪
X X ′

1 (H )2 X 2 .
W 5
1⩽n,n′ ⩽X 1⩽h1 ⩽H ′
′ ′
Par les changements d’indices a1 n + b1 → n et a1 n + b1 → n , on obtient qu’il est suffisant de montrer
que 10 :
2
A4
1S g1 (n + h1 )1S g1 (n + h1 ) ≪
X X ′

1 (H )2 X 2 .
W 5
n,n′ ∈Z 1⩽h1 ⩽H ′

Or d’après la proposition VI.10 et en utilisant que si n ∈ S alors n ≪ AX :


2
X j k  X A4
1S g1 (n + h1 )1S g1 (n′ + h1 )
′ ′
H − |h1 | ≪ 1 (H )2 X 2 .
W 5
|h1 |<H ′ n∈Z

Et on peut écrire :

2 2
X j k  X
1S g1 (n + h1 )1S g1 (n′ + h1 ) 1S g1 (n + h1 )1S g1 (n + h1 ) .
′ X X ′
H − |h1 | =
|h1 |<H ′ n∈Z n,n′ ∈Z 1⩽h1 ⩽H ′

On en déduit donc la proposition. □

VI.4 Preuve de la conjecture d’Elliott en moyenne


Dans cette sous-partie, on va à l’aide des résultats montrés dans les sous-parties précédentes démon-
trer la conjecture d’Elliott en moyenne (VI.4). Pour cela on commence par supposer que X, H, M sont
suffisamment grands devant n’importe quelle constante qui apparaîtra dans la preuve sinon celle-ci est
triviale. On remarque que la première assertion de ce théorème provient de la deuxième si celle-ci est
vraie pour bj ⩽ 2AX pour tout j ∈ {1, . . . , k} (il suffit juste pour décaler b1 par h1 , les termes d’erreurs
qui apparaissant sont négligeables). Donc pour prouver la conjecture d’Elliott en moyenne il nous suffit
de montrer la deuxième assertion du théorème pour bj ⩽ 2AX pour tout j ∈ {1, . . . , k}. Soit H0 ∈ R∗+
10. On prolonge ici les fonctions N → C à tout Z par 0 pour simplifier légèrement les calculs

79
tel que :    
1 M
log(H0 ) = min log(X) 3000 log log(X), exp M .
80
— Premier cas : H ⩽ H0 .

20 2 H
On pose W = log(H) , P1 = W 00, Q1 == et S = SP1 ,Q1 ,√10AX,10AX . D’après la proposition
W3
VI.11 :
k
kA2 H k−1
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪
X X Y
X.
j=2
log(H)
1⩽h2 ,...,hk ⩽X 1⩽n⩽X

De plus, grâce à au lemme VI.6 :

X log(P1 ) log(W )
1 ≪ AX ≪ AX .
log(Q1 ) log(H)
n⩽10AX
n̸∈S

Ainsi par inégalité triangulaire :

X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2

k
log(W )
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) + H k−1 kAX
X X Y
≪ ,
j=2
log(H)
1⩽h2 ,...,hk ⩽X 1⩽n⩽X

kA2 log(W )
≪ H k−1 X + H k−1 kAX ,
log(H) log(H)
 
M log log(H) 1
≪ A2 k e− 80 + + 1 H k X.
log(H) log(X) 3000

— Deuxième cas : H > H0 .

On va se ramener au cas précédent. Pour cela on subdivise [1, H] en segments de taille H0 et dans chaque
segment on se ramène à une sommation de la forme 1 ⩽ h2 , . . . , hk ⩽ H0 11 :

X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2

X X X k
Y
≪ g1 (a1 n + b1 ) gj (aj n + bj,l + hj ) ,
1⩽h2 ,...,hk ⩽H0 1⩽n⩽X j=2
j k
H
0⩽l⩽ H0

 
H
où pour tous j, l : bj,l = bj +lH0 . Comme pour tout l ⩽ , lH0 ⩽ AX, on peut appliquer le théorème
H0
11. Les changements d’indices font apparaître le terme négligeable H0k−1 .

80
?? dans le cas où H ⩽ H0 . On obtient alors (où M0 désigne la valeur de M si l’on remplace H par H0 ) :

X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
 
H 2 M
− 800 log log(H0 ) 1
≪ A k e + + 1 H0k X
H0 log(H0 ) log(X) 3000
 
2 −M log log(H) 1
≪A k e 80 + + 1 H k X.
log(H) log(X) 3000

81
VII Conjectures de Chowla et d’Elliott en moyenne logarith-
mique

VII.1 Moyenne logarithmique de fonctions multiplicatives


On va dans ce paragraphe introduire une nouvelle manière de considérer une moyenne d’une fonction
multiplicative qui est moins contraignante et qui permettra d’établir des résultats "en moyenne". Pour
cela on va introduire la grandeur suivante.
Définition VII.1
Soit f : N → C une fonction arithmétique. On dit que f admet une moyenne logarithmique si la
limite suivante existe :
1 X f (k)
lim .
x→+∞ log(x) k
k⩽x

Dans ce cas on note mlog (A) cette limite.

Le résultat principal de ce paragraphe est le suivant :

Proposition VII.2

Soit f une fonction arithmétique. Si elle possède une moyenne alors elle possède une moyenne
logarithmique et elles sont égales. La réciproque est fausse.

Démonstration : Le premier fait est une conséquence directe de la formule de sommation par parties.
Pour le sens réciproque, on a déjà vu que la fonction multiplicative n 7→ nit ne possédait pas de valeur
moyenne pour t ̸= 0. Par contre elle possède une moyenne logarithmique car pour tout x ⩾ 1 :

X Z x Z x 
it−1 it−1 it−2
n = u du + O (it − 1)u du .
n⩽x 1 1

En fait la moyenne logarithmique ne prend pas en compte les oscillations de nit lorsque n est grand ce
qui donne une plus grande perméabilité quant à l’admission de moyenne logarithmique.

VII.2 Présentation du résultat principal et réduction du problème


L’objectif de cette partie est d’établir une conjecture d’Elliott non asymptotique en moyenne loga-
rithmique :

82
Théorème VII.3

Soient a1 , a2 ∈ N, b1 , b2 ∈ Z tels que a1 b2 − a2 b1 ̸= 0. Soit ε > 0 et soit A suffisamment grand


1
devant a1 , a2 , b1 , b2 et . Soit x ⩾ ω ⩾ A et soient g1 , g2 : N → C deux fonctions multiplicatives
ε
1-bornées. Supposons que g1 est non-prétentieuse, c’est-à-dire pour tout caractère de Dirichlet χ de
module au plus A et pour tout t ∈ [−Ax, +Ax] :

D(g1 ; n 7→ χ(n)nit , x) ⩾ A.

Alors :
X 1
g1 (a1 n + b1 )g2 (a2 n + b2 ) ⩽ ε log(ω).
x n
ω <n⩽x

Dans cette sous-partie on va se ramener à prouver ce résultat pour g1 , g2 complètement multiplicatives


et à valeurs dans la sphère unité. On commence par :

Proposition VII.4

Pour établir le théorème VII.3, il suffit de le faire pour g1 à valeurs dans le cercle unité

Démonstration : On suppose que pour tout n ∈ N : |g1 (n)| ⩽ 1. On factorise g1 sous la forme
′ ′′ ′ ′′
g1 = g1 g1 où g1 = |g1 | et g1 à valeurs dans ∈ S1 . Soit A0 une quantité suffisamment grande (dépendant
de a1 , a2 , b1 , b2 , ε) que l’on ajustera plus tard.
X 1 − g ′ (p)
1
— Premier cas : ⩾ A0 .
p
p⩽x
Ce premier cas est simple a traiter cas il se fait directement sans se servir de l’hypothèse que le théorème
′′
VII.3 est vrai pour g1 . En effet
h d’après
i le deuxième théorème de Mertens (II.19) et pour A0 suffisamment
1
grand, on a pour tout y ∈ x A0 , x :
X 1 − g ′ (p) A0
1
⩾ .
p 2
p⩽y

Donc d’après l’inégalité faible d’Halasz (IV.9) :



X g1 (a1 n + b1 )
= oA0 →+∞ (log(ω)) .
x n
ω ⩽n⩽x

On obtient le théorème VII.3 dans ce cas-ci après une sommation par parties.
X 1 − g ′ (p)
1
— Deuxième cas : < A0 .
p
p⩽x
Dans ce cas-ci on va adopter un point de vue probabiliste. C’est quelque chose qu’on fera plusieurs fois
d’ici la fin du rapport et cela est surtout utile pour simplifier certains arguments. Pour tout p premier
′  ′ 
et pour tout j, on introduit g1 pj une variable aléatoire d’espérance g1 pj à valeurs dans S1 et qui
forment une famille d’évènements indépendants. On introduit alors pour tout n ∈ N de décomposition
αk ′ Qk ′ ′
en facteurs premierspα αi j

1 . . . pk , g1 (n) = i=1ig1 (pi ). Par indépendance des variables aléatoires g1 p
1


h ′ ′
et par multiplicativité de gi , on a : E g1 (n) = g1 (n). D’après l’inégalité de Markov et par hypothèse

83
dans ce deuxième cas :  
X 1 − g′ (p) 1
1
P > A20  ⩽ .
p A0
p⩽x

X 1 − g′ (p)  
1
1
Donc ⩽ A20 avec probabilité 1 − O . On se restreint pour le moment à cet évènement.
p A0
p⩽x
′ ′′
On pose g1 = g1 g1 , ainsi g1 est multiplicative, à valeurs dans S1 et de moyenne g1 . Par hypothèse de
"non-prétentieusité" de g1 et inégalité triangulaire, on obtient pour tout A suffisamment grand devant
A0 :  
X 1 − Re g1 (p)χ(p)p−it A
⩾ .
p 2
p⩽x

X 1 − g′ (p)
1
1
Si on suppose vrai le théorème VII.3 pour g1 ∈ S , alors dans l’évènement ⩽ A20 :
p
p⩽x

X g1 (a1 n + b1 )g2 (a2 n + b2 )


⩽ ε log(ω).
x n
ω <n⩽x

Si on est pas dans cet évènement, on a quand même la majoration triviale :

X g1 (a1 n + b1 )g2 (a2 n + b2 )


⩽ log(ω).
x n
ω <n⩽x

Ainsi on obtient pour A0 suffisamment grand.


 
X g1 (a1 n + b1 )g2 (a2 n + b2 )  ε log(ω)
E ⩽ ε log(ω) ≪ log(ω) + ≪ ε log(ω).
x n 2 A0
ω <n⩽x

On obtient le théorème VII.3 dans ce cas-ci par linéarité de l’espérance. □

Remarquons qu’un argument similaire permet de se ramener au cas où g2 aussi est aussi à valeurs dans
le cercle unité. En effet, le travail est même plus simple car l’hypothèse de "non-prétentieusité" de g1
n’est pas affectée par le choix de g2 . On continue par :

Proposition VII.5

Pour établir le théorème VII.3, il suffit de le faire pour g1 complètement multiplicative et g1 , g2 à


valeurs dans le cercle unité.

Démonstration : Les précédentes réductions nous permettent déjà de pouvoir supposer que g1 et g2
1
sont à valeurs dans S . On introduit la fonction multiplicative g˜1 par pour tout p premier g˜1 (p) = g1 (p).
On définit h comme la fonction multiplicative qui vérifie : g˜1 ∗ h = g1 , on a déjà vu que pour tout p

premier que pour tout j, on a : h(p) = 0 et h pj ⩽ 2. Comme dans la preuve précédente, on choisi une
quantité A0 qui sera suffisamment grande devant a1 , a2 , b1 , b2 , ε et on suppose que A est suffisamment

84
grand devant toutes ces quantités. On peut alors écrire :

a1 n+b1

X 1 X X g̃ d g2 (a2 n + b2 )
g1 (a1 n + b1 )g2 (a2 n + b2 ) = h(d) .
x n x n
ω <n⩽x d∈N ω ⩽n⩽x
d|a1 n+b1

On va maintenant contrôler la somme intérieure en fonction de la valeur de d ∈ N.


— Premier cas : d ⩽ A0 .

On subdivise la somme en classe modulo d (en négligeant certains termes de bords), et, en notant a1 = a1 ,
′ ′ a1 r + b1 ′
a2 = a2 d, b1 = et b2 = a2 r + b2 on a :
d
 ′ ′

a1 n+b1 ′ ′

X g̃1 a1 n+b1 g2 (a2 n + b2 )



X X g̃1 d g2 (a2 n + b2 )
d

x n x x kd + r
ω ⩽n⩽x 0⩽r⩽d−1 ωd ⩽n⩽ d
d|a1 n+b1 d|a1 r+b1
  ′ ′
 
a1 n+b1 ′ ′
g̃1 d g2 (a2 n + b2 )   
X  X 1 
⩽  1+O .

x x kd k 
0⩽r⩽d−1 ωd ⩽n⩽ d
d|a1 r+b1

ε
Donc en appliquant le théorème VII.3 à g˜1 en prenant 2A0 plutôt que ε, on obtient :

a1 n+b1

X g̃1 d g2 (a2 n + b2 ) ε
⩽ log(ω).
x n 2A0
ω ⩽n⩽x
d|a1 n+b1

— Deuxième cas : d > A0 .


On a trivialement :
a1 n+b1

X g̃1 d g2 (a2 n + b2 ) log(ω)
≪ .
x n d
ω ⩽n⩽x
d|a1 n+b1

Or en développant en produit eulérien h (comme on a déjà fait dans ce rapport), on montre que la série
h(k)
de terme général 2 , k ∈ N converge absolument et donc :
k3
X |h(d)| −1
≪ A0 3 .
d
d>A0

On en déduit que :
a1 n+b1

X X g̃1 d g2 (a2 n + b2 ) log(ω)
h(d) ≪ 1 .
x n A03
d>A0 ω ⩽n⩽x
d|a1 n+b1

— Conclusion : En combinant les deux cas pour d, on obtient le résultat attendu.


Comme précédemment, on peut facilement refaire le même argument pour se ramener au cas où g1 , g2
sont complètement multiplicatives et à valeurs dans le cercle unité. On présente désormais le théorème
auquel on s’est ramené pour démontrer le théorème VII.3 :

85
Théorème VII.6: (Réduction du problème)

1
Soient a ∈ N, b ∈ Z et h ̸= 0. Soit ε > 0 et soit A suffisamment grand devant a, b, h et .
x
ε
Soit x ⩾ log(x) ⩾ ω ⩾ A et soient g1 , g2 : N → S1 deux fonctions complètement multiplicatives.
Supposons que g1 est non-prétentieuse, c’est-à-dire pour tout caractère de Dirichlet χ de module au
plus A et pour tout t ∈ [−Ax, +Ax] :

D(g1 ; n 7→ χ(n)nit , x) ⩾ A.

Alors :
X 1
g1 (an + b)g2 (an + b + h) ⩽ ε log(ω).
x n
ω <n⩽x

Montrons que ce résultat implique le théorème VII.3 :

Proposition VII.7

Pour montrer le théorème VII.3, il suffit de démontrer le théorème VII.6.

Démonstration : Déjà par les réductions précédentes, on peut supposer que g1 et g2 sont complètement
multiplicatives et à valeurs dans S1 , on a pour tout n ∈ N :

g1 (a1 n + b1 )g2 (a2 n + b2 ) = g1 (a2 )g2 (a1 )g1 (a1 a2 n + a2 b1 )g2 (a1 a2 n + a1 b2 ).

Ainsi quitte à remplacer a1 , a2 , b1 , b2 par a1 a2 , a1 a2 , b1 a2 , b2 a1 , pour démontrer le théorème VII.3, on


x
peut supposer que a1 = a2 = a, b1 = b et b2 = b + h où h ̸= 0. Soit ω ∈ [A, x]. On suppose ω ⩾
log(ω)
sinon il suffit juste d’appliquer le théorème VII.6. Sinon on sépare en deux la somme et on applique VII.6
dans la deuxième somme :

X g1 (an + b) g2 (an + b + h) X g1 (an + b) g2 (an + b + h) ε


⩽ + log(ω),
x n x
n 2
ω <n⩽x ω <n⩽log(x)

≪ ε log(ω).

VII.3 Passage à un point de vue probabiliste


Soient a, b, h, ε comme dans le théorème VII.6. Supposons que celui-ci est faux pour ce choix de
paramètres. Quitte à diminuer ε, on peut supposer que ε est suffisamment faible devant a, b, h. On
1 1
introduit H− suffisamment grand a, b, h, , H+ suffisamment grand a, b, h, , H− et A > 0 suffisamment
ε ε
1
grand a, b, h, , H− , H+ . On gardera en tête les deux hiérarchies suivantes (avec certaines notations qui
ε
seront introduites plus tard) :

1 x
a, b, h ≪ ≪ H− ≪ p ≪ H ≪ H+ ≪ A ⩽ ω ⩽ ⩽ x.
ε2 log(x)

86
x
x⩾n⩾ ⩾ log(x) ⩽ log(A) ≪ H+ .
ω
Par hypothèse, il existe x ⩾ ω ⩾ A et g1 , g2 : N → S1 complètement multiplicatives tels que pour
tout caractère de Dirichlet χ de module au plus A et pour tout |t| ⩽ Ax :

D(g1 ; n 7→ χ(n)nit , x) ⩾ A,

et tels que :
X 1
g1 (an + b)g2 (an + b + h) > ε log(ω). (VII.1)
x n
ω <n⩽x

Proposition VII.8

Pour tout H− ⩽ H ⩽ H+ , on a :

H
X 1 X log log(H)
sup g1 (n + j)e(jα) ≪ log(ω).
α∈S1 x Hn j=1 log(H)
ω <n⩽x

En particulier :
H
X 1 X
sup g1 (n + j)e(jα) = oH− →+∞ (log(ω)).
α∈S1 x Hn j=1
ω <n⩽x

x 
Démonstration : Soient α ∈ S 1 , et X ∈ 2ω , 2x . On définit S comme au théorème VI.8 avec
H
P1 = W 2 00 et Q1 = 3 où W = log(H)5 . On écrit :
W

H H
X 1 X X 1 X
g1 (n + j)e(jα) ≪ g1 (n + j)e(jα) + |S c | .
HX j=1 HX j=1
X<n⩽2X X<n⩽2X

Or d’après le lemme VI.6, on a :

log(P1 ) log log(H)


|S c | ≪ ≪ .
H log(Q1 ) H log(H)

Ainsi d’après le théorème VI.8, on obtient que :

H
X 1 X log log(H)
g1 (n + j)e(jα) ≪ .
HX j=1 log(H)
X<n⩽2X

On obtient alors par sommation partielle que :

H
X 1 X log log(H)
g1 (n + j)e(jα) ≪ log(X).
n j=1 log(H)
X<n⩽2X

On en déduit facilement les deux points de la proposition en moyennisant. □

Il sera plus adapté dans le contexte de la sous-partie suivante, d’utiliser un langage probabiliste. On

87
x

introduit une variable aléatoire discrète n sur n ∈ N : ω < n ⩽ x en posant :

1/n
P(n = n) = P 1 .
k∈N k
x
ω <k⩽x

Montrons que uniformément H ∈ [H− , H+ ] :


 
H
X
sup E  g1 (n + j)e(jα)  = oH→+∞ (H). (VII.2)
α∈S1 j=1

x
Comme x ⩾ ω ⩾ A et ω ⩽ , on a :
log(x)
X 1
= (1 + oA→+∞ ) log(ω).
n
n∈N
x
ω ⩽n⩽x

Donc par (VII.1), pour A suffisamment grand.

E [g1 (an + b)g2 (an + b + h)] ≫ ε.

On obtient le fait annoncé par la proposition VII.8.

Lemme VII.9

Soit q ∈ N, q ⩽ H+ et r ∈ Z tel que |r| ⩽ H+ . Alors pour toute variable aléatoire X(n) à valeurs
complexes dépendant de n et bornée en module par un nombre indépendant des paramètres du
problème :
 1
E X(n)1n≡r[q] = E [X(qn + r)] + oA→+∞ (1).

q

Démonstration : La preuve ne présente pas de difficulté, pour les détails on se référera à [7]. □

Proposition VII.10
h i
ε2 H 2
Notons PH l’ensemble des nombres premiers dans 2 ,ε H . Pour tout p premiers on note cp =
1
g1 (p)g2 (p) ∈ S . Alors on a :
 
εH
cp 1an+j≡pb[ap] g1 (an + j)g2 (an + j + ph)
X X 
E
 ≫ log(H)
.
p∈PH j∈[1,H]
j:
j+pH∈[1,H]

1n≡b[a] g1 (n)g2 (n + h) . Par complète multiplicativité de g1 et g2


 
Démonstration : On note X = E
et par définition de cp , on voit que pour tout p ∈ PH :

X = E cp 1pn≡pb[ap] g1 (pn)g2 (pn + ph) .


 

88
D’après le lemme VII.9, on a pour tout j ∈ {1, . . . , H} et pour tout p ∈ PH :

 X
E cp 1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph) =

+ oA→+∞ (1).
p

En sommant ceci pour j = 1, . . . , H, on obtient pour tout p ∈ PH :


 
H
X
1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph) =
X
E cp + oA→+∞ (1).
j=1
p

On fixe désormais p ∈ PH et on introduit pour s ∈ {0, . . . , a − 1}, la quantité :


 
H
1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph)1n≡s[a]  .
X
Q(s) = E cp
j=1

X HX
Par le calcul précédent, on sait que Q(s) =
+ oA→+∞ (1), l’idée est de comparer Q(s) et Q(s + 1)
s
p
pour tout s et d’utiliser cette relation pour obtenir une estimation de Q(0) et de la sommer sur p ∈ PH
afin d’obtenir une quantité pas trop éloignée de ce que l’on cherche. Tout d’abord, d’après le lemme
VII.9, on a :

Q(s + 1) = Q(s) + E cp 1n+1≡pb[ap] g1 (n + 1)g2 (n + 1 + ph)1n≡s[a]


 

− E cp 1n+1+H≡pb[ap] g1 (n + H + 1)g2 (n + 1 + H + ph)1n+H≡s[a] + oA→+∞ .


 

 
1
Or les deux quantités dans les espérances sont nulles avec probabilité 1 − O p . En dehors de cet
événement elles sont des O(1). Ainsi on obtient que pour tout s ∈ {0, . . . , a − 1} :
 
1
Q(s + 1) = Q(s) + O .
p
 
HX a
Ainsi Q(0) = ap +O p . Donc en sommant sur p ∈ PH , on obtient :

 
H   X
HX 1
cp 1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph)1n≡0[a]  =
X X
E + O(a) .
a p
p∈PH j=1 p∈PH

Donc d’après le deuxième théorème de Mertens (II.19) 12 :


 
H
εH
cp 1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph)1n≡0[a]  ≫
X X
E .
a log(H)
p∈PH j=1

Ainsi d’après le lemme VII.9 :


 
H
εH
cp 1an+j≡pb[ap] g1 (an + j)g2 (an + j + ph)1n≡0[a]  ≫
X X
E .
log(H)
p∈PH j=1

x √ 1
12. On a aussi utilisé l’équivalent suivant : log log(x) − log log ∼ 2 .
2 x→+∞ log(x)

89
Si j + ph ̸∈ [1, H] alors j ∈ [1, |h| ε2 H] ou j ∈ [(1 − ε2 |h|)H, H] et dans ce cas on a :
 
ε2 H
cp 1an+j≡pb[ap] g1 (an + j)g2 (an + j + ph)1n≡0[a] 
X X 
E ≪ .
  log(H)
p∈PH j∈[1,H]
j:
j+ph̸∈[1,H]

On en déduit le résultat annoncé par inégalité triangulaire. □

On va maintenant effectuer une discrétisation du problème. On définit gi,ε2 (n) pour i = 1, 2 l’élément
de ε2 Z[i] le plus proche de gi (n) (s’il y a égalité, on en prend un arbitrairement). Cette fonction n’est

pus multiplicative mais prend au plus Oε (1) valeurs, est toujours par 1 et vérifie : gi,ε2 = gi + O ε2
pour i = 1, 2. D’après la proposition VII.10 et l’inégalité triangulaire :
 
εH
cp 1an+j≡pb[ap] g1,ε2 (an + j)g2,ε2 (an + j + ph)
X X 
E
 ≫ log(H)
.
p∈PH j∈[1,H]
j:
j+pH∈[1,H]

H
On réécrit cette inégalité sous la forme : E [F (XH , YH )] ≫ ε , où :
log(H)

XH := (gi,ε2 (an + j))i=1,2; j=1,...,H et YH = n mod PH ,

et où F désigne la fonction suivante : Notons bien ici que la fonction est bien définie car si on prend
deux représentants Y1 et Y2 de la même classe dans Z/PH Z, alors aY1 ≡ aY2 [ap] pour tout p ∈ PH
car (PH , a) = 1 13

VII.4 Point de vue entropique et conclusion


Dans cette partie on va utiliser la notion d’entropie de Shannon vu dans la première partie pour en
arriver à une absurdité et donc en déduire le théorème VII.6 et donc la conjecture d’Elliott en moyenne
logarithmique (VII.3).

VII.4.1 Argument de décrément d’entropie

Avant d’appliquer l’argument, on va d’abord voir des estimations élémentaires de l’entropie de Shan-
non des variables aléatoires XH et YH introduites précédemment :

Proposition VII.11

Soit H ∈ [H− , H+ ]. On a les propriétés suivantes :

0 ⩽ H(XH ) ≪ε H et H(YH ) ≪ H.

Démonstration : Chaque composante de XH prend Oε (1) valeurs donc on a H(XH ) ≪ε H d’après


le lemme ??. Pour la deuxième inégalité, on a par un développement limité :

X 1
∀ ⩽k⩽x: P(YH = k) = + oH→+∞ (1).
ω PH
1
13. On rappelle ici qu’on a H suffisamment grand devant et donc que pour tout p ∈ PH est premier avec a.
ε2

90
Ainsi H(YH ) = log(PH ) − oA→+∞ (1). On obtient le résultat par le théorème des nombres premiers. □

L’idée principale de l’argument de décrément d’entropie se base sur la proposition suivante :

Proposition VII.12

Soient H− ⩽ H ⩽ kH ⩽ H+ . On a l’estimation :
 
H(XkH ) H(XH ) I(XH , YH ) 1
⩽ − +O .
kH H H k

Démonstration : On définit temporairement la variante de XH suivante :



∀H− ⩽ H1 , H2 ⩽ H+ : XH1 ,H1 +H2 := X gi,ε2 (n + j i=1,2;j=H1 +1,...,H1 +H2
.

Soient H− ⩽ H1 , H2 ⩽ H+ . D’après le lemme VII.9 :


 PH

H XH1 ,H1 +H2 |nPH = H XH1 ,H1 +H2 |n + H1 = H XH2 |nPH + oA→+∞ (1).
 

On en déduit par sous-additivité relative de l’entropie (??) :

H (XH1 +H2 |YH ) ⩽ H(XH1 |YH1 ) + H(XH2 |YH2 ) + oA→+∞ (1).

En itérant ce procédé, on conclut que :

∀k, H tels que H− ⩽ H ⩽ kH ⩽ H+ : H(XkH |YH ) ⩽ kH(XH |YH ) + oA→+∞ (1).

On en déduit facilement que pour de tels k, H que

H(XkH ) ⩽ kH(XH ) − kI(XH , YH ) + H(YH ) + oA→+∞ (1).

On obtient le fait annoncé par la proposition précédente. □

Cette inégalité nous dit que la présence d’information mutuelle entre XH et YH amène à une diminution
du taux d’entropie de XH , ainsi si cette information mutuelle est taux grande alors elle amènerait à une
trop grande diminution du taux d’entropie et qu’elle devienne ainsi négative. Cette idée est confirmée
par le théorème suivant :

Théorème VII.13: (Décrément d’entropie)

Il existe H ∈ [H− , H+ ], multiple de a tel que :

H
I(XH , YH ) ⩽ .
log(H) log log log(H)

Démonstration : Supposons par l’absurde que pour tout H ∈ [H− , H+ ] multiple de a :

H
I(XH , YH ) > .
log(H) log log log(H)

Soient C0 un nombre suffisamment grand devant H− , J suffisamment grand devant C0 , H− , ε. On peut


supposer que H+ est suffisamment grand en fonction de H− , C0 , J. On définit par récurrence une famille

91
(Hj )j∈{1,...,J} par H1 = aH− et pour tout j ⩾ 1 : Hj+1 = Hj ⌊C0 log(Hj ) log log log(Hj )⌋ et avec
J l’entier maximal tel que HJ ∈ [H− , H+ ]. D’après la proposition précédente appliquée à (H, k) =
(Hj , ⌊C0 log(Hj ) log log log(Hj )⌋) pour tout j ∈ {1, . . . , J} :
 
H(XHj+1 ) H(XHj ) I(XHj , YHj ) 1
⩽ − +O .
Hj+1 Hj Hj ⌊C0 log(Hj ) log log log(Hj )⌋

Donc par la proposition I.10 :

H(XHj+1 ) H(XHj ) 1
⩽ − .
Hj+1 Hj 2 log(Hj ) log log log(Hj )

Montrons que :

Il existe B (dépendant de C0 , H− ) tel que pour tout j ⩾ 2 : Hj ⩽ eBj log(j) .

On pose pour tout j : Mj = Bj log(j) et Rj = log(Hj ). On a :

Rj+1 ⩽ Rj + log(C0 ) + log(Rj ) + log log log(Rj ).

Ainsi pour j ⩾ j0 assez grand devant C0 , H− : Rj+1 ⩽ Rj + 2 log(Rj ). Soit B tel que pour tout j ⩽ j0 :
Hj ⩽ eBj log(j) . Procédons maintenant par récurrence, par le choix de B le fait que l’on veut montrer est
vrai pour j ⩽ j0 . Supposons celui-ci vrai pour j ∈ N et montrons le fait pour j + 1. Par choix de j0 et
par hypothèse de récurrence :

Mj
Rj+1 ⩽ Mj + 2 log(Mj ) ⩽ Mj + ,
j

où la deuxième inégalité est obtenue par l’inégalité vraie pour tout x, y ⩾ 4 : 4x + 2y ⩽ ey x. On obtient
Mj
ainsi Rj+1 ⩽ Mj + j ⩽ Mj+1 . D’où l’hérédité. On obtient donc l’inégalité par récurrence. Ainsi :

H(XHj+1 ) H(XHj ) 1
⩽ − .
Hj+1 Hj 2Bj log(j) log log(Bj log(j))

Donc par la proposition VII.12 et par télescopage on obtient :

J−1
X 1
≪ε 1.
j=2
2Bj log(j) log log(Bj log(j))

Or la somme de gauche diverge pour J → +∞, on obtient donc une contradiction lorsque J est suffi-
samment grand. □

Ce résultat utilise ce qu’on appelle un argument de décrément d’entropie, en fait l’idée est de montrer que
H(XH )
le rapport d’entropie décroît quand H → +∞. Le fait de supposer que l’information I(XH , YH )
H
H(XH )
est suffisamment grande pour un H amène au fait que le rapport va décroître trop vite et ainsi
H
devenir négatif pour un certain H. Désormais, on considéra le H amené par ce théorème.

VII.4.2 Quelques conséquences

92
Définition VII.14
Dans cette section et uniquement dans cette section, on dira que x est une bonne valeur si :
 
H
H(YH ) − H(YH |XH = x) = oH− →+∞ .
log(H)

Le premier intérêt à considérer les bonnes valeurs est qu’elles représentes presque toutes les valeurs prises
par XH :

Lemme VII.15

La probabilité que XH prenne une bonne valeur est 1 − oH− →+∞ (1).

Démonstration : On a par définition d’une bonne valeur on a pour tout ε > 0 fixé :
X
P(XH = x) (H(YH ) − H(YH | XH = x))
x
X H
⩾ P(XH = x) (H(YH ) − H(YH | XH = x)) + ε .
log(H)
xbonne valeur

 
H
Or par le théorème VII.16 : I(XH , YH ) = oH− →+∞ . Ainsi :
log(H)
 
X H
P(XH = x) (H(YH ) − H(YH | XH = x)) = oH− →+∞ .
x
log(H)

On en déduit le résultat annoncé □

De manière intuitive, si x est bon alors YH reste presque uniformément distribuée sur Z/PH Z (comme on
l’a vu dans la preuve de la proposition VII.12) même après conditionnement par rapport à l’évènement
XH = x. Plus précisément on a :

Lemme VII.16
 
H
Soit x une bonne valeur. Soit Ex une partie de Z/PH Z de cardinal au plus exp −ε7 PH ,
log(H)
alors on a :
P(YH ∈ Ex | XH = x) = oH− →+∞ (1).

Démonstration : Par définition de l’entropie conditionnelle, on a :

H(YH |(XH = x, 1Ex (YH ))) ⩾ H(YH |XH = x) − H(1Ex (YH )|XH = x).

Ainsi comme x est une bonne valeur on en déduit que :

P(YH ∈ Ex |XH = x)H(YH |(XH = x, YH ∈ Ex )) + P(YH ̸∈ Ex |XH = x)H(YH |(XH = x, YH ̸∈ Ex ))


 
H
⩾ H(YH ) − H(1Ex (YH )|XH = x) − oH− →+∞ .
log(H)

93
Or 1Ex (YH )|XH = x ne prend que deux valeurs possibles, ainsi par la proposition I.10 :
 
H
H(1Ex (YH )|XH = x) = oH− →+∞ .
log(H)

Et d’après la proposition I.8 :

H(YH |(XH = x, YH ̸∈ Ex )) ⩽ H(YH ).

On en déduit que :
 
H
P(YH ∈ Ex |XH = x) (H(YH ) − H(YH |(XH = x, YH ∈ Ex ))) ⩽ oH− →+∞ .
log(H)

Or par hypothèse YH |XH = x, YH ∈ Ex prend au maximum |Ex | valeurs donc par la proposition I.10 :

H
H(YH |XH = x, YH ∈ Ex ) ⩽ log(|Ex |) ⩽ log(PH ) − ε7 .
log(H)

Or d’après la proposition

Proposition VII.17

Soient a, H comme au dessus. On note pour α ∈ R/Z :

X cp (αp)
SH (α) = ,
p
p∈PH

et notons :

ε2
   
(b + h)η h · ξ
ΞH = ξ ∈ Z/HZ tel qu’il existe η ∈ Z/aZ tel que : SH − − ⩾ .
a H log(H)

On introduit (Xi,j )i=1,2,j=1,...,H une famille d’éléments dans S1 . On a :


 
X cp H  
H  2 X 1 X jε 
1j≡pb[a] X1,j X2,j+ph ≪x,h
X
ε + X1,j e − .
p log(H) H j=1 H
p∈PH j:j,j+ph∈[1,H] ξ∈ΞH

Démonstration : On étend X1,j et X2,j de manière périodique (i.e X1,H+j := X1,j pour tout j). Si
on retire de la somme de gauche la contraire j + ph ∈ [1, H] cela occasionnera une erreur de :
 
X1  
2 H
O  |ph| = Oh ε
 ,
p log(H)
p∈P

ce qui est acceptable par rapport à ce que l’on veut montrer. Maintenant en re-faisant la confusion d’un
élément de [1, H] par sa projection dans Z/HZ, on peut dire que la quantité que l’on cherche à estimer
est :
X cp X
1j≡pb[a] X1,j X2,j+ph .
p
p∈PH jZ/HZ

94
Par inversion de Fourier, on écrit pour i = 1, 2; j ∈ Z/HZ :
   
X jξ 1 X jξ
Xi,j = Gi (ξ)e où pour tout ξ ∈ Z/HZ : Gi (ξ) = Xi,j e − .
H H H
ξZ/HZ j∈Z/HZ

Des manipulations élémentaires permettent d’écrire :


   
X cp X H H (b + h)η h · ξ
1j≡pb[a] X1,j X2,j+ph
X X
= G1 (ξ)G2 −ξ − η SH − − .
p a a a H
p∈PH jZ/HZ η∈Z/aZ ξ∈Z/HZ

Or par l’inégalité de Cauchy-Scwharz et par l’identité de Plancherel on a :


 
X H
G1 (ξ)G2 −ξ − η ≪ 1.
a
ξ∈Z/HZ

 
De plus, on a par le deuxième théorème de Mertens (II.19) : SH − (b+h)η
a − h·ξ
H
1
≪ log(H) . On obtient
H

donc par définition de ΞH et en majorant trivialement pour ξ ∈ ΞH , G2 −ξ − aη ≪1:

X cp X H X |G1 (ξ)| H X ε2
1j≡pb[a] X1,j X2,j+ph ≪
X
+
p a log(H) a log(H)
p∈PH jZ/HZ η∈Z/aZ ξ∈ΞH η∈Z/aZ
 
H  2 X
≪ ε + |G1 (ξ)| .
log(H)
ξ∈ΞH

On en déduit le résultat annoncé par définition de G1 . □

Lemme VII.18

Pour les mêmes quantités introduites que précédemment, on a : |ΞH | ≪a,h,ε 1.

Démonstration : Des manipulations élémentaires nous permettent d’obtenir :


  4
X k X cp1 cp2 cp3 cp4 1 X
SH = aH ≪a 3 1.
aH p1 p2 p3 p4 H
k∈Z/aZ p1 ,p2 ,p3 ,p4 ∈PH p1 ,p2 ,p3 ,p4 ∈PH
p1 +p2 −p3 −p4 =0 p1 +p2 −p3 −p4 =0

Et l’estimation suivante provenant d’un crible de Selberg nous permet de conclure


  4
X k 1
SH ≪a,ε ≪a,ε,h 1.
aH log(H)4
k∈Z/aZ

Conclusion : Essayons maintenant de conclure à une absurdité. Grâce aux deux lemmes précédents,
on a  
H  
X 1 X jξ
E g1 (an + j)e −  ≫a,h ε.
H j=1 H
ξ∈ΞH

On en déduit d’après VII.2 que ε ≪a,h oH− →+∞ (|ΞH |). Avec le lemme précédent, on conclut à une
absurdité.

95
VIII Problème de la discrépance d’Erdös

VIII.1 Présentation du problème


Commençons par nous mettre en situation. Imaginons que nous devons guider par message quelqu’un
qui se trouve sur la voie du milieu d’un pont à trois voies. Notre objectif est d’avancer sur ce pont sans
jamais tomber, tout en respectant une règle essentielle : il est interdit d’avancer en ligne droite. Pour
mieux visualiser la situation, nous pouvons subdiviser le pont comme suit :

Avancée
Figure 2 – Schématisation du pont

Une solution très simple pour progresser sur le pont sans tomber consiste à avancer en zigzag, comme
illustré dans le schéma ci-dessous :

Avancée
Figure 3 – Schématisation du déplacement en zigzag.

Nous représentons ce déplacement par la séquence suivante : DGDGDGDG . . ., que l’on lit de gauche à
droite. La lettre ′ D′ indique un déplacement en diagonale vers la droite, tandis que la lettre ′ G′ indique
un déplacement en diagonale vers la gauche. C’est ainsi que nous communiquons ces instructions à la
personne se trouvant sur le pont.
Maintenant, supposons qu’il soit difficile de communiquer directement avec cette personne, ce qui fait
qu’elle pourrait ne comprendre qu’une lettre sur deux du message. Il est donc essentiel de s’assurer que
si elle ne reçoit qu’une lettre sur deux, le message lui permettra tout de même de rester sur le pont sans
jamais tomber.

96
Prenons l’exemple du message précédent et considérons uniquement une lettre sur deux. Nous obtenons
alors le message suivant : GGGGGG . . .. Sur le schéma ci-contre cela revient à dire qu’en suivant
uniquement les flèches rouges, la personne tombera du pont.

Avancée
Figure 4 – Schéma illustrant que le déplacement "trivial" sur le pont n’est pas adapté si on ne considère qu’un
déplacement sur deux.

Par conséquent, il est nécessaire de réfléchir plus en profondeur. Nous allons donc procéder étape par
étape :

— Le premier déplacement est sans importance, nous choisissons donc D.


— Pour rester sur le pont, nous sommes obligés de choisir G pour le deuxième déplacement.
— Si nous choisissons D pour le troisième déplacement, en prenant un déplacement sur deux, le chemin
devient DD, ce qui fera tomber la personne du pont. Nous sommes donc contraints de choisir G
pour le troisième déplacement.
— Pour rester sur le pont, nous devons choisir D pour le quatrième déplacement.
— Nous continuons à prolonger ce chemin de manière périodique.

Avancée
Figure 5 – Schématisation d’un chemin qui permet à la personne de rester sur le pont même un déplacement sur deux.

Ainsi, nous obtenons le chemin DGGDDGGDDGGDDGG . . ., qui permettra à la personne de rester


sur le pont s’il est transmis intact. Si le chemin est transmis en prenant une lettre sur deux, il devient
DGDGDGDG . . ., qui est évidemment un chemin permettant de rester sur le pont (voir figure 6).
Nous allons compliquer davantage le processus en supposant que la personne sur le pont ne peut
comprendre aussi qu’un déplacement sur trois du message. Il est donc crucial de s’assurer que si nous
considérons un déplacement sur trois, le chemin obtenu permettra à la personne de rester sur le pont. En
examinant le message précédemment obtenu, le chemin résultant en prenant un déplacement sur trois
commence par GG, ce qui fera tomber la personne du pont.

97
Avancée
Figure 6 – Vérification qu’en considérant un déplacement sur deux, la personne sur deux restera sur le pont.

Avancée
Figure 7 – En prenant le même chemin et en ne considérant qu’un déplacement sur trois alors la personne tombera du
pont.

Nous devons donc trouver un nouveau chemin en poursuivant le même procédé.


— Nous sommes contraints de reprendre les quatre premiers déplacements identiques.
— Si nous choisissons D pour le cinquième déplacement, nous serons contraints de choisir G pour le
sixième, ce qui entraînera le problème décrit précédemment. Nous devons donc choisir G pour le
cinquième déplacement et D pour le sixième.
— Le chemin doit donc commencer par DGGDGD. Ensuite, si nous choisissons G pour le septième
déplacement, le huitième sera D et le chemin deviendra DGGDGDGD, ce qui ne respecte pas les
conditions si l’on considère un déplacement sur deux. Nous devons donc prendre D comme septième
déplacement et G comme huitième déplacement.
— Le chemin doit donc commencer par DGGDGDDG. Si nous choisissons D comme neuvième dé-
placement, le dixième sera forcément G, et comme indiqué précédemment, le onzième sera G et le
douzième sera D (sinon le chemin ne fonctionnerait pas si nous ne considérons qu’un déplacement
sur deux). Nous obtenons donc le chemin qui commence par DGGDGDDGDGGD. En considérant
un déplacement sur trois, nous obtenons GDDD, ce qui fera tomber la personne du pont dans ce
cas.

— Le chemin doit donc commencer par DGGDGDDGGD. Cependant, si nous continuons avec un
déplacement sur trois en choisissant D comme neuvième déplacement, le dixième sera inévitable-
ment G, et comme mentionné précédemment, le onzième sera également G et le douzième sera D
(sinon le chemin ne fonctionnerait pas si nous ne considérons qu’un déplacement sur deux). Cela
nous donnerait un chemin commençant par DGGDGDDGDGGD. En prenant un déplacement sur
trois, nous obtenons GDGG, ce qui fera également tomber la personne du pont dans ce cas. Ainsi,

98
Avancée
Figure 8 – Premier cas non concluant

nous pouvons conclure qu’il n’existe aucun chemin satisfaisant à nos conditions avec une longueur
minimale de 12 déplacements. En réalité, la situation est symétrique lorsque nous sommes à l’étape
8, et il y a autant de déplacements à droite qu’à gauche, que nous prenions tous les déplacements,
un déplacement sur deux ou un déplacement sur trois. Par conséquent, nous aurions pu éviter de
considérer ce cas. Ce qui pose problème ici, c’est que nous sommes contraints de raisonner par
groupes de quatre afin d’éviter d’avoir deux fois le même déplacement en prenant un déplacement
sur deux. Cependant, dans le quadruplet d’éléments supérieurs à huit, il y a deux multiples de trois
qui se retrouveront nécessairement dans la même direction si nous raisonnons ainsi. Cela conduit
à l’impossibilité de former un chemin d’une longueur supérieure ou égale à douze qui respecte les
conditions énoncées.

Avancée
Figure 9 – Deuxième cas aussi non concluant : il est impossible de construire un chemin de longueur au moins 12
vérfiant les conditions demandées

—- On pourrait se demander comment résoudre le problème lorsque le pont est de taille plus grande et en
considérant également toutes les progressions arithmétiques homogènes 14 . Cette question a été soulevée
par Erdos au début des années 1930, et il a émis l’hypothèse que la réponse serait également négative dans
le cas général, c’est-à-dire qu’il n’existerait pas de tels chemins. Pour formaliser davantage la situation,
nous pouvons considérer le n-ème déplacement comme un élément f (n) ∈ −1, +1, qui représente les
directions droite et gauche. Ainsi, la position de la personne sur le pont après le n-ème déplacement
Xn
peut être exprimée par f (n). On peut dire que la personne tombera du pont si la valeur absolue de
k=1
cette quantité devient trop grande le long de toute progression arithmétique homogène, on appelle cette
quantité la discrépance de la (f (n)) 15 :
14. C’est-à-dire qu’il faudrait également tenir compte des suites de déplacements sur quatre, cinq, etc.
15. Le terme "discrépance" est peu fréquent en français ; en fait, il n’est même pas répertorié dans les dictionnaires

99
Définition VIII.1
n
X
Soit (f (n)) une suite de réels, on appelle discrépance de la suite (f (n)) la quantité sup f (jd).
d,n∈N∗ j=1
La conjecture d’Erdos peut finalement être formulée de la manière suivante :

Conjecture VIII.2: (Conjecture d’Erdos)

Pour toute suite d’éléments (f (n))n∈N∗ et pour tout C ⩾ 0, on a :

n
X
sup f (dj) ⩾ C.
n,d∈N∗
k=1

On a montré précédemment que cette conjecture était vrai si C = 2. On peut même énoncer cette
conjecture dans un cadre encore plus général.

Conjecture VIII.3: (Conjecture d’Erdos générale)

Soit (H, ∥·∥H ) un espace vectoriel normé. Pour toute suite d’éléments (f (n))n∈N∗ de norme 1 et
pour tout C ⩾ 0, on a :
n
X
sup f (dj) ⩾ C.
n,d∈N∗
k=1 H

C’est cette version que l’on va démontrer dans la suite de cette partie.

VIII.2 Quelques remarques sur le problème


Avant de passer à des éléments de démonstration, il est intéressant de s’intéresser un peu à ce qu’il y
a autour. Cette démonstration a été établie par Terence Tao en 2015 [taoErdos] alors que le problème
a été posé plus de 80 ans auparavant. Roth a montré en 1964 dans [8] que le résultat est vrai si l’on
considère la borne supérieure sur toutes les progressions arithmétiques (et non seulement les progressions
arithmétiques homogènes comme dans la conjecture d’Erdos). En 2010, le projet PolyMath5 avait pour
projet d’arriver à bout de cette conjecture, mais sans réel succès (malgré l’efficacité des différents projets
PolyMath) même si on retrouve quelques éléments mis au point pendant ce projet dans la démonstration
de Tao. Les seuls réels succès avant la preuve de Tao en toute généralité étaient des preuves par ordinateurs
dans les cas où C = 3 et C = 4 [9] de 2014 seulement !
Essayons de se rendre compte de la difficulté du problème en cherchant des presque contre-exemples
lorsque l’on modifie très peu les hypothèses.
Soit χ : N → C un caractère de Dirichlet modulo q non principal. Par définition, χ est complètement
multiplicatif et a pour moyenne 0 sur tout intervalle de longueur q, ainsi on a :

n
X n
X
∀j, n ∈ N∗ : χ(jd) = |χ(d)| χ(j) ⩽ q.
j=1 j=1

Ceci ne constitue évidemment pas un contre-exemple à la discrépance d’Erdos puisque que χ(n) = 0
quand n et q ne sont pas premiers entre eux.
traditionnels. Il dérive du latin "discrepantia" et peut être synonyme de "dissonance". Au sens figuré, il peut également
signifier "divergence, dissemblance, discordance".

100
Maintenant ce que l’on peut faire c’est d’adapter un peu le contre-exemple précédent pour qu’il rentre
dans les hypothèses du problème de la discrépance d’Erdos. On prend χ3 le caractère de Dirichlet vérifiant
χ3 (n) = +1 ni n ≡ 1[3], 0 si n ≡ 0[3] et −1 si n ≡ −1[3].
Soit H un espace de Hilbert de base orthonormale e0 , e1 , . . . et soit f : N → H définie par f (3a m) =
χ3 (m)ea quand a = 0, 1, 2, . . . et (m, 3) = 1, f prend des valeurs dans SH (0, 1). Prenons n = 1+3+. . .+3k
pour k assez grand. On remarque que :
n
X
f (j) = e0 + . . . + ek .
j=1

Donc :
n
X √ p
f (j) = k+1≫ log(n).
j=1
H

De plus, on remarque par le théorème de Pythagore :

n
X p
f (jd) ≪ log(n).
j=1
H

p
Ainsi en modifiant un peu le contre-exemple précédant on obtient une discrépance d’ordre log(N ).
On n’a pas trouvé de fonctions arithmétiques qui admettent des discrépances beaucoup plus petites.
D’ailleurs, cela peut nous donner une estimation (pas très fondée certes) du nombre de la taille d’une
séquence (f (n)) de discrépance fixée. En effet les preuves par ordinateurs ont permis de montrer qu’il
n’existe pas de chemin de longueur strictement plus grande que 1160 de discrépance d’au moins 3 et qu’il
n’existe pas de chemin de longueur strictement plus grande que 127645 ( !) de discrépance d’au moins 4.
p p
Et on remarque que log(1160) ≃ 2.66 ∈ [2, 3] et log(127645) ≃ 3.43 ∈ [3, 4]. Ainsi on peut imaginer

que la plus longue suite qui admettrait une discrépance C aurait environ exp C 2 termes. Ainsi si on
veut construire une très grande suite de discrépance 14, il faudrait sûrement s’aventurer à construire une

suite possédant exp 142 ≃ 1.1085 ce qui environ autant de particules dans l’univers observable. Bref
cela montre à quel point les chances pour obtenir une preuve exhaustive de la conjecture d’Erdos par
ordinateur est vouée à l’échec avec les techniques les plus sophistiquées trouvées en 2014. C’est ici que la
théorie analytique et probabiliste des nombres vient à la rescousse pour démontrer la conjecture d’Erdos,
on utilisera dans la démonstration de cette conjecture la conjecture d’Elliott en moyenne logarithmique
qui est une conséquence des travaux de Matomäki et Radziwiłł, les résultats qu’ils ont démontrés forment
le point de départ de la démonstration.

VIII.3 Forme équivalente du problème


Le but de cette partie est de montrer que les théorèmes suivants sont des formes équivalentes de la
conjecture d’Erdos (VIII.2).

101
Théorème VIII.4: (Forme probabiliste de la conjecture d’Erdos)

Soit g : N → S1 une fonction stochastique complètement multiplicative. Alors :


 2 
n
 X
supE  g(j)  = +∞.

n∈N j=1

Théorème VIII.5: (Formulation en théorie de la mesure de la conjecture d’Erdos)

N
Soient (Ω, µ) un espace probabilisé, g : Ω → S1 une fonction mesurable telle que pour µ-presque
tout ω ∈ Ω, g(ω) est complètement multiplicative, alors :

2
Z n
X
sup g(ω)(j) dµ(ω) = +∞.
n∈N Ω j=1

Ces deux formulations sont très clairement équivalentes.

Proposition VIII.6

Le théorème VIII.3 implique le théorème VIII.5

Démonstration : Soient (Ω, µ) et g comme dans le théorème VIII.5, on note H l’espace de Hilbert
sont L (Ω, µ). Pour tout n ∈ N, on pose f (n) ∈ H l’application ω 7→ g(ω)(n). Comme g(ω)(n) ∈ S1
2

pour µ-presque tout ω ∈ Ω et que µ est une mesure de probabilité on a pour tout n ∈ N : ∥f ∥H = 1. De
plus, comme g est µ-presque partout complètement multiplicative, pour toute progression arithmétique
homogène de raison d on a :
2 2 2
n
X Z n
X Z n
X
f (jd) = g(ω)(jd) dµ(ω) = g(ω)(j) dµ(ω).
j=1 Ω j=1 Ω j=1
H

Ainsi si on suppose le théorème VIII.3 vrai et en prenant la borne supérieure sur n dans la relation
précédente, on obtient :
2 2
Z n
X n
X
sup g(ω)(j) dµ(ω) = sup f (jd) = +∞.
n∈N Ω j=1 n∈N j=1
H

On obtient alors dans ce cas que le théorème VIII.5 est vrai. □

L’implication réciproque est bien plus difficile, on aura besoin d’un résultat d’analyse fonctionnelle qui
nécessite la définition suivante :

102
Définition VIII.7
Soit X un espace métrique et soient (µn )n∈N une suite de mesures de probabilités sur X. On dit que
la suite (µn )n∈N converge étroitement vers µ lorsque pour tout fonction f continue bornée sur X,
on a : Z Z
f (x) dµn (x) → f (x) dµ(x).
X n→+∞ X

Lemme VIII.8: (Théorème de Prokhorov - Cas compact)

Soit X un espace métrique compact et µn une suite de mesures de probas sur X. Alors il existe une
sous-suite de µn qui converge étroitement vers un autre mesure de proba µ.

Démonstration : On sait que si X est un espace métrique compact alors C 0 (X, C) est séparable. Donc
par le théorème de Banach-Alaoglu la sphère unité de M(X), le dual de C 0 (X, C) est séquentiellement
compact pour la topologie faible-∗. Z
0
Or pour tout n ∈ N, on peut poser l’application continue suivante Tµn f ∈ C (X, C) 7→ f dµn .
X
Cette application est clairement continue de norme d’application égale à 1 (car les µn sont des mesures
de probabilités sur X). Ainsi il existe une extractrice φ telle que Tµφ(n) converge faible-∗ vers T ∈ M(X)
de norme égale à 1. Or par le théorème de représentation de Riesz-Radon, il existe une mesure de
probabilité µ telle que T = Tµ . Cela revient à dire que (µφ(n) ) converge étroitement vers µ. □

Voici un second lemme qui consiste en l’application du théorème de Prokhorov.

Lemme VIII.9

Supposons que pour tout X ⩾ 1, il existe une fonction stochastique complètement multiplicative
gX a qui soit à valeurs dans S1 et telle que :
 2
n
X
∀n ⩽ X : E  gX (j)  ≪C 1.
j=1

Alors il existe une fonction g stochastique complètement multiplicative à valeurs dans S1 et telle
que :  
2
n
X
∀n ∈ N : E  g(j)  ≪C 1.
 
j=1

a. L’univers sur lequel est définie gX peut dépendre de X

Démonstration : Dans cette preuve on notera P l’ensemble des nombres premiers. Soit M l’ensemble
des fonctions complètement multiplicatives à valeurs dans S1 . Comme les éléments de M sont déterminées
P
uniquement par leurs valeurs sur les nombres premiers, on voit facilement que M est isomorphe à S1 .
Comme produit dénombrable de compacts, M est compact pour la topologie produit. Or comme énoncé
précédemment, on peut voir chaque gX comme une application mesurable fX : ΩX → M telle que :
2
Z n
X
∀n ⩽ X : fX (ω)(j) dµX (ω) ≪C 1.
ΩX j=1

103
On note νX la mesure image de µX par fX , c’est une mesure sur M qui vérifie :
Z Z
∀F ∈ C 0 (M, C) : F (g) dνX (g) = E [F (gX )] = F (fx (ω)) dµX (ω).
M ΩX

 2
Xn
On remarque que les fonctions g 7→  g(j) sont continues sur M, en effet on peut décomposer
j=1
ces applications en polynômes en les g 7→ g(p) où p est premier, ces applications étant continues par
définition de la topologie produit. Ainsi en appliquant la dernière estimation à ces fonctions, on obtient
que :
2
Z n
X
∀n ⩽ X : g(j) dνX ≪C 1.
M j=1

Par le lemme de Prokhorov (VIII.8), on peut trouver une sous-suite νXj de νX telle que (νXj )j∈N converge
étroitement vers une mesure ν de probabilité sur M. Donc on conclut que :
2
Z n
X
∀n ∈ N : g(j) dν(g) ≪C 1.
M j=1

On définit ensuite une fonction stochastique complètement multiplicative g : N → S1 en choisissant


(M, ν) comme espace de probabilité ambiant et l’identité g 7→ g comme application mesurable. On
obtient alors dans cet espace probabilisé :
 
2
n
X
∀n ∈ N : E  g(j)  ≪C 1.
 
j=1

On peut enfin démontrer la proposition suivante :

Proposition VIII.10

Le théorème VIII.4 implique le théorème V III.3

Démonstration : Procédons par contraposée, on suppose qu’il existe f : N → H à valeurs dans


SH (0, 1) et C ⩾ 0 tels que
n
X
∀d ∈ N∗ : f (jd) ⩽ C. (VIII.1)
j=1
H

Pour conclure notre preuve, il suffit de construire une fonction stochastique complètement multiplicative
g à valeurs dans S1 telle que :  
2
n
X
∀n ∈ N : E  g(j)  ≪C 1.
 
j=1

D’après le lemme VIII.9, il suffit de construire pour tout X ⩾ 1, une fonction stochastique complètement

104
multiplicative gX qui soit à valeurs dans S1 et telle que :
 2
n
X
∀n ⩽ X : E  gX (j)  ≪C 1.
j=1

Soit X ⩾ 1, notons p1 , . . . , pr les nombres premiers inférieurs ou égaux à X rangés par ordre croissant.
Soit M ⩾ X un entier naturel que l’on suppose suffisamment grand devant C, X. On définit les fonctions
suivantes : 16
 
(Z/M Z)r →H [1, X] → (Z/M Z)r
F : et π: .
(a [M ], . . . , a [M ]) 7→ f (pa1 . . . par ) pa1 . . . par 7→ (a1 [M ], . . . , ar [M ])
1 r 1 r 1 r

En appliquant l’équation VIII.1 pour tout n ⩽ X et pour tout d ∈ N de la forme d = pα αr


1 . . . pr avec
1

pour tout i ∈ {1, . . . , r} : 1 ⩽ αi ⩽ M − X :

n
X
f (jpα αr
1 . . . pr )
1
≪C 1,
j=1
H

β β r
en notant j = p1 j1 . . . pr jr . Or pour tout x = (x1 , . . . , xr ) ∈ (Z/M Z) :

n n
x +βj1 x +βjr
X X
F (x + π(j) = f (p1 1 . . . pr r ) .
j=1 j=1
H H

Il y a donc (M − X)r−1 choix de x (correspondants aux (M − X)r−1 choix de d possibles) qui permettent
d’avoir :
n
X
F (x + π(j)) ≪C 1.
j=1
H

On obtient alors :
2
n
1 X X
F (x + π(j)) ≪C 1.
Mr
x∈(Z/M Z)r j=1
H
r
Or, on peux écrire pour tout x ∈ (Z/M Z) :
   
X x·ξ 1 X ω.ξ
F (x) = F̂ (ξ)e où F̂ (ξ) = F (ω)e − .
M Mr M
ξ∈(Z/M Z)r ω∈(Z/M Z) r

Ainsi par le théorème de Plancherel :


2
n n  2
1 X X X 2 X π(j).ξ
F (x + π(j)) = F̂ (ξ) e .
Mr H M
x∈(Z/M Z)r j=1 ξ∈(Z/M Z)r j=1
H

16. Pour s’assurer que F est bien définie on considère que les ai sont des éléments de {0, . . . , M − 1}. Notons aussi que
π est bien définie pour M ⩾ X

105
De plus, aussi d’après le théorème de Plancherel :
X 2
F̂ (ξ) = 1.
H
ξ∈(Z/M Z)r

2
Donc on peut interpréter F̂ (ξ) comme une densité de probabilité d’une fréquence ξ = (ξ1 , . . . , xir ) ∈
H
r
(Z/M Z) . Ainsi avec cette interprétation :
 
n  
X π(j) · ξ
∀n ⩽ X : E  e  ≪C 1.
j=1
M

 
ξj
Si on définit la fonction stochastique complètement multiplicative gX définie par : gX (pj ) = e M pour
j ∈ {1, . . . , r} et gX (p) pour les autres nombres premiers (il n’interviennent pas ensuite), on obtient :
 
2
n
X
∀n ⩽ X : E  gX (j)  ≪C 1.
 
j=1

D’où le résultat. □

Remarque : Un point intéressant à remarquer est de voir notre preuve ne marche plus si on considère
un caractère de Dirichlet χ. Il est bien de module souvent à valeurs dans le cercle unité mais pour q ⩽ pr ,
la fonction qui à (a1 , . . . , ar ) associe χ (pa1 1 . . . par r ) est presque toujours nulle (comme l’argument est très
souvent un multiple de q). Ainsi :
X
F̂ (ξ) ≪ 1.
ξ∈(Z/M Z)r

On ne peut donc pas définir une fonction gX telle que dans le preuve ci-dessus.

VIII.4 Application de la conjecture d’Elliott logarithmique

Proposition VIII.11

Supposons que g : N → S1 soit une fonction stochastique complètement multiplicative telle qu’il
existe C > 0 :  
2
n
X
∀n ∈ N : E  g(j)  ⩽ C 2 .
 
j=1

Soit ε > 0 et supposons que X est suffisamment grand devant ε, C. Alors avec probabilité 1 −
O(ε), il existe un caractère de Dirichlet (stochastique) de période q = OC,ε (1) et un nombre réel
(stochastique) t = OC,ε (X) tels que :
 
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X

Démonstration : Soient g, C, ε comme introduits ci-dessus. Soit H ⩾ 1 un nombre modérément large


devant ε à choisir plus tard. On suppose que X est suffisamment grand devant X, ε. Par hypothèse et

106
par inégalité triangulaire, on a pour X suffisamment grand :
 
2
n+H
X 1 X
E g(j)  ≪C log(X).
 
√ n j=n+1
X⩽n⩽X

Ainsi par l’inégalité de Markov, avec probabilité 1 − O(ε) :

H 2
X X g(n + h1 )g(n + h2 ) X 1 X
= g(n + h) ≪C,ε log(X).
√ n √ n
h1 ,h2 ∈[1,H] X⩽n⩽X X⩽n⩽X h=1

Or dans la somme sur h1 , h2 il est faicle de voir que le terme diagonal contribue pour ≫ H log(X).
Ainsi pour H suffisamment grand devant C, ε et d’après le principe des tiroirs, on peut trouver deux
entiers (stochastiques) et distincts h1 , h2 ∈ [1, X] tels que :

X g(n + h1 )g(n + h2 )
≫C,ε,H log(X).
√ n
X⩽n⩽X

Donc par réciproque de la conjecture d’Elliott en moyenne logarithmique VII.3, il existe un caractère de
Dirichlet stochastique de période q = OC,ε (1) et un nombre réel stochastique t = OC,ε (X) tels que :
 
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X

Détaillons juste comment on peut s’arranger pour que (χ, t) soient pris mesurables (et ainsi stochas-
tiques). Par le théorème VII.3, on sait qu’il existe plusieurs couples (χ, t) tels que :

X 1 − g(p)χ(p)p−it
< a.
p
p⩽x

Et s’il existe t0 ∈ R tel que l’inégalité précédente est lieu pour t = t0 alors par densité de Q dans
′ ′
R, on peut trouver t0 ∈ Q tel que cette inégalité est aussi lieu pour t = t0 . Ainsi on peut s’arranger
pour considérer un ensemble dénombrable de (χ, t) qui vérifie l’inégalité. Comme
 il est dénombrable,
 on
X 1 − g(p)χ(p)p−it
peut lui construire un bon ordre sur cet ensemble. Or l’application g 7→  
p
p⩽x
(χ,t)
est continue donc mesurable et l’application qui à une suite (xn ) de réels associe l’unique n ∈ N tel que
xn ⩽ a et pour tout m ⩽ n : xn > a est aussi mesurable 17 . Ainsi on peut trouver (χ, t) qui vérifie :
 
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X

17. On rappelle ici qu’on considère la tribu P(N) sur N et la tribu produit dans les espaces produits.

107
VIII.5 Preuve de la conjecture d’Erdos
Dans cette partie, on va prouver le théorème VIII.4 ce qui démontrera la conjecture d’Erdos. Pour
cela, on va supposer par l’absurde qu’il est faux. Il existe donc une constante C > 0 et une fonction g
stochastique complètement multiplicative à valeurs dans S1 telle que :
 
2
n
X
∀n ∈ N : E  g(j)  ⩽ C 2 .
 
j=1

On va maintenant considérer que toutes les constantes peuvent dépendre de C, ainsi on pourra écrire :
 
2
n
X
∀n ∈ N : E  g(j)  ≪ 1.
 
j=1

On introduit désormais les grandeurs suivantes ε, H, δ, k, X vérifiant :

1 1
C≪ ≪ H ≪ , k ≪ X.
ε δ

D’après la proposition VIII.11, avec probabilité 1−O(ε), il existe un caractère de Dirichlet (stochastique)
de période q = OC,ε (1) et un nombre réel (stochastique) t = OC,ε (X) tels que :
 
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X

Quitte à réduire χ, on peut supposer qu’il est primitif (car si χ′ est un caractère primitif qui induit χ
alorsχ(p) et χ′ (p) ne diffèrent qu’en les premiers p qui divisent le module de χ, dont il y en a un nombre
fini).

Lemme VIII.12

Avec probabilité 1 − O(ε), t = Oε X δ .

Démonstration : Preuve admise, elle se base sur des résultats d’analyse complexe qu’on a pas eu le
temps d’aborder pendant le stage. On pourra en trouver une démonstration dans (Lemme 4.1, [7]). □

On se conditionne maintenant sur ces deux évènements de probabilité 1 − O(ε).


˜ it h(n) où on définit :
On écrit pour tout n ∈ N : g(n) = χ(n)n
— pour tout p premier ne divisant pas q : χ̃(p) = χ(p) et h(p) = g(p)χ(p)pit ,
— pour tout p premier divisant q : χ̃(p) = g(p)p−it et h(p) = 1.
Avec ces notations on peut écrire :

X 1 − Re (h(p))
≪ε 1. (VIII.2)
p
p⩽X

108
Lemme VIII.13

Conditionné à l’évènement de probabilité 1 − O(ε), on a :

′ 2
H
1 X X 1 X
1 χ̃(n + m)h(n + m) ≪ε log(X).
H ′ n1+ log(X) m=1
H<H ⩽2H n∈N

Démonstration : Par hypothèse sur g et par inégalité triangulaire :

2
 

H
1 X X
∀n ∈ N : E  g(n + m)  ≪ 1.

H
H<H ′ ⩽2H m=1


Soit n ⩾ X 2δ , d’après le lemme VIII.12 on sait que t = Oε X δ donc par un simple développement
limité :

∀m ⩽ H : (n + m)it = nit + Oε,H,δ X −δ .


Ainsi on a :
2
 

H
1 X X
∀n ⩾ X 2δ : E  χ̃(n + m)nit h(n + m)  ≪ 1.

H
H<H ′ ⩽2H m=1

Si n < X 2δ alors on majore cette même quantité par H 2 trivialement. Ainsi pour δ suffisamment petit
1
on obtient en moyennisant par la densité 1+ 1 :
n log(X)
2
 

H
1 X X 1 X
E χ̃(n + m)h(n + m)  ≪ log(X).

1
H 1+
n log(X) m=1
H<H ′ ⩽2H n∈N

On obtient le résultat demandé par l’inégalité de Markov. □

Définition VIII.14
Dans cette partie et uniquement dans cette partie, on dira qu’une classe a modulo qk est mauvaise
si pour tout m ∈ {1, . . . , 2H}, il existe un facteur premier p de q tel que a + m soit divisible par pk .
Sinon, on dira que cette classe est bonne.

Lemme VIII.15

Avec les définitions précédentes, on a :

′ 2
H
1 X 1 X X
χ̃(a + m) ≪ε 1.
qk H ′
a bonne H<H ⩽2H m=1

Démonstration : On reprend le résultat du lemme précédent en se restreignant à l’évènement de

109
probabilité 1 − O(ε) et en ne sommant que sur les bonnes classes :

′ 2
H
1 X X 1 X
1 χ̃(n + m)h(n + m) ≪ε log(X).
H n1+ log(X)
H<H ′ ⩽2H a bonne m=1
n≡a[qk ]

Donc d’après l’inégalité de Cauchy-Scwharz :

′ 2
H
1 X X X 1 X log(X)2
1 χ̃(n + m)h(n + m) ≪ε .
H n1+ log(X) qk
H<H ′ ⩽2H a bonne n≡a[qk ] m=1

Or on remarque que si n appartient à une bonne classe a alors χ̃(n + m) = χ̃(a + m) (c’est en fait pour
cela qu’on les a introduites). Ainsi on obtient facilement :

′ 2
H
1 X X X X 1 log(X)2
χ̃(a + m) 1 h(n) ≪ε .
H n 1+ log(X) qk
H<H ′ ⩽2H a bonne m=1 n≡a+m[qk ]

X 1
On va maintenant estimer h(n). On remarque tout d’abord par le second théorème
1
1+ log(X)
n
n≡a+m[qk ]
de Mertens II.19 et par hypothèse sur h VIII.2 que :
 
1
log(X) ≪ε Dh 1 + ≪ε log(X). (VIII.3)
log(X)

X χ(n)h(n)
Maintenant on va regarder cette quantité quand χ est un caractère de Dirichlet : 1 .
n∈N n1+ log(X)
— Supposons que χ1 est un caractère de Dirichlet non-principal de période divisant qk alors par
analycité en 1 de la série de Dirichlet associée à χ1 :
 
1
Dχ1 1 + ≪q,k 1.
log(X)

De plus en développant en produit eulérien on a l’égalité suivante :


 !−1 !
X χ1 (n)h(n)  Y
1 h(p)χ1 (p) χ1 (p)
1 = Dχ1 1 +  1− 1 1− 1
.
n1+ log(X) log(X) p p1+ log(X) p1+ log(X)
n∈N

1
On en déduit l’estimation suivante (en ne gardant que les termes dans le produit sur p en 1
1+ log(X)
):
p
!
X χ1 (n)h(n) X |1 − h(p)|
1 ≪q,k exp 1 .
n∈N n1+ log(X) p p1+ log(X)

110
|1 − h(p)|
Ainsi comme la série de terme général 1 est convergente, on a :
p1+ log(X)
!    
X |1 − h(p)| X |1 − h(p)| X |1 − h(p)|
exp 1 = exp   1 + O(1) ≪ exp  .
p p1+ log(X) p1+ log(X) p
p⩽X p⩽X

On en déduit par l’inégalité de Cauchy-Scwharz puis le deuxième théorème de Mertens (II.19) et


enfin l’hypothèse VIII.2 sur h :
 
X χ1 (n)h(n) X O (1 − Re (h(p))) 21
1 ≪q,k exp  ,
n1+ log(X) p
n∈N p⩽X
   12 
X (1 − Re(h(p))
≪q,k exp O log log(X) ,
  
p
p⩽X
 p 
≪q,k exp Oε log log(X) .

— Maintenant supposons que χ0 soit un caractère principal de période r|qk . On peut alors écrire en
développant en produit eulérien et en se rappelant que h(p) = 1 pour tout p divisant r (donc qk ) :
 Y !
X χ0 (n)h(n) 1 1
1 = Dh 1 + 1 − 1+ 1
n1+ log(X) log(X) p log(X)
n∈N p|r
    Y  
1 1 1
= Dh 1 + 1 + Oε 1−
log(X) log(X) p
p|r
     
φ(r) 1 φ(r) 1 1
= Dh 1 + + Oε Dh 1 +
r log(X) r log(X) log(X)
 
φ(r) 1
= Dh 1 + + Oε (1)
r log(X)

où la dernière estimation à été obtenue grâce à l’estimation VIII.3.


De ces deux points par orthogonalité des caractères, on en déduit pour toute classe de résidus primitives
b[r] (i.e (b, r) = 1), on a :
 
X h(n) 1 1   p 
1 = Dh 1 + + Oq,k exp Oε ( log log(X)) .
n1+ log(X) r log(X)
n≡b[r]

′ r ′ b
Si b[r] est une classe de résidus non-primitive alors en notant r = et b = :
(b, r) (b, r)
 
X h(n) 1 1   p 
1 = Dh 1 + + Oq,k exp Oε ( log log(X)) .
n1+ log(X) r log(X)
n≡b′ [r ′ ]

Donc en utilisant l’estimation VIII.3, on obtient quelque soit la classe de résidus b[r] :
 
X h(n) 1 1   p 
1 = Dh 1 + + Oq,k exp Oε ( log log(X)) .
n1+ log(X) r log(X)
n≡b[r]

111
Ainsi en réinsérant cette expression dans celle de départ :

′ 2
H
log(X)2
 
1 X X X χ̃(a + m) 1   p 
Dh 1 + + O q,k exp O ε ( log log(X)) ≪ε .
H qk log(X) qk
H<H ′ ⩽2H a bonne m=1

  p  log(X)2
Or la contribution de Oq,k exp Oε ( log log(X)) est ≪ε pour X suffisamment grand. On
qk
en déduit le fait annoncé en utilisant VIII.3. □

Lemme VIII.16


Pour tous d1 ̸= d2 diviseurs de qk−1 et m1 , m2 ∈ {1, . . . , H }, on a :

k
q    
X a + m1 a + m2
χ χ = 0.
a=1
d1 d2
d1 | a+m1
d2 | a+m2

Démonstration : Nous n’allons pas faire en détails cette preuve. D’après les résultats du paragraphe
??, on peut
 direque le terme que l’on cherche
 à rendre nul est une combinaison linéaire de termes de la
ξa ξa
forme : e pour (ξ, d1 q) = 1 et e pour (ξ, d2 q) = 1. Comme d1 ̸= d2 toutes les fréquences
d1 q d2 q
qui vont apparaître seront non nulles et ainsi leur somme sera elle nulle. □

Fin de la démonstration du théorème VIII.4 On va maintenant utiliser les deux lemmes précédents
pour démontrer la démonstration du théorème VIII.4. On se rappelle que l’on procède par l’absurde.
Si on est dans l’évènement q = 1 alors χ est constant égal à 1 et donc d’après le lemme VIII.15 on a
le fait suivant : 2
1 X  ′
H≪ H ≪ε 1,
H ′
H<H ⩽2H

ce qui est absurde pour H suffisamment grand devant ε. On se restreint maintenant à l’évènement q > 1,
ainsi χ sera non-principal. Encore d’après le lemme VIII.15 :

1 X X X
χ̃(a + m1 )χ̃(a + m2 ) ≪ε qk .
H ′ ′
H<H ⩽2H m1 ,m2 =1,...,H a bonne

On écrit d1 = (a + m1 , qk ) et d2 = (a + m2 , qk ) ainsi d1 , d2 divisent qk−1 . Ainsi :


   
X X χ̃(d1 )χ̃(d2 ) X X a + m1 a + m2
χ χ ≪ε qk .
H d1 d2
d1 ,d2 |qk−1 H<H ′ ⩽2H m1 ,m2 =1,...,H ′ a bonne
d1 =(a+m1 ,qk )
d2 =(a+m2 ,qk )

 k
X q
Or on remarque que le nombre de mauvaises classes a est au plus H p|q ≪ H2−k qk . Ainsi on
p
peut écrire :
   
X X χ̃(d1 )χ̃(d2 ) X X a + m1 a + m2
χ χ ≪ε q k .
H a d1 d2
d1 ,d2 |qk−1 H<H ′ ⩽2H m1 ,m2 =1,...,H ′ d |a+m
1 1
d2 |a+m2

112
D’après le lemme VIII.16 on obtient :
   
1 X X X X a + m1 a + m2
χ χ ≪ε qk .
H k−1 a d d
d|q H<H ′ ⩽2H m1 ,m2 =1,...,H ′ d|a+m
1
d|a+m2

On peut réécrire ceci sous cette forme :


2
 
1 X X X X a+m
χ ≪ε qk .
H k−1 d
d|q H<H ′ ⩽2H a m∈[1,H ]

d|a+m

On voit ici que tous les termes de la somme sur d sont positifs ainsi on peut se restreindre à ceux qui

s’écrivent qi avec qi < H :
2
 
1 X X X X a+m
χ ≪ε q k .
H √ ′ a ′
qi
i:qi < H H<H ⩽2H m∈[1,H ]
qi |a+m

Observons que par inégalité triangulaire on a :


2
 
X 1 X X X a+m
χ ≪ε q k .
√ H ′ ′
qi
i:qi < H H ′ ∈[H, 32 H ] a H <m⩽H +qi
qi |a+m

 
′ 3H
Donc il existe H ∈ H, tel que :
2

2
 
X X X a+m
χ ≪ε q k .

a ′ ′
qi
i:qi < H H <m⩽H +qi
qi |a+m

Et on peut le réécrire sous la forme :


2
 
X X X a+m
χ ≪ε qk .
√ ′ ′
qi
i:qi < H a⩽ qk H <m⩽H +qi
2
qi |a+m

Or on observe que la condition 0 < m ⩽ qi  


i a+m a
q |a + m n’est vérifiée que par un seul entier m et il vérifie : = + 1. Donc par changement
qi qi
de variable (et en retirant quelques termes parasites positifs) :
X X 2
|χ(b)| ≪ε qk .

i:qi < H b∈[1,q k−i
4

113
2
Or b 7→ |χ(b)| ≫ε qk−i est périodique de période q et de moyenne ≫ε 1. On en déduit :
X X 2
X
|χ(b)| ≪ε 1.
√ √
i:qi < H b∈[1,q k−i
4 ] i:qi < H

Des deux dernières estimations on en déduit que :


X
1 ≪ε 1.

i:qi < H

Et ceci est absurde quand H est suffisamment grand. On en déduit le théorème VIII.3 et donc la conjecture
d’Erdos est démontrée.

114
Références
[1] Gerald Hildebrand Adolf ; Tenenbaum. “Integers without large prime factors”. In : Journal de
théorie des nombres de Bordeaux, Tome 5 (1993) no. 2, pp. (1993), p. 411-484.
[2] Kevin Ford. Sieve methods lecture notes. Spring 2023.
[3] Gérald Tenenbaum. Introduction à la théorie analytique et probabiliste des nombres : Cours et
exercices. Dunod, 2022.
[4] Terence Tao. A cheap version of Halasz’s inequality. [Link]
11/23/a-cheap-version-of-halaszs-inequality/. 2015.
[5] S. Chowla. The Riemann Hypothesis and Hilbert’s Tenth Problem. Mathematics and its applica-
tions. Gordon et Breach, 1966. isbn : 9780677001401.
[6] Hugh L Montgomery et Robert C Vaughan. Multiplicative number theory I : Classical theory.
97. Cambridge university press, 2007.
[7] Terence Tao. “The Logarithmically averaged Chowla and Elliott conjectures for two-point corre-
lations”. In : Forum of Mathematics, Pi 4 (2016), e8. doi : 10.1017/fmp.2016.6.
[8] K. Roth. “Remark concerning integer sequences”. eng. In : Acta Arithmetica 9.3 (1964), p. 257-260.
url : [Link]
[9] Boris Konev et Alexei Lisitsa. “Computer-aided proof of ErdHos discrepancy properties”. In :
Artificial Intelligence 224 (2015), p. 103-118.
[10] Terence Tao. Elementary multiplicative number theory. https : / / terrytao . wordpress . com /
2014/11/23/254a-notes-1-elementary-multiplicative-number-theory/. 2022.
[11] Terence Tao. Mean values of nonpretentious multiplicative functions. [Link]
com / 2019 / 12 / 17 / 254a - notes - 10 - mean - values - of - nonpretentious - multiplicative -
functions/. 2019.
[12] Terence Tao. Second moment and entropy methods. [Link]
11/12/254a-notes-9-second-moment-and-entropy-methods/. 2019.
[13] Olivier Bordellès. Arithmetic tales. Springer, 2012.
[14] Jérémy Bettinger. Le théorème des nombres premiers.
[15] Kaisa Matomäki et Maksym Radziwiłł. “Multiplicative functions in short intervals”. In : Annals
of Mathematics (2016), p. 1015-1056.
[16] Adrian Dudek. “An Elementary Proof of an Asymptotic Formula of Ramanujan”. In : arXiv
preprint arXiv :1401.1514 (2014).
[17] Kaisa Matomäki, Maksym Radziwiłł, Terence Tao et al. “An averaged form of Chowla’s conjec-
ture”. In : Algebra Number Theory 9.9 (2015), p. 2167-2196.
[18] Henryk Iwaniec et Emmanuel Kowalski. Analytic number theory. T. 53. American Mathematical
Soc., 2004.
[19] Kannan Soundararajan. “The Liouville function in short intervals [after Matomaki and Radzi-
will]”. In : arXiv preprint arXiv :1606.08021 (2016).
[20] G. Peyré. L’algèbre discrète de la transformée de Fourier : niveau M1. Mathématiques à l’uni-
versité : cours et exercices corrigés. Ellipses, 2004. isbn : 9782729818678. url : [Link]
[Link]/books?id=WFp8AAAACAAJ.

115
[21] Terence Tao. The Erdos discrepancy problem. 2017. arXiv : 1509.05363 [[Link]].

116

Vous aimerez peut-être aussi