Rapport Stage M1
Rapport Stage M1
Université Rennes 1
Département de Mathématiques
Rapport de Stage
Élève : Encadrant :
Titouan Donnart Pierre-Yves Bienvenu
1
Introduction :
Une heuristique en théorie analytique des nombres stipule que les ensembles de nombres entiers po-
sitifs ne peuvent pas être simultanément structurés de manière additive et multiplicative. La vérification
pratique de cette heuristique est à l’origine d’un grand nombre de problèmes difficiles. Les conjectures
de ce type sont également au moins équivalentes sur le plan conceptuel à l’attente selon laquelle une
fonction multiplicative quelconque se comporte de manière aléatoire sur des ensembles additifs.
Dans ce rapport, nous examinons l’un de ces problèmes qui est resté ouvert jusqu’en 2015 : le problème
de la discrépance d’Erdos. Il s’agit de voir si oui ou non la borne supérieure prise (en module) par les
sommes des éléments d’une suite (f (n))n∈N à valeurs dans {−1, +1} le long de progressions arithmétiques
Après avoir rappelé divers résultats de base sur la théorie analytique des nombres, nous nous intéres-
serons au point de départ de la preuve du problème de la discrépance d’Erdos : les résultats obtenus par
Matomäki et Radziwiłł en 2014 sur les moyennes de fonctions multiplicatives sur de petits intervalles.
Ces résultats ont bouleversé la recherche en théorie analytique des nombres, et la direction de notre
rapport emprunte seulement l’une des nombreuses conséquences importantes de ces résultats.
Cela nous amènera à discuter de la conjecture de Chowla et d’Elliott, ainsi que des versions dites "en
moyenne" de ces conjectures, qui seront démontrées par les résultats obtenus par Matomäki et Radziwiłł.
m’avoir fait découvrir ce domaine des mathématiques dont je n’avais presque aucune connaissance avant
ce stage. Je tiens aussi à le remercier pour toute l’aide et toutes les connaissances qu’il m’a apportées
pendant ces deux mois. Je tiens également à remercier l’ensemble du personnel du Trinity College de
m’avoir permis de réaliser ce stage dans un bon cadre. Enfin, je remercie l’ENS de Rennes et le centre
Henri Lebesgue de m’avoir octroyé une bourse pour que je puisse réaliser ce stage à Dublin malgré le
Je tiens enfin à rappeler que cette version constitue une version complète de mes travaux réalisés
pendant mon stage et n’en constitue pas en soi le rapport "officiel". En particulier, il y a un plus grand
2
3
Table des matières
I Rappels nécessaires 7
I.1 Formule de sommation par parties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.2 Théorème d’approximation de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
I.3 Caractères de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
I.4 Entropie de Shannon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4
i Une introduction à la méthode du cercle . . . . . . . . . . . . . . . . . . . . . . . . . 68
ii Retour à notre problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
VI.3.3 Mise en place de la méthode du cercle . . . . . . . . . . . . . . . . . . . . . . . . . 71
i Preuve dans le cadre des arcs mineurs . . . . . . . . . . . . . . . . . . . . . . . . . . 71
ii Preuve dans le cadre des arcs majeurs . . . . . . . . . . . . . . . . . . . . . . . . . . 73
iii Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
VI.3.4 Une conjecture d’Elliott en moyenne tronquée . . . . . . . . . . . . . . . . . . . . . 76
VI.4 Preuve de la conjecture d’Elliott en moyenne . . . . . . . . . . . . . . . . . . . . . . . . . 79
5
Notations :
— On notera φ l’indicatrice d’Euler définie par φ(n) = |{1 ≤ k ≤ n; k est premier avec n}|.
— On note µ la fonction de Mobiüs définie par µ(1) = 1,µ(n) = 0 si n possède un facteur carré et
µ(n) = (−1)k si n est le produit de k nombres premiers distincts. Elle est multiplicative.
— On note λ la fonction de Liouville définie par λ(n) = (−1)Ω(n) où Ω(n) désigne le nombre de facteurs
premiers comptés avec multiplicité de l’entier n. C’est une fonction complètement multiplicative.
— On note π la fonction qui à x ∈ R compte le nombre de nombres premiers inférieurs ou égaux à x.
— On adoptera les notations asymptotiques dans deux contextes, un où il n’y a pas de paramètre
asymptotique présent et un où il y en a. Dans le contexte sans paramètre asymptotique, on utilisera
X = O(Y ), X ≪ Y ou Y ≫ X pour noter une estimation de la forme |X| ⩽ CY où C est une
constante fixe.
— Dans certains cas où la constante C dépend de paramètres additionnels comme k on le notera en
indice comme ceci X = Ok (Y ), X ≪k Y ou Y ≫k X.
— Quand il existe un paramètre asymptotique (par exemple x) tous les objets mathématiques pourront
dépendre de ce paramètre (à part contre-indications). On utilisera X = O(Y ), X ≪ Y ou Y ≫ X
pour noter une estimation de la forme |X| ⩽ CY où C est une constante qui peut dépendre d’autre
paramètres tant que ceux-ci sont fixés. On notera aussi X = o(Y ) pour noter une estimation de la
forme |X| ⩽ cY où c est une quantité qui tend vers 0 quand le paramètre asymptotique tend vers
+∞.
Les autres notations apparaissant dans ce rapport seront précisées au fur et à mesure du document.
6
I Rappels nécessaires
De plus, si x ⩾ 2, alors :
X X Z x X
f (p)g(p) = f (p)g(x) − g ′ (t) f (p) dt.
p⩽x p⩽x 2 p⩽t
Donc on obtient :
Z
f (n)1[n,x] (t) dt
X X X
f (n)g(n) = f (n)g(x) − g ′ (t)
a⩽n⩽x a⩽n⩽x R a⩽n⩽x
Z
g ′ (t)1[a,x] (t)
X X
= f (n)g(x) − f (n) dt
a⩽n⩽x R a⩽n⩽t
X Z x X
= f (n)g(x) − g ′ (t) f (n) dt
a⩽n⩽x a a⩽n⩽t
Pour obtenir le deuxième point on applique le premier point à la fonction f˜ qui vaut f (p) si p est premier
et 0 sinon. □
p
Soient θ ∈ R et Q un entier supérieur ou égal à 2. Alors il existe un rationnel tel que :
q
p 1
0<q<Q et θ− ⩽ .
q qQ
7
Démonstration : La preuve est assez rapide et repose essentiellement sur "le principe des tiroirs".
Considérons les Q+1 nombres 0, 1{θ}, {2θ},
. . . {(Q−1)θ}. Tous ces nombres appartiennent à [0, 1]. Donc
k k+1
au moins un des Q intervalles , pour k ∈ {0, . . . , Q − 1} contient deux de ces nombres. Ainsi
Q Q
il existe des entiers a1 , a2 , b1 , b2 tels que :
1
0 ⩽ a1 < a2 ⩽ Q et |(a1 θ − b1 ) − (a2 θ − b2 )| ⩽ .
Q
Proposition I.5
Un premier résultat fondamental pour les caractères de Dirichlet est l’application de la formule d’inversion
de Fourier pour la transformation de Fourier discrète.
8
Théorème I.6: Formule d’inversion de Fourier
1
∀n ∈ N : 1n≡a[q] =
X
χ(a)χ(n),
φ(q)
χ mod q
Définition I.7
Soient X, Y deux variables aléatoires discrètes.
— On appelle entropie de X la quantité H(X) définie par :
X 1
H(X) = P(X = x) log .
x atome
P(X = x)
où :
X 1
H(X|Y = y) = P(X = x|Y = y) log .
x atome
P(X = x|Y = y)
En fait on appelle dans ce texte l’entropie ce qui est couramment appelé dans la littérature entropie de
Shannon. Cette grandeur est surtout utilisée en théorie de l’information Compléter description. On
notera aussi H(X, Y ) comme l’entropie de Shannon du couple (X, Y ) de variables aléatoires discrètes.
Proposition I.8
Démonstration :
— Le premier point vient d’un calcul direct.
— On développe l’expression de H(X|Y ) :
X 1
H(X|Y ) = P(Y = y)P(X = x|Y = y) log .
x,y atomes
P(X = x|Y = y)
9
1
Donc d’après l’inégalité de Jensen appliquée à la fonction concave x ∈ [0, 1] 7→ xlog :
x
! !
X X 1
H(X|Y ) ⩽ P(Y = y)P(X = x|Y = y) log P .
x atome y atome y atome P(X = x|Y = y)
Définition I.9
Soient X, Y deux variables aléatoires discrètes, on définit leur information mutuelle par :
Par la proposition précédente, on remarque que : I(X, Y ) = I(Y, X) ⩾ 0. On peut voir I(X, Y ) comme
la mesure de la non-indépendance de X et Y : plus elle est petite plus les variables aléatoires sont
d’avantage indépendantes (en fait X et Y sont indépendantes si et seulement si I(X, Y ) = 0) et plus elle
est grande pour les variables aléatoires X et Y ne sont pas indépendantes. On termine cette introduction
à l’entropie de Shannon par cette dernière proposition qui nous sera très utile en pratique.
Proposition I.10
Soit X une variable aléatoire discrète prenant au maximum N valeurs. Alors H(X) ⩽ log(N ).
Démonstration : Notons A l’ensemble des valeurs prises X. On a |A| ⩽ N par hypothèse. D’après
par
1 1
l’inégalité de Jensen appliqué à encore x ∈ [0, 1] 7→ xlog (en prenant les poids tous égaux à ):
x |A|
!
X 1 X 1 |A|
H(X) = P(X = x) log ⩽ |A| P(X = x) log P = log(|A|).
P(X = x) |A| y∈A P(X = y)
x∈A x∈A
10
II Introduction de quelques éléments de la théorie analytique des
nombres
Définition II.1
Une fonction f : N → C est appelée une fonction arithmétique.
Définition II.2
Une fonction arithmétique f est dite multiplicative si f est non nulle et si :
Si la relation précédente tient pour tous les couples (m, n) ∈ N2 , on dit que f est complètement
multiplicative.
∗
∀n ∈ N : φ(n) = (Z/nZ) .
Cette fonction arithmétique n’est pas multiplicative. Par exemple Λ(2) = ln(2), Λ(9) = ln(3) mais
Λ(18) = 0.
— Pour tout t ∈ R∗ , on peut définir la fonction complètement multiplicative : n 7→ nit . Cette fonction
jouera un grand rôle plus tard dans notre étude.
Les fonctions multiplicatives sont très utiles parce qu’il suffit de les connaître sur des puissances de
nombres premiers pour les connaître partout.
11
Proposition II.3
Maintenant, on va définir une opération sur l’ensemble des fonctions arithmétiques qui va bien marcher
avec la notion de multiplicativité.
Définition II.4
Soient f, g deux fonctions arithmétiques. On définit la fonction (f ∗ g), appelée, convolution de
Dirichlet de f et g, par :
X n
∀n ∈ N : (f ∗ g)(n) = f (d)g .
d
d|n
On obtient alors une batterie de résultats pas très difficiles à obtenir (moyennant calculs et théorème
chinois) :
Proposition II.5
Définition II.6
Soit f une fonction arithmétique. S’il existe une autre fonction arithmétique g telle que f ∗ g = δ,
alors on dit que f est inversible et on appelle g son inverse de Dirichlet. Cet inverse est unique par
la proposition précédente.
Proposition II.7
Démonstration :
— Supposons que f est inversible. Alors, il existe g : N → C telle que f ∗ g = δ. En particulier
f (1)g(1) = δ(1) = 1 donc f (1) ̸= 0.
12
— Réciproquement, supposons que f (1) ̸= 0. On va construire l’inverse de Dirichlet par récurrence.
1
Tout d’abord, on pose g(1) = f (1) . Ainsi (f ∗ g)(1) = 1. Puis, fixons n ⩾ 2 et supposons qu’on ait
définit les valeurs de g(1), . . . , g(n − 1) pour que (f ∗ g)(m) = δ(m) pour tout m ∈ {1, . . . , n − 1}.
On pose :
−1 X n
g(n) = f (d)g .
f (1) d
d|m,d>1
Ainsi (f ∗ g)(n) = δ(n) = 0. Donc, f est inversible d’inverse g construit par récurrence.
□
Proposition II.8
Toute fonction multiplicative est inversible et son inverse de Dirichlet est aussi une fonction multi-
plicative.
Démonstration : Le sens direct est évident car pour toute fonction multiplicative f , f (1) = 1 ̸= 0
et la proposition précédente s’applique. Montrons le sens réciproque. Pour cela, il suffit maintenant, par
unicité de l’inverse, d’exhiber une fonction multiplicative g telle que f ∗ g = δ. Afin de construire g,
posons d’abord g(1) = 1 pour que (f ∗ g)(1) = 1 = δ(1). Puis on fixe un nombre premier p et on va
construire g (pν ) pour tout ν ⩾ 1 par récurrence comme dans la preuve précédente.
Quand ν = 1, on pose g(p) = −f (p), ainsi (f ∗ g)(p) = f (p) + g(p) = 0 = δ(p). Puis fixons ν ⩾ 2 et
supposons que l’on a définit g pk tels que (f ∗ g) pk = 0 pour tout k ∈ {1, . . . , ν − 1}. Posons alors :
ν
X
g (pν ) = − f pk g pν−k .
k=1
Ainsi (f ∗g)(pν ) = 0. Finalement, on prolonge g à tous les nombres naturels par : g(n) = g (pν ). Par
Q
pν ||n
la proposition II.3 ceci définit bien une fonction multiplicative. De plus, comme f et g sont multiplicative,
d’après II.5 f ∗ g est aussi multiplicative et alors par II.3, on peut écrire :
Y
∀n ⩾ 2 : (f ∗ g)(n) = (f ∗ g) (pν ) .
pν ||n
Or le membre de droite est nul par construction donc pour tout n ⩾ 2 : (f ∗ g)(n) = δ(n) = 0. Donc
f ∗ g = δ. D’où le résultat attendu. □
13
Quand on considérera la série de Dirichlet d’une fonction arithmétique classique on la notera plutôt avec
un D avant, par exemple pour la série de Dirichlet de la fonction de Möbius sera notée : Dµ.
Proposition II.10
Soit f une fonction arithmétique dont a série de Dirichlet converge absolument pour un certain
nombre complexe s0 . Alors pour tout nombre réel r > σ0 , la série F (r) converge absolument.
Proposition II.12
Soit f une fonction arithmétique dont la série de Dirichlet converge simplement pour un certain
nombre complexe s0 . Alors pour tout nombre complexe s tel que σ > σ0 , la série F (s) converge
simplement.
Démonstration : On ne peut pas faire la même preuve que précédemment car la série n’est pas à
termes de signe constant à partir d’un certain rang. Il faut donc y aller de manière plus fine. Pour cela
on fixe s ∈ C tel que σ > σ0 et on va montrer que F (s) converge simplement en montrant que la suite
de ses sommes partielles forme une suite de Cauchy. On remarque d’abord que :
Z N
1 1 du
− = (s − s0 ) .
ns−s0 N s−s0 n us−s0 +1
|s − s0 |
Donc en notant C := 1 + > 0, on obtient :
σ − σ0
X an X an
⩽ C max .
ns M ⩽a⩽b⩽N ns0
M <n⩽N a<n⩽b
On en déduit que comme les sommes partielles de F (s0 ) sont de Cauchy, alors les sommes partielles de
F (s) sont aussi de Cauchy, donc F (s) converge. □
14
Définition II.13
On appelle abscisse de convergence simple d’une fonction arithmétique f , le plus petit réel σc
tel que la série de Dirichlet F (σc ) converge (simplement).
Il y a un lien entre ces deux abscisses de convergence par la proposition (optimale) suivante :
Proposition II.14
On a :
σc ⩽ σa ⩽ σc + 1.
Démonstration : L’inégalité σc ⩽ σa est évidente car si une série à valeurs complexes converge
absolument alors elle est converge. Pour montrer l’autre inégalité, il suffit de montrer que si F (s0 )
converge pour un certain s0 alors il converge absolument pour tout s ∈ C de partie réelle σ > σ0 + 1.
Si F (s) converge en s0 alors f (n)n−s0 n → +∞ donc il existe n0 ∈ N tel que pour tout n ⩾ n0 :
→
|f (n)n−s0 | ⩽ 1. Donc pour tout s ∈ C : |f (n)n−s | ⩽ nσ0 −σ . On en déduit que si σ > σ0 + 1 : F (s)
converge absolument. □
Proposition II.15
Démonstration : Supposons le contraire et soit k l’entier le plus petit tel que f (k) ̸= 0. Soit G(s) =
P+∞
k s n=k f (n)n−s , défini pour σ > σC . Par hypothèse, pour tout σ > σC : G(s) = 0. Or limσ→+∞ G(σ) =
f (k) = 0, ce qui est absurde. D’où le résultat. □
Proposition II.16
Soient f et g deux fonctions arithmétiques. Supposons qu’il existe s tel que F (s) et G(s) convergent
absolument. Alors en notant h = f ∗ g, H(s) converge absolument et H(s) = F (s)G(s).
Une astuce d’écriture qui nous sera bien utile, c’est qu’on peut décomposer la série de Dirichlet d’une
fonction multiplicative en produit eulérien :
15
Proposition II.17
Soit f une fonction multiplicative. On a pour tout s ∈ C où la série de Dirichlet converge absolu-
ment : !
+∞
Y X f pk
F (s) = .
p
pks
k=0
Démonstration : On note p1 < . . . , < pk < . . . la suite des nombres premiers écrit en ordre croissant.
Par le théorème de sommation par paquets et le théorème fondamental de l’arithmétique, les calculs
suivants sont bien justifiés :
X f (p1ν1 ) . . . f (pkνk )
F (s) = lim lim
k→+∞ N →+∞ ν ν pν11 s . . . pνkk s
n=p11 ...pkk ,0⩽ν1 ,...,νk ⩽N
+∞
! +∞
!
X f (pν11 ) X f (pν1k )
= lim lim ...
k→+∞ N →+∞
ν1 =0
pν11 s νk =0
pνkk s
+∞ !
Y X f pk
= .
p
pks
k=0
Avant de passer au premier théorème de Mertens, on va faire deux remarques importantes pour la
démonstration. Tout d’abord, on a cette relation sur la fonction de Von Mangoldt qui sera centrale dans
les démonstrations des théorèmes de Mertens :
X
∀n ∈ N∗ : log(n) = Λ(d).
d|n
Pour tout x ⩾ 1 :
X Λ(n)
= log(x) + O(1),
n
n⩽x
et :
X log(p)
= log(x) + O(1).
p
p⩽x
Démonstration :
16
— Grâce à la remarque précédente, on a en sommant sur N∗ :
X X X
log(n) = Λ(d).
n∈N∗ n∈N∗ d|n
Par notre remarque précédente le membre de gauche se comporte comme x log x + O (x). Pour la
somme double, on change l’ordre de sommation comme suit :
X X X X
Λ(d) = Λ(d) 1.
n∈N∗ d|n d≤x n≤x/d
Or verra (sans utiliser les résultats qu’on utilise) que pour tout x ∈ R+ :
X
Λ(n) ≪ x.
n≤x
X Λ(n) X log p
= + O (1) .
n p
n≤x p≤x
On obtient alors le deuxième point du théorème grâce au premier point juste au dessus.
□
X1
1
= log log(x) + c2 + O .
p log(x)
p⩽x
et :
X Λ(n) 1
= log log(x) + c1 + O ,
n log(n) log(x)
n⩽x
Démonstration :
17
— Pour le premier point, on utilise d’abord une sommation par parties pour écrire pour tout x ⩾ 2 :
X 1 X log(p)
= log(p)
p p
p⩽x p⩽x
X log(p) Z x X
log(p) 1
= log(x) + dt.
p
p⩽x 2 p t log2 (t)
p⩽t
+∞ X
X Λ(n) X log(p) X log(p)
= +
n log(n) p log(p) j=2 j pj log(pj )
n⩽x p⩽x p ⩽x
X1 +∞
1 X 1 X
= + .
p j=2 j j pj
p⩽x p ⩽x
On en déduit donc le deuxième point de la même manière que pour le deuxième point du premier
théorème de Mertens.
□
En fait on peut avoir un résultat plus fin et montrer que C = exp−γ où γ est la constante d’Euler, mais
ce n’est pas important pour la suite.
X 1 Y e− p1
Démonstration : Tout d’abord par comparaison à la série convergente , le produit
p
p2 p
1 − p1
converge. Ainsi on peut écrire pour tout x ⩾ 2 :
!
Y 1 X1 Y e− p1
1 = exp .
p⩽x
1− p p
p
p⩽x
1 − p1
18
Or d’après le second théorème de Mertens :
!
X1 Y e− p1 Y e− p1
exp = C log(x) + O(1), où on note C = ec1 .
p
p
p⩽x
1 − p1 p
1 − p1
On présente maintenant le fameux théorème des nombres premiers ainsi que ses formes équivalentes
qu’on utilisera dans la suite de ce rapport.
On a l’équivalent suivant :
x
π(x) ∼ .
x→+∞ log(x)
De manière équivalente on a :
1X 1X
lim λ(n) = lim µ(n) = 0.
x→+∞ x x→+∞ x
n⩽x n⩽x
Soit I ⊂ R un intervalle de longueur au moins 1 et n un entier tiré au sort uniformément dans cet
intervalle. Soit P une partie finie de N ne contenant que des nombres premiers de taille au plus
P ⩾ 2. Alors la variable aléatoire ω = p∈P 1p|n vérifie :
P
P2
ℓ(P) + mes(I)
∀λ > 0 : P(|ω − ℓ(P)| ⩾ λ) ≪ .
λ2
Démonstration : La démonstration ici est importante car on sera ramené dans la suite refaire les
mêmes calculs. La première chose qu’on remarque est :
mes(I)
1d|n =
X X
∀d ∈ N : 1= + O(1).
d
n∈I n∈I/d
Donc
1 1
P(d|n) = + O .
dmes(I)
1 1 1 1
Ainsi pour tout p ∈ P, 1p|n a une espérance égale à + O et une variance O + .
p mes(I) p mes(I)
Et pour tous p1 , p2 ∈ P distincts :
1
1p1 |n , 1p2 |n = O
Cov .
mes(I)
19
On en déduit que :
P2
P
E[ω] = ℓ(P) + O et Var(ω) ≪ ℓ(P) + .
mes(I) mes(I)
Donc
P2
E[ω 2 ] ≪ ℓ(P)2 + ℓ(P) + .
mes(I)
On en déduit que :
2 P2 ℓ(P)P
E[|ω − ℓ(P)| ] ≪ ℓ(P)2 + ℓ(P) + − ℓ(P)2 +
mes(I) mes(I)
P2
≪ ℓ(P) + .
mes(I)
1X 2
|ω(n) − log log(x)| ≪ log log(x).
x
n⩽x
Démonstration : On note I = [1, x] pour x suffisamment grand et P == {p, p ⩽ x0,1 }. D’après ??,
on a :
ℓ(P) = log log(x) + O(1).
2 x0,2
E[|ω − ℓ(P)| ] ≪ log log(x) + ≪ log log(x).
x
Définition II.24
Soit y ⩾ 2. On dit qu’un entier naturel n est y-friable si son plus grand facteur premier n’excède
pas y.
Pour tous x1 , x2 , y ⩾ 2, on notera S(x1 , x2 ; y) l’ensemble des entiers y-friables compris entre x1 et x2 .
L’objectif de cette sous-partie est de présenter un résultat général sur l’asymptotique (quand x tend vers
+∞) du nombre d’entiers compris entre 1 et x qui sont y-friables. Pour cela on va devoir présenter une
fonction spéciale, appelée fonction de Dickman définie par la proposition suivante.
20
Proposition II.25
Il existe une unique fonction continue ρ sur R+ , dérivable sur ]1, +∞[ qui satisfait l’équation diffé-
rentielle suivante :
∀u > 1 : uρ′ (u) + ρ(u − 1) = 0,
∀u ∈]1, 2] : uρ′ (u) + ρ(u − 1) = uρ′ (u) + 1 = 0 car u ≡ 1 sur [0, 1].
Ainsi pour tout u ∈]1, 2] : ρ(u) = 1 − log(u). ρ est bien continue sur ]0, 2[ et dérivable sur ]1, 2].
— Si n = 2, alors :
∀u ∈]2, 3] : uρ′ (u) + 1 − log(u − 1) = 0.
Ru
Ainsi pour tout u ∈]2, 3] : ρ(u) = 1 − log(u) + 2 log(t−1)
t dt. On vérifie facilement que ρ est continue
sur ]0, 3] et dérivable sur ]1, 3].
— On itère ce même procédé (les calculs sont les mêmes mais sont un peu lourds pour rédiger une
récurrence complète) pour obtenir une expression unique de ρ. On vérifie facilement qu’elle vérifie
les conditions demandées.
□
Théorème II.26
Uniformément pour x ⩾ y ⩾ 2 :
x log(x)
|S(1, x; y)| = xρ(u) + O où u = .
log(y) log(y)
Proposition II.27
1
Démonstration : C’est une application directe du théorème précédente avec y = x ε . □
Enfin on utilisera un dernier résultat sur les entiers friables (on pourra voir sa preuve dans ([1] , Corollaire
1.3) ) :
21
Proposition II.28
Soient u ⩾ 1 et ε > 0 et soit x suffisamment grand. Alors, le nombre d’entiers dans [1, x] qui n’ont
1
pas de facteur premier pus grand que x u est au plus égal : O u−(1−ε)u x .
22
III Un peu de théorie des cribles
Proposition III.1
Le problème est si on a k propriétés d’indésirabilités, il y aura 2k termes à estimer ce qui est trop. Nos
cribles permettront d’obtenir une bonne estimation du nombre d’éléments désirables en estimant k O(1) .
La construction générale d’un crible est la suivante.
Définition III.2
— Un problème de crible est un espace probabilisé (A, F, P) muni d’une masse totale M et
d’évènements Ap pour tout p premier.
— Une fois un problème de crible posé, on introduit sa fonction de criblage définie pour tout
z ⩾ 2 par :
\
S(A, z) = M × P Ap .
p⩽z
Pour toutes les applications, le problème de crible (qui sera noté par abus A) sera toujours une partie finie
\
de Z munie de la probabilité uniforme et on prendra M = |A|. Ainsi, S(A, z) = Ap . On adoptera la
p⩽z
notation suivante : pour tout d ∈ N sans facteur carré, on notera :
\
Ad = Ap .
p|d
Un premier cas général à étudier est celui où l’on considère les évènements Ap comme indépendants,
Y
dans ce cas on a S(a, z) = M (1 − P(Ap ). En pratique les évènements ne sont pas indépendants mais
p⩽z
jxk x
sont proches de l’être, par exemple pour le crible de Legendre, on a |Ad | = ce qui est proche de
d d
auquel cas les évènements Ad seraient indépendants.
23
Sous des conditions très générales, on va s’appuyer sur ce cas très simple en utilisant la formule
conséquence du principe d’inclusion-exclusion :
X
S(A, z) = µ(d) |Ad | . (III.1)
d∈P(z)
A chaque fois, une fonction complètement multiplicative g à valeurs dans [0, 1[ sauf en 1, sera introduite.
Elle sera choisie telle que |Ad | ≈ M g(d) pour tout d sans facteur carré. Une fois cette fonction introduite,
on va adopter de nouvelles notations :
— On notera X une bonne approximation de M , cela peut être n’importe quoi en fait, mais en pratique
ce sera très proche de M auquel cas on a |Ad | ≈ Xg(d) pour tout d sans facteur carré.
— On notera pour tout d sans facteur carré rd = |Ad | − Xg(d) les restes.
Dans le cas où les évènements sont indépendants, on prend g(p) = Ap et rd = 0. Enfin, on introduit une
dernière notation :
Y
∀z ∈ R : V (z) := (1 − g(p)).
p⩽z
L’idée fondamentale de Viggo Brun est de remplacer la somme dans III.1 en une somme sur un
nombre de d plus petit en remplaçant l’égalité par un encadrement. Ainsi construire un crible de manière
générale sera de trouver deux suites λ± = (λ±
d ) indicées sur les nombres sans facteur carré (désormais
dans toute cette partie sur les cribles la quantité d sera un nombre sans facteur carré) qui remplacent
µ(d) dans III.1. On va imposer deux conditions à suites Changer les labels en (λ+ ) et (λ− ) :
X
λ+
1 =1 et ∀m > 1 : λ+
d ⩾ 0. (III.2)
d|m
X
λ−
1 =1 et ∀m > 1 : λ−
d ⩽ 0. (III.3)
d|m
On appellera (par abus) les suites λ+ , λ− vérifiant respectivement les conditions III.2 et III.3 borne
supérieure du crible et borne inférieure du crible grâce à la proposition suivante :
Proposition III.3
Soit z ⩾ 2. On suppose l’existence de bornes supérieure et inférieure de crible λ± . Alors pour tout
problème de crible A :
X X
λ−
d |Ad | ⩽ S(A, z) ⩽ λ+
d |Ad | .
d∈P(z) d∈P(z)
De plus, pour toute fonction complètement multiplicative telle que g(p) ∈ [0, 1[ pour tout p ⩽ z, on
a:
X X
λ−
d g(d) ⩽ V (z) ⩽ λ+
d g(d).
d∈P(z) d∈P(z)
Y
Démonstration : Pour ω ∈ A choisi aléatoirement, on note mω = p. Alors, comme λ± vérifient
p⩽z
ω∈Ap
24
III.3 et III.2, on a :
X X X
S(A, z) = M P(mω = 1) ⩽ M E λ+
d
= λ+
d |Ad | et S(A, z) ⩾ λ−
d |Ad | .
d|mω d∈P(z) d∈P(z)
D’où le premier point. Le deuxième point est en fait un cas particulier du premier point. Notons m = π(z),
pk le k-ème nombre premier et A = {0, 1}m . On définit une probabilité en posant :
Y Y
P((v1 , . . . , vm )) = g(pk ) (1 − g(pk )).
k | vk =0 k | vk =1
Posons pour tout k ∈ N∗ : Apk = {(v1 , . . . , vm ) ∈ A : vk = 0}. On a alors pour tout z ⩾ 2 et pour tout
d ∈ P(z) :
Y
S(A, z) = (1 − g(p)) et |Ad | = g(d).
p⩽z
Lemme III.4
Soit u ⩾ 0. Alors :
k
u u−1
1u=0 =
X
∀k ∈ N : (−1)r + (−1)k .
r=0
r k
25
Théorème III.5
Alors λ satisfait III.2 si k est pair et III.3 si k est impair. De plus si ke est pair et ko est impair
alors pour tout problème de crible A et pour tout z ⩾ 2 on a :
X X
µ(d) |Ad | ⩽ S(A, z) ⩽ µ(d) |Ad | .
d∈P(z) d∈P(z)
ω(d)⩽ko ω(d)⩽ke
X X
S(A, z) − µ(d) |Ad | ⩽ µ(d) |Ad | .
d∈P(z) d∈P(z)
ω(d)⩽k ω(d)⩽k+1
k
ω(m)
1m=1 = 1ω(m)=0 =
X
(−1)r + (−1)k Y
r=0
r
k
X X
= (−1)r 1 + (−1)k+1 Y.
r=0 d|m
ω(d)=r
X
= µ(d) + (−1)k+1 Y par définition de la fonction de Möbius,
d|m
ω(d)⩽k
X
= λd + (−1)k+1 Y, par définition de la suite λ.
d|m
Le premier point vient immédiatement. Le deuxième point provient du premier point et du lemme III.3.
□
Lemme III.6
où : k+1
X 1 X
0⩽W ⩽ g(d) ⩽ g(p) .
(k + 1)!
d∈P(z) p⩽z
ω(d)⩽k
26
Démonstration : L’égalité provient du théorème précédent appliqué au problème de crible P(Ap ) =
g(p). Il reste à montrer que :
k+1
X 1 X
g(d) ⩽ g(p) .
(k + 1)!
d∈P(z) p⩽z
ω(d)⩽k
Pour cela, on se rappelle qu’un nombre d ∈ P(z) tel que ω(d) = k + 1 s’écrit sous la forme p1 . . . pk+1 où
pour tout i ∈ {1, . . . , k + 1} pi est nombre premier inférieur où égal à z. L’inégalité cherchée vient alors
directement. □
Proposition III.7
3 X
S(A, z) = XV (z) + O XV (z) 2 +O
|rd |
.
d∈P(z)
d⩽z
4 log ( V (z)
1
)+1
1
Démonstration : En appliquant le théorème III.5 avec k = 4 log , puis par application du
V (z)
lemme III.6 :
X X
S(A, z) = µ(d) |Ad | + O
|Ad |
,
d∈P(z) d∈P(z)
ω(d)⩽k ω(d)=k+1
k+1
X X X
= XV (z) + O g(p) +O |rd |
.
(k + 1)!
p⩽z d∈P(z)
ω(d)=k+1
1 ek
Or, par concavité de log puis l’inégalité ⩽ k et par définition de k, on a :
k! k
k+1
X X 1
g(p) ⩽ k+1
(k + 1)!
p⩽z (k + 1)! log V 1(z)
k+1
e log V 1(z)
⩽
k+1
3
≪ V (z) 2 .
Exemple : On va faire ici un premier exemple qui va montrer la puissance d’une méthode de crible
pour l’étude de problèmes arithmétiques. On rappelle qu’on dit qu’un nombre premier p est jumeau si
p + 2 ou si p − 2 est aussi premier. Il existe une conjecture dite des nombres premiers jumeaux qui affirme
27
qu’il en existe une infinité. Cette conjecture n’a toujours pas été démontrée malgré les récentes avancées
en 2013 par en partie Zhang et Maynard.
Modélisons d’abord ceci par un problème de crible. On pose A = [1, x] ∩ N, pour tout p premier :
Ap = {k ∈ A : p|k(k + 2)} et on considère le problème de crible munie de la probabilité uniforme. On
prend X = x et on introduit la fonction complètement multiplicative ρ telle que ρ(2) = 1 et qui vaut 2
sur tous les autres nombres premiers. On introduit la fonction complètement multiplicative g telle que
ρ(p)
pour tout p : g(p) = . Avec ce choix de g, on aura rd suffisamment faible. En effet on a pour tout d
p
sans facteur carré : jxk lxm
ρ(d) ⩽ |Ad | ⩽ ρ(d).
d d
1
Si on prend z = x 16 log log(x) , on a :
d∈P(z)
d⩽z
4 log ( V (z)
1
)+1
Or S(A, z) compte plus que les nombres premiers jumeaux, il compte en fait le nombre d’entiers k dans
A tels que k(k + 2) n’admette pas de facteurs premiers inférieurs ou égaux à z et cela inclus le cas où k
est un nombre premier jumeau. Ainsi :
2
log log(x)
Card ({k ⩽ x, k, k + 2 premiers }) ≪ x .
log(x)
On voit ici que cette quantité tend très lentement vers +∞, tellement qu’on a même le résultat suivant.
Proposition III.8
X 1
La série est convergente.
p
p,p+2 premiers
1
Or l’intégrale ci dessus est convergente par comparaison à , on en déduit que la limite de
t log(t)3/2
X 1
quand x → +∞ est finie d’où le résultat annoncé. □
p
p,p+2 premiers
p⩽x
28
III.3 Crible de Brun-Hooley
Dans cette partie, on va présenter une variante du crible de Brun pur par Hooley qui est simple
d’un point de vue combinatoire et assez puissante quand même pour donner des résultats satisfaisants.
Nous allons ici que nous intéresser à chercher une borne supérieure de crible car ce n’est que ça qui
nous intéresse dans nos applications. On pourra trouver la suite dans [2]. L’idée fondamentale est de
partitionner les nombres premiers inférieurs ou égaux à z en des ensembles P1 , . . . , Pt et d’appliquer le
crible de Brun pur sur chacun des Pi .
Lemme III.9
t
(i)
Y
λ+
d = λdi ,
i=1
Lemme III.10
(i)
Démonstration : C’est une application directe du résultat précédent en prenant λd une borne
supérieure de crible de Brun pur (voir partie précédente) avec k = ki pair. □
29
Théorème III.11
Soit A un problème de crible et soit g une fonction complètement multiplicative telle que 0 ⩽ g(p) <
1 pour tout p. Soit z ⩾ 2. Partitionnons les nombres premiers inférieurs ou égaux à z en P1 ⊔. . .⊔Pt .
Y
Soient k1 , . . . , kt des entiers pairs. On note pour tout i ∈ {1, . . . , t} : Pi =: p. Alors :
p∈Pi
′
S(A, z) ⩽ XV (z)eE + R ,
où
t k +1
Lj j
X Lj 1kj >0 1 Y
E= e où pour tout j ∈ {1, . . . , t} : Lj = log et Vj = (1 − g(p)),
j=1
(kj + 1)! Vj
p∈Pj
et
′ X
R = |rd | .
ω((d,Pj ))⩽kj , 1⩽j⩽t
d∈P(z)
X t
Y X
Uj = µ(dj )g(dj ) et R = µ(d1 ) . . . µ(dt )rd1 ...dt .
dj |Pj j=1 dj |Pj
ω(dj )⩽kj ω(dj )⩽kj
Or d’après le lemme III.6 et par les inégalités de convexité : g(p) ⩽ − log(1 − g(p)) pour tout p et
1 + x ⩽ ex pour tout x ∈ R, on a pour tout j ∈ {1, . . . , t} :
k +1 k +1 kj +1
! !
Lj j Lj j L j
Uj ⩽ Vj + ⩽ Vj 1 + eLj ⩽ Vj exp eLj .
(kj + 1)! (kj + 1)! (kj + 1)!
Pour produire une borne supérieure d’utilité plus générale, on va devoir faire une petite hypothèse
supplémentaire sur g. Cette condition est des fois appelée condition d’Iwaniec : on suppose qu’il existe
30
κ ⩾ 0 et B > 0 tels que :
κ
Y 1 log(w) B
∀2 ⩽ y ⩽ w ⩽ z : ⩽ exp . (III.5)
1 − g(p) log(y) log(y)
y⩽p⩽w
En pratique, on ne montre pas cette condition directement mais plutôt la suivante, plus simple à démon-
trer :
Proposition III.12
Soit g une fonction complètement multiplicative à valeurs dans [0, 1[ sauf en 1. S’il existe κ ⩾ 0 et
δ > 0 tels que :
κ
∀p ⩽ z : g(p) ⩽ min ,1 − δ , (III.6)
p
alors g vérifie la condition d’Iwaniec III.5.
Théorème III.13
Alors, on a :
X
S(A, z) ⩽ Oκ0 ,B0 (XV (z)) + |rd | .
d⩽z
µ(d)2 =1
Démonstration : Au vu de l’énoncé, il va falloir qu’on choisisse une partition des nombres premiers
inférieurs ou égaux à z adaptée. Pour cela on décide de poser :
1
∀j ∈ {1, . . . , t} : zj = z 4j−1 et zt+1 = 2,
Afin d’appliquer le théorème III.11, on introduit enfin k1 = 0 et kj = 2j−1 pour tout j ⩾ 2 des entiers
pairs. Il reste maintenant à appliquer ce théorème et étudier les différents termes qui y apparaissent.
— Par hypothèse, g vérifie la condition d’Iwaniec, donc en prenant le logarithme de cette inégalité,
on obtient pour tout j ∈ {1, . . . , t} :
X B B0
Lj := − log(1 − g(p)) ⩽ κ log(4) + ⩽ κ0 log(4) + := L.
log(zj+1 ) log(2)
zj+1 <p⩽zj
31
— De cette estimation, on obtient aussi une de E :
t k +1 t
Lj j Lkj +1
eLj 1kj >0
X X
E= ⩽ eL ⩽ e2L ⩽ e3κ0 +3B0 .
j=1
(kj + 1)! j=1 (kj + 1)!
′ X X
R = |rd | ≪ |rd | .
ω((d,Pj ))⩽kj , 1⩽j⩽t k k
d⩽z1 1 ...zt t ⩽z
d∈P(z) 2
µ(d) =1
On obtient le résultat demandé en appliquant le théorème III.11 et par les remarques ci-dessus. □
Proposition III.14
\
Ainsi S(A, x) = Ap compte la quantité demandée. La fonction complètement multiplicative g définie
p∈P
1
par g(1) = 1 et g(p) = vérifie facilement la condition d’Iwaniec par III.6. Ainsi d’après le théorème
p
III.13 :
X
S(A, x) ⩽ O(Xv(x)) + |rd | .
d⩽x,µ(d)2 =1
jxk
Or par le lemme chinois |Ad | = donc |rd | = O(1). On en déduit le résultat annoncé. □
d
Proposition III.15
On note Ξ(x, y, z) le nombre d’entiers n ⩽ x qui n’ont pas de facteurs premiers dans ]y, z]. On a :
x log(y)
Ξ(x, y, z) ≪ .
log(z)
32
Démonstration : La démonstration est identique en prenant I =]y, z] et Ap = {n ∈ A, p|n}. D’après
le théorème III.13, on a :
Y 1
X
S(A, z) = O x 1− + |rd | .
p
p∈]y,z] d⩽x,µ(d)2 =1
On en déduit le résultat recherché car |rd | = O(1) ici aussi et par le troisième théorème de Mertens II.20.
□
33
IV Moyennes de fonctions multiplicatives
1X
limf (n).
x→+∞ x
n⩽x
Dans ce cas, on appelle valeur moyenne d’une fonction arithmétique f la valeur de cette limite.
Se ramener à l’étude de la valeur moyenne d’une fonction arithmétique est un raisonnement qui se
rejoint beaucoup à la théorie des probabilités, on construit des objets qui sont plus simples à étudier et
qui permettent de connaître quelques informations sur la loi étudiée (comme on le fait avec les moments
ou la fonction caractéristique d’une variable aléatoire).
En fait, on n’étudie que les valeurs moyennes de fonctions multiplicatives car une fonction arith-
métique est trop malléable pour obtenir un résultat général. En effet, on peut construire une fonction
arithmétique non multiplicative qui n’admet pas de valeur moyenne. Pour cela on pose :
1 s’il existe k ∈ N tel que 22k < x ⩽ 22k+1
f (n) = .
0 s’il existe k ∈ N tel que 22k+1 < x ⩽ 22k+2
1X 1 1X 2
lim inf f (n) = et lim sup f (n) = .
x→+∞ x 3 x→+∞ x 3
n⩽x n⩽x
Pourtant l’étude de la moyenne d’une fonction multiplicative est loin d’être simple, par exemple
connaître le comportement de la valeur moyenne de manière suffisamment précise, on devra faire appel
au théorème des nombres premiers (par exemple pour la fonction µ ou la fonction τ ). On peut cependant
obtenir une estimation correcte de la valeur moyenne sans faire appel à ce théorème. Pour cela on faire
34
appel au résultat suivant appelé "Principe de l’hyperbole" 1 .
Démonstration : On a :
X X
(f ∗ g)(n) = f (m)g(d)
n⩽x md⩽x
X X
= f (m)g(d) + f (m)g(d)
md⩽x,d⩽y md⩽x,d>y
X x X x
= g(n)F + f (m) G − G(y) .
d x m
d⩽y m⩽ y
Grâce à ce résultat, on va obtenir une estimation de la valeur moyenne de τ . Pour cela on applique
√
IV.2 avec f = g = 1. et y = x. On obtient :
X X √ 2 X 1 √
τ (n) = 2 ⌊x/m⌋ − x = 2x −x+O x .
√ √ m
n⩽x m⩽ x m⩽ x
On peut aussi calculer la valeur moyenne de certaines fonctions multiplicatives assez simples par des
techniques encore plus élémentaires.
— Calculons par exemple la valeur moyenne de µ2 , pour cela une technique standard est d’écrire µ2
sous forme de produit de convolution, d’inverser les sommations et ensuite estimer les sommes qui
apparaissent. Pour cela, on décompose tout n ∈ N en un produit canonique n = qm2 où q est égal
au produit des facteurs premiers de n dont l’exposant est impair. Cette décomposition est unique
et µ(q) = 1. On a alors :
X
∀n ∈ N : µ2 (n) = δ(m) = µ(d).
d|m
En effet, la première égalité est évidente et la deuxième vient en montrant d’abord cette égalité
sur les pα où p est premier et α ⩾ 1 puis en utilisant le fait que les deux membres de cette égalité
représentent des fonctions multiplicatives. Donc en remarquant que d|m si et seulement si d2 |n et
1. Le nom de "principe de l’hyperbole" provient d’une interprétation géométrique de celle-ci, pour plus de détails on
pourra aller voir ([3], 1.3.2)
35
par inversion de sommation :
X X X µ(d) X 1 √
µ2 (n) = µ(d) x/(d2 ) =
x + O x + x .
√ d2 √ d
2
n⩽x d⩽ x d⩾1 d⩾ x
Or, comme la fonction de Möbius est l’inverse de convolution de la fonction 1, on a d’après II.16
(les deux séries sont convergentes) :
X µ(d) X 1
= 1.
d2 d2
d⩾1 d⩾1
X µ(d) 6 2
Donc = . Donc par théorème de sommation de relation de comparaison pour contrôler
d2 π2
d⩾1
le O, on obtient un résultat qui illustre ??.
1X 2 6 1
µ (n) = 2 + O √ .
x π x
n⩽x
— On peut, avec cette même méthode (et un peu plus de travail) obtenir cette estimation qu’on
utilisera par la suite.
1X 2
τ (n) ≪ log3 (x). (IV.1)
x
n⩽x
Il arrive même que certaines fonctions multiplicatives n’aient même pas de moyenne, par exemple
n 7→ nit . Montrons que :
1 X it
x 7→ n n’a pas de limite quand x → +∞.
x
n⩽x
Ainsi :
1 X it it it
n ∼ x 1+ .
x x→+∞ it + 1
n⩽x
On en déduit le fait annoncé. En fait, on remarque qu’en module l’équivalent calculé est constant mais
qu’il varie en argument en fonction de x, c’est parce que la fonction n 7→ nit oscille trop. Cette fonction
joue un rôle important dans le cadre général, une fonction multiplicative qui se situera assez loin de
n 7→ nit (dans un sens qu’on définira), alors on pourra "contrôler la valeur moyenne" de cette fonction
multiplicative.
36
tout n ∈ N : |f (n)| ⩽ 1. Avant cela, on va avoir besoin du lemme suivant :
Lemme IV.3
Soient u, v, w trois vecteurs d’un espace préhilbertien (H, ⟨. | .⟩ , ∥.∥) de norme inférieure ou égale à
1. Alors, on a l’inégalité suivante :
p p p
1 − ⟨u | w⟩ ⩽ 1 − ⟨u | v⟩ + 1 − ⟨v | w⟩.
Démonstration :
— On va d’abord démontrer ce lemme dans le cas où u, v, w sont de norme égale à 1. On a alors :
p 1
1 − ⟨u | v⟩ = √ ∥u − v∥ .
2
Les vecteurs ũ, ṽ, w̃ sont unitaires donc on peut appliquer le point précédent dans H̃ à ces trois
vecteurs : q q q
1 − ⟨u | w⟩H̃ ⩽ 1 − ⟨u | v⟩H̃ + 1 − ⟨v | w⟩H̃ .
37
Proposition IV.5
Avant la preuve de ces résultats, la première chose que l’on remarque est que la distance prétentieuse
n’est pas une distance. Pourtant, elle possède quand même des propriétés appréciables que vérifie une
distance comme l’inégalité triangulaire et la symétrie.
Démonstration :
— Vérifions d’abord que D(f, g; X) est positif. Pour cela, on va vérifier que chaque terme à l’intérieur
de la somme est positif. Soit p premier, on a les majorations suivantes :
Re f (p)g(p) = Re(f (p))Re(g(p)) + Im(f (p))Im(g(p))
1 2 2
1
2 2
⩽ Re(f (p)) + Re(g(p)) + Im(f (p)) + Im(g(p))
2 2
1 2 2
⩽ |f (p)| + |g(p)| ⩽ 1.
2
Cela veut donc dire que les majorations du premier point sont en fait des égalités. On en déduit
que :
1 2 2
∀p : Re(f (p))Re(g(p)) = Re(f (p)) + Re(g(p)) .
2
Donc pour tout p : Re(f (p)) = Re(g(p)). De la même manière : Im(f (p)) = Im(g(p)) pour tout p.
On obtient alors que pour tout p premier inférieur ou égal à x : |f (p)| = |g(p)| = 1 et f (p) = g(p).
— On a pour tout p :
Re f (p)g(p) = Re(f (p))Re(g(p)) + Im(f (p))Im(g(p)),
38
On en déduit en sommant sur p puis par l’inégalité de Cauchy-Schwarz :
2
D(f, h; X)2 ⩽ D(f, g; X)2 + D(g, h; X)2 + 2D(f, g; X)D(g, h; X) = (D(f, g; X) + D(g, h; X)) .
On en déduit l’inégalité triangulaire car chaque distance prétentieuse est positive par le premier
point.
□
On finit par introduire quelques définitions liées à la distance prétentieuse qui nous seront plutôt
utiles dans les parties suivantes.
Définition IV.6
Pour toute fonction multiplicative g 1-bornée, pour tout Q ⩾ 1 et pour tout X ⩾ 2, on introduit les
quantités suivantes :
M (g; X) = inf D(g, n 7→ nit ; X).
|t|⩽X
Lorsque M (g; X) est petit alors g "prétend" être n 7→ nit et M (g; X, Q) est petit lorsque g "prétend"
être un caractère de Dirchlet modulo au plus Q tordu de facteur de torsion au plus X.
On commence par une inégalité de type Perron (voir ([4], Proposition 3) pour un exemple de preuve) :
Proposition IV.7
39
Proposition IV.8
Soit f : N → C une fonction arithmétique et soit T ⩾ 1. On suppose que F (s) converge absolument
pour Re(s) ⩾ 1. Alors :
|f (n1 )| |f (n2 )|
Z X
2
|F (1 + it)| dt ≪ T .
|t|⩽T n1 n2
n1 ,n2 | log(n2 )=log(n1 )+O ( T1 )
h πi
Démonstration : Par concavité du sinus sur 0, , on a :
2
Z Z
2 2 t
|F (1 + it)| dt ≪ |F (1 + it)| sin2c dt.
|t|⩽T R 2T
Or on sait que sinc est la transformée de Fourier d’une fonction porte à support dans [−1, 1] et l’intégrale
t
précédente est la transformée de Fourier de f 2 où f : t 7→ sinc 2T . Donc on sait que si log(n1 ) et log(n2 )
1
sont distants de strictement plus que O T , alors l’intégrale sera nulle. On peut donc que ne considérer
dans la somme ci-dessus les couples (n1 , n2 ) ∈ N2 qui vérifie log(n1 ) − log(n2 ) = O T1 ce qui donne le
résultat annoncé. □
Alors :
1X M 1
f (n) ≪ (1 + M )e− 2 + .
x T
n⩾x
40
où :
— f1 est la restriction de f aux entiers naturels dont les facteurs premiers tous petits et f1 (1) = 1.
— f2 est la restriction de f aux entiers naturels dont les facteurs premiers tous moyens et f2 (1) = 1.
— f3 est la restriction de f aux entiers naturels dont les facteurs premiers tous grands et f3 (1) = 1.
En effet, pour montrer l’égalité il suffit de la montrer sur les nombres de la forme pν où p est premier
et ν > 1 par multiplicativité de f . On va le montrer quand p est petit, la preuve quand p est moyen ou
grand est identique.
ν
X
(f1 ∗ f2 ∗ f3 ) (pν ) = f1 pλ f2 (pµ ) f3 pν−µ−λ
λ,µ=0
En fait, pour pouvoir appliquer les lemmes III.14 et II.28, on va encore décomposer f en écrivant f2 =
δ + f2′ et f3 = δ + f3′ . Ainsi on obtient :
Äinsi, on obtient :
1X 1X 1X 1X
f (n) = f1 ∗ f2′ ∗ f3′ (n) + f1 ∗ f2 (n) + f1 ∗ f3′ (n).
x x x x
n⩾x n⩾x n⩾x n⩾x
Etape 2 : On utilise quelques lemmes pour pouvoir avoir une première estimation de la moyenne de
f par rapport aux séries de Dirichlet de f1 , f2′ , f3′ .
Par le même raisonnement que précédemment, f1 ∗ f2 est la restriction de f aux nombres inférieurs
à x dont leurs
facteurs premiers sont petits ou moyens. Ainsi par la proposition II.28, leur nombre est
1
O e− ε1 x pour x suffisamment grand.
De manière similaire, f1 ∗ f3′ est la restriction de f aux nombres inférieurs à x qui contiennent
au
moins un facteur large mais aucun facteur moyen. Donc d’après la proposition III.14, il y en a O εε21 x
pour x suffisamment grand.
Enfin, comme f1 ∗ f2′ ∗ f3′ est à support sur les nombres dont les facteurs premiers ne dépassent pas
x, sa série de Dirichlet associée est absolument convergente pour Re(s) ⩾ 1 et d’après II.16, on a pour
tout s de partie réelle supérieure à 1 3 :
3. On précise qu’ici F2′ et F3′ désigne la série de Dirichlet associée respectivement à f2′ et f3′ et non pas à la dérivée de
la série de Dirichlet de f2 et f3 respectivement.
41
Etape 3 : On estime les trois facteurs du premier terme.
— Montrons d’abord que pour x suffisamment grand : |F1 (1 + it)| ≪ e−M log(M ) pour tout |t| ⩽ T .
+∞
YX f1 (pj )
F1 (1 + it) =
p j=0
pj(1+it)
+∞
Y X f (pj )
= par définition de f1 ,
x⩽xε2 j=0
pj(1+it)
Y f (p)p−it
≪ 1+ car les termes de plus haut degré sont négligeables,
p
x⩽xε2
f (p)p−it
X
≪ exp Re ,
ε2
p
p⩽x
1
Le terme f2′ (n1 ) s’annule à part si n1 ⩾ xε2 et on a n2 = 1+O n1 , donc on obtient :
T
Z
2
X |f ′ (n1 )| X |f2′ (n2 )|
|F2′ (1 + it)| dt ≪ T 2
.
|t|⩽T ε2
n1 n2
n1 ⩾x n2 =(1+O ( T1 ))n1
42
D’après les étapes précédentes, on a pour x suffisamment grand :
1X e−M 1 1 ε2
f (n) ≪ √ + + e − ε1 + .
x ε1 ε2 T ε1
n⩽x
M
Donc en prenant ε1 = 1
M et ε2 = e− 2 , on obtient l’estimation demandée. □
Y f (pν )
X
1
M (f ) = 1− ,
p
p pν
ν⩾0
où le produit infini est considéré comme nul s’il diverge. Alors on a pour x → +∞ :
X
f (n) = x (M (f ) + o(1)) .
n⩽x
Démonstration : On ne va effectuer la preuve que dans le cas où f est une fonction multiplicative
à valeurs dans [0, 1]. Dans le cas général la preuve est bien plus difficile car elle comprend au moins
le théorème des nombres premiers (il suffit d’appliquer le théorème de Wirsing avec f = µ pour le
retrouver). Pour cette preuve on va adopter une preuve quelque peu similaire à la preuve de l’inégalité
faible de Halasz en décomposant f (n) selon la taille des facteurs premiers de n mais ici ce sera un peu
plus simple.
Pour tout y > 2, on introduit les fonctions complètement multiplicatives suivantes αy (p) = 1p⩽y et
βy (p) = 1p>y . De la même manière que dans la preuve de l’inégalité faible d’Halasz, on a :
f = f αy ∗ f βy .
f ⩽ f αy ∗ βy := fy .
43
développement en produit eulérien :
1X 1 X Y 1
βy (n) = hy (m) ⌊x/m⌋ → 1− .
x x x→+∞ p
n⩽x m⩽P (y) p⩽y
De plus, on écrit :
f (d)αy (d)
Or la série de terme général , d ⩾ 1 est finie par définition de αy donc par le théorème de
d
convergence dominée :
X X f (d)αy (d) X
lim fy (n) = d⩾1 lim βy (n)
x→+∞ d x→+∞
n⩽x n⩽x
Y 1 X f (pν )
= 1− = M (fy ).
p pν
p⩽y ν⩾0
1X
f (n) ⩽ M (fy ) + o(1).
x
n⩽x
Or, y 7→ M (fy ) est décroissante, donc si le produit infini diverge alors M (fy ) tend vers 0 lorsque y → +∞.
Donc si le produit infini diverge alors f possède bien une valeur moyenne qui est nulle.
X 1 − f (p)
Maintenant, supposons que le produit M (f ) converge alors la série converge aussi par
p
p
convexité de l’exponentielle. Or pour tout n ⩾ 1, on a par le lemme ??
Y X
fy (n) − f (n) ⩽ 1 − f (pν ) ⩽ (1 − f (pν )) .
pν ,p>y
X 1 − f (p) !
1
⩽x + ,
p>y
p p(p − 1)
X 1
en isolant le premier terme de la somme et en majorant le reste par la série géométrique . Et en
ν>1
pν
tant que reste d’une série convergente, on a :
X 1 − f (p) 1
lim + = 0.
y→+∞
p>y
p p(p − 1)
lim M (fy ) ⩽ M (f ).
y→+∞
44
On en déduit donc que si le produit M (f ) converge alors f admet une valeur moyenne qui est égale à
M (f ). □
45
V Moyenne de fonctions multiplicatives sur des petits intervalles :
résultats de Matomäki et Radziwiłł
Lemme V.1
Soit (an )n∈N une suite de nombres à valeurs complexes, nulle à partir d’un certain rang. On définit
le polynôme de Dirichlet associé à cette suite par :
X
∀y ∈ R, A(y) = an niy .
n∈N
Soit T ⩾ 1, alors :
2
+∞ +∞ y
!
sin
Z Z
X dx 2 2 T
an = |A(y)| dy.
0 1 1
x π −∞ y
xe− T <n⩽xe T
P
Démonstration : On introduit la fonction f : x ∈ R 7→ 1 1 an . Sa transformée de Fourier
ex− T ⩽n⩽ex+ T
est donnée par :
ξ
Z XZ log(n)+ T1 2 sin T
∀ξ ∈ R : fˆ(ξ) = ++∞f (x)e −ixξ
dx = e −ixξ
dx = A(−ξ) .
−∞ log(n)− T1 ξ
n∈N
46
Lemme V.2
Soit X suffisamment grand et an , A définies comme précédemment. On suppose aussi qu’il existe
deux constantes c1 , c2 telles que an = 0 en dehors de [c1 X, c2 X]. Soit h ∈ 1, c10
1X
. Alors :
2
+∞ +∞
c2 h2
Z Z
X 2 1
an ≪ 2X |A(y)| min 2 2
, 2 dy.
0 c1 −∞ c1 X y
x<n⩽x+h
P
Démonstration : On définit la fonction A : x ∈ R 7→ n⩽x an . Pour tout ν ∈ [2h, 3h], on a par
l’inégalité triangulaire et par l’inégalité de Cauchy-Scwharz :
Z +∞ Z +∞
2 2 2
|A(x + h) − A(x)| dx ⩽ 2 |A(x + ν) − A(x)| + |A(x + h) − A(x + ν)| dx.
0 0
Maintenant dans l’intégrale en ν, on fait le changement de variable "δ = x/ν. Ceci nous permet d’obtenir :
6h
Z C2 X Z 3h Z C2 X Z C1 X
2 2
|A(x + ν) − A(x)| dν dx ≪ |A(x(1 + δ)) − A(x)| x dδ dx.
C1 X
2 h C1 X
2
h
C2 X
C22 X 2
C1 X
Et avec la majoration x ⩽ valable pour tout x ∈ , C2 X , on obtient finalement :
x 2
!
+∞ C2 X
c2 hX
Z Z
2 dx 2
|A(x + h) − A(x)| dx ≪ 2 max |A(x(1 + δ)) − A(x)| dδ .
0 c1 h
c2 X ⩽δ⩽ C6hX
1
C1 X
2
x
h 6h 2
Soit ⩽δ⩽ . D’après le lemme précédent appliqué avec T = après avoir effectué le
c2 X C1 X √ log(1 + δ)
changement de variable "u = x 1 + δ :
!
C2 X +∞
c22 hX c2 hX
Z Z
dx 2 2 1 1
max |A(x(1 + δ)) − A(x)| dδ ≪ 2 max |A(y)| min , .
c1 h
c2 X ⩽δ⩽ C6hX
1
C1 X
2
x c1 h
c2 X ⩽δ⩽ C6hX
1
0 T 2 y2
Or :
1 δ2 h2
≪ ≪ .
T2 4 c21 X 2
On en déduit que :
2
+∞ +∞
c2 h2
Z Z
X 2 1
h an ≪ 2 hX |A(y)| min 2 , dy.
0 c1 −∞ c1 X 2 y 2
x<n⩽x+h
47
On donnera le lemme suivant sans démonstration.
Lemme V.3
Lemme V.4
2
Z T X X
it 2
an n dt ≪ (T + N ) |an | .
−T n⩽N n⩽N
Démonstration :
f (t)
t
−T − N −N N T +N
Ainsi on peut écrire :
2 2
Z T X Z X X m
it it
an n dt ⩽ f (t) an n dt = am an F ,
−T n⩽N R n
n⩽N 1⩽m,n⩽N
Z Z
it
où on note F la fonction x 7→ f (t)x dt. On remarque que F (1) = f (t) dt = 2T + N . Un calcul un
R R
peu pénible donne que pour tout x ̸= 1 :
2 sin(T ) 2 cos(N + T ) 1 1
F (x) = − − ≪ .
N log(x)2 N log(x)2 N log(x)2
Donc pour 1 ⩽ m ̸= n ⩽ N , on a :
m 2
1 1 1 m+n N
F ≪ 2 ≪ ≪ .
n N log m n m−n (m − n)2
n
48
On déduit de ces deux points :
2
Z T X X X m
it 2
an n dt ≪ F (1) |an | + am an F
−T n⩽N n
1⩽n⩽N 1⩽m̸=n⩽N
X 2
X 1
≪ (2T + N ) |an | + N |an am | .
(m − n)2
1⩽n⩽N 1⩽m̸=n⩽N
2 2
Le dernier terme étant négligeable devant le premier (par exemple par l’inégalité 2 |ab| ⩽ |a| + |b| pour
tous a, b ∈ C), on en déduit le résultat annoncé. □
Le lemme précédent nous sera très utile pour la suite. On va aussi l’utiliser sous cette forme :
Lemme V.5
Soit T suffisamment grand et 2 ⩽ P ⩽ T . Soit (ap ) une suite indicée sur les nombres premiers à
valeurs dans D. Soit V ⩾ 3 et notons E l’ensemble suivant :
X π(P )
E = |t| ⩽ T tel que ap pit ⩾ .
V
p⩽P
Alors :
log(T )
|mes(E)| ≪ (V 2 log(T ))1+ log(P ) .
log(T )
Démonstration : Soit k = , ainsi on a P k ⩾ T . On définit les suites (αn )n∈N par la relation
log(P )
suivante : k
X X
ap pit = αn nit .
p⩽P n⩾P k
2k
2k Z T
π(P ) X
|mes(E)| ≪ ap pit dt
V −T p⩽P
X 2
≪ (T + P k ) |αn |
n⩽P k
≪ k!P k π(P )k .
Ainsi : 2k
V
|mes(E)| ≪ k!P k π(P )k .
π(P )
On retrouve l’estimation annoncée par la formule de Stirling et par ??. □
49
Lemme V.6
Soit T suffisamment grand et E un ensemble de mesurable de [−T, T ]. Alors pour toute suite de
nombres complexes (an )n∈N :
2
Z X √ X
2
an nit dt ≪ N + mes(E) T log(T ) |an | .
E n⩽N n∈N
Démonstration : On note :
2
Z X X
I= an nit et ∀t ∈ [−T, T ] : A(t) = an nit .
E n⩽N n⩽N
On a : Z X Z
X
−it
I= an n A(t) dt ⩽ |an | A(t)n−it dt .
E n⩽N n⩽N E
n
Donc d’après l’inégalité de Cauchy-Schwarz et en utilisant le fait que pour tout n ⩽ N : 2 − ⩾1:
N
!
Z 2
X 2
X n
I2 ⩽ |an | 2− A(t)n−it dt .
N E
n∈N n⩽2N
De plus
Z 2 Z
X n X n i(t2 −t1 )
2− A(t)n−it dt ⩽ A(t1 )A(t2 ) 2− n dt1 dt2 .
N E E2 N
n⩽2N n⩽2N
L’ajout des termes jusqu’à 2N dans la somme précédente nous permet d’utiliser qu’on a pour tout
t ∈ [−T, T ] :
X n it N p
2− n ≪ 2 + 1 + |t| log(2 + |t|).
N 1 + |t|
n⩽2N
Ceci donne le résultat annoncé en divisant par I > 0 (sinon ça voudrait dire que la suite (an ) est nulle
mais le résultat est trivial pour celle-ci). □
50
Théorème V.7
Soit f : N → [−1; 1] une fonction multiplicative. Alors il existe des constantes absolues C, C ′ > 1
telles que pour tous 2 ⩽ h ⩽ X et δ > 0 :
1 X 1 X log log(h)
f (n) − f (n) ⩽ δ + C ′
h X log(h)
x⩽n⩽x+h X⩽n⩽2X
1
log(h) 3 1
pour tous les entiers x ∈ [X, 2X], sauf au plus CX δ + 1 entiers qu’on appellera
δ 2 h 25 δ 2 log(X) 50
exceptions.
Nous n’allons pas le démontrer en généralité mais dans le cas particulier de la fonction de Liouville λ
et en obtenant une borne du nombre d’exceptions moins satisfaisante. Cependant, on retrouve les mêmes
idées générales mais avec un peu moins d’estimations techniques. Le résultat qu’on va démontrer est le
suivant.
Théorème V.8
Pour tout ε > 0, il existe H(ε) tel que pour tout H(ε) < h ⩽ X, on a :
2
Z 2X X
λ(n) ⩽ εXh2 .
X x<n⩽x+h
Démonstration : Nous allons faire la démonstration deux fois. La première fois pour obtenir le
résultat relativement rapidement mais avec une borne inférieure pour h un peu trop grande. La deuxième
démonstration reprendra le même cheminement que la première mais en ajoutant quelques estimations
plus fines pour obtenir une borne inférieure pour h plus satisfaisante.
— Première démonstration :
3
Dans cette première démonstration, on va démontrer le résultat pour h ⩾ exp (log(X)) 4 . On peut
√ √
aussi supposer h ⩽ X : si on prouve le résultat pour h⩽ X alors on peut en déduire le résultat
3 3
juste pour h ⩾ exp (log(X)) 4 . En effet si H := exp (log(X)) 4 , alors il existe k ∈ N tel que
√ √ Pk √
H − kh ∈ [ x, x + h]. Alors on peut écrire H = i=0 hi avec hi ⩽ X. Et ainsi :
X k−1
X X
λ(n) = λ(n).
x⩽n⩽x+H i=0 x+Pi Pi+1
j=0 hj ⩽n⩽x+ j=0 hj
51
√
Ainsi si on montre le résultat pour tout h ∈ [H, X], alors on démontrera le résultat dans le cas h ⩾ H.
On va maintenant adopter quelques notations :
— On note P l’ensemble des nombres premiers dans [H, h].
— Pour tout j ∈ N, on note Pj := P ∩ [Pj , Pj+1 ] où on définit pour tout j ∈ N : Pj := 2j H.
9
[J
— On pose J := log(h)−(log(h))
10
log(2) , ainsi on a P = Pj .
j=0
— On note ωP l’application ω où on ne considère que les nombres premiers dans P, c’est-à-dire :
X
∀n ∈ N : ωP (n) = 1.
p∈P
p|n
X1
— On note, en référence à II.22 qu’on va utiliser la quantité W (P) = . D’après II.19, on a :
p
p∈P
1
W (P) ∼ log log(h).
10
— Ce choix
de P a été fait pour qu’il
vérifie la condition
suivante
: tout élément p ∈ P vérifie
9 2 27
exp log(h) 10 ⩽ p ⩽ h donc exp log(X) 3 ⩽ exp log(X) 40 ⩽ p ⩽ h (en anticipant l’applica-
tion du lemme V.3).
Soit (an )n∈N une suite qui vérifie pour tout y ∈ R :
X J X
X X
A(y) := an niy = λ(p)piy λ(m)miy .
n∈N j=0 p∈Pj X
⩽m⩽ 2X
Pj+1 P j
On a obtenu la dernière estimation en appliquant le lemme V.2 pour le premier terme et l’inégalité
de Turan-Kubilius II.22 pour le deuxième terme. Il nous reste donc à estimer l’intégrale. Pour cela on
va d’abord gérer la contribution des |y| ⩾ X à l’intégrale, pour cela on décomposer cet ensemble en
52
sous-ensembles dyadiques et appliquer V.4 sur chacun de ces sous-ensembles :
h2 1
Z Z
1
|A(y)| min , dy = |A(y)| dy,
|y|>X X 2 y2 |y|>X y2
+∞ Z
X 2 dy
= |A(y)|
2k X⩽|y|⩽2k+1 X y2
k=0
+∞ Z
1 X 1 2
≪ |A(y)| dy,
X2 22k |y|⩽2k+1 X
k=0
+∞
1 X 2k+1 X + 4X X 2
≪ |an | .
X2 22k
k=0 n⩽4X
On en déduit que :
2
2X
h2 1 Xh2
Z Z
X X 2
λ(n) dx ≪ X + |A(y)| min , dy + .
X W (P)2 |y|⩽X X 2 y2 W (P)
x<n⩽x+h
Xh2
Notons que le premier terme (que l’on vient d’obtenir) est négligeable devant . Il reste donc
W (P)
2
à regarder l’intégrale restante. Pour cela, on utilise l’inégalité de Cauchy-Schwarz dans |A(y)| pour
montrer que :
h2 1
Z
2
|A(y)| min , dy ≪ W (P) max Ij ,
|y|⩽X X 2 y2 0⩽j⩽J
2 2
X
h2 1
Z X X
2 iy iy
Ij = (log(Pj )) p λ(m)m min , dy.
−X p∈P X
X 2 y2
j
Pj+1 ⩽m⩽ 2X
P j
Il reste donc à estimer Ij pour tout j. On fixe un tel j et on utilise le lemme V.3 pour dire que :
X Pj 1 27 2
Pj 1 1
piy ≪ + Pj exp −(log(X)) 40 − 3 −δ ≪ + . (V.1)
log(Pj ) 1 + |y| log(Pj ) 1 + |y| log(Pj )
p∈Pj
2 2
h2 1
Z X X
2 iy iy
(log(Pj )) p λ(m)m min , dy
log(Pj )⩽|y|⩽X p∈P X
X 2 y2
j
Pj+1 ⩽m⩽ 2X
P j
2
Pj2 h2 1
Z X
≪ λ(m)miy min , dy.
(log(Pj )2 log(Pj )⩽|y|⩽X X
X 2 y2
Pj+1 ⩽m⩽ 2X
P j
53
Or, en faisant en découpant en sous-ensembles dyadiques (de la même manière qu’au dessus) et en
appliquant le lemme V.4, on montre que :
2
Pj2 h2 1 h2
Z X
iy
λ(m)m min , dy ≪ .
(log(Pj )2 log(Pj )⩽|y|⩽X X
X 2 y2 Pj2
Pj+1 ⩽m⩽ 2X
P j
Pour gérer la contribution |y| ⩽ log(Pj ) à Ij , on utilise le lemme V.3 qui nous dit que :
X X
λ(m)miy ≪ .4
X
Pj (log(X)10
Pj+1 ⩽m⩽ 2X
P j
2 2
h2 1 h2
Z X X
2 iy iy
(log(Pj )) p λ(m)m min , dy ≪ .
|y|⩽log(Pj ) p∈P X
X 2 y2 log(X)−19
j
Pj+1 ⩽m⩽ 2X
P j
h2
Ainsi on obtient que Ij ≪ . Donc en tout :
(log(Pj )2
2
2X
Xh2
Z X
λ(n) dx ≪ .
X log log(h)
x<n⩽x+h
3
On obtient ainsi le théorème demandé pour h ⩾ exp (log(X)) 4 .
— Deuxième démonstration :
On va maintenant affiner un peu plus les arguments pour obtenir le résultat recherché pour h ⩾
10
exp (10(log log(X) 9 ), comme on a déjà montré le résultat dans la première démonstration pour h ⩾
3 10 3
exp(log(X) 4 ), on va supposer que h ∈ [exp (10(log log(X) 9 ), exp(log(X) 4 )]. On garde les mêmes nota-
tions P, Pj , Pj , J, ωP , W (P) qu’à la preuve précédente. Dans la première démonstration, on avait expliqué
notre mauvaise gestion des nombres premiers "grands". On va donc introduire des notations similaires
pour ces entiers. On note :
4 9
— Q, l’ensemble des nombres premiers appartenant à [exp (log(X) 5 ), exp (log(X) 10 )],
4
— Pour tout k : Qk = Q ∩ [Qk , Qk+1 ] où Qk = 2k exp(log(X) 5 ),
9 4
10 −log(X) 5
— Q = log(X) log(2) ,
4. L’exposant 10 sur le log n’est pas obligatoire, on le choisi (et le lemme V.3 nous permet de le faire) suffisamment
grand pour qu’à la fin on puisse négliger ce terme.
54
où
Q X
X X
∀y ∈ R, ∀j ∈ {0, . . . , J} : Aj (y) = λ(q)q iy λ(m)miy .
k=0 q∈Qk X
⩽m⩽ P2X
Pj+1 Qj+1 Q j k
X
De la même manière qu’à la première preuve, on a an = 0 en dehors de 4 , 8X et pour tout n ∈ [X, 2X],
on a an = λ(n)ωP (n)ωQ (n). Montrons maintenant que :
X 1 1
(ωP (n)ωQ (n) − W (P)W (Q))2 ≪ XW (P)2 W (Q)2 + . (V.2)
W (P) W (Q)
X⩽n⩽2X
On aurait envie d’utiliser II.22 mais cela n’est pas possible directement dans notre cas, par contre on
peut adapter sa preuve pour montrer V.2. Pour cela on remarque que :
X
(ωP (n)ωQ (n) − W (P)W (Q))2
X⩽n⩽2X
X X
= (ωP (n)ωQ (n))2 − 2W (P)W (Q) (ωP (n)ωQ (n)) + XW (P)2 W (Q)2
X⩽n⩽2X X⩽n⩽2X
X
≪ (ωP (n)ωQ (n)) − XW (P) W (Q)2 .
2 2
X⩽n⩽2X
1p1 q1 |n 1p2 q2 |n
X X X
(ωP (n)ωQ (n))2 =
X⩽n⩽2X n∈N p1 ,p2
q1 ,q2
Donc en insérant cette estimation dans l’estimation précédente, on obtient bien V.2. On va pouvoir
reprendre maintenant le même cheminement que dans la première démonstration. Pour cela on pose
pour tout j ∈ {0, . . . , J} :
2
X
h2 1
Z X
2 iy 2
Ij = (log(Pj )) p |Aj (y)| min , dy.
−X p∈P X 2 y2
j
Le second terme ici est satisfaisant, on va donc maintenant s’attarder sur l’estimation de Ij . Soit
j ∈ {0, . . . , J} fixé. De la même manière qu’à la preuve précédente, la contribution de |y| ⩽ log(Pj )
est gérée facilement. Il ne reste plus qu’à gérer la contribution de |y| ∈ [log(Pj ), X]. Malheureseument,
X
on ne peut pas appliquer directement le lemme V.3 pour borner piy car ici p peut être inférieur à
p∈Pj
2
exp log(X) 3 +δ . Pour contrer ce problème, on va encore séparer en deux l’ensemble des |y| ∈ [log(Pj ), X]
55
. Pour cela, on pose :
X Pj
Ej = y ∈ R : log(Pj ) ⩽ |y| ⩽ X, piy ⩾ .
(log(Pj ))2
p∈P|
X Pj
piy ⩽
(log(Pj ))2
p∈P|
2
h2 1 h2 W (Q)2
Z X
2 iy 2
(log(Pj )) p |Aj (y)| min , dy ≪ .
Ej p∈P X 2 y2 (log(Pj ))2
j
X Pj
— On va maintenant regarder la contribution des y ∈ Ej . Par l’estimation : 1≪ , on a :
log(Pj )
p∈Pj
2
h2 1 Pj2 h2
Z X Z
2 iy 2 2
(log(Pj )) p |Aj (y)| min , dy ≪ |Aj (y)| dy,
Ej p∈P X 2 y2 X2 Ej
j
2 2
2 Z
h X X
≪ Pj2 W (Q)2 max (log Qk )2 q iy λ(m)miy dy,
X 2 k∈{0,...,Q} Ej q∈Q X
k
Pj+1 Qk+1 ⩽m⩽ P2X
j Qk
où la deuxième ligne a été obtenue avec les mêmes manipulations que dans la preuve précédente.
Ainsi d’après le lemme V.3,
2
h2 1
Z X
2 iy 2
(log(Pj )) p |Aj (y)| min , dy
Ej p∈P X 2 y2
j
2
Pj2 W (Q)h2
Z X
≪ max Q2 λ(m)miy dy.
(log(Pj )2 X 2 k∈{0,...,Q} k Ej X
Pj+1 Qk+1 ⩽m⩽ P2X
Qj k
10 3
Or comme h ∈ [exp (10(log log(X) 9 ), exp(log(X) 4 )], on a pour ε > 0 : Pj ∈ [log(X)7 , X ε ]. Ainsi
d’après V.5 :
log(X)
1+ log(P 3
mes(Ej ) ≪ (log(Pj ))2 (log(X)) j) ≪ X 7 +ε .
56
Donc d’après le lemme V.6 :
2
Pj2 W (Q)h2
Z X
max Q2 λ(m)miy dy,
(log(Pj )2 X 2 k∈{0,...,Q} k Ej X
Pj+1 Qk+1 ⩽m⩽ P2X
j Qk
Pj2 W (Q)h2 √
X X
≪ max Q2 + mes(Ej X log(X) ,
(log(Pj )2 X 2 k∈{0,...,Q} k Qk Pj Pj Qk
W (Q)2 h2
≪ .
(log(Pj ))2
On en déduit que :
2
h2 1 h2 W (Q)2
Z X
2 iy 2
(log(Pj )) p |Aj (y)| min , dy ≪ .
Ej p∈P X 2 y2 (log(Pj ))2
j
10
On obtient ainsi une nouvelle démonstration du résultat pour h ⩾ exp 10 log log(X) 9 . □
La preuve effectuée par Matomäki et Radziwiłł constitue en soi une généralisation du raisonnement
(en particulier des ingrédients nécessaires pour passer de la première à la seconde preuve).
Pour les applications on va d’abord présenter les résultats obtenus par Matomäki et Radziwiłł. Le
premier résultat est le théorème V.7. Les autres sont les théorèmes suivants :
Théorème V.9
Pour prouver ces deux résultats, Matomäki et Radziwiłł ont d’abord établi ces mêmes résultats mais
en se restreignant à un espace "dense" S. On va prendre les notations suivantes : soit η ∈]0, 1/6[, on
considère une suite d’intervalles ([Pj , Qj ])j telle que :
p
— Q1 ⩽ exp ( log(X)),
— "les intervalles ne sont pas trop loin l’un de l’autre" c’est-à-dire :
log log(Qj ) η
∀j : ⩽ 2.
log log(Pj−1 ) − 1 j
57
— "les intervalles sont quand même un petit peu espacés" c’est-à-dire :
η
∀j : log(Pj ) ⩾ 8 log(Qj−1 ) + 16 log(j).
j2
On peut très bien construire une suite ([Pj , Qj ])j qui vérifie ces conditions. Par exemple, on peut choisir
p 40
[P1 , Q1 ] tels que exp( log(X)) ⩾ Q1 ⩾ P1 ⩾ log(Q1 ) η , et on construit les autres intervalles en posant :
Théorème V.10
Soit f : N → [−1, 1] une fonction multiplicative. Soit S un ensemble comme défini ci-dessus où
η ∈]0, 16 [. Si [P1 , Q1 ] ⊂ [1, h], alors pour tout X > X(η) suffisamment grand :
2
Z 2X 1
1 1 X 1 X (log(h) 3 1
f (n) − f (n) dx ≪ 1 + 1 .
X h X 6 −η log(X) 50
X x⩽n⩽x+h X⩽n⩽2X P1
n∈S n∈S
Théorème V.11
Soit f : N → [−1, 1] une fonction multiplicative. Soit S comme ci-dessus avec η ∈]0, 16 [. Si [P1 , Q1 ] ⊂
[1, h], alors pour tout x > x(η) suffisamment grand :
2
1
!
1 X 1 X (log(Q1 ) 6 1
√ √x √
f (n1 )f (n2 ) = +O
f (n) + .
h x log(2) √ √
1
− η2 1
log(X) 100
x⩽n P112
√ 1 n2 ⩽x+h√ x x⩽n⩽2 x
x⩽n1 ⩽2 x n∈S
n1 ,n2 ∈S
Le premier résultat intéressant que l’on peut obtenir sur les entiers friables est un généralisation de
II.27 pour des petits intervalles.
5. On oubliera l’indice X ensuite mais il ne faut pas oublier que cet ensemble dépend de X.
58
Proposition V.12
Soient ψ une fonction qui tend vers +∞ en +∞ et u > 0. Alors pour presque tout x :
1
S(x, x + ψ(x); x u ) ∼ ρ(u)ψ(x).
x→+∞
1
Démonstration : On pose f : N → C la fonction qui vérifie f (n) = 1 si n est x u -friable et 0 sinon.
Par définition et en appliquant V.7 avec h = ψ(x) et X = x, on a :
1
X ψ(x) X
′ log log(ψ(x))
S(x, x + ψ(x); x ) =
u f (n) = f (n) + O δ + C .
x log(ψ(x))
x⩽n⩽x+ψ(x) x⩽n⩽2x
Or d’après II.27, on a :
X x
f (n) = xρ(u) + O .
log(x)
x⩽n⩽2x
Avant Matomäki-Radziwiłł, le résultat suivant n’avait été établi que sous l’hypothèse de Riemann.
Proposition V.13
Soit ε > 0. Il existe une constante C(ε) telle que pour tout x suffisamment grand a :
√
√ x
S(x, x + C(ε) x; xε ≫ .
log(x)3
a. Dans l’article original, le log(x) est à la puissance −4, on a une borne très légèrement meilleure.
Une variante de la proposition III.15 nous dit que pour x suffisamment grand et pour tout j ⩽ J :
√ log(Pj )
X 1
1 ⩽ (1 + δ)2 ρ x .
√ √ 2ε log(Qj )
x⩽n⩽2 x
p|n→p̸∈[Pj ,Qj ]
n xε -friable
59
Or par définition n ̸∈ S si, et seulement s’il existe j0 ∈ {1, . . . , J} tel qu’aucun facteur premier p de n
n’appartienne à [Pj0 , Qj0 ], donc :
J
X X X
1= 1.
√ √ √ √
j=1 x⩽n⩽2 x x⩽n⩽2 x
p|n→p̸∈[Pj ,Qj ] n̸∈S
n xε -friable n xε -friable
J
√ log(Pj )
X 1 X 1
1⩾ρ (1 + o(1)) − (1 + δ)2 ρ x ,
√ √ 2ε j=1
2ε log(Qj )
x⩽n⩽2 x
n∈S
n xε -friable
J
δ2
1 1 + o(1) − (1 + δ 2 )(1 − δ) −
X
=ρ .
2ε j=2
j2
Or, pour δ > 0 suffisamment petit et x suffisamment grand, cette dernière quantité est :
1.01
1
2 1
− 12 1
+2δ+ 1000 1
≫δ ρ +O h + 1 ,
ε log(x) 100
1 −13
qui est positive si on pose h = ρ ε et toujours avec δ et ε suffisamment petits. Or par l’inégalité de
Cauchy-Schwarz et l’estimation IV.1, on a :
12
12
√ X X
τ (n)2 ,
x≪
√ 1
√ √
x⩽n⩽x+h x x⩽n⩽x+h x
n xε -friable
12
√ 12 X
x log(x)3
≪
√ 1
.
√
x⩽n⩽x+h x
ε
n x -friable
60
V.4.3 Conséquences sur les signes de fonctions multiplicatives
Proposition V.14
Soit f : N → R une fonction multiplicative. Supposons qu’il existe un entier naturel n0 tel que
f (n0 ) < 0 et que f (n) ̸= 0 pour une proportion positive d’entiers n. Alors pour toute fonction ψ
qui tend vers +∞ en +∞, presque tout intervalle de la forme [x, x + ψ(x)] contient un changement
de signe de f
C’est un résultat que l’on considère optimal, car de manière probabiliste on s’attend à ce que pour tout
h > 0, il y ait une proportion positive d’intervalles [x, x+h] de longueur h sur le que f garde le même signe.
En effet, si l’on considère une suite de variables aléatoires (Xn ) i.i.d suivant une loi de Rademacher. Fixons
h ∈ N pour le moment et posons pour tout n ∈ N, l’évènement En := (Xn = Xn+1 = . . . = Xn+h = 1).
1 P
Il est facile de voir que P(En ) = h+1 . Ainsi la série n∈N P (En ) diverge donc d’après le lemme de
2
Borel-Cantelli En a lieu infiniment souvent. 6
Passons maintenant à le preuve du résultat annoncé.
Démonstration : On peut supposer sans perte de généralité que f est à valeurs seulement dans
{−1, 0, +1}. Pour cette preuve, on va admettre le fait suivant 7 :
1 X 1 X 1
Pour g = f ou g = |f | : g(n) = g(n) + O log(X)− 20 +o(1) . (V.5)
X X
X⩽n⩽2X n⩽X
n∈S n∈S
Soit pν0 la plus petite puissance d’un nombre premier tel que f (pν0 ) = −1 (possible par hypothèse). Alors,
en utilisant la multiplicativité de f :
X X X
|f (n)| − f (n) ⩾ |f (n)| − f (n) + |f (pν0 )| − f (pν0 ) = 2 |f (n)| .
n⩽X n⩽ pXν n⩽ pXν
n∈S 0 0
n∈S n∈S
p0 ̸|n p0 ̸|n
2
Z 2X 1
1 1 X 1 X (log(h) 3 1
g(n) − g(n) dx ≪ 1 + 1 .
X h X 6 −η log(X) 50
X x⩽n⩽x+h X⩽n⩽2X P1
n∈S n∈S
6. Il y a ici un léger abus car les En ne sont pas indépendants pour appliquer le lemme de Borel-Cantelli, pour contrer
cela on considère plutôt les évènements E0 , Eh+1 , . . . , En(h+1) , . . . mais cela ne change pas le résultat final.
7. Ce fait vient de différents résultats sur les moyennes sur des intervalles de tailles "moyennes" qu’on a décidé de ne
pas traiter ici. On pourra trouver des éléments de démonstration au lemme 5 de [MatomÃďki2016multiplicative]
61
Donc en utilisant ce résultat, V.5, et par inégalité triangulaire, on montre que :
2
Z 2X 1
1 1 X (log(h) 3 1
|f (n)| − f (n) ≪ + 1 .
X h (1−δ)( 16 −η )
X x⩽n⩽x+h h log(X) 50
n∈S
n∈S
Donc f est négative sur presque tous les intervalles de la forme [x, x + h]. De la même manière, on peut
montrer que :
1
X (log(h) 3 1
|f (n)| + f (n) ≫ hpour tous sauf ≪ + 1 entiersx ∈ [X, 2X].
(1−δ)( 16 −η ) log(X)
x⩽n⩽x+h h 50
n∈S
Donc f est positive sur presque tous les petits intervalles. Donc presque tous les petits intervalles com-
prennent un changement de signe de f . D’où le corollaire. □
Proposition V.15
Proposition V.16
Soit f : N → [−1, 1] une fonction complètement multiplicative telle qu’il existe n0 > 0 tel que
f (n0 ) < 0. Alors pour tout h ∈ N∗ , il existe δ(h) > 0 tel que pour tout x suffisamment grand
1 X
f (n)f (n + h) ⩽ 1 − δ(h).
x
n⩽x
Démonstration : Tout d’abord comme il existe n0 > 0 tel que f (n0 ) < 0 et que f est complètement
multiplicative, on sait que f est non nulle sur n0 N∗ , ainsi f (n) ̸= 0 pour une proportion au moins n10
d’entiers n, donc d’après la proposition précédente on sait qu’il existe une proportion strictement positive
d’entiers n tels que f (n)f (n + 1) ⩽ 0. Donc, en notant δ cette proportion on obtient :
X X
f (n)f (n + 1) ⩽ 1 ⩽ (1 − δ)x.
n⩽x n⩽x
f (n)f (n+1)>0
2
f (n)f (n + 1)f (2n)f (2n + 1)2 f (2(n + 1)) = (f (2)f (n)f (n + 1)f (2n + 1)) ⩾ 0.
62
Donc au moins un de ces trois termes est positif : f (n)f (n + 1), f (2n)f (2n + 1), f (2n + 1)f (2n + 2). Par
conséquent :
X X
f (n)f (n + 1) ⩾ (−1) ⩾ −(1 − δ)x.
n⩽x n⩽x
f (n)f (n+1)<0
X
f (n)f (n + 1) ⩽ (1 − δ)x.
n⩽x
δ
Enfin, par inégalités triangulaires successives on obtient le résultat attendu avec δ(h) = 2h pour tout
8
h⩾2 . □
Proposition V.17
Soit f : N → R une fonction complètement multiplicative. S’il existe n0 > 0 tel que f (n0 ) < 0 et
que f (n) ̸= 0 pour une proportion positive d’entiers n alors il existe une constante C > 0 telle que
√
f change de signe dans l’intervalle [x, x + C x] pour x suffisamment grand.
Démonstration : Sans perte de généralité, on peut supposer que f est à valeurs dans {−1, 0, 1}. Par
hypothèse et par V.15 f ne s’annule pas sur une proportions strictement positive d’entiers n. On pose :
1 X
S± = √ (|f (n1 )f (n2 )| ± f (n1 )f (n2 )).
h x log(2) √
x⩽n
√ 1 n2 ⩽x+h
√ x
x⩽n1 ⩽2 x
Montrons que ces deux quantités sont strictement positives pour x suffisamment grand. D’après V.9,
pour toute fonction multiplicative g : N → [−1, 1] :
2
1 X 1 X 1
√ g(n1 )g(n2 ) = g(n) + O 1 .
h x log(2) √ x √ √ log(h) 100
x⩽n
√ 1 n2 ⩽x+h
√ x x⩽n⩽2 x
x⩽n1 ⩽2 x
On obtient donc directement que S + est strictement positif pour x suffisamment grand car le premier
terme (positif) est ≫ 1 car f est non nulle sur une proportion strictement positive d’entiers n. Pour
contrôler le signe de S − , on écrit :
1 1 X 1 X 1
S− = √ (|f (n)| + f (n)) √ (|f (n)| − f (n)) + O 1 .
x x√ √ x√ √ log(h) 100
x⩽n⩽2 x x⩽n⩽2 x
Or en s’inspirant de la preuve de V.14, on montre que ces deux termes (positifs) sont ≫ 1, donc S − > 0
δ 1
8. En fait on obtient δ(h) = h
− x
puis on utilise que x est suffisamment grand pour enlever la dépendance en x.
63
pour x suffisamment grand. Or dire que S + > 0, c’est dire qu’il existe (n1 , n2 ) tel que |f (n1 )f (n2 )| +
√
f (n1 )f (n2 ) > 0, ce qui est équivalent à l’existence de n ∈ [x, x + h x] tel que |f (n)| + f (n) > 0 car f
√
est supposée complètement multiplicative. Donc il existe n ∈ [x, x + h x] tel que f (n) > 0. De même
√
S − > 0 implique qu’il existe m ∈ [x, x + h x] tel que f (m) < 0, d’où le résultat annoncé. □
64
VI Conjecture de Chowla et conjecture d’Elliott
Ceci est lié aux corrélations à k points de la fonction de Liouville par la proposition suivante :
Proposition VI.1
1
(i) |{n ⩽ x tel que λ(n + h1 ) = ε1 , . . . , λ(n + hk ) = εk }| −−−−−→ 2−k .
x x→+∞
X x
(ii) λ(n + h1 ) . . . λ(n + hk ) = ox→+∞ (x).
n=1
Démonstration : Dans cette preuve on va adopter la notation suivante, pour S ⊂ {1, . . . , k}, on
Y
posera εS = εj . On va procéder directement par équivalence : la proposition (i) est équivalente à
j∈S
1X
lim
x→+∞ x
1λ(n+h1 )=ε1 . . . 1λ(n+hk )=εk = 2−k .
n⩽x
1 + εj λ(n + hj )
Or comme on a pour tout j ∈ {1, . . . , k} : = 1λ(n+hj )=ε1 , ceci est équivalent à :
2
k
1 XY
lim (1 + εj λ(n + hj )) = 1.
x→+∞ x
j=1n⩽x
C’est-à-dire :
1X X Y
lim εS λ(n + hj ) = 1,
x→+∞ x
n⩽x S⊂{1,...,k} j∈S
65
ce que l’on peut encore réécrire :
X 1X Y
lim εS λ(n + hj ) = 1.
x→+∞ x
S⊂{1,...,k} n⩽x j∈S
Or, ici tous les termes de la somme sur S ⊂ {1, . . . , k} sont positifs donc cette dernière proposition est
équivalente à (ii) (en basculant de l’autre côté de l’égalité le terme associé à S = ∅). De facto, on vient
de prouver l’équivalence entre (i) et (ii). □
C’est sous cette deuxième forme que Sarvadaman D. S. Chowla a émis cette conjecture dans [5].
x
X
λ(n + h1 ) . . . λ(n + hk ) = ox→+∞ (x).
n=1
C’est toujours à l’heure actuelle une conjecture mais les résultats de Matomäki et Radziwiłł permettent
d’obtenir de nombreuses avancées. On va dans cette partie présenter une version "en moyenne" sur les
paramètres (h1 , . . . , hk ). Dans la partie suivante nous présenterons une autre version en moyenne. Faire
un état des avancées de la recherche de nos jours la-dessus.
k
X Y
gj (aj n + bj ) = o(X).
1⩽n⩽X j=1
Cette conjecture affirme que pour tous (ai , bi ) Q-libres deux à deux et pour toutes fonctions multiplica-
tives 1-bornées g1 , . . . , gk , on a l’asymptotique ci-dessus à part si tous les gj prétendent être un caractère
de Dirichlet tordu. Comme la fonction λ de Liouville vérifie l’hypothèse de la conjecture d’Elliott, cette
dernière implique la conjecture de Chowla. Si on veut généraliser ce résultat pour des fonctions multipli-
catives à valeurs complexes il faut remplacer l’hypothèse sur les gj par la suivante 9 :
Une première idée pour arriver à un tel résultat est de rechercher une version en moyenne sur des
paramètres de shift. En voici une version quantitative dont la preuve sera l’objet principal de cette
partie.
9. Elles sont d’ailleurs équivalentes dans le cas des fonctions gi à valeurs réelles.
66
Théorème VI.4: Conjecture d’Elliott en moyenne
k
X X Y
2 −M log log(H) 1
gj (aj n + bj + hj ) ≪ A k e 80 + + 1 H k X,
log(H) log(X) 3000
1⩽h1 ,...,hk ⩽H 1⩽n⩽X j=1
1
où M = M (gj0 ; 10AX, Q) où Q = min log(X) 125 , log(H)20 . En fait on a même légèrement mieux
en enlevant un paramètre :
X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
2 −M log log(H) 1
≪A k e 80 + + 1 H k−1 X.
log(H) log(X) 3000
Lemme VI.5
Z
Démonstration : On commence par utiliser l’identité e(nα) dα = 1n=0 pour écrire que :
S1
2
2
Z Z X
f (n)e(αn) dx dα
S1 R x⩽n⩽x+H
Z Z
f (n)f (n )f (m)f (m )1n+m−n 1x⩽n,n ⩽x+H dx 1y⩽m,m ⩽y+H dy .
X ′ ′
= ′ ′
−m =0 ′ ′
R R
n,n′ ,m,m′ ∈N
′ ′ ′
En écrivant n = n + h (i.e en faisant le changement de variable h = n − n dans la somme sur n ), on
remarque de le terme de la somme ci-dessus est nul si |h| > H. De plus, ci |h| ⩽ H, on remarque que les
67
deux intégrales écrites ci-dessus valent H − |h|. On obtient alors :
2
2
Z Z
f (n)f (n + h)f (m)f (m )1m=m′ +h (H − |h|)2
X X ′
f (n)e(αn) dx dα =
S1 R x⩽n⩽x+H |h|⩽H
′
n,m,m ∈N
2
X X
2
= (H − |h|) f (n)f (n + h) .
|h|⩽H n∈N
Lemme VI.6
√ p
Soient 10 < P1 < Q1 ⩽ X et X ⩽ X0 ⩽ X tels que Q1 ⩽ exp( log(X0 )). Alors, pour tout X
suffisamment grand :
log(P1 )
|{1 ⩽ n ⩽ X : n ̸∈ SP1 ,Q1 ,X0 ,X }| ≪ X.
log(Q1 )
Démonstration : D’après la proposition III.15, on sait que pour tout 1 ⩽ j ⩽ J et pour X suffisamment
grand, que le nombre d’entiers n ∈ [1, X] qui ne sont pas divisibles par aucun nombre premier dans
log(Pj ) 1 log(P1 )
[Pj , Qj ] est au plus : X = 2 X. Or, dire que n n’appartient pas à SP1 ,Q1 ,X0 ,X est
log(Qj ) j log(Q1 )
équivalent à dire qu’il existe j ∈ {1, . . . , J} tel que n ne possède aucun facteur premier dans [Pj , Qj ]. On
1
obtient alors par convergence de la série de terme général 2 :
j
J
X 1 log(P1 ) log(P1 )
|{1 ⩽ n ⩽ X : n ̸∈ SP1 ,Q1 ,X0 ,X }| ≪ 2 log(Q )
X≪ X.
j=1
j 1 log(Q1)
On termine par un lemme admis qu’on pourra retrouver à partir de ([6], Theorème 3.13).
Lemme VI.7
Le nombre de représentations d’un entier n qui est un O(P ) sous la forme p1 + p2 − p3 − p4 avec
P3
p1 , p2 , p3 , p4 ⩽ 2P quatre nombres premiers est O .
log(P )4
Pour certains problèmes d’arithmétique comme étudier l’asymptotique (comme le nombre de façons
d’écrire n comme une somme de s éléments de l’ensemble A), on est ramené à étudier l’asymptotique
de : Z 1
fP (x)s e−nx dx
0
68
où :
P
X j 1k
fP (x) := e(j k x) et P ⩾ nk .
j=1
Pour estimer cette intégrale de manière précise, réfléchissons un peu de manière probabiliste aux
sommes d’exponentielles. Si nous avons une famille de N nombres tirés au sort de manière uniforme
sur le cercle unité et que nous les additionnons, nous nous attendons à ce que la somme soit d’environ
√
N en module par le théorème limite central. Pour des valeurs suffisamment génériques de x ∈ [0, 1],
la collection de nombres {e(j k x)}1⩽j⩽P devrait "presque" se répartir uniformément sur le cercle unité,
du moins si P est suffisamment grand. Ainsi, pour des valeurs de x suffisamment génériques, nous nous
√
attendons à ce que fP (x) ∼ P .
Cependant, cela ne peut pas être vrai pour tous les x. Par exemple,
P
X
fP (0) = e(ik · 0) = P,
i=1
Ce qui montre en particulier que nous ne pouvons pas nous attendre à obtenir quelque chose d’utile
en bornant l’intégrale par supx |fP (x)|. Quelques expériences montrent que ce manque d’annulation se
produit assez souvent lorsque x est très proche d’un nombre rationnel avec un petit dénominateur - pas
toujours, mais assez souvent pour être préoccupant. Par exemple, si k = 2, nous constatons que fP (1/2)
est réellement borné, mais fP (1/8) ∼ CP pour une certaine constante non nulle C car les carrés sont
biaisés modulo 8 : la moitié du temps, ils sont égaux à 1 modulo 8, et un quart du temps chacun, ils sont
égaux à 0 et 4 modulo 8.
Formalisons cette intuition de la manière suivante : fixons un petit δ > 0. Définissons (en s’inspirant
du théorème d’approximation de Dirichlet I.2).
a
Ma,q = x ∈ R/Z : x − < P −k+δ ,
q
Chacun de ces ensembles est un petit intervalle autour de la fraction a/q. Nous posons
[ [
M= Ma,q .
1⩽q⩽P δ 1⩽a⩽q,(a,q)=1
Il s’agit d’une union de tous les Ma,q tels que a/q est une fraction dans R/Z avec un dénominateur
"petit" (comparé à P ).
Nous appellerons M l’ensemble des arcs majeurs. C’est la région dans laquelle nous nous attendons à
ce que la majeure partie de l’intégrale se trouve. Soit m = [0, 1] − M son complémentaire, qu’on appellera
l’ensemble des arcs mineurs, pour lesquels nous nous attendons à une certaine annulation. Ainsi le déroulé
de la méthode du cercle est toujours la suivante :
Z
— Cas des arcs majeurs : Évaluer fP (x)e−nx dx.
M
Z
— Cas des arcs mineurs : Montrer que fP (x)e−nx dx est petit par rapport à ce qui précède.
m
Voyons maintenant comment l’adapter à notre contexte. L’objectif est de démontrer le résultat sui-
vant :
69
Théorème VI.8
1 1
Soient X, H, W ⩾ 10 tels que (log(H))5 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
M (g; X, Q)
multiplicative 1-bornée telle que W ⩽ exp . Soit enfin S = SP1 ,Q1 ,√X,X où P1 =
3
W 200 et Q1 = WH3 . Alors pour tout α ∈ S1 , on a :
Z 1
log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
1 HX.
R x⩽n⩽x+H W4
Nous allons appliquer la méthode du cercle dans un cas plus simple où la fonction g est supposée
complètement multiplicative et duquel on déduira ensuite le théorème VI.8 :
Proposition VI.9
1 1
Soient X, H, W ⩾ 10 tels que (log(H))5 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
M (g; X, W )
complètement multiplicative 1-bornée telle que W ⩽ exp . Soient enfin d ∈ N tel
3
200 H
que d < W et S = SP1 ,Q1 ,√X, X où P1 = W et Q1 = W 3 . Alors pour tout α ∈ S1 , on a :
d
Z 1
1 log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
3 1 HX.
R x x+H d4 W4
d ⩽n⩽ d
Z
HX
1S g(n)e(αn) dx ≪
X
Si q < W alors : 1 .
R x x+H dW 4
d ⩽n⩽ d
70
VI.3.3 Mise en place de la méthode du cercle
On suppose dans cette partie que q > W . On va montrer que pour toute fonction θ : R → C 1-bornée
mesurable dont le support contient [0, X] que :
Z 1
1 log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
θ(x) 3 1 HX.
R x x+H d4 W4
d ⩽n⩽ d
Soient θ un telle fonction et P l’ensemble des nombres premiers dans [P1 , Q1 ]. Par définition de S, tout
élément de n ∈ S possède au moins un facteur premier dans P. De plus si n = mp pour p ∈ P, alors il y
a autant de nombres premiers dans P divisant n que de nombres
premiers dans P divisant m auxquels
X
on ajoute 1p̸|m . Ainsi en notant S l’ensemble des n ∈ 1;
′
qui ont au moins un facteur premier dans
d
chaque [Pj , Qj ] pour 2 ⩾ j ⩽ J, on obtient la relation :
1S ′ (mp)
1S (n) =
X
.
1
p∈P,m:mp=n p̸|m
+ |{q ∈ P : q|m}|
En effet, cette relation est évidente si n ̸∈ S et on vient de la démontrer quand n ∈ S. Ainsi en utilisant
cette relation et par complète multiplicativité de g, il nous suffit de montrer :
X X 1 ′ (mp)g(m)g(p)e(mpα) Z 1
1 log(H) 4 log log(H)
S
θ(x)1 x ⩽mp⩽ x+H dx ≪ 3 HX.
p∈P m
1p̸|m + |{q ∈ P : q|m}| R d d
d4 W4
1
On va encore simplifier le problème en recouvrant P par des intervalles de la forme [P, 2P ] où P est
une puissance de 2 et P1 ≪ P ≪ Q. On remarque que (la dernière estimation étant obtenue car W est
négligeable devant H) :
X 1 log(Q1 )
≪ log ≪ log log(H).
log(P ) log(P1 )
P1 ⩽P ⩽Q1
P =2j
Ainsi, quitte à sommer sur des tels P , il nous suffit de montrer la relation suivante :
X 1 ′ (mp)g(m)g(p)e(mpα) Z 1 log(H) 4
1
X 1 ′ (mp)g(m)g(p)e(mpα) Z
θ(x)1 x ⩽mp⩽ x+H dx
X
S
p∈P m
1 p̸|m + |{q ∈ P : q|m}| R
d d
P ⩽p⩽2P
X 1 ′ (mp)g(m)g(p)e(mpα) Z
θ(x)1 x ⩽mp⩽ x+H dx
X
S
≪
m
1 + |{q ∈ P : q|m}| R
d d
p∈P
P ⩽p⩽2P
1S ′ (mp)g(m)g(p)e(mpα)
Z
θ(x)1 x ⩽mp⩽ x+H dx.
X X
+
1 + |{q ∈ P : q|m}| R
d d
p∈P m, p|m
P ⩽p⩽2P
71
Et on peut contrôler sans trop de difficultés le deuxième terme de la somme :
1S ′ (mp)g(m)g(p)e(mpα)
Z
X HX
θ(x)1 x ⩽mp⩽ x+H dx ≪
X X X X
H≪P H≪ .
1 + |{q ∈ P : q|m}| R
d d dP 2 dP
p∈P m, p|m p∈P X
m⩽ dP
P ⩽p⩽2P P ⩽p⩽2P p|m
X 1 ′ (mp)g(m)g(p)e(mpα) Z 1 log(H) 4
1
m
1 + |{q ∈ P : q|m}| R
d d
p∈P
P ⩽p⩽2P
Z
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx
X X
≪
d d
X p∈P R
m⩽ dP
P ⩽p⩽2P
1
4 4
34 Z
X
1mp⩽ Xd g(p)e(mpα) θ(x)1 x ⩽mp⩽ x+H dx
X X
≪
.
dP
R
d d
X
m⩽ dP p∈P
P ⩽p⩽2P
Θ(x1 , x2 , x3 , x4 ) = θ(x1 )θ(x2 )θ(x3 )θ(x4 ) et G(p1 , p2 , p3 , p4 ) = g(p1 )g(p2 )g(p3 )g(p4 ).
H 1
On remarque que la somme sur m est un O min , . De plus, cette somme
p ∥p1 + p2 − p3 − p4 ∥
est nulle à part si x1 = O(X) et pour tout i = 2, 3, 4 xi ) xp11pi + O(H). Ainsi l’expression précédente est
72
un O XH 3 p1 ,p2 ,p3 ,p4 ⩽2P min H 1
P
p , ∥p1 +p2 −p3 −p4 ∥ . Il nous suffit donc de montrer que :
HP 3
X H 1
min , ≪ log(H) .
p ∥p1 + p2 − p3 − p4 ∥ W log(P )4
p1 ,p2 ,p3 ,p4 ⩽2P
P3
Or d’après le lemme VI.7, le nombre de termes de la somme est O log(P )4 . Il nous suffit donc de
montrer que :
X H 1 log(H)
min , ≪ H, où C est un constante positive quelconque.
p ∥p1 + p2 − p3 − p4 ∥ W
n⩽CP
q 1 1
Or par le principe des tiroirs, on sait qu’il y a au plus points entre 0 et espacés d’au moins . On
2 2 2q
en déduit que :
X H 1 H H
min , ≪ + P log(q) + + q log(q).
p ∥p1 + p2 − p3 − p4 ∥ q p
n⩽CP
H H
Or comme W 2 00 = P1 ≪ P ≪ Q1 = et W ⩽ q ⩽ on finit par avoir :
W3 W
X H 1 H H H H H H log(H)
min , ≪ + 3 log + 2 + log ≪ H.
p ∥p1 + p2 − p3 − p4 ∥ W W W W 00 W W W
n⩽CP
On va maintenant faire la preuve dans le cas où q ⩽ W , celui des arcs majeurs. En fait on va montrer
ici que :
Z
HX
1S g(n)e(αn) dx ≪
X
1 .
R x x+H dW 4
d ⩽n⩽ d
Z H
αn W d αn
1S g(n)e(αn) ≪ 1S g(n)e 1S g(n)e
X X X ′
+ dH .
x x+H x x+H
q Hq 0 x x ′
q
d ⩽n⩽ d d ⩽n⩽ d d ⩽n⩽ d +H
H ′
Fixons désormais H ∈ 0, et contrôlons :
d
Z
αn
1S g(n)e
X
dx.
R x x ′
q
d ⩽n⩽ d +H
73
En séparant en classes de résidus modulo q, on voit par inégalité triangulaire que :
Z X Z
αn αn
1S g(n)e 1S g(n)e
X X
dx ⩽ dx.
R x x ′
q R ′
q
d ⩽n⩽ d +H
b(modq) x x
d ⩽n⩽ d +H
n≡b[q]
(b, q)
Supposons que n ≡ b[q], on peut écrire q = d0 q0 , b = d0 b0 et n = d0 m où on a posé d0 = et où
n
q0 , b0 et m sont des entiers vérifiant : m ≡ b0 [q0 ]. De plus, comme g est complètement multiplicative et
que d0 ⩽ q ⩽ W ⩽ P1 on a :
1
1m≡b0 [q0 ] (m) =
X
χ(b0 )χ(m).
φ(q0 )
χ mod q0
Ainsi on obtient :
Z Z
αn 1
1S g(n)e 1Sd g(m)χ(m) dx
X X X X
dx ⩽
R ′
q φ(q0 ) R ′
x x b mod q χ mod q0
d ⩽n⩽ d +H
x x
dd0 ⩽m⩽ dd +H
d0
0
Z
d0
1Sd g(m)χ(m) dy.
X X X
⩽d
φ(q0 ) R ′
b mod q χ mod q0
y⩽m⩽y+ H
d0
Z Z
αn d0
1S g(n)e 1Sd g(m)χ(m) dy
X X X X
dx ≪ d
R ′
q φ(q0 ) y> WX1 0 ′
x x b mod q χ mod q0
d ⩽n⩽ d +H y⩽m⩽y+ H
d0
X ′
+ dq 10
H .
W
X 2X
Il nous reste à estimer l’intégrale pour ⩽y⩽ , pour cela on va procéder comme d’autres fois
W 10 dd0
déjà : on va découper cette intervalle en blocs dyadiques. Pour tout j ∈ {0, . . . , J}, on pose :
$ %
j+
log ( WX1 0 )
log(2) 2X
Xj = 2 , où J est l’entier j maximal tel que Xj ⩽ .
dd0
1
On fixe désormais j ∈ {0, . . . , J}. D’après le théorème ?? avec η = , on a :
20
2 ′ 13
H ′2
Z Xj+1 log d0 1 H
1Sd g(m)χ(m) dy ≪
X
−M (gχ;Xj )
e + + Xj .
Xj ′ P16
1 1
− 20 log(Xj )
1
50 d20
y⩽m⩽y+ H
d 0
74
′
200 H
Or comme P1 = W , et W ⩾ log(H)5 , on a :
d0
′ 31
H
log d0 1 1 1
1 1 ≪ et 1 ≪ 5 .
P16 − 20 W 20 log(Xj ) 50 W2
1
e−M (gχ;Xj ) ≪ 5 .
W2
Z Xj+1 ′
1 H
1Sd g(m)χ(m) dy
X
5 Xj .
Xj ′ W 4 d0
y⩽m⩽y+ H
d 0
Z J ′
αn HX d0 H qHX
1S g(n)e
X X X X
dx ≪ 3
+ d 5 Xj ≪ .
R x x ′
q dW j=0
φ(q 0)
b mod q χ mod q0
d0 W 4 dW 5/4
d ⩽n⩽ d +H
Z Z H
qHX W d qHX HX
1S g(n)e(αn) dx ≪
X ′
+ 5 dH ≪ 1 .
R x x+H
dW 5/4 Hq 0 dW 4 dW 4
d ⩽n⩽ d
On va maintenant déduire l’estimation de cette même quantité dans le cas général où la fonction
considérée n’est pas forcément complètement multiplicative, c’est-à-dire du théorème VI.8.
Démonstration : On considère la fonction complètement multiplicative g1 : N → C 1-bornée définie
par pour tout p : g1 (p) = g(p). Comme on l’a déjà vu précédemment, on voit que : g = g1 ∗ h où
h = g ∗ µg1 . De plus pour tout p premier et pour tout j ⩾ 2, h(p) = 0 et h pj ⩽ 2. Avec cette écriture
de g on peut écrire :
Z +∞ Z
1S g(n)e(αn) dx ≪ 1S (dm)g1 (m)e(αdm) dx.
X X X
|h(d)|
R x⩽n⩽x+H d=1 R x x+H
d ⩽m⩽ d
75
On va séparer la somme sur d en deux : occupons-nous d’abord du cas où d ⩾ W .
+∞
HX X |h(d)|
Z
HX
1S (dm)g1 (m)e(αdm) dx ≪
X X X
|h(d)| |h(d)| ≪ 1 3 .
R x+H
d W 4 d=1 d 4
d⩾W x d⩾W
d ⩽m⩽ d
3
Or comme on l’a déjà vu précédemment, la série de Dirichlet de h en converge absolument. On en
4
déduit que :
Z
HX
1S g(n)e(αn) dx ≪
X
1 .
R x⩽n⩽x+H W4
Considérons maintenant le cas où d < W . Dans ce cas d < P1 et alors pour tout m ∈ N on a :
1S (dm) = 1SP1 ,Q1 ,√X, X (m) := 1S ′ (m). Donc en utilisant la proposition dans le cas particulier où g est
d
complètement multiplicative (VI.9) :
Z Z
1S (dm)g1 (m)e(αdm) dx ≪ 1S ′ g1 (m)e(αdm) dx
X X X X
|h(d)| |h(d)|
d<W R x x+H d<W R x x+H
d ⩽m⩽ d d ⩽m⩽ d
+∞ 1
X |h(d)| log(H) 4 log log(H)
≪ 3 1 HX.
d=1
d4 W4
On en conclut que :
Z 1 1
HX log(H) 4 log log(H) log(H) 4 log log(H)
1S g(n)e(αn) dx ≪
X
1 + 1 HX ≪ 1 HX.
R x⩽n⩽x+H W4 W4 W4
On commence par montrer une "conjecture d’Elliott en moyenne tronquée" pour le cas d’une seule
fonction multiplicative. On se ramènera à cette proposition dans la preuve de la "vraie" conjecture
d’Elliott en moyenne tronquée.
Proposition VI.10
1 1
Soient X, H, W ⩾ 10 tels que (log(H))20 ⩽ W ⩽ min H 250 , (log(X)) 125 et soit g une fonction
M (g; X, W )
multiplicative 1-bornée telle que W ⩽ exp . Soit S = SP1 ,Q1 ,√X,X où P1 = W 200 et
3
Q1 = WH3 . Alors on a :
2
HX 2
1S g(n)1S g(n + h) ≪
X X
1 .
1⩽h⩽H 1⩽n⩽X
W5
Z 1
log(H) 4 log log(H) HX
1S g(n)e(αn) dx ≪
X
sup 1 HX ≪ 1 .
α∈S1 R x⩽n⩽x+H W 4 W5
76
On en déduit que :
2
H 2X
Z
1S g(n)e(αn) dx ≪
X
sup 1 .
α∈S1 R x⩽n⩽x+H W5
X 2
H 3X 2
1S g(n)1S g(n + h) ≪
X X
2
(2H − |h|) 1 .
|h|⩽2H n=1 W5
Théorème VI.11
1 1
Soient X, H, W, A ⩾ 10 tels que (log(H))20 ⩽ W ⩽ min H 500 , (log(X)) 125 et soient g1 , . . . , gk des
fonctions multiplicatives 1-bornées. On suppose qu’il existe j0 ∈ {1, . . . , k} tel que :
M (gj0 ; 10AX, Q)
W ⩽ exp .
3
Soient ensuite a1 , . . . , ak , b1 , . . . , bk tels que pour tout j ∈ {1, . . . , k} aj ⩽ A et bj ⩽ 3AX. Soit enfin
√
H
S = SP1 ,Q1 ,√10AX,10AX où P1 = W 200 et Q1 = W3 . Alors on a :
k
kA2 H k−1
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪
X X Y
1 X.
1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2
W 20
k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪ H k−1 X.
X X Y
1 1
Ainsi si W 20 ⩾ kA2 le résultat est trivial, on peut donc supposer désormais que W 20 < kA2 . Un principe
récurrent lors de cette démonstration est d’effectuer des changements d’indices dans les sommes qui vont
apparaître mais sans changer les bornes. Cela va faire apparaître une erreur qui sera contrôlée par le
nombre de termes qui sont apparus multipliée par la borne supérieure de ce qu’il y a dans la somme. De
h
plus, quand le changement d’indice sera de la forme h → , on ignorera les conditions de divisibilité qui
a
apparaîtront.
— Première étape : Se ramener à un cas où les rôles des gj sont symétriques (1 ⩽ j ⩽ k).
77
Si on fait le changement de variable n → n + h1 puis les changements de variables hj → hj − aj h1 on a :
k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y
k
1S g1 (a1 n + b1 + a1 h1 ) 1S gj (aj n + bj + hj ) + H k−1 H + kH k−2 H X.
X X Y ′ ′
≪
1⩽h2 ,...,hk ⩽X 1⩽n⩽X j=2
( ′
)
H
Puis en moyennant sur h1 ∈ 1, . . . , , on arrive à :
A
k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y
h1
Enfin, par le changement d’indice h1 → , on obtient :
a1
k
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj )
X X Y
Or on a :
′
H k
1S gj (aj n + bj + hj )
X X X Y
Nous avons donc obtenu une situation symétrique en les gj . On peut donc supposer désormais que j0 = 1.
78
Par inégalité triangulaire, il suffit de démontrer que :
H k
A
1S gj (aj n + bj + hj ) ≪
X X Y ′
∀h2 , . . . , hk ∈ {1, . . . , H} : 1 H X.
h1 =0 1⩽n⩽X j=1
W 20
k
1S gj (aj n + bj + hj ). Montrons que :
Y
— Deuxième étape : Posons pour tout n ∈ N : G(n) =
j=2
H
A
1S g1 (a1 n + b1 + h1 )G(n) ≪
X X ′
∀h2 , . . . , hk ∈ {1, . . . , H} : 1 H X.
h1 =1 1⩽n⩽X
W 20
Et on peut écrire :
2 2
X j k X
1S g1 (n + h1 )1S g1 (n′ + h1 ) 1S g1 (n + h1 )1S g1 (n + h1 ) .
′ X X ′
H − |h1 | =
|h1 |<H ′ n∈Z n,n′ ∈Z 1⩽h1 ⩽H ′
79
tel que :
1 M
log(H0 ) = min log(X) 3000 log log(X), exp M .
80
— Premier cas : H ⩽ H0 .
√
20 2 H
On pose W = log(H) , P1 = W 00, Q1 == et S = SP1 ,Q1 ,√10AX,10AX . D’après la proposition
W3
VI.11 :
k
kA2 H k−1
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) ≪
X X Y
X.
j=2
log(H)
1⩽h2 ,...,hk ⩽X 1⩽n⩽X
X log(P1 ) log(W )
1 ≪ AX ≪ AX .
log(Q1 ) log(H)
n⩽10AX
n̸∈S
X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
k
log(W )
1S g1 (a1 n + b1 ) 1S gj (aj n + bj + hj ) + H k−1 kAX
X X Y
≪ ,
j=2
log(H)
1⩽h2 ,...,hk ⩽X 1⩽n⩽X
kA2 log(W )
≪ H k−1 X + H k−1 kAX ,
log(H) log(H)
M log log(H) 1
≪ A2 k e− 80 + + 1 H k X.
log(H) log(X) 3000
On va se ramener au cas précédent. Pour cela on subdivise [1, H] en segments de taille H0 et dans chaque
segment on se ramène à une sommation de la forme 1 ⩽ h2 , . . . , hk ⩽ H0 11 :
X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
X X X k
Y
≪ g1 (a1 n + b1 ) gj (aj n + bj,l + hj ) ,
1⩽h2 ,...,hk ⩽H0 1⩽n⩽X j=2
j k
H
0⩽l⩽ H0
H
où pour tous j, l : bj,l = bj +lH0 . Comme pour tout l ⩽ , lH0 ⩽ AX, on peut appliquer le théorème
H0
11. Les changements d’indices font apparaître le terme négligeable H0k−1 .
80
?? dans le cas où H ⩽ H0 . On obtient alors (où M0 désigne la valeur de M si l’on remplace H par H0 ) :
X X k
Y
g1 (a1 n + b1 ) gj (aj n + bj + hj )
1⩽h2 ,...,hk ⩽H 1⩽n⩽X j=2
H 2 M
− 800 log log(H0 ) 1
≪ A k e + + 1 H0k X
H0 log(H0 ) log(X) 3000
2 −M log log(H) 1
≪A k e 80 + + 1 H k X.
log(H) log(X) 3000
81
VII Conjectures de Chowla et d’Elliott en moyenne logarith-
mique
Proposition VII.2
Soit f une fonction arithmétique. Si elle possède une moyenne alors elle possède une moyenne
logarithmique et elles sont égales. La réciproque est fausse.
Démonstration : Le premier fait est une conséquence directe de la formule de sommation par parties.
Pour le sens réciproque, on a déjà vu que la fonction multiplicative n 7→ nit ne possédait pas de valeur
moyenne pour t ̸= 0. Par contre elle possède une moyenne logarithmique car pour tout x ⩾ 1 :
X Z x Z x
it−1 it−1 it−2
n = u du + O (it − 1)u du .
n⩽x 1 1
En fait la moyenne logarithmique ne prend pas en compte les oscillations de nit lorsque n est grand ce
qui donne une plus grande perméabilité quant à l’admission de moyenne logarithmique.
82
Théorème VII.3
D(g1 ; n 7→ χ(n)nit , x) ⩾ A.
Alors :
X 1
g1 (a1 n + b1 )g2 (a2 n + b2 ) ⩽ ε log(ω).
x n
ω <n⩽x
Proposition VII.4
Pour établir le théorème VII.3, il suffit de le faire pour g1 à valeurs dans le cercle unité
Démonstration : On suppose que pour tout n ∈ N : |g1 (n)| ⩽ 1. On factorise g1 sous la forme
′ ′′ ′ ′′
g1 = g1 g1 où g1 = |g1 | et g1 à valeurs dans ∈ S1 . Soit A0 une quantité suffisamment grande (dépendant
de a1 , a2 , b1 , b2 , ε) que l’on ajustera plus tard.
X 1 − g ′ (p)
1
— Premier cas : ⩾ A0 .
p
p⩽x
Ce premier cas est simple a traiter cas il se fait directement sans se servir de l’hypothèse que le théorème
′′
VII.3 est vrai pour g1 . En effet
h d’après
i le deuxième théorème de Mertens (II.19) et pour A0 suffisamment
1
grand, on a pour tout y ∈ x A0 , x :
X 1 − g ′ (p) A0
1
⩾ .
p 2
p⩽y
On obtient le théorème VII.3 dans ce cas-ci après une sommation par parties.
X 1 − g ′ (p)
1
— Deuxième cas : < A0 .
p
p⩽x
Dans ce cas-ci on va adopter un point de vue probabiliste. C’est quelque chose qu’on fera plusieurs fois
d’ici la fin du rapport et cela est surtout utile pour simplifier certains arguments. Pour tout p premier
′ ′
et pour tout j, on introduit g1 pj une variable aléatoire d’espérance g1 pj à valeurs dans S1 et qui
forment une famille d’évènements indépendants. On introduit alors pour tout n ∈ N de décomposition
αk ′ Qk ′ ′
en facteurs premierspα αi j
1 . . . pk , g1 (n) = i=1ig1 (pi ). Par indépendance des variables aléatoires g1 p
1
′
h ′ ′
et par multiplicativité de gi , on a : E g1 (n) = g1 (n). D’après l’inégalité de Markov et par hypothèse
83
dans ce deuxième cas :
X 1 − g′ (p) 1
1
P > A20 ⩽ .
p A0
p⩽x
X 1 − g′ (p)
1
1
Donc ⩽ A20 avec probabilité 1 − O . On se restreint pour le moment à cet évènement.
p A0
p⩽x
′ ′′
On pose g1 = g1 g1 , ainsi g1 est multiplicative, à valeurs dans S1 et de moyenne g1 . Par hypothèse de
"non-prétentieusité" de g1 et inégalité triangulaire, on obtient pour tout A suffisamment grand devant
A0 :
X 1 − Re g1 (p)χ(p)p−it A
⩾ .
p 2
p⩽x
X 1 − g′ (p)
1
1
Si on suppose vrai le théorème VII.3 pour g1 ∈ S , alors dans l’évènement ⩽ A20 :
p
p⩽x
Remarquons qu’un argument similaire permet de se ramener au cas où g2 aussi est aussi à valeurs dans
le cercle unité. En effet, le travail est même plus simple car l’hypothèse de "non-prétentieusité" de g1
n’est pas affectée par le choix de g2 . On continue par :
Proposition VII.5
Démonstration : Les précédentes réductions nous permettent déjà de pouvoir supposer que g1 et g2
1
sont à valeurs dans S . On introduit la fonction multiplicative g˜1 par pour tout p premier g˜1 (p) = g1 (p).
On définit h comme la fonction multiplicative qui vérifie : g˜1 ∗ h = g1 , on a déjà vu que pour tout p
premier que pour tout j, on a : h(p) = 0 et h pj ⩽ 2. Comme dans la preuve précédente, on choisi une
quantité A0 qui sera suffisamment grande devant a1 , a2 , b1 , b2 , ε et on suppose que A est suffisamment
84
grand devant toutes ces quantités. On peut alors écrire :
a1 n+b1
X 1 X X g̃ d g2 (a2 n + b2 )
g1 (a1 n + b1 )g2 (a2 n + b2 ) = h(d) .
x n x n
ω <n⩽x d∈N ω ⩽n⩽x
d|a1 n+b1
ε
Donc en appliquant le théorème VII.3 à g˜1 en prenant 2A0 plutôt que ε, on obtient :
a1 n+b1
X g̃1 d g2 (a2 n + b2 ) ε
⩽ log(ω).
x n 2A0
ω ⩽n⩽x
d|a1 n+b1
Or en développant en produit eulérien h (comme on a déjà fait dans ce rapport), on montre que la série
h(k)
de terme général 2 , k ∈ N converge absolument et donc :
k3
X |h(d)| −1
≪ A0 3 .
d
d>A0
On en déduit que :
a1 n+b1
X X g̃1 d g2 (a2 n + b2 ) log(ω)
h(d) ≪ 1 .
x n A03
d>A0 ω ⩽n⩽x
d|a1 n+b1
Comme précédemment, on peut facilement refaire le même argument pour se ramener au cas où g1 , g2
sont complètement multiplicatives et à valeurs dans le cercle unité. On présente désormais le théorème
auquel on s’est ramené pour démontrer le théorème VII.3 :
85
Théorème VII.6: (Réduction du problème)
1
Soient a ∈ N, b ∈ Z et h ̸= 0. Soit ε > 0 et soit A suffisamment grand devant a, b, h et .
x
ε
Soit x ⩾ log(x) ⩾ ω ⩾ A et soient g1 , g2 : N → S1 deux fonctions complètement multiplicatives.
Supposons que g1 est non-prétentieuse, c’est-à-dire pour tout caractère de Dirichlet χ de module au
plus A et pour tout t ∈ [−Ax, +Ax] :
D(g1 ; n 7→ χ(n)nit , x) ⩾ A.
Alors :
X 1
g1 (an + b)g2 (an + b + h) ⩽ ε log(ω).
x n
ω <n⩽x
Proposition VII.7
Démonstration : Déjà par les réductions précédentes, on peut supposer que g1 et g2 sont complètement
multiplicatives et à valeurs dans S1 , on a pour tout n ∈ N :
g1 (a1 n + b1 )g2 (a2 n + b2 ) = g1 (a2 )g2 (a1 )g1 (a1 a2 n + a2 b1 )g2 (a1 a2 n + a1 b2 ).
≪ ε log(ω).
1 x
a, b, h ≪ ≪ H− ≪ p ≪ H ≪ H+ ≪ A ⩽ ω ⩽ ⩽ x.
ε2 log(x)
86
x
x⩾n⩾ ⩾ log(x) ⩽ log(A) ≪ H+ .
ω
Par hypothèse, il existe x ⩾ ω ⩾ A et g1 , g2 : N → S1 complètement multiplicatives tels que pour
tout caractère de Dirichlet χ de module au plus A et pour tout |t| ⩽ Ax :
D(g1 ; n 7→ χ(n)nit , x) ⩾ A,
et tels que :
X 1
g1 (an + b)g2 (an + b + h) > ε log(ω). (VII.1)
x n
ω <n⩽x
Proposition VII.8
Pour tout H− ⩽ H ⩽ H+ , on a :
H
X 1 X log log(H)
sup g1 (n + j)e(jα) ≪ log(ω).
α∈S1 x Hn j=1 log(H)
ω <n⩽x
En particulier :
H
X 1 X
sup g1 (n + j)e(jα) = oH− →+∞ (log(ω)).
α∈S1 x Hn j=1
ω <n⩽x
x
Démonstration : Soient α ∈ S 1 , et X ∈ 2ω , 2x . On définit S comme au théorème VI.8 avec
H
P1 = W 2 00 et Q1 = 3 où W = log(H)5 . On écrit :
W
H H
X 1 X X 1 X
g1 (n + j)e(jα) ≪ g1 (n + j)e(jα) + |S c | .
HX j=1 HX j=1
X<n⩽2X X<n⩽2X
H
X 1 X log log(H)
g1 (n + j)e(jα) ≪ .
HX j=1 log(H)
X<n⩽2X
H
X 1 X log log(H)
g1 (n + j)e(jα) ≪ log(X).
n j=1 log(H)
X<n⩽2X
Il sera plus adapté dans le contexte de la sous-partie suivante, d’utiliser un langage probabiliste. On
87
x
introduit une variable aléatoire discrète n sur n ∈ N : ω < n ⩽ x en posant :
1/n
P(n = n) = P 1 .
k∈N k
x
ω <k⩽x
x
Comme x ⩾ ω ⩾ A et ω ⩽ , on a :
log(x)
X 1
= (1 + oA→+∞ ) log(ω).
n
n∈N
x
ω ⩽n⩽x
Lemme VII.9
Soit q ∈ N, q ⩽ H+ et r ∈ Z tel que |r| ⩽ H+ . Alors pour toute variable aléatoire X(n) à valeurs
complexes dépendant de n et bornée en module par un nombre indépendant des paramètres du
problème :
1
E X(n)1n≡r[q] = E [X(qn + r)] + oA→+∞ (1).
q
Démonstration : La preuve ne présente pas de difficulté, pour les détails on se référera à [7]. □
Proposition VII.10
h i
ε2 H 2
Notons PH l’ensemble des nombres premiers dans 2 ,ε H . Pour tout p premiers on note cp =
1
g1 (p)g2 (p) ∈ S . Alors on a :
εH
cp 1an+j≡pb[ap] g1 (an + j)g2 (an + j + ph)
X X
E
≫ log(H)
.
p∈PH j∈[1,H]
j:
j+pH∈[1,H]
88
D’après le lemme VII.9, on a pour tout j ∈ {1, . . . , H} et pour tout p ∈ PH :
X
E cp 1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph) =
+ oA→+∞ (1).
p
X HX
Par le calcul précédent, on sait que Q(s) =
+ oA→+∞ (1), l’idée est de comparer Q(s) et Q(s + 1)
s
p
pour tout s et d’utiliser cette relation pour obtenir une estimation de Q(0) et de la sommer sur p ∈ PH
afin d’obtenir une quantité pas trop éloignée de ce que l’on cherche. Tout d’abord, d’après le lemme
VII.9, on a :
1
Or les deux quantités dans les espérances sont nulles avec probabilité 1 − O p . En dehors de cet
événement elles sont des O(1). Ainsi on obtient que pour tout s ∈ {0, . . . , a − 1} :
1
Q(s + 1) = Q(s) + O .
p
HX a
Ainsi Q(0) = ap +O p . Donc en sommant sur p ∈ PH , on obtient :
H X
HX 1
cp 1n+j≡pb[ap] g1 (n + j)g2 (n + j + ph)1n≡0[a] =
X X
E + O(a) .
a p
p∈PH j=1 p∈PH
x √ 1
12. On a aussi utilisé l’équivalent suivant : log log(x) − log log ∼ 2 .
2 x→+∞ log(x)
89
Si j + ph ̸∈ [1, H] alors j ∈ [1, |h| ε2 H] ou j ∈ [(1 − ε2 |h|)H, H] et dans ce cas on a :
ε2 H
cp 1an+j≡pb[ap] g1 (an + j)g2 (an + j + ph)1n≡0[a]
X X
E ≪ .
log(H)
p∈PH j∈[1,H]
j:
j+ph̸∈[1,H]
On va maintenant effectuer une discrétisation du problème. On définit gi,ε2 (n) pour i = 1, 2 l’élément
de ε2 Z[i] le plus proche de gi (n) (s’il y a égalité, on en prend un arbitrairement). Cette fonction n’est
pus multiplicative mais prend au plus Oε (1) valeurs, est toujours par 1 et vérifie : gi,ε2 = gi + O ε2
pour i = 1, 2. D’après la proposition VII.10 et l’inégalité triangulaire :
εH
cp 1an+j≡pb[ap] g1,ε2 (an + j)g2,ε2 (an + j + ph)
X X
E
≫ log(H)
.
p∈PH j∈[1,H]
j:
j+pH∈[1,H]
H
On réécrit cette inégalité sous la forme : E [F (XH , YH )] ≫ ε , où :
log(H)
et où F désigne la fonction suivante : Notons bien ici que la fonction est bien définie car si on prend
deux représentants Y1 et Y2 de la même classe dans Z/PH Z, alors aY1 ≡ aY2 [ap] pour tout p ∈ PH
car (PH , a) = 1 13
Avant d’appliquer l’argument, on va d’abord voir des estimations élémentaires de l’entropie de Shan-
non des variables aléatoires XH et YH introduites précédemment :
Proposition VII.11
0 ⩽ H(XH ) ≪ε H et H(YH ) ≪ H.
X 1
∀ ⩽k⩽x: P(YH = k) = + oH→+∞ (1).
ω PH
1
13. On rappelle ici qu’on a H suffisamment grand devant et donc que pour tout p ∈ PH est premier avec a.
ε2
90
Ainsi H(YH ) = log(PH ) − oA→+∞ (1). On obtient le résultat par le théorème des nombres premiers. □
Proposition VII.12
Soient H− ⩽ H ⩽ kH ⩽ H+ . On a l’estimation :
H(XkH ) H(XH ) I(XH , YH ) 1
⩽ − +O .
kH H H k
Cette inégalité nous dit que la présence d’information mutuelle entre XH et YH amène à une diminution
du taux d’entropie de XH , ainsi si cette information mutuelle est taux grande alors elle amènerait à une
trop grande diminution du taux d’entropie et qu’elle devienne ainsi négative. Cette idée est confirmée
par le théorème suivant :
H
I(XH , YH ) ⩽ .
log(H) log log log(H)
H
I(XH , YH ) > .
log(H) log log log(H)
91
(Hj )j∈{1,...,J} par H1 = aH− et pour tout j ⩾ 1 : Hj+1 = Hj ⌊C0 log(Hj ) log log log(Hj )⌋ et avec
J l’entier maximal tel que HJ ∈ [H− , H+ ]. D’après la proposition précédente appliquée à (H, k) =
(Hj , ⌊C0 log(Hj ) log log log(Hj )⌋) pour tout j ∈ {1, . . . , J} :
H(XHj+1 ) H(XHj ) I(XHj , YHj ) 1
⩽ − +O .
Hj+1 Hj Hj ⌊C0 log(Hj ) log log log(Hj )⌋
H(XHj+1 ) H(XHj ) 1
⩽ − .
Hj+1 Hj 2 log(Hj ) log log log(Hj )
Montrons que :
Ainsi pour j ⩾ j0 assez grand devant C0 , H− : Rj+1 ⩽ Rj + 2 log(Rj ). Soit B tel que pour tout j ⩽ j0 :
Hj ⩽ eBj log(j) . Procédons maintenant par récurrence, par le choix de B le fait que l’on veut montrer est
vrai pour j ⩽ j0 . Supposons celui-ci vrai pour j ∈ N et montrons le fait pour j + 1. Par choix de j0 et
par hypothèse de récurrence :
Mj
Rj+1 ⩽ Mj + 2 log(Mj ) ⩽ Mj + ,
j
où la deuxième inégalité est obtenue par l’inégalité vraie pour tout x, y ⩾ 4 : 4x + 2y ⩽ ey x. On obtient
Mj
ainsi Rj+1 ⩽ Mj + j ⩽ Mj+1 . D’où l’hérédité. On obtient donc l’inégalité par récurrence. Ainsi :
H(XHj+1 ) H(XHj ) 1
⩽ − .
Hj+1 Hj 2Bj log(j) log log(Bj log(j))
J−1
X 1
≪ε 1.
j=2
2Bj log(j) log log(Bj log(j))
Or la somme de gauche diverge pour J → +∞, on obtient donc une contradiction lorsque J est suffi-
samment grand. □
Ce résultat utilise ce qu’on appelle un argument de décrément d’entropie, en fait l’idée est de montrer que
H(XH )
le rapport d’entropie décroît quand H → +∞. Le fait de supposer que l’information I(XH , YH )
H
H(XH )
est suffisamment grande pour un H amène au fait que le rapport va décroître trop vite et ainsi
H
devenir négatif pour un certain H. Désormais, on considéra le H amené par ce théorème.
92
Définition VII.14
Dans cette section et uniquement dans cette section, on dira que x est une bonne valeur si :
H
H(YH ) − H(YH |XH = x) = oH− →+∞ .
log(H)
Le premier intérêt à considérer les bonnes valeurs est qu’elles représentes presque toutes les valeurs prises
par XH :
Lemme VII.15
La probabilité que XH prenne une bonne valeur est 1 − oH− →+∞ (1).
Démonstration : On a par définition d’une bonne valeur on a pour tout ε > 0 fixé :
X
P(XH = x) (H(YH ) − H(YH | XH = x))
x
X H
⩾ P(XH = x) (H(YH ) − H(YH | XH = x)) + ε .
log(H)
xbonne valeur
H
Or par le théorème VII.16 : I(XH , YH ) = oH− →+∞ . Ainsi :
log(H)
X H
P(XH = x) (H(YH ) − H(YH | XH = x)) = oH− →+∞ .
x
log(H)
De manière intuitive, si x est bon alors YH reste presque uniformément distribuée sur Z/PH Z (comme on
l’a vu dans la preuve de la proposition VII.12) même après conditionnement par rapport à l’évènement
XH = x. Plus précisément on a :
Lemme VII.16
H
Soit x une bonne valeur. Soit Ex une partie de Z/PH Z de cardinal au plus exp −ε7 PH ,
log(H)
alors on a :
P(YH ∈ Ex | XH = x) = oH− →+∞ (1).
H(YH |(XH = x, 1Ex (YH ))) ⩾ H(YH |XH = x) − H(1Ex (YH )|XH = x).
93
Or 1Ex (YH )|XH = x ne prend que deux valeurs possibles, ainsi par la proposition I.10 :
H
H(1Ex (YH )|XH = x) = oH− →+∞ .
log(H)
On en déduit que :
H
P(YH ∈ Ex |XH = x) (H(YH ) − H(YH |(XH = x, YH ∈ Ex ))) ⩽ oH− →+∞ .
log(H)
Or par hypothèse YH |XH = x, YH ∈ Ex prend au maximum |Ex | valeurs donc par la proposition I.10 :
H
H(YH |XH = x, YH ∈ Ex ) ⩽ log(|Ex |) ⩽ log(PH ) − ε7 .
log(H)
Or d’après la proposition
Proposition VII.17
X cp (αp)
SH (α) = ,
p
p∈PH
et notons :
ε2
(b + h)η h · ξ
ΞH = ξ ∈ Z/HZ tel qu’il existe η ∈ Z/aZ tel que : SH − − ⩾ .
a H log(H)
Démonstration : On étend X1,j et X2,j de manière périodique (i.e X1,H+j := X1,j pour tout j). Si
on retire de la somme de gauche la contraire j + ph ∈ [1, H] cela occasionnera une erreur de :
X1
2 H
O |ph| = Oh ε
,
p log(H)
p∈P
ce qui est acceptable par rapport à ce que l’on veut montrer. Maintenant en re-faisant la confusion d’un
élément de [1, H] par sa projection dans Z/HZ, on peut dire que la quantité que l’on cherche à estimer
est :
X cp X
1j≡pb[a] X1,j X2,j+ph .
p
p∈PH jZ/HZ
94
Par inversion de Fourier, on écrit pour i = 1, 2; j ∈ Z/HZ :
X jξ 1 X jξ
Xi,j = Gi (ξ)e où pour tout ξ ∈ Z/HZ : Gi (ξ) = Xi,j e − .
H H H
ξZ/HZ j∈Z/HZ
De plus, on a par le deuxième théorème de Mertens (II.19) : SH − (b+h)η
a − h·ξ
H
1
≪ log(H) . On obtient
H
donc par définition de ΞH et en majorant trivialement pour ξ ∈ ΞH , G2 −ξ − aη ≪1:
X cp X H X |G1 (ξ)| H X ε2
1j≡pb[a] X1,j X2,j+ph ≪
X
+
p a log(H) a log(H)
p∈PH jZ/HZ η∈Z/aZ ξ∈ΞH η∈Z/aZ
H 2 X
≪ ε + |G1 (ξ)| .
log(H)
ξ∈ΞH
Lemme VII.18
Conclusion : Essayons maintenant de conclure à une absurdité. Grâce aux deux lemmes précédents,
on a
H
X 1 X jξ
E g1 (an + j)e − ≫a,h ε.
H j=1 H
ξ∈ΞH
On en déduit d’après VII.2 que ε ≪a,h oH− →+∞ (|ΞH |). Avec le lemme précédent, on conclut à une
absurdité.
95
VIII Problème de la discrépance d’Erdös
Avancée
Figure 2 – Schématisation du pont
Une solution très simple pour progresser sur le pont sans tomber consiste à avancer en zigzag, comme
illustré dans le schéma ci-dessous :
Avancée
Figure 3 – Schématisation du déplacement en zigzag.
Nous représentons ce déplacement par la séquence suivante : DGDGDGDG . . ., que l’on lit de gauche à
droite. La lettre ′ D′ indique un déplacement en diagonale vers la droite, tandis que la lettre ′ G′ indique
un déplacement en diagonale vers la gauche. C’est ainsi que nous communiquons ces instructions à la
personne se trouvant sur le pont.
Maintenant, supposons qu’il soit difficile de communiquer directement avec cette personne, ce qui fait
qu’elle pourrait ne comprendre qu’une lettre sur deux du message. Il est donc essentiel de s’assurer que
si elle ne reçoit qu’une lettre sur deux, le message lui permettra tout de même de rester sur le pont sans
jamais tomber.
96
Prenons l’exemple du message précédent et considérons uniquement une lettre sur deux. Nous obtenons
alors le message suivant : GGGGGG . . .. Sur le schéma ci-contre cela revient à dire qu’en suivant
uniquement les flèches rouges, la personne tombera du pont.
Avancée
Figure 4 – Schéma illustrant que le déplacement "trivial" sur le pont n’est pas adapté si on ne considère qu’un
déplacement sur deux.
Par conséquent, il est nécessaire de réfléchir plus en profondeur. Nous allons donc procéder étape par
étape :
Avancée
Figure 5 – Schématisation d’un chemin qui permet à la personne de rester sur le pont même un déplacement sur deux.
97
Avancée
Figure 6 – Vérification qu’en considérant un déplacement sur deux, la personne sur deux restera sur le pont.
Avancée
Figure 7 – En prenant le même chemin et en ne considérant qu’un déplacement sur trois alors la personne tombera du
pont.
— Le chemin doit donc commencer par DGGDGDDGGD. Cependant, si nous continuons avec un
déplacement sur trois en choisissant D comme neuvième déplacement, le dixième sera inévitable-
ment G, et comme mentionné précédemment, le onzième sera également G et le douzième sera D
(sinon le chemin ne fonctionnerait pas si nous ne considérons qu’un déplacement sur deux). Cela
nous donnerait un chemin commençant par DGGDGDDGDGGD. En prenant un déplacement sur
trois, nous obtenons GDGG, ce qui fera également tomber la personne du pont dans ce cas. Ainsi,
98
Avancée
Figure 8 – Premier cas non concluant
nous pouvons conclure qu’il n’existe aucun chemin satisfaisant à nos conditions avec une longueur
minimale de 12 déplacements. En réalité, la situation est symétrique lorsque nous sommes à l’étape
8, et il y a autant de déplacements à droite qu’à gauche, que nous prenions tous les déplacements,
un déplacement sur deux ou un déplacement sur trois. Par conséquent, nous aurions pu éviter de
considérer ce cas. Ce qui pose problème ici, c’est que nous sommes contraints de raisonner par
groupes de quatre afin d’éviter d’avoir deux fois le même déplacement en prenant un déplacement
sur deux. Cependant, dans le quadruplet d’éléments supérieurs à huit, il y a deux multiples de trois
qui se retrouveront nécessairement dans la même direction si nous raisonnons ainsi. Cela conduit
à l’impossibilité de former un chemin d’une longueur supérieure ou égale à douze qui respecte les
conditions énoncées.
Avancée
Figure 9 – Deuxième cas aussi non concluant : il est impossible de construire un chemin de longueur au moins 12
vérfiant les conditions demandées
—- On pourrait se demander comment résoudre le problème lorsque le pont est de taille plus grande et en
considérant également toutes les progressions arithmétiques homogènes 14 . Cette question a été soulevée
par Erdos au début des années 1930, et il a émis l’hypothèse que la réponse serait également négative dans
le cas général, c’est-à-dire qu’il n’existerait pas de tels chemins. Pour formaliser davantage la situation,
nous pouvons considérer le n-ème déplacement comme un élément f (n) ∈ −1, +1, qui représente les
directions droite et gauche. Ainsi, la position de la personne sur le pont après le n-ème déplacement
Xn
peut être exprimée par f (n). On peut dire que la personne tombera du pont si la valeur absolue de
k=1
cette quantité devient trop grande le long de toute progression arithmétique homogène, on appelle cette
quantité la discrépance de la (f (n)) 15 :
14. C’est-à-dire qu’il faudrait également tenir compte des suites de déplacements sur quatre, cinq, etc.
15. Le terme "discrépance" est peu fréquent en français ; en fait, il n’est même pas répertorié dans les dictionnaires
99
Définition VIII.1
n
X
Soit (f (n)) une suite de réels, on appelle discrépance de la suite (f (n)) la quantité sup f (jd).
d,n∈N∗ j=1
La conjecture d’Erdos peut finalement être formulée de la manière suivante :
n
X
sup f (dj) ⩾ C.
n,d∈N∗
k=1
On a montré précédemment que cette conjecture était vrai si C = 2. On peut même énoncer cette
conjecture dans un cadre encore plus général.
Soit (H, ∥·∥H ) un espace vectoriel normé. Pour toute suite d’éléments (f (n))n∈N∗ de norme 1 et
pour tout C ⩾ 0, on a :
n
X
sup f (dj) ⩾ C.
n,d∈N∗
k=1 H
C’est cette version que l’on va démontrer dans la suite de cette partie.
n
X n
X
∀j, n ∈ N∗ : χ(jd) = |χ(d)| χ(j) ⩽ q.
j=1 j=1
Ceci ne constitue évidemment pas un contre-exemple à la discrépance d’Erdos puisque que χ(n) = 0
quand n et q ne sont pas premiers entre eux.
traditionnels. Il dérive du latin "discrepantia" et peut être synonyme de "dissonance". Au sens figuré, il peut également
signifier "divergence, dissemblance, discordance".
100
Maintenant ce que l’on peut faire c’est d’adapter un peu le contre-exemple précédent pour qu’il rentre
dans les hypothèses du problème de la discrépance d’Erdos. On prend χ3 le caractère de Dirichlet vérifiant
χ3 (n) = +1 ni n ≡ 1[3], 0 si n ≡ 0[3] et −1 si n ≡ −1[3].
Soit H un espace de Hilbert de base orthonormale e0 , e1 , . . . et soit f : N → H définie par f (3a m) =
χ3 (m)ea quand a = 0, 1, 2, . . . et (m, 3) = 1, f prend des valeurs dans SH (0, 1). Prenons n = 1+3+. . .+3k
pour k assez grand. On remarque que :
n
X
f (j) = e0 + . . . + ek .
j=1
Donc :
n
X √ p
f (j) = k+1≫ log(n).
j=1
H
n
X p
f (jd) ≪ log(n).
j=1
H
p
Ainsi en modifiant un peu le contre-exemple précédant on obtient une discrépance d’ordre log(N ).
On n’a pas trouvé de fonctions arithmétiques qui admettent des discrépances beaucoup plus petites.
D’ailleurs, cela peut nous donner une estimation (pas très fondée certes) du nombre de la taille d’une
séquence (f (n)) de discrépance fixée. En effet les preuves par ordinateurs ont permis de montrer qu’il
n’existe pas de chemin de longueur strictement plus grande que 1160 de discrépance d’au moins 3 et qu’il
n’existe pas de chemin de longueur strictement plus grande que 127645 ( !) de discrépance d’au moins 4.
p p
Et on remarque que log(1160) ≃ 2.66 ∈ [2, 3] et log(127645) ≃ 3.43 ∈ [3, 4]. Ainsi on peut imaginer
que la plus longue suite qui admettrait une discrépance C aurait environ exp C 2 termes. Ainsi si on
veut construire une très grande suite de discrépance 14, il faudrait sûrement s’aventurer à construire une
suite possédant exp 142 ≃ 1.1085 ce qui environ autant de particules dans l’univers observable. Bref
cela montre à quel point les chances pour obtenir une preuve exhaustive de la conjecture d’Erdos par
ordinateur est vouée à l’échec avec les techniques les plus sophistiquées trouvées en 2014. C’est ici que la
théorie analytique et probabiliste des nombres vient à la rescousse pour démontrer la conjecture d’Erdos,
on utilisera dans la démonstration de cette conjecture la conjecture d’Elliott en moyenne logarithmique
qui est une conséquence des travaux de Matomäki et Radziwiłł, les résultats qu’ils ont démontrés forment
le point de départ de la démonstration.
101
Théorème VIII.4: (Forme probabiliste de la conjecture d’Erdos)
N
Soient (Ω, µ) un espace probabilisé, g : Ω → S1 une fonction mesurable telle que pour µ-presque
tout ω ∈ Ω, g(ω) est complètement multiplicative, alors :
2
Z n
X
sup g(ω)(j) dµ(ω) = +∞.
n∈N Ω j=1
Proposition VIII.6
Démonstration : Soient (Ω, µ) et g comme dans le théorème VIII.5, on note H l’espace de Hilbert
sont L (Ω, µ). Pour tout n ∈ N, on pose f (n) ∈ H l’application ω 7→ g(ω)(n). Comme g(ω)(n) ∈ S1
2
pour µ-presque tout ω ∈ Ω et que µ est une mesure de probabilité on a pour tout n ∈ N : ∥f ∥H = 1. De
plus, comme g est µ-presque partout complètement multiplicative, pour toute progression arithmétique
homogène de raison d on a :
2 2 2
n
X Z n
X Z n
X
f (jd) = g(ω)(jd) dµ(ω) = g(ω)(j) dµ(ω).
j=1 Ω j=1 Ω j=1
H
Ainsi si on suppose le théorème VIII.3 vrai et en prenant la borne supérieure sur n dans la relation
précédente, on obtient :
2 2
Z n
X n
X
sup g(ω)(j) dµ(ω) = sup f (jd) = +∞.
n∈N Ω j=1 n∈N j=1
H
L’implication réciproque est bien plus difficile, on aura besoin d’un résultat d’analyse fonctionnelle qui
nécessite la définition suivante :
102
Définition VIII.7
Soit X un espace métrique et soient (µn )n∈N une suite de mesures de probabilités sur X. On dit que
la suite (µn )n∈N converge étroitement vers µ lorsque pour tout fonction f continue bornée sur X,
on a : Z Z
f (x) dµn (x) → f (x) dµ(x).
X n→+∞ X
Soit X un espace métrique compact et µn une suite de mesures de probas sur X. Alors il existe une
sous-suite de µn qui converge étroitement vers un autre mesure de proba µ.
Démonstration : On sait que si X est un espace métrique compact alors C 0 (X, C) est séparable. Donc
par le théorème de Banach-Alaoglu la sphère unité de M(X), le dual de C 0 (X, C) est séquentiellement
compact pour la topologie faible-∗. Z
0
Or pour tout n ∈ N, on peut poser l’application continue suivante Tµn f ∈ C (X, C) 7→ f dµn .
X
Cette application est clairement continue de norme d’application égale à 1 (car les µn sont des mesures
de probabilités sur X). Ainsi il existe une extractrice φ telle que Tµφ(n) converge faible-∗ vers T ∈ M(X)
de norme égale à 1. Or par le théorème de représentation de Riesz-Radon, il existe une mesure de
probabilité µ telle que T = Tµ . Cela revient à dire que (µφ(n) ) converge étroitement vers µ. □
Lemme VIII.9
Supposons que pour tout X ⩾ 1, il existe une fonction stochastique complètement multiplicative
gX a qui soit à valeurs dans S1 et telle que :
2
n
X
∀n ⩽ X : E gX (j) ≪C 1.
j=1
Alors il existe une fonction g stochastique complètement multiplicative à valeurs dans S1 et telle
que :
2
n
X
∀n ∈ N : E g(j) ≪C 1.
j=1
Démonstration : Dans cette preuve on notera P l’ensemble des nombres premiers. Soit M l’ensemble
des fonctions complètement multiplicatives à valeurs dans S1 . Comme les éléments de M sont déterminées
P
uniquement par leurs valeurs sur les nombres premiers, on voit facilement que M est isomorphe à S1 .
Comme produit dénombrable de compacts, M est compact pour la topologie produit. Or comme énoncé
précédemment, on peut voir chaque gX comme une application mesurable fX : ΩX → M telle que :
2
Z n
X
∀n ⩽ X : fX (ω)(j) dµX (ω) ≪C 1.
ΩX j=1
103
On note νX la mesure image de µX par fX , c’est une mesure sur M qui vérifie :
Z Z
∀F ∈ C 0 (M, C) : F (g) dνX (g) = E [F (gX )] = F (fx (ω)) dµX (ω).
M ΩX
2
Xn
On remarque que les fonctions g 7→ g(j) sont continues sur M, en effet on peut décomposer
j=1
ces applications en polynômes en les g 7→ g(p) où p est premier, ces applications étant continues par
définition de la topologie produit. Ainsi en appliquant la dernière estimation à ces fonctions, on obtient
que :
2
Z n
X
∀n ⩽ X : g(j) dνX ≪C 1.
M j=1
Par le lemme de Prokhorov (VIII.8), on peut trouver une sous-suite νXj de νX telle que (νXj )j∈N converge
étroitement vers une mesure ν de probabilité sur M. Donc on conclut que :
2
Z n
X
∀n ∈ N : g(j) dν(g) ≪C 1.
M j=1
Proposition VIII.10
Pour conclure notre preuve, il suffit de construire une fonction stochastique complètement multiplicative
g à valeurs dans S1 telle que :
2
n
X
∀n ∈ N : E g(j) ≪C 1.
j=1
D’après le lemme VIII.9, il suffit de construire pour tout X ⩾ 1, une fonction stochastique complètement
104
multiplicative gX qui soit à valeurs dans S1 et telle que :
2
n
X
∀n ⩽ X : E gX (j) ≪C 1.
j=1
Soit X ⩾ 1, notons p1 , . . . , pr les nombres premiers inférieurs ou égaux à X rangés par ordre croissant.
Soit M ⩾ X un entier naturel que l’on suppose suffisamment grand devant C, X. On définit les fonctions
suivantes : 16
(Z/M Z)r →H [1, X] → (Z/M Z)r
F : et π: .
(a [M ], . . . , a [M ]) 7→ f (pa1 . . . par ) pa1 . . . par 7→ (a1 [M ], . . . , ar [M ])
1 r 1 r 1 r
n
X
f (jpα αr
1 . . . pr )
1
≪C 1,
j=1
H
β β r
en notant j = p1 j1 . . . pr jr . Or pour tout x = (x1 , . . . , xr ) ∈ (Z/M Z) :
n n
x +βj1 x +βjr
X X
F (x + π(j) = f (p1 1 . . . pr r ) .
j=1 j=1
H H
Il y a donc (M − X)r−1 choix de x (correspondants aux (M − X)r−1 choix de d possibles) qui permettent
d’avoir :
n
X
F (x + π(j)) ≪C 1.
j=1
H
On obtient alors :
2
n
1 X X
F (x + π(j)) ≪C 1.
Mr
x∈(Z/M Z)r j=1
H
r
Or, on peux écrire pour tout x ∈ (Z/M Z) :
X x·ξ 1 X ω.ξ
F (x) = F̂ (ξ)e où F̂ (ξ) = F (ω)e − .
M Mr M
ξ∈(Z/M Z)r ω∈(Z/M Z) r
16. Pour s’assurer que F est bien définie on considère que les ai sont des éléments de {0, . . . , M − 1}. Notons aussi que
π est bien définie pour M ⩾ X
105
De plus, aussi d’après le théorème de Plancherel :
X 2
F̂ (ξ) = 1.
H
ξ∈(Z/M Z)r
2
Donc on peut interpréter F̂ (ξ) comme une densité de probabilité d’une fréquence ξ = (ξ1 , . . . , xir ) ∈
H
r
(Z/M Z) . Ainsi avec cette interprétation :
n
X π(j) · ξ
∀n ⩽ X : E e ≪C 1.
j=1
M
ξj
Si on définit la fonction stochastique complètement multiplicative gX définie par : gX (pj ) = e M pour
j ∈ {1, . . . , r} et gX (p) pour les autres nombres premiers (il n’interviennent pas ensuite), on obtient :
2
n
X
∀n ⩽ X : E gX (j) ≪C 1.
j=1
D’où le résultat. □
Remarque : Un point intéressant à remarquer est de voir notre preuve ne marche plus si on considère
un caractère de Dirichlet χ. Il est bien de module souvent à valeurs dans le cercle unité mais pour q ⩽ pr ,
la fonction qui à (a1 , . . . , ar ) associe χ (pa1 1 . . . par r ) est presque toujours nulle (comme l’argument est très
souvent un multiple de q). Ainsi :
X
F̂ (ξ) ≪ 1.
ξ∈(Z/M Z)r
On ne peut donc pas définir une fonction gX telle que dans le preuve ci-dessus.
Proposition VIII.11
Supposons que g : N → S1 soit une fonction stochastique complètement multiplicative telle qu’il
existe C > 0 :
2
n
X
∀n ∈ N : E g(j) ⩽ C 2 .
j=1
Soit ε > 0 et supposons que X est suffisamment grand devant ε, C. Alors avec probabilité 1 −
O(ε), il existe un caractère de Dirichlet (stochastique) de période q = OC,ε (1) et un nombre réel
(stochastique) t = OC,ε (X) tels que :
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X
106
par inégalité triangulaire, on a pour X suffisamment grand :
2
n+H
X 1 X
E g(j) ≪C log(X).
√ n j=n+1
X⩽n⩽X
H 2
X X g(n + h1 )g(n + h2 ) X 1 X
= g(n + h) ≪C,ε log(X).
√ n √ n
h1 ,h2 ∈[1,H] X⩽n⩽X X⩽n⩽X h=1
Or dans la somme sur h1 , h2 il est faicle de voir que le terme diagonal contribue pour ≫ H log(X).
Ainsi pour H suffisamment grand devant C, ε et d’après le principe des tiroirs, on peut trouver deux
entiers (stochastiques) et distincts h1 , h2 ∈ [1, X] tels que :
X g(n + h1 )g(n + h2 )
≫C,ε,H log(X).
√ n
X⩽n⩽X
Donc par réciproque de la conjecture d’Elliott en moyenne logarithmique VII.3, il existe un caractère de
Dirichlet stochastique de période q = OC,ε (1) et un nombre réel stochastique t = OC,ε (X) tels que :
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X
Détaillons juste comment on peut s’arranger pour que (χ, t) soient pris mesurables (et ainsi stochas-
tiques). Par le théorème VII.3, on sait qu’il existe plusieurs couples (χ, t) tels que :
X 1 − g(p)χ(p)p−it
< a.
p
p⩽x
Et s’il existe t0 ∈ R tel que l’inégalité précédente est lieu pour t = t0 alors par densité de Q dans
′ ′
R, on peut trouver t0 ∈ Q tel que cette inégalité est aussi lieu pour t = t0 . Ainsi on peut s’arranger
pour considérer un ensemble dénombrable de (χ, t) qui vérifie l’inégalité. Comme
il est dénombrable,
on
X 1 − g(p)χ(p)p−it
peut lui construire un bon ordre sur cet ensemble. Or l’application g 7→
p
p⩽x
(χ,t)
est continue donc mesurable et l’application qui à une suite (xn ) de réels associe l’unique n ∈ N tel que
xn ⩽ a et pour tout m ⩽ n : xn > a est aussi mesurable 17 . Ainsi on peut trouver (χ, t) qui vérifie :
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X
17. On rappelle ici qu’on considère la tribu P(N) sur N et la tribu produit dans les espaces produits.
107
VIII.5 Preuve de la conjecture d’Erdos
Dans cette partie, on va prouver le théorème VIII.4 ce qui démontrera la conjecture d’Erdos. Pour
cela, on va supposer par l’absurde qu’il est faux. Il existe donc une constante C > 0 et une fonction g
stochastique complètement multiplicative à valeurs dans S1 telle que :
2
n
X
∀n ∈ N : E g(j) ⩽ C 2 .
j=1
On va maintenant considérer que toutes les constantes peuvent dépendre de C, ainsi on pourra écrire :
2
n
X
∀n ∈ N : E g(j) ≪ 1.
j=1
1 1
C≪ ≪ H ≪ , k ≪ X.
ε δ
D’après la proposition VIII.11, avec probabilité 1−O(ε), il existe un caractère de Dirichlet (stochastique)
de période q = OC,ε (1) et un nombre réel (stochastique) t = OC,ε (X) tels que :
X 1 − Re g(p)χ(p)p−it
≪C,ε 1.
p
p⩽X
Quitte à réduire χ, on peut supposer qu’il est primitif (car si χ′ est un caractère primitif qui induit χ
alorsχ(p) et χ′ (p) ne diffèrent qu’en les premiers p qui divisent le module de χ, dont il y en a un nombre
fini).
Lemme VIII.12
Avec probabilité 1 − O(ε), t = Oε X δ .
Démonstration : Preuve admise, elle se base sur des résultats d’analyse complexe qu’on a pas eu le
temps d’aborder pendant le stage. On pourra en trouver une démonstration dans (Lemme 4.1, [7]). □
X 1 − Re (h(p))
≪ε 1. (VIII.2)
p
p⩽X
108
Lemme VIII.13
′ 2
H
1 X X 1 X
1 χ̃(n + m)h(n + m) ≪ε log(X).
H ′ n1+ log(X) m=1
H<H ⩽2H n∈N
2
′
H
1 X X
∀n ∈ N : E g(n + m) ≪ 1.
H
H<H ′ ⩽2H m=1
Soit n ⩾ X 2δ , d’après le lemme VIII.12 on sait que t = Oε X δ donc par un simple développement
limité :
′
∀m ⩽ H : (n + m)it = nit + Oε,H,δ X −δ .
Ainsi on a :
2
′
H
1 X X
∀n ⩾ X 2δ : E χ̃(n + m)nit h(n + m) ≪ 1.
H
H<H ′ ⩽2H m=1
Si n < X 2δ alors on majore cette même quantité par H 2 trivialement. Ainsi pour δ suffisamment petit
1
on obtient en moyennisant par la densité 1+ 1 :
n log(X)
2
′
H
1 X X 1 X
E χ̃(n + m)h(n + m) ≪ log(X).
1
H 1+
n log(X) m=1
H<H ′ ⩽2H n∈N
Définition VIII.14
Dans cette partie et uniquement dans cette partie, on dira qu’une classe a modulo qk est mauvaise
si pour tout m ∈ {1, . . . , 2H}, il existe un facteur premier p de q tel que a + m soit divisible par pk .
Sinon, on dira que cette classe est bonne.
Lemme VIII.15
′ 2
H
1 X 1 X X
χ̃(a + m) ≪ε 1.
qk H ′
a bonne H<H ⩽2H m=1
109
probabilité 1 − O(ε) et en ne sommant que sur les bonnes classes :
′ 2
H
1 X X 1 X
1 χ̃(n + m)h(n + m) ≪ε log(X).
H n1+ log(X)
H<H ′ ⩽2H a bonne m=1
n≡a[qk ]
′ 2
H
1 X X X 1 X log(X)2
1 χ̃(n + m)h(n + m) ≪ε .
H n1+ log(X) qk
H<H ′ ⩽2H a bonne n≡a[qk ] m=1
Or on remarque que si n appartient à une bonne classe a alors χ̃(n + m) = χ̃(a + m) (c’est en fait pour
cela qu’on les a introduites). Ainsi on obtient facilement :
′ 2
H
1 X X X X 1 log(X)2
χ̃(a + m) 1 h(n) ≪ε .
H n 1+ log(X) qk
H<H ′ ⩽2H a bonne m=1 n≡a+m[qk ]
X 1
On va maintenant estimer h(n). On remarque tout d’abord par le second théorème
1
1+ log(X)
n
n≡a+m[qk ]
de Mertens II.19 et par hypothèse sur h VIII.2 que :
1
log(X) ≪ε Dh 1 + ≪ε log(X). (VIII.3)
log(X)
X χ(n)h(n)
Maintenant on va regarder cette quantité quand χ est un caractère de Dirichlet : 1 .
n∈N n1+ log(X)
— Supposons que χ1 est un caractère de Dirichlet non-principal de période divisant qk alors par
analycité en 1 de la série de Dirichlet associée à χ1 :
1
Dχ1 1 + ≪q,k 1.
log(X)
1
On en déduit l’estimation suivante (en ne gardant que les termes dans le produit sur p en 1
1+ log(X)
):
p
!
X χ1 (n)h(n) X |1 − h(p)|
1 ≪q,k exp 1 .
n∈N n1+ log(X) p p1+ log(X)
110
|1 − h(p)|
Ainsi comme la série de terme général 1 est convergente, on a :
p1+ log(X)
!
X |1 − h(p)| X |1 − h(p)| X |1 − h(p)|
exp 1 = exp 1 + O(1) ≪ exp .
p p1+ log(X) p1+ log(X) p
p⩽X p⩽X
— Maintenant supposons que χ0 soit un caractère principal de période r|qk . On peut alors écrire en
développant en produit eulérien et en se rappelant que h(p) = 1 pour tout p divisant r (donc qk ) :
Y !
X χ0 (n)h(n) 1 1
1 = Dh 1 + 1 − 1+ 1
n1+ log(X) log(X) p log(X)
n∈N p|r
Y
1 1 1
= Dh 1 + 1 + Oε 1−
log(X) log(X) p
p|r
φ(r) 1 φ(r) 1 1
= Dh 1 + + Oε Dh 1 +
r log(X) r log(X) log(X)
φ(r) 1
= Dh 1 + + Oε (1)
r log(X)
′ r ′ b
Si b[r] est une classe de résidus non-primitive alors en notant r = et b = :
(b, r) (b, r)
X h(n) 1 1 p
1 = Dh 1 + + Oq,k exp Oε ( log log(X)) .
n1+ log(X) r log(X)
n≡b′ [r ′ ]
Donc en utilisant l’estimation VIII.3, on obtient quelque soit la classe de résidus b[r] :
X h(n) 1 1 p
1 = Dh 1 + + Oq,k exp Oε ( log log(X)) .
n1+ log(X) r log(X)
n≡b[r]
111
Ainsi en réinsérant cette expression dans celle de départ :
′ 2
H
log(X)2
1 X X X χ̃(a + m) 1 p
Dh 1 + + O q,k exp O ε ( log log(X)) ≪ε .
H qk log(X) qk
H<H ′ ⩽2H a bonne m=1
p log(X)2
Or la contribution de Oq,k exp Oε ( log log(X)) est ≪ε pour X suffisamment grand. On
qk
en déduit le fait annoncé en utilisant VIII.3. □
Lemme VIII.16
′
Pour tous d1 ̸= d2 diviseurs de qk−1 et m1 , m2 ∈ {1, . . . , H }, on a :
k
q
X a + m1 a + m2
χ χ = 0.
a=1
d1 d2
d1 | a+m1
d2 | a+m2
Démonstration : Nous n’allons pas faire en détails cette preuve. D’après les résultats du paragraphe
??, on peut
direque le terme que l’on cherche
à rendre nul est une combinaison linéaire de termes de la
ξa ξa
forme : e pour (ξ, d1 q) = 1 et e pour (ξ, d2 q) = 1. Comme d1 ̸= d2 toutes les fréquences
d1 q d2 q
qui vont apparaître seront non nulles et ainsi leur somme sera elle nulle. □
Fin de la démonstration du théorème VIII.4 On va maintenant utiliser les deux lemmes précédents
pour démontrer la démonstration du théorème VIII.4. On se rappelle que l’on procède par l’absurde.
Si on est dans l’évènement q = 1 alors χ est constant égal à 1 et donc d’après le lemme VIII.15 on a
le fait suivant : 2
1 X ′
H≪ H ≪ε 1,
H ′
H<H ⩽2H
ce qui est absurde pour H suffisamment grand devant ε. On se restreint maintenant à l’évènement q > 1,
ainsi χ sera non-principal. Encore d’après le lemme VIII.15 :
1 X X X
χ̃(a + m1 )χ̃(a + m2 ) ≪ε qk .
H ′ ′
H<H ⩽2H m1 ,m2 =1,...,H a bonne
k
X q
Or on remarque que le nombre de mauvaises classes a est au plus H p|q ≪ H2−k qk . Ainsi on
p
peut écrire :
X X χ̃(d1 )χ̃(d2 ) X X a + m1 a + m2
χ χ ≪ε q k .
H a d1 d2
d1 ,d2 |qk−1 H<H ′ ⩽2H m1 ,m2 =1,...,H ′ d |a+m
1 1
d2 |a+m2
112
D’après le lemme VIII.16 on obtient :
1 X X X X a + m1 a + m2
χ χ ≪ε qk .
H k−1 a d d
d|q H<H ′ ⩽2H m1 ,m2 =1,...,H ′ d|a+m
1
d|a+m2
d|a+m
On voit ici que tous les termes de la somme sur d sont positifs ainsi on peut se restreindre à ceux qui
√
s’écrivent qi avec qi < H :
2
1 X X X X a+m
χ ≪ε q k .
H √ ′ a ′
qi
i:qi < H H<H ⩽2H m∈[1,H ]
qi |a+m
′ 3H
Donc il existe H ∈ H, tel que :
2
2
X X X a+m
χ ≪ε q k .
√
a ′ ′
qi
i:qi < H H <m⩽H +qi
qi |a+m
113
2
Or b 7→ |χ(b)| ≫ε qk−i est périodique de période q et de moyenne ≫ε 1. On en déduit :
X X 2
X
|χ(b)| ≪ε 1.
√ √
i:qi < H b∈[1,q k−i
4 ] i:qi < H
Et ceci est absurde quand H est suffisamment grand. On en déduit le théorème VIII.3 et donc la conjecture
d’Erdos est démontrée.
114
Références
[1] Gerald Hildebrand Adolf ; Tenenbaum. “Integers without large prime factors”. In : Journal de
théorie des nombres de Bordeaux, Tome 5 (1993) no. 2, pp. (1993), p. 411-484.
[2] Kevin Ford. Sieve methods lecture notes. Spring 2023.
[3] Gérald Tenenbaum. Introduction à la théorie analytique et probabiliste des nombres : Cours et
exercices. Dunod, 2022.
[4] Terence Tao. A cheap version of Halasz’s inequality. [Link]
11/23/a-cheap-version-of-halaszs-inequality/. 2015.
[5] S. Chowla. The Riemann Hypothesis and Hilbert’s Tenth Problem. Mathematics and its applica-
tions. Gordon et Breach, 1966. isbn : 9780677001401.
[6] Hugh L Montgomery et Robert C Vaughan. Multiplicative number theory I : Classical theory.
97. Cambridge university press, 2007.
[7] Terence Tao. “The Logarithmically averaged Chowla and Elliott conjectures for two-point corre-
lations”. In : Forum of Mathematics, Pi 4 (2016), e8. doi : 10.1017/fmp.2016.6.
[8] K. Roth. “Remark concerning integer sequences”. eng. In : Acta Arithmetica 9.3 (1964), p. 257-260.
url : [Link]
[9] Boris Konev et Alexei Lisitsa. “Computer-aided proof of ErdHos discrepancy properties”. In :
Artificial Intelligence 224 (2015), p. 103-118.
[10] Terence Tao. Elementary multiplicative number theory. https : / / terrytao . wordpress . com /
2014/11/23/254a-notes-1-elementary-multiplicative-number-theory/. 2022.
[11] Terence Tao. Mean values of nonpretentious multiplicative functions. [Link]
com / 2019 / 12 / 17 / 254a - notes - 10 - mean - values - of - nonpretentious - multiplicative -
functions/. 2019.
[12] Terence Tao. Second moment and entropy methods. [Link]
11/12/254a-notes-9-second-moment-and-entropy-methods/. 2019.
[13] Olivier Bordellès. Arithmetic tales. Springer, 2012.
[14] Jérémy Bettinger. Le théorème des nombres premiers.
[15] Kaisa Matomäki et Maksym Radziwiłł. “Multiplicative functions in short intervals”. In : Annals
of Mathematics (2016), p. 1015-1056.
[16] Adrian Dudek. “An Elementary Proof of an Asymptotic Formula of Ramanujan”. In : arXiv
preprint arXiv :1401.1514 (2014).
[17] Kaisa Matomäki, Maksym Radziwiłł, Terence Tao et al. “An averaged form of Chowla’s conjec-
ture”. In : Algebra Number Theory 9.9 (2015), p. 2167-2196.
[18] Henryk Iwaniec et Emmanuel Kowalski. Analytic number theory. T. 53. American Mathematical
Soc., 2004.
[19] Kannan Soundararajan. “The Liouville function in short intervals [after Matomaki and Radzi-
will]”. In : arXiv preprint arXiv :1606.08021 (2016).
[20] G. Peyré. L’algèbre discrète de la transformée de Fourier : niveau M1. Mathématiques à l’uni-
versité : cours et exercices corrigés. Ellipses, 2004. isbn : 9782729818678. url : [Link]
[Link]/books?id=WFp8AAAACAAJ.
115
[21] Terence Tao. The Erdos discrepancy problem. 2017. arXiv : 1509.05363 [[Link]].
116