0% ont trouvé ce document utile (0 vote)
77 vues30 pages

Convolution

Ce document traite de la convolution dans L1(Rd), en abordant des concepts tels que les inégalités de Jensen, Minkowski et Hölder, ainsi que la régularisation et l'approximation des fonctions. Il présente également des résultats sur la densité des fonctions continues dans Lp(Rd) et les propriétés des convolutions périodiques. Enfin, il aborde la convolution dans le cadre de la mesure de comptage sur Z.

Transféré par

Hamada Routbi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
77 vues30 pages

Convolution

Ce document traite de la convolution dans L1(Rd), en abordant des concepts tels que les inégalités de Jensen, Minkowski et Hölder, ainsi que la régularisation et l'approximation des fonctions. Il présente également des résultats sur la densité des fonctions continues dans Lp(Rd) et les propriétés des convolutions périodiques. Enfin, il aborde la convolution dans le cadre de la mesure de comptage sur Z.

Transféré par

Hamada Routbi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

2007-12-08 by BM

3. Convolution, inégalités, approximation et régularisation

Contenu du chapitre
3.1. Convolution dans L1 (Rd )
— Autres cadres pour la convolution : le cadre périodique
3.2. Densité des fonctions continues
3.3. Inégalités
3.3.a. Inégalité de Jensen
3.3.b. Inégalité de Minkowski
3.3.c. Inégalité de Hölder
3.3.d. Isométrie dans le dual de Lq
3.3.e. Convolutions L1 ∗ Lp lorsque 1 ≤ p < +∞
3.3.f. Convolutions Lp ∗ Lq lorsque 1/p + 1/q = 1
3.4. Régularisation et approximation
3.4.a. Continuité, opérateurs de translation
— Continuité des translations sur Lp (Rd ), ou bien Lp (Td )
3.4.b. Convolution et dérivées
— La classe D de Schwartz
— Fonctions plateaux
3.4.c. Approximations de l’unité
— Densité de la classe D(Rd )
— Une approximation de l’unité utile
— Deux exemples
3.4.d. Théorème d’approximation de Weierstrass
— Des polynômes aux polynômes trigonométriques
— Séries de Fourier et théorème de Fejér
— Base hilbertienne de L2 (T)

3.1. Convolution dans L1 (Rd )


On se place sur Rd muni de la mesure de Lebesgue. On commence par définir le produit
de convolution f ∗ g de deux fonctions f et g mesurables ≥ 0, en posant
Z
d
∀x ∈ R , (f ∗ g)(x) = f (x − y)g(y) dy.
Rd

Le résultat est à valeurs dans [0, +∞] ; la fonction f ∗g est mesurable d’après les résultats
de la section 2.2 (théorème de Fubini). Les propriétés d’invariance de la mesure de
Lebesgue entraı̂nent que
Z Z
(f ∗ g)(x) = f (x − y)g(y) dy = f (z)g(x − z) dz = (g ∗ f )(x)
Rd Rd

pour tout x. On veut ensuite montrer que l’intégrale ci-dessus est finie pour presque tout
x ∈ RRd , lorsque f et g ont des intégrales finies. On va obtenir ce résultat en montrant
que (f ∗ g)(x) dx < +∞. La fonction h : (x, y) → f (x − y)g(y) est mesurable ≥ 0 sur

1
le produit Rd × Rd , ce qui permet d’appliquer le théorème de Fubini positif. L’intégrale
double sur Rd × Rd de cette fonction h(x, y) est donc
Z Z  Z Z Z 
f (x − y)g(y) dy dx = (f ∗ g)(x) dx = f (x − y)g(y) dx dy.
Rd Rd Rd Rd Rd

R R
L’invariance par translation de la mesure de Lebesgue donne f (x − y) dx = f (x) dx
pour tout y, de sorte que
Z Z  Z Z 
(1) f (x − y)g(y) dx dy = f (x) dx g(y) dy < +∞.
Rd Rd Rd Rd

On vient de montrer le résultat qui suit.

Lemme 3.1.1. Si f et g sont deux fonctions mesurables positives sur Rd , la fonction


f ∗ g est mesurable à valeurs dans [0, +∞], et
Z Z Z 
f ∗g = f g .
Rd Rd Rd

Supposons maintenant que f et g soient intégrables, réelles ou complexes. On vient


de voir dans le lemme précédent que
Z Z  Z Z 
|f (x − y)| |g(y)| dy dx = |f (x)| dx |g(y)| dy < +∞,
Rd Rd Rd Rd

R
ce qui implique que |f (x − y)| |g(y)| dy est fini pour presque tout x ; ceci montre que la
fonction y → f (x − y)g(y) est intégrable pour presque tout x. On peut donc poser pour
presque tout x
Z
(f ∗ g)(x) = f (x − y)g(y) dy,
Rd

et on obtient ainsi une fonction mesurable définie presque-partout (c’est une partie de
l’énoncé du théorème de Fubini 2.2.2) ; les calculs obtenus en majorant par les modules
montrent que f ∗ g est intégrable ; plus précisément on obtient l’inégalité de normes

kf ∗ gk1 ≤ kf k1 kgk1 .

Si on reprend avec Fubini le calcul qui menait à la formule (1), on obtient pour deux
fonctions intégrables réelles ou complexes f et g que
Z Z Z 
(f ∗ g)(x) dx = f (x) dx g(x) dx .
Rd Rd Rd

On note en passant que pour des fonctions intégrables positives, on a kf ∗gk1 = kf k1 kgk1 .

2
Exercice. Soient f, g ∈ L1 (Rd ) ; calculer la transformée de Fourier de f ∗ g.
d
Solution. On vient de voir R que si f1Ret g1Rsont deux fonctions intégrables surd R , alors
f1 ∗ g1 est intégrable et f1 ∗ g1 = ( f1 )( g1 ). On applique ceci, pour t ∈ R fixé, avec
f1 (x) = f (x) e−i x·t et g1 (x) = g(x) e−i x·t . On obtient
Z
(f1 ∗ g1 )(x) = f (x − y) e−i (x−y)·t g(y) e−i y·t dy = e−i x·t (f ∗ g)(x)

et Z Z Z 
(fd
∗ g)(t) = (f1 ∗ g1 )(x) dx = f1 (x) dx g1 (x) dx = fb(t) b
g(t).

Quand f = 2a 1
1[−a,a] , a > 0, on calcule facilement fb(t) = sin(at)/at (pour t 6= 0,
2
et fb(0) = 1). On obtient donc sans calculs supplémentaires que sin(at)/at est la
transformée de Fourier de g = f ∗ f , la fonction en triangle telle que g(−2a) = g(2a) = 0,
g(0) = 1/(2a), et affine sur [−2a, 0] et [0, 2a], nulle hors de [−2a, 2a].

Exercice 3.1.2. Si f est une fonction borélienne sur Rd , disons que f est supportée par
un sous-ensemble A de Rd si f est nulle en dehors de A,

f (x) 6= 0 ⇒ x ∈ A

(ne pas confondre avec la notion de support d’une fonction continue, qui est par définition
l’adhérence de l’ensemble {f 6= 0}). Si f, g ∈ L1 (Rd ), si f est supportée par le borélien
A et g par le borélien B, montrer que la convolution f ∗ g est supportée par la somme
de Minkowski de A et de B, définie par

A + B = {a + b : a ∈ A, b ∈ B}

(on n’essaiera pas de prouver que A + B est borélien ; on pourra cependant vérifier, bien
que la question n’ait pas été posée, qu’il est Lebesgue-mesurable).

Autres cadres pour la convolution : le cadre périodique


Dans le cas périodique, on s’occupera en général ici de fonctions 2π-périodiques sur R ;
une fonction f est dite intégrable dans ce contexte si elle est intégrable sur une période.
R a+2π R 2π
Dans ce cas, on vérifie facilement que a f (t) dt = 0 f (t) dt pour tout réel a. Si f et
g sont deux fonctions 2π-périodiques intégrables, on définira leur convolution périodique
en posant
Z 2π Z a+2π
dt dt
(f ∗ g)(s) = f (s − t)g(t) = f (s − t)g(t)
per 0 2π a 2π
pour tout a. On peut généraliser au cas périodique en plusieurs variables ; on peut aussi
changer de langage et dire qu’on est en train de travailler avec le groupe compact abélien
R/2πZ et sa probabilité invariante par translation. La convolution se généralise dans le
cadre plus général des groupes abéliens localement compacts, munis de leur mesure de
Haar.
Un modèle pour le groupe topologique quotient T = R/2πZ est fourni par le groupe
multiplicatif U des nombres complexes de module 1. Si θ est un nombre réel, il est clair

3
que e i θ ∈ U ne dépend que de la classe θb de θ dans R/2πZ, et l’application θb → e i θ
ainsi définie est un isomorphisme du groupe additif R/2πZ sur le groupe multiplicatif U.
Munissons le cercle U de son unique probabilité µ invariante par rotation. La formule de
convolution prend alors la forme suivante, pour deux fonctions F et G intégrables sur le
cercle unité U, Z
∀x ∈ U, (F ∗ G)(x) = F(xy −1 )G(y) dµ(y).
U

C’est une formule de ce type qu’il faut utiliser pour définir la convolution sur certains
groupes non commutatifs (comme O(n) par exemple), où la loi est toujours notée mul-
tiplicativement.
Si on paramétrise le cercle par x = e i θ , θ ∈ [0, 2π] et si on pose en plus f (θ) = F(e i θ ),
g(θ) = G(e i θ ) on retrouve l’écriture
Z 2π
dt
(f ∗ g)(θ) = f (θ − t)g(t) .
per 0 2π

Les fonctions f et g sont deux fonctions 2π-périodiques définies sur R, mais on peut aussi
les considérer simplement comme deux éléments de L1 (0, 2π).
Quand on parlera de T ou Td , on choisira selon les besoins l’une des trois présenta-
tions précédentes. On dira qu’une fonction 2π-périodique f sur R est dans Lp (T) si sa
restriction à une période quelconque [a, a + 2π] est dans Lp ([a, a + 2π], dx/(2π)). On
regardera Rd ou Td comme un groupe noté additivement, avec élément neutre noté 0,
et muni d’une distance d ; c’est si on veut la distance euclidienne pour Rd , et pour
Rd /(2πZ)d , la notation d(x, y) désignera la plus courte distance (euclidienne) entre deux
représentants x1 , y1 ∈ Rd des classes x, y ∈ Rd /(2πZ)d .
Exemple. Si on pose en (t) = e i nt , pour n ∈ Z, on a

(f ∗ en ) = cn (f ) en ,
per

où cn (f ) est le nième coefficient de Fourier complexe de f ,


Z 2π
dt
cn (f ) = f (t) e−i nt .
0 2π

On peut remarquer que la convolution périodique peut se ramener à la convolution


sur R de la façon suivante : si f et g sont 2π-périodiques sur R et appartiennent à L1 (T),
posons f1 = 1(0,2π) f ; on voit que
Z Z 2π
(f1 ∗ g)(x) = f1 (y)g(x − y) dy = f (y)g(x − y) dy = 2π (f ∗ g)(x).
R 0 per

Ainsi, plusieurs des propriétés de la convolution périodique ne nécessitent pas de preuve


séparée de celle qu’on donnera pour R.

4
Pour finir, il existe un dernier cadre de convolution qui se révèle intéressant, mais
où on ne rencontre pas de finesses de théorie de l’intégration : c’est le cas de la mesure
de comptage sur Z. Si a = (an )n∈Z et b = (bn )n∈Z sont deux éléments de `1 (Z), leur
convolution est définie par X
(a ∗ b)n = an−k bk ,
k∈Z

qui est l’analogue exact pour la mesure de comptage de la formule utilisée sur R.

3.2. Densité des fonctions continues


Définition. Le support d’une fonction continue f définie sur Rd est l’adhérence de
l’ensemble des points où f est non nulle,

supp(f ) = {x ∈ Rd : f (x) 6= 0}.

Théorème 3.2.1. Les fonctions continues à support compact sont denses dans Lp (Rd ),
pour tout p tel que 1 ≤ p < +∞.
Il est évident que le résultat ne peut pas être vrai dans L∞ : une suite de Cauchy dans L∞ ,
formée de fonctions continues, est une suite de Cauchy uniforme, et la limite sera toujours
continue. Le cas de tous les espaces Lp (Rd ), pour 1 ≤ p < +∞ est essentiellement le
même et on écrira la preuve dans le cas p = 1.
Démonstration. Il est clair que les fonctions étagées sont denses dans L1 : pour toute
fonction f ∈ L1 (Rd ), il existe une suite de fonctions étagées (fn ) telle que |fn | ≤ |f |
et fn → f simplement (proposition 1.1.2) ; par convergence dominée, f est limite dans
L1 des fn . Pour montrer le théorème, il suffit de voir que toute indicatrice de borélien
peut être approchée par des fonctions continues à support compact : par linéarité on
obtiendra que toute fonction étagée peut être approchée par une fonction continue à
support compact, d’où le résultat puisque les fonctions étagées sont denses dans L1 (Rd ).
Soit A un borélien de Rd ; alors 1A est limite dans L1 (Rd ) d’une suite (1An ) cor-
respondant à des boréliens bornés (intersections de A avec des boules de rayon n par
exemple), et pour n assez grand on aura
Z
|1A (x) − 1An (x)| dx < ε.
Rd

Finalement, il suffit pour montrer le théorème d’approcher, pour la norme de L1 (Rd ),


toute indicatrice de borélien borné par une fonction continue à support compact. Si A est
un borélien borné, on peut le placer dans un ouvert borné de la forme W = ]−a, a[d, qui est
de mesure finie pour la mesure de Lebesgue. D’après le théorème d’approximation 1.2.4
appliqué à X = Rd , il existe une fonction continue ϕ sur Rd , nulle hors de W et telle que
Z
1A (x) − ϕ(x) dx < ε,
Rd

ce qui termine la preuve, car le support de ϕ est contenu dans [−a, a]d, qui est compact.

5
Remarque. Les fonctions en escalier sont denses aussi (en plusieurs dimensions, on ap-
pelle ainsi toute combinaison linéaire de fonctions indicatrices de produits d’intervalles).
Pour montrer cette densité, on peut constater qu’une fonction continue à support
compact peut être approchée dans L1 par des fonctions en escalier (utiliser la continuité
uniforme ; procéder ainsi, c’est utiliser la stratégie mathématique qui consiste à toujours
commencer par raccrocher la casserole au mur, quand on ne sait faire cuire l’œuf qu’à
partir de cet état initial ; sinon, on peut vérifier que les boréliens de [0, 1] approchables
dans L1 par des fonctions en escalier forment une tribu qui contient les intervalles).

3.3. Inégalités

3.3.a. Inégalité de Jensen

Proposition 3.3.1 : inégalité de Jensen. On suppose que (Ω, A, µ) est un espace de


probabilité, f une fonction réelle µ-intégrable sur Ω et ϕ une fonction convexe sur R.
On a
Z  Z
ϕ f (ω) dµ(ω) ≤ ϕ(f (ω)) dµ(ω).
Ω Ω

Il est possible que ϕ(f ) ne soit pas µ-intégrable, mais l’intégrale a toujours un sens (en
admettant la valeur +∞) parce que ϕ(f )− = max(−ϕ(f ), 0) est intégrable.

Si la fonction f ne prend que deux valeurs u et v sur l’espace Ω, avec probabilités


1 − t et t, l’inégalité
 de Jensen se réduit à la définition de la convexité de ϕ, à savoir
ϕ (1 − t)u + tv ≤ (1 − t)ϕ(u) + tϕ(v).
R
Démonstration. Posons m = Ω f (ω) dµ(ω) ∈ R (c’est la valeur moyenne de la fonction
f ). On considère une fonction affine d’appui h à la fonction convexe ϕ au point m,
h(x)R= ax + b, avec h(m) = ϕ(m) et h ≤ ϕ partout. On a ensuite, compte tenu du fait
que dµ = µ(Ω) = 1,
Z Z
ϕ(m) = h(m) = am + b = (af (ω) + b) dµ(ω) ≤ ϕ(f (ω)) dµ(ω).
Ω Ω

La fonction ϕ(f )− = max(−ϕ(f ), 0) est intégrable ; en effet, on a −ϕ(f ) ≤ −af − b ≤


|a| |f | + |b|, donc max(−ϕ(f ), 0) ≤ |a| |f | + |b| est intégrable.

Remarque. Si on considère la fonction convexe ϕ(t) = |t|p , 1 ≤ p < +∞ et une mesure


finie ν sur Ω, on a
Z p
Z
p−1
f (ω) dν(ω) ≤ ν(Ω) |f (ω)|p dν(ω).
Ω Ω

Pour obtenir cette inégalité dans le cas non trivial où ν(Ω) 6= 0, il suffit de raisonner sur
la probabilité dµ(ω) = ν(Ω)−1 dν(ω) et d’utiliser l’homogénéité de la fonction puissance.

6
3.3.b. Inégalité de Minkowski
Lemme. Si ν est une mesure σ-finie non nulle sur un espace mesurable (Y, B), on peut
trouver
R une fonction mesurable k strictement positive en tout point de Y, et telle que
Y
k dν = 1.
Preuve. Il existe une suite (An ) ⊂ B d’ensembles de mesure finie > 0 qui recouvre Y ; on
pose
+∞ −n−1
X 2
k= 1A .
n=0
ν(An ) n
R
On a k(y) > 0 pour tout y ∈ Y, et Y k(y) dν(y) = 1.
Théorème 3.3.2. Si f (x, y) est mesurable sur un espace produit (X × Y, A ⊗ B), si µ
et ν sont σ-finies sur X et Y respectivement, et si p ≥ 1, on a
Z Z p 1/p Z Z 1/p
p
|f (x, y)| dν(y) dµ(x) ≤ |f (x, y)| dµ(x) dν(y).
X Y Y X

Il faut comprendre l’inégalité de Minkowski de la façon suivante : si fy1 , . . . , fyn est


une famille finie de fonctionsPdans Lp (X, µ), l’inégalité triangulaire dans Lp (X, µ) nous
n
donne pour la fonction F = j=1 fyj ∈ Lp (X, µ)

Z X
n 1/p n
X n Z
X 1/p
p
fyj (x) dµ(x) = kFkp ≤ kfyj kp = |fyj (x)|p dµ(x) .
X j=1 j=1 j=1 X

Dans l’inégalité de Minkowski, on a une famille (fy ) de fonctions de Lp (X, µ), qui dépend
d’un paramètre continu y ∈ Y, famille définie par fy (x) = |f (x, y)|, et on considère son
intégrale F ∈ Lp (X, µ) par rapport au paramètre y, au lieu de la somme finie considérée
précédemment. Cette fonction de la variable x est égale à
Z Z
F(x) = fy (x) dν(y) = |f (x, y)| dν(y).
Y Y

L’inégalité de Minkowski dit que la norme de F dans Lp (X, µ) est majorée par l’intégrale
par rapport au paramètre y des normes dans Lp (X, µ) des morceaux fy . Il s’agit donc
d’une version continue de l’inégalité triangulaire.

Démonstration. Clairement on peut se limiter au cas f ≥ 0. Posons


Z Z
1/p
M= f (x, y)p dµ(x) dν(y).
Y X

Si M = +∞, la relation à démontrer est évidente. Soit t < 1 fixé, et supposons M ≤ t < 1 ;
posons
Z 1/p
p
g(y) = f (x, y) dµ(x) .
X
R
On a Y g(y) dν(y) = M < 1 ; l’ensemble N des y ∈ Y tels que g(y) = +∞ est donc
ν-négligeable, et on peut se ramener à N = ∅ en modifiant f sur X × N : si on pose
fe(x, y) = 0 lorsque y ∈ N et fe(x, y) = f (x, y) quand y ∈
/ N, la fonction ge correspondante

7
est finie partout, et les deux membres de l’inégalité de Minkowski sont inchangés. On
supposera donc que g(y) < +∞ pour tout y ∈ Y.
On va suivre une démarche analogue à celle qui nous a permis de voir que la norme
de Lp est bien une norme. Dans l’interprétation donnée avant la démonstration, g(y) est
la norme de la fonction fy . Puisque ν est σ-finie, on peut trouver h > g ≥ 0 telle que
R
h(y) dν(y) = 1 (prendre h = g + (1 − M)k, avec k donnée par le lemme). Écrivons
Z p Z p
f (x, y) dν(y) = h(y)−1 f (x, y) h(y) dν(y) ≤
Y Y
Z Z
−1
p
≤ h(y) f (x, y) h(y) dν(y) = f (x, y)p h(y)1−p dν(y),
Y Y

où on a utilisé Jensen pour la probabilité h(y) dν(y), puis avec Fubini on obtient
Z Z p Z Z
f (x, y) dν(y) dµ(x) ≤ f (x, y)p h(y)1−p dν(y)dµ(x) =
X Y X Y
Z Z Z Z
p
 1−p p 1−p
= f (x, y) dµ(x) h(y) dν(y) = g(y) h(y) dν(y) ≤ h(y) dν(y) = 1.
Y X Y Y

Par homogénéité, on voit qu’on a prouvé que


Z Z p 1/p 1 Z Z 1/p
|f (x, y)| dν(y) dµ(x) ≤ |f (x, y)|p dµ(x) dν(y)
X Y t Y X

pour tout t < 1, d’où le résultat voulu en faisant tendre t vers 1.


Remarque. Dans la preuve, on a utilisé le théorème de Fubini, qui nous a imposé
des mesures σ-finies, mais on peut se demander si des restrictions dans l’énoncé de
Minkowski sont vraiment nécessaires. Et en effet, comme le théorème de Fubini, l’inégalité
de Minkowski n’est pas vraie sans un minimum d’hypothèses : considérons sur [0, 1]2
la fonction borélienne f qui est l’indicatrice de la diagonale, f (x, y) = 1 si x = y et
f (x, y) = 0 sinon. Prenons pour µ la mesure de Lebesgue sur X = [0, 1] et pour ν la
mesure de comptage sur Y = [0, 1] ; on a alors
Z X
|f (x, y)| dν(y) = |f (x, y)| = 1
Y y∈Y

pour tout x ∈ [0, 1], donc


Z Z p 1/p
|f (x, y)| dν(y) dµ(x) = 1;
X Y

mais pour la quantité qui devrait majorer ce premier résultat on trouve


Z Z Z 1/p
p
|f (x, y)| dµ(x) = 0, |f (x, y)|p dµ(x) dν(y) = 0.
X Y X

8
Exercice. On suppose 0 < r < p < +∞. Montrer que
Z Z p/r 1/p Z Z r/p 1/r
r
|f (x, y)| dν(y) dµ(x) ≤ |f (x, y)|p dµ(x) dν(y) .
X Y Y X

3.3.c. Inégalité de Hölder


On dit que deux nombres p, q de [1, +∞] forment un couple d’exposants conjugués s’ils
vérifient la relation
1 1
+ = 1.
p q
Cette relation est à prendre au sens étendu : (1, +∞) est un cas particulier de couple
d’exposants conjugués. Dans le cas 1 < p < +∞, on notera que q(p − 1) = p.
Théorème 3.3.3 : inégalité de Hölder. Soient p, q ∈ [1, +∞] tels que 1/p + 1/q = 1 ; si
f ∈ Lp (Ω, A, µ) et g ∈ Lq (Ω, A, µ), la fonction produit f g est intégrable et
Z
f g dµ ≤ kf kp kgkq .

Démonstration. Si p = ∞, alors q = 1 ; la fonction f est (presque-sûrement) bornée


par M = kf k∞ et g est intégrable ; le produit f g est mesurable et |f g| ≤ M |g| presque
partout, donc f g est intégrable et
Z Z Z
fg ≤ |f g| ≤ M |g| = kf k∞ kgk1 .
Ω Ω Ω

Supposons maintenant 1 < p < +∞. Pour tous nombres réels t, u ≥ 0, on a la relation
1 p 1 q
tu ≤ t + u ;
p q
cette relation résulte immédiatement de la convexité de l’exponentielle : on pose tp = ex ,
uq = ey , et on obtient que
1 1  1 1 1 1
tu = exp x + y ≤ ex + ey = tp + uq .
p q p q p q
Il en résulte que pour tout s ∈ Ω
1 1
|f (s)g(s)| ≤ |f (s)|p + |g(s)|q ,
p q
ce qui montre que f g est intégrable, et que
Z Z Z
1 p 1
f (s)g(s) dµ(s) ≤ |f (s)| dµ(s) + |g(s)|q dµ(s).
Ω p Ω q Ω

L’inégalité cherchée est positivement homogène par rapportRà f et à g, donc R ilq suffit de
p
la démontrer lorsque kf kp = Rkgkq = 1. Mais dans ce cas, |f | = 1 et |g| = 1, et
l’inégalité précédente donne | Ω f g| ≤ 1/p + 1/q = 1, ce qui est le résultat voulu.

9
Corollaire. Soient p ∈ [1, +∞[ et q tels que 1/p + 1/q = 1 ; si f ∈ Lp (Ω, A, µ),
Z

kf kp = sup f g dµ : kgkq ≤ 1 .

Dans le cas p = +∞, le résultat reste vrai si tout ensemble B ∈ A tel que µ(B) = +∞
contient un A ∈ A tel que 0 < µ(A) < +∞.
Démonstration. L’inégalité de Hölder nous dit déjà que
Z

kf kp ≥ sup f g dµ : kgkq ≤ 1 ,

le problème est de montrer l’autre direction. On va voir qu’en fait le maximum est atteint
pour une certaine fonction g ∈ Lq , kgkq ≤ 1, lorsque 1 ≤ p < +∞. Si f = 0, le résultat est
évident, on supposera donc f 6= 0, et par homogénéité on peut se ramener à kf kp = 1. En
choisissant un représentant de la classe f , on se permettra de raisonner sur une hh vraie ii
fonction mesurable f ; définissons une fonction mesurable g sur l’ensemble Ω en posant
g(s) = |f (s)|p/f (s) sur l’ensemble mesurable A = {f 6= 0}, et g(s) = 0 lorsque s ∈ / A.
p−1 q q(p−1) p
R q |g(s)|
Alors R = |f (s)| pour tout s ∈ A ; pour p > 1, on a |g| = |f | = |f | , donc
|g| = |f |p = 1, soit encore kgkq = 1 ; pour p = 1, g(s) est de module 1 quand s ∈ A,
nul sinon, donc kgk∞ = 1. D’autre part
Z Z Z
p
f g dµ = |f (s)| dµ(s) = |f |p dµ = 1 = kf kp .
Ω A Ω

Dans le cas p = +∞, le maximum n’est pas nécessairement atteint ; cependant, si on


suppose kf k∞ = 1, l’ensemble mesurable Bε = {|f | > 1 − ε} est de mesure > 0 pour
tout ε ∈ ]0, 1[. On prendra g(s) = µ(A)−1 |f (s)|/f (s) si s ∈ A, g(s) R= 0 sinon, où A est
un sous-ensemble de Bε tel que 0 < µ(A) < +∞. Alors kgk1 = 1 et Ω f g dµ > 1 − ε.

3.3.d. Isométrie dans le dual de Lq


Soient (Ω, A, µ) un espace mesuré quelconque, et p, q ∈ [1, +∞] un couple d’exposants
conjugués. Par Hölder, on peut définir pour toute f ∈ Lp (Ω, A, µ) une forme linéaire
continue jp (f ) sur Lq (Ω, A, µ) en posant
Z
q
∀g ∈ L , jp (f )(g) = f (t)g(t) dµ(t).

Le corollaire ci-dessus indique


R que l’application jp qui associe à une fonction f ∈ Lp la
forme linéaire g ∈ Lq → f g dµ est une isométrie linéaire de Lp dans le dual de Lq (ici,
nous entendons par dual d’un espace normé X le dual topologique, formé de toutes les
formes linéaires continues sur X). On sait en fait que
lorsque 1 < p < +∞, l’application jp précédente est une bijection isométrique de
L (Ω, A, µ) sur le dual de Lq (Ω, A, µ).
p

Le résultat précédent est valable pour toute mesure µ ≥ 0. En revanche, le cas p = +∞


demande une hypothèse minimale,
lorsque p = +∞, et si la mesure µ est σ-finie, l’application j∞ est une bijection
isométrique de L∞ (Ω, A, µ) sur le dual de L1 (Ω, A, µ).

10
La condition σ-finie n’est pas une condition nécessaire pour la validité de l’énoncé
précédent, mais il faut imposer une condition minimale. En effet, pour la mesure patho-
logique µ qui vaut toujours +∞ sauf pour ∅, on a L1 = {0}, alors que L∞ 6= {0} (il
contient les fonctions bornées) ne peut pas être le dual de cet espace L1 . Pour terminer
cette discussion sur l’identification des duaux (topologiques) des espaces Lp , rappelons
que L1 n’est pas le dual de L∞ , sauf circonstance extraordinaire (quand L∞ est de
dimension finie, parce que l’ensemble Ω est fini par exemple).

3.3.e. Convolutions L1 ∗ Lp lorsque 1 ≤ p < +∞


Si f ∈ L1 et g ∈ Lp , on va voir que la convolution f ∗ g a un sens ; dans le cas de Rd ,
ce résultat n’est pas contenu dans ce qui a été fait avec L1 ∗ L1 ; en revanche, ce résultat
n’est pas nouveau dans le cas périodique où la mesure est finie, car Lp (T) ⊂ L1 (T).
On commence avec f ∈ L1 , g ∈ Lp positives et on écrit, avec valeur infinie admise
pour les intégrales, l’inégalité de Minkowski pour la fonction h(x, y) = f (y)g(x − y),
Z Z Z p 1/p Z Z 1/p
p
(f ∗ g)(x) dx = f (y)g(x − y) dy dx ≤ f (y)p g(x − y)p dx dy =

Z Z 1/p
= f (y) g(x − y)p dx dy = kf k1 kgkp .

Si f et g sont à valeurs réelles ou complexes, on utilise d’abord le résultat obtenu pour |f |


et |g|, qui garantit que (f ∗ g)(x) existe pour presque tout x, et on obtient que f ∗ g ∈ Lp ,
avec la majoration de norme
kf ∗ gkp ≤ kf k1 kgkp
obtenue en majorant les modules d’intégrales par les intégrales de modules. On notera
que le résultat est valable pour la mesure de comptage sur Z : on a `1 (Z) ∗ `p(Z) ⊂ `p (Z),
avec l’inégalité de norme précédente.
3.3.f. Convolutions Lp ∗ Lq lorsque 1/p + 1/q = 1
Ce cas est une conséquence immédiate de l’inégalité de Hölder et des propriétés d’inva-
riance de la mesure de Lebesgue : si f est dans Lp et g dans Lq (sur Rd , T ou Z), la
fonction y → f (x − y) est aussi dans Lp et a la même norme que f , donc pour tout x
Z
|(f ∗ g)(x)| = f (x − y)g(y) dy ≤ kf kp kgkq .

On a donc Lp ∗Lq ⊂ L∞ quand les exposants p, q sont conjugués, et kf ∗gk∞ ≤ kf kp kgkq .


On remarquera qu’ici, la fonction f ∗ g est définie en tout point ; ce fait est à rapprocher
de la proposition 3.4.4, qui dira que f ∗ g est en fait une fonction continue.
Les deux cas L1 ∗ Lp ⊂ Lp et Lp ∗ Lq ⊂ L∞ sont deux cas particuliers dans une
échelle continue de résultats du même type :
si 1/p + 1/q = 1 + 1/r, avec p, q, r ≥ 1, alors Lp ∗ Lq ⊂ Lr et kf ∗ gkr ≤ kf kp kgkq .
Ce résultat s’appelle l’inégalité de convolution de Young. Il est possible de le démontrer
par des applications astucieuses de l’inégalité de Hölder.

11
3.4. Régularisation et approximation
3.4.a. Continuité, opérateurs de translation
Commençons par les propriétés de continuité des convolées. Elles résultent du théorème
de convergence dominée de Lebesgue.
Proposition 3.4.1. Si f ∈ L1 (Rd ) et si g est continue bornée sur Rd , la convolée f ∗ g
est continue bornée sur Rd . Le même résultat est valable pour Td .
Preuve. Posons M = kgk∞ . Soient x un point de Rd et (xn ) une suite tendant vers
x ; on obtient pour tout y ∈ Rd l’inégalité |f (y)g(xn − y)| ≤ M |f (y)|, qui donne la
majoration par une fonction intégrable fixe, et hn (y) = f (y)g(xn − y) tend simplement
vers h(y) = f (y)g(x − y). La convergence des intégrales, justifiée par le théorème de
convergence dominée, donne (f ∗ g)(xn) → (f ∗ g)(x).
Notons τv l’opérateur de translation par un vecteur v ∈ Rd : si f est une fonction
sur Rd , on posera
∀x ∈ Rd , (τv f )(x) = f (x − v) ;
on définit aussi les translations τv sur Td , par la même formule. On emploiera aussi
la notation fv = τv f pour gagner de la place. Il est important de remarquer que les
translations commutent avec les convolutions, (f ∗ g)v = f ∗ gv = fv ∗ g.
Une fonction définie sur Rd est uniformément continue si et seulement si kfv − f k∞
tend vers 0 lorsque la norme |v| du vecteur v de la translation tend vers 0. Le module de
continuité ωf de la fonction f , défini par

ωf (δ) = sup{|f (x) − f (x0 )| : |x − x0 | ≤ δ}

est aussi égal à sup{kfv − f k∞ : |v| ≤ δ} : en effet, on a |x − x0 | ≤ δ si et seulement si


on peut écrire x0 = x − v avec |v| ≤ δ. Alors

|f (x0 ) − f (x)| = |(fv − f )(x)| ≤ kfv − f k∞ .

Proposition 3.4.2. Si f ∈ L1 (Rd ) et si g est uniformément continue bornée sur Rd ,


f ∗ g est uniformément continue bornée.
Preuve. On a |gv − g| ≤ ωg (|v|) et (f ∗ g)v − (f ∗ g) = f ∗ (gv − g), il suffit d’appliquer la
plus simple des majorations : kf ∗ (gv − g)k∞ ≤ kf k1 kgv − gk∞ .
Remarque. Plus précisément, on vient d’obtenir l’estimation

ωf ∗g (δ) ≤ kf k1 ωg (δ)

pour les modules de continuité. De plus cette inégalité subsiste si g est uniformément
continue, non nécessairement bornée, mais telle que f ∗ g soit définie en tout point : par
exemple, si f ∈ L1 (Rd ) est nulle hors d’un borné, et g uniformément continue sur Rd .
Dans le cas de T, on a affaire à des fonctions continues périodiques, qui sont toujours
uniformément continues ; la proposition 3.4.2 et sa démonstration sont valables dans le
cas périodique, mais elles ne disent rien de plus que le premier résultat de continuité 3.4.1.
En revanche, l’information sur le module de continuité reste valable et pertinente dans
le cas périodique.

12
Continuité des translations sur Lp (Rd ), ou bien Lp (Td )
On considère la famille des translations τv , v ∈ Rd , agissant sur Lp (Rd ) ; il est clair que
les translations définissent des isométries de tous les espaces Lp (à cause de l’invariance
de la mesure de Lebesgue par translation).
Proposition 3.4.3. On suppose 1 ≤ p < +∞. Pour toute fonction f ∈ Lp (Rd ) on a

lim kτv f − f kp = 0.
v→0

Le même résultat est vrai pour Td .


Démonstration. Les translations τv sont des isométries de Lp , donc kτv k = 1 pour tout
v ∈ Rd ; le sous-espace vectoriel K = K(Rd ) des fonctions continues à support compact
est dense dans Lp (Rd ) (théorème 3.2.1) et pour toute fonction g ∈ K on a kτv g − gkp → 0
lorsque v → 0 (continuité uniforme plus considérations de support, voir plus bas). On en
déduit que ce résultat est vrai pour toute fonction de Lp : en effet, on approche f ∈ Lp
par g ∈ K, disons kf − gkp < ε/3 ; pour |v| < t0 on aura kτv g − gkp < ε/3 d’après ce qui
précède, et d’autre part kτv f − τv gkp = kf − gkp < ε/3, d’où le résultat kτv f − f kp < ε
par l’inégalité triangulaire.
Justifions plus précisément la convergence Lp dans le cas g ∈ K(Rd ). Supposons
que le support de g soit contenu dans la boule B(0, R), et supposons |v| ≤ 1. Les deux
fonctions g et τv g sont alors nulles en dehors de l’ensemble A = B(0, R+1), par conséquent
Z
kτv g − gkpp = |g(x − v) − g(x)|p dx ≤ λ(A) ωg (|v|)p ,
A

qui tend vers 0 quand |v| → 0.


On vient d’utiliser un principe d’équicontinuité bien connu.
Lemme. Si une suite (Tn ) d’applications linéaires continues entre deux espaces normés
X et Y, telle que sup kTn k < +∞ (c’est l’équicontinuité de la suite) tend simplement
vers une application continue T ∈ L(X, Y) sur un sous-ensemble dense X0 de X, alors
on a convergence de la suite (Tn (x)) ⊂ Y vers T(x) pour tout x ∈ X.

On a vu que Lp ∗ Lq ⊂ L∞ quand p et q sont conjugués. De plus, la fonction f ∗ g


est uniformément continue dans ce cas.
Proposition 3.4.4. On suppose que 1 ≤ p ≤ +∞, 1/p + 1/q = 1 ; si f ∈ Lp (Rd ) et
g ∈ Lq (Rd ), la convolée f ∗ g est uniformément continue sur Rd (même résultat sur Td ).
Démonstration. L’un au moins de p ou q est fini, par exemple p < +∞. On a

k(f ∗ g)v − f ∗ gk∞ = k(fv − f ) ∗ gk∞ ≤ kfv − f kp kgkq

par Hölder, et kfv − f kp → 0 d’après ce qui précède. Pour tout ε > 0, il existe donc
t0 > 0 tel que la condition |v| < t0 entraı̂ne k(f ∗ g)v − f ∗ gk∞ < ε.
Exercice. Soit A un borélien de mesure > 0 dans Rd ; montrer que l’ensemble différence
de Minkowski A − A = {a − b : a, b ∈ A} est un voisinage de 0 dans Rd .

13
3.4.b. Convolution et dérivées
En une variable, si f ∈ L1 et si g ∈ L∞ a une dérivée bornée, alors f ∗ g est dérivable et
(f ∗ g)0 = f ∗ g 0 (dérivation sous l’intégrale à la Lebesgue). On a des résultats analogues
pour les dérivées partielles ; il existe un grand nombre de variantes de ces résultats. On
va commencer par un cas simple. Soient u un vecteur 6= 0 dans Rd et g une fonction sur
Rd ; notons Du g la dérivée de g dans la direction u, définie au point x par

g(x + tu) − g(x)


(Du g)(x) = lim ;
t→0 t

supposons que g soit mesurable, définie et bornée sur Rd , que Du g existe sur Rd et soit une
fonction bornée par M ; en appliquant le théorème des accroissements finis aux fonctions
d’une variable t ∈ R → g(x + tu), on voit que ces fonctions sont M-lipschitziennes ; on a
Z
(f ∗ g)(x + tu) − (f ∗ g)(x) g(x + tu − y) − g(x − y)
= f (y) dy.
t Rd t

En posant (pour x fixé) G(y, t) = t−1 g(x + tu − y) − g(x − y) on aura l’inégalité
|f (y)G(y, t)| ≤ M |f (y)| qui donne la majoration par une fonction intégrable fixe indé-
pendante du paramètre t, pendant que G(y, t) tend simplement vers Du g(x − y) quand
t → 0, pour tout y ; le théorème de convergence dominée montre que Du (f ∗ g)(x) existe,
et Z
Du (f ∗ g)(x) = f (y)(Dug)(x − y) dy = (f ∗ Du g)(x).
Rd

Si Du g est de plus continue sur Rd , la dérivée directionnelle f ∗ Du g de f ∗ g est aussi


continue sur Rd par la proposition 3.4.1.
Rappelons que la jième dérivée partielle Dj g de la fonction g est la dérivée dans la
direction du vecteur ej de la base canonique de Rd . Si toutes les dérivées partielles de g
sont des fonctions continues bornées, il en résulte que f ∗ g admet des dérivées partielles
continues. Autrement dit : si g est bornée et de classe C1 , à dérivées partielles bornées
sur Rd , et si f ∈ L1 , la convolution f ∗ g est de classe C1 sur Rd . On a ainsi obtenu le
résultat qui suit.
Proposition 3.4.5. On suppose que f ∈ L1 (Rd ) et que g est mesurable bornée sur Rd ;
on suppose que u est un vecteur non nul fixé, et que g admet en tout point de Rd une
dérivée directionnelle Du g, bornée sur Rd . Il en résulte que f ∗ g admet f ∗ Du g comme
dérivée directionnelle Du (f ∗ g). En particulier, si f ∈ L1 (Rd ), si g est bornée, de classe
C1 sur Rd et si toutes les dérivées partielles de g sont bornées sur Rd , la fonction f ∗ g
est de classe C1 et ses dérivées partielles sont données par

Dj (f ∗ g) = f ∗ Dj g, j = 1, . . . , d.

On va considérer un énoncé un peu différent, où on demandera un peu plus que la


simple dérivabilité directionnelle.
Proposition 3.4.6. On suppose que f ∈ Lp (Rd ) et que g, définie en tout point de Rd ,
appartient à Lq (Rd ) avec 1/p + 1/q = 1 ; on suppose que u 6= 0 est fixé, et que g admet

14
une dérivée directionnelle Du g ∈ Lq (Rd ), définie en tout point x ∈ Rd et telle que pour
tout t > 0 on ait s → (Du g)(x + su) intégrable sur [0, t] et
Z t
(2) g(x + tu) − g(x) = (Du g)(x + su) ds.
0
Il en résulte que f ∗ g admet f ∗ Du g comme dérivée directionnelle. En particulier, si
f ∈ Lp , si g ∈ Lq est de classe C1 et si toutes les dérivées partielles de g sont dans Lq ,
la fonction f ∗ g est de classe C1 et ses dérivées partielles sont données par
Dj (f ∗ g) = f ∗ Dj g, j = 1, . . . , d.

Démonstration. Fixons x ∈ Rd , quelconque. D’après la proposition 3.4.4, la convolée


f ∗ Du g est continue sur Rd , donc
s ∈ R → h(s) = (f ∗ Du g)(x + su)
est continue. D’après le théorème de Fubini et l’hypothèse (2),
Z t Z Z t 
H(t) = h(s) ds = f (y) (Du g)(x + su − y) ds dy
0 Rd 0
Z

= f (y) g(x + tu − y) − g(x − y) dy = (f ∗ g)(x + tu) − (f ∗ g)(x).
Rd
Comme h est continue, la fonction H est dérivable à l’origine, de dérivée h(0), ce qui
signifie que f ∗ g admet au point x une dérivée dans la direction u, qui est donnée par
(f ∗ Du g)(x). Justifions maintenant l’utilisation de Fubini, en montrant l’intégrabilité en
(s, y) ∈ [0, t] × Rd de la fonction considérée,
Z tZ
|f (y)| |(Dug)(x + su − y)| dsdy
0 Rd
Z tZ 
|f (y)|p |(Du g)(x + su − y)|q 
≤ + dsdy
0 Rd p q
Z Z Z
t p 1 t   t t
= |f (y)| dy + ds |(Du g)(x + su − y)|q dy = kf kpp + kDu gkqq
p Rd q 0 Rd p q
qui est fini.
Montrons le dernier point. Si g est de classe C1 , chaque dérivée partielle Dj g est
continue et on a la formule (2) (appliquée avec le vecteur u = ej , jième vecteur de la
base canonique). On voit donc d’après ce qui précède que f ∗ g admet f ∗ Dj g comme
dérivée partielle. Comme toutes ces dérivées partielles sont continues d’après 3.4.4, la
fonction f ∗ g est de classe C1 .
Si g est C∞ à support compact, il résulte de la proposition 3.4.6 que f ∗ g est C∞
lorsque f ∈ Lp (Rd ). En effet, toutes les dérivées partielles de g sont continues à support
compact, donc appartiennent à Lq ; d’après ce qui précède toutes les dérivées partielles
Di , i = 1, . . . , d de la convolée f ∗g existent, et sont données par les f ∗Di g ; mais chacune
de ces f ∗ Di g est à nouveau une convolution d’une fonction f de Lp par une fonction
Di g qui est C∞ à support compact. On voit de proche en proche que f ∗ g admet des
dérivées partielles de tous les ordres, donc f ∗ g est C∞ . Pour tout multi-indice α, on a
Dα (f ∗ g) = f ∗ Dα g.

15
Exercice. Montrer que la fonction f définie sur R par f (x) = exp(−1/x) si x > 0 et
f (x) = 0 si x ≤ 0 est de classe C∞ sur R.

La classe D de Schwartz
C’est la classe D(Rd ) formée de toutes les fonctions sur Rd , de classe C∞ et à support
compact ; il n’est pas totalement évident de donner un élément non nul de cet espace.
À partir de la fonction f de l’exercice précédent, on peut construire des fonctions C∞ à
support compact sur R, par exemple la fonction ϕ définie par
 
∀x ∈ R, ϕ(x) = f 2(1 + x) f 2(1 − x) .

Cette fonction est à support dans [−1, 1], et pour |x| < 1 on a
 1 1   1 
ϕ(x) = exp − − = exp − .
2(1 + x) 2(1 − x) 1 − x2

À partir de cette fonction C∞ à support compact, ≥ 0 et non identiquement nulle,


on construit des exemples ψ en toute dimension d, par exemple
d
Y  X
d
1/2 
ψ(x1 , . . . , xd ) = ϕ(xj ) ou bien ϕ x2j .
j=1 j=1

En utilisant les changements d’échelle définis par

ψa (x) = ψ(ax),

et en prenant a > 0 grand, on pourra trouver des fonctions dans D(Rd ), non identique-
ment nulles ≥ 0, et avec un support dans une boule B(0, ε) de rayon arbitrairement petit.
Retenons le fait essentiel suivant :
si ϕ ∈ D(Rd ) et si f ∈ Lp (Rd ), 1 ≤ p < +∞, la convolée f ∗ ϕ est de classe C∞ et
bornée sur Rd .

Fonctions plateaux
Lemme. Si K est un compact non vide de Rd et U un ouvert contenant K, il existe une
fonction θ ∈ D(Rd ) telle que 0 ≤ θ ≤ 1, θ = 1 sur K et θ = 0 hors de U.
Preuve. On pose

ε = min{dist(x, Uc ) : x ∈ K} = min{kx − x0 k : x ∈ K, x0 ∈
/ U} > 0,

puis
V = {x ∈ Rd : dist(x, K) < ε/2},
et on choisit une fonction ϕ ∈ D(Rd ) à support dans la boule B(0, ε/2), ϕ ≥ 0 et
d’intégrale égale à 1. On va montrer que θ = 1V ∗ ϕ convient. On a pour tout x
Z
θ(x) = 1V (x − y)ϕ(y) dy ;
Rd

16
il est clair sur cette formule que 0 ≤ θ ≤ 1. Supposons que x0 ∈/ U, et montrons que la
fonction h : y → 1V (x0 − y)ϕ(y) est identiquement nulle, ce qui donnera bien sûr
Z
0
θ(x ) = 1V (x0 − y)ϕ(y) dy = 0 ;
Rd

si |y| ≥ ε/2, on a ϕ(y) = 0, donc h(y) = 0 ; puisque x0 ∈ / U, on a dist(x0 , K) ≥ ε. Si


|y| < ε/2, on aura dist(x0 − y, K) ≥ ε − ε/2 = ε/2 par l’inégalité triangulaire, donc
x0 − y ∈/ V et 1V (x0 − y) = 0 = h(y). Ainsi, h(y) = 0 pour tout y.
Si x ∈ K, on va montrer que y → 1V (x − y)ϕ(y) est égale à la fonction y → ϕ(y), ce
qui donnera Z Z
θ(x) = 1V (x − y)ϕ(y) dy = ϕ(y) dy = 1 ;
Rd Rd

si ϕ(y) = 0, les deux fonctions sont nulles, donc égales au point y ; sinon, on aura
|y| < ε/2, dist(x − y, K) ≤ |y| < ε/2, donc x − y ∈ V et 1V (x − y) = 1.

3.4.c. Approximations de l’unité


Définition. Une approximation de l’unité est une suite (ϕk ) dans L1 (Rd ) ou L1 (Td )
telle que
Z
(a) sup |ϕk | < +∞,
k

Z
(b) ϕk = 1 pour tout k ≥ 1,

Z
(c) ∀α > 0, lim |ϕk | = 0.
k {y:d(y,0)>α}

On rappelle que d(y, 0) est égal à la norme |y| dans le cas Rd , et au minimum des |y 0 |
pour y 0 appartenant à la classe y, dans le cas du quotient Rd /(2πZ)d .

Théorème 3.4.7. On se place dans Rd ou Td , et on suppose que la suite (ϕk ) est une
approximation de l’unité, vérifiant les propriétés (a), (b) et (c) ci-dessus.
– Pour toute fonction mesurable bornée g et pour tout point de continuité x0 de g,
la suite (ϕk ∗ g)(x0 ) converge vers g(x0 ).
– Pour toute fonction uniformément continue bornée g, la suite (ϕk ∗ g) converge
uniformément vers g.
– Pour toute fonction g ∈ Lp , 1 ≤ p < +∞, la suite des convolées (ϕk ∗ g) converge
vers g dans Lp .
Démonstration. Soit g une fonction mesurable bornée sur Rd ou Td , et qui soit continue
au point x0 ; considérons
Z

dk (x0 ) = (ϕk ∗ g)(x0 ) − g(x0 ) = g(x0 − y) − g(x0 ) ϕk (y) dy ;

17
il faut montrer que dk (x0 ) tend vers 0 quand k → ∞. On a
Z
|dk (x0 )| ≤ g(x0 − y) − g(x0 ) |ϕk (y)| dy.

Posons M = supk kϕk k1 . Puisque g est continue au point x0 , on peut trouver α > 0 tel
que |g(x0 − y) − g(x0 )| < ε/(2M) pour tout y tel que d(y, 0) < α. On découpe alors
l’intégrale ci-dessus en intégrale sur B = B(0, α) et complémentaire et on obtient
Z Z
|dk (x0 )| ≤ |g(x0 − y) − g(x0 )| |ϕk (y)| dy + |g(x0 − y) − g(x0 )| |ϕk (y)| dy
B Bc
Z
ε
≤M + 2kgk∞ |ϕk (y)| dy.
2M Bc
La propriété (c) implique que pour k assez grand,
Z
ε
|ϕk (y)| dy <
Bc 1 + 4kgk∞
donc |dk (x0 )| ≤ ε/2 + ε/2 ; on a ainsi montré la convergence de (ϕk ∗ g)(x0 ) vers g(x0 ).
Pour montrer le deuxième point on va devoir se répéter un peu. Soit g une fonction
uniformément continue et bornée sur Rd ; il faut montrer que dk (x) = (ϕk ∗ g)(x) − g(x)
tend vers 0, uniformément en x ∈ Rd . On a pour tout x
Z Z
|dk (x)| ≤ g(x − y) − g(x) |ϕk (y)| dy ≤ kτy g − gk∞ |ϕk (y)| dy.

Puisque g est uniformément continue, on peut trouver α > 0 tel que kτy g−gk∞ < ε/(2M)
pour tout y ∈ Rd tel que |y| < α. En découpant comme avant, on obtient
Z Z
kdk k∞ ≤ kτy g − gk∞ |ϕk (y)| dy + kτy g − gk∞ |ϕk (y)| dy
B Bc
Z
ε
≤M + 2kgk∞ |ϕk (y)| dy,
2M Bc
qui sera < ε pour k assez grand d’après la condition (c) ; on obtient ainsi la convergence
uniforme de ϕk ∗ g vers g.
Démontrons la troisième partie. On doit montrer que kdk kp → 0 ; on utilise l’inégalité
de Minkowski (théorème 3.3.2) pour la mesure |ϕk (y)| dy pour obtenir que
Z Z  p 1/p
kdk kp = g(x − y) − g(x) ϕk (y) dy dx ≤
Z Z 1/p Z
p
≤ g(x − y) − g(x) dx |ϕk (y)| dy = kτy g − gkp |ϕk (y)| dy.

À partir de ce point la démonstration est identique à celle du cas précédent, si on rappelle


qu’on peut choisir α > 0 tel que kτy g − gkp < ε/(2M) pour tout vecteur y tel que |y| < α
(proposition 3.4.3). On obtient alors par un découpage identique à celui de la première
partie, en posant B = B(0, α)
Z Z
kdk kp ≤ kτy g − gkp |ϕk (y)| dy + kτy g − gkp |ϕk (y)| dy
B Bc
Z
ε
≤M + 2kgkp |ϕk (y)| dy.
2M Bc
Pour k assez grand on obtiendra encore avec (c) que kdk kp ≤ ε ; on a ainsi montré la
convergence Lp de ϕk ∗ g vers g.

18
Remarques.
– Dans le cas périodique, la deuxième partie de l’énoncé du théorème 3.4.7 s’applique
à toutes les fonctions continues périodiques, qui sont automatiquement uniformément
continues.
– Dans le cas de R, si la fonction mesurable bornée g admet des limites à droite et à
gauche au point x0 et si les fonctions (ϕk ) sont paires, on voit facilement par la preuve
ci-dessus que (ϕk ∗ g)(x0 ) tend vers la demi-somme 21 (g(x0 +) + g(x0 −)) des limites.

Une méthode utile pour construire des approximations


R de l’unité est la suivante. On
se donne une fonction ϕ intégrable sur Rd telle que ϕ(x) dx = 1 et on considère la suite
(ϕk ) définie par

(3) ϕk (x) = k d ϕ(kx)

pour k entier ≥ 1. Par le changement de variable y = kx on obtient les propriétés a, b,


c voulues. En effet,
Z Z Z
d
|ϕk (x)| dx = |ϕ(kx)| k dx = |ϕ(y)| dy,
Rd Rd Rd
Z Z Z
d
ϕk (x) dx = ϕ(kx) k dx = ϕ(y) dy = 1
Rd Rd Rd
et Z Z
|ϕk (x)| dx = |ϕ(y)| dy
|x|≥α |y|≥kα

tend vers 0 quand k → +∞, par convergence dominée.

Densité de la classe D(Rd )


À partir d’une fonction ϕ ∈ D(Rd ), positive et d’intégrale 1, on peut construire par la
méthode précédente une approximation de l’unité (ϕk ) formée de fonctions de D(Rd ). Les
fonctions continues à support compact peuvent être approchées uniformément par des
fonctions C∞ qui ont hh presque ii le même support : si g est continue à support compact,
la suite ϕk ∗ g converge uniformément vers g, et elle est formée de fonctions de D(Rd )
qui ont un support à peine plus grand que celui de g.
Pour toute fonction g ∈ Lp (Rd ), 1 ≤ p < +∞, la suite (ϕk ∗ g) est formée de fonc-
tions C∞ d’après la proposition 3.4.6, et converge vers g dans Lp par le théorème 3.4.7.
Mentionnons une dernière méthode d’approximation, la méthode de troncature ; on se
donne une fonction ψ ∈ D(Rd ), égale à 1 dans un voisinage de 0, et on considère la suite
des fonctions x → ψ(x/k), k ≥ 1, qui tend vers 1 (uniformément sur tout compact).
Lemme. Soit ψ ∈ D(Rd ), égale à 1 dans un voisinage de 0 ; si f est dans Lp (Rd ),
1 ≤ p < +∞, la suite des fonctions

x → ψ(x/k)f (x)

tend vers f dans Lp .


La preuve du lemme est une simple application du théorème de convergence dominée.
Puisque ψ est continue à support compact, elle est bornée, disons par M. On voit que

gk (x) = ψ(x/k)f (x) − f (x)|p

19
est bornée par (M + 1)p |f (x)|p , fonction intégrable fixe. Par ailleurs pour tout x on a
gk (x) = 0 pour k assez grand, puisque x/k finit par entrer dans le voisinage de 0 dans
lequel ψ = 1.
En associant régularisation et troncature, on voit que D(Rd ) est dense dans tous
les Lp (Rd ), pour 1 ≤ p < +∞ : si f est dans Lp , on trouve d’abord une fonction C∞
de la forme f1 = ϕk0 ∗ f , telle que kf − f1 kp < ε/2 ; ensuite, par le lemme, on trouve
f2 (x) = ψ(x/k1 )f1 (x) telle que kf1 − f2 kp < ε/2 ; finalement, f2 est C∞ à support
compact, et kf − f2 kp < ε.
Une approximation de l’unité utile
Lemme 3.4.8. Si ϕ est une fonction continue ≥ 0 à support compact sur Rd (ou bien
une fonction continue ≥ 0 sur T = R/2πZ), telle que
x 6= 0 ⇒ ϕ(x) < ϕ(0),
la suite (ϕn ) construite à partir des puissances ϕn de la fonction ϕ par la formule
Z −1
ϕn (x) = ϕ(y)n dy ϕ(x)n

est une approximation de l’unité.


R R
Preuve. On a ϕn > 0 puisque ϕ est continue ≥ 0 et ϕ(0) > 0. Il est clair que ϕn = 1,
et ϕn ≥ 0, ce qui donne immédiatement que la suite (ϕn ) vérifie les conditions (a) et (b)
pour une approximation de l’unité. Soit α > 0 fixé et soit (tk ) une suite croissante de
nombres tendant vers ϕ(0), tels que 0 < tk < ϕ(0) ; on note que
Ak = {x : d(x, 0) ≥ α et ϕ(x) ≥ tk }
est compact, puisque c’est un fermé contenu dans le support de ϕ, et la suite décroissante
des compacts (Ak ) a pour intersection
\
Ak = {x : d(x, 0) ≥ α et ϕ(x) ≥ ϕ(0)} = ∅
k

d’après l’hypothèse, donc l’un de ces compacts Ak est vide. En posant δ = tk pour un k
choisi assez grand, on aura donc Ak = ∅, c’est-à-dire que ϕ < δ sur le complémentaire
de la boule B(0, α). En désignant par M le volume du support de ϕ, on aura donc
Z
ϕ(x)n dx ≤ M δ n ;
{d(x,0)≥α}

d’un autre côté, choisissons δ1 tel que δ < δ1 < 1 ; l’ouvert V = {ϕ > δ1 } n’est pas vide,
donc |V| > 0, où |V| désigne le volume de l’ouvert V ; on a de plus
Z Z
−1 n
cn = ϕ(x) dx ≥ ϕ(x)n dx ≥ |V| δ1n .
V
n
On en déduit pour ϕn = cn ϕ l’inégalité
Z Z  δ n
ϕn (x) dx = cn ϕ(x)n dx ≤ M|V|−1
{d(x,0)≥α} {d(x,0)≥α} δ1
qui tend vers 0 quand n → +∞.

20
Deux exemples

1. Considérons la fonction 2π-périodique f (t) = 1 + cos(t) ; il s’agit d’une fonction ≥ 0,


qui atteint sur l’intervalle [−π, π] un unique maximum au point 0. D’après le lemme 3.4.8,
on obtient une approximation de l’unité dans L1 (T) en posant pour tout n ≥ 0
Z π
dt n
In = (1 + cos(t))n et ϕn (t) = I−1
n 1 + cos(t) ,
−π 2π

qui est bien ≥ 0 d’intégrale 1 pour la probabilité dt/(2π). L’intérêt de cet exemple est
que les fonctions de la suite sont des polynômes trigonométriques. On voit en effet que

1 −i t 1 1
1 + cos(t) = e +1 + e i t = (e−i t/2 + e i t/2 )2
2 2 2
n
ce qui implique que 1 + cos(t) est un polynôme trigonométrique pour tout n ≥ 0,

n
X  
n −n −i t/2 i t/2 2n −n 2n
1 + cos(t) =2 (e +e ) =2 e i kt .
n+k
k=−n

2. Si on considère sur Rd la fonction



ϕ(x) = max 1 − |x|2 /4, 0 ,

on aura le même phénomène : la fonction est ≥ 0 sur R, continue à support compact,


et atteint un maximum unique au point 0. L’intérêt ici est que les fonctions (ϕn ) sont
polynomiales sur la boule de rayon 2.

On peut aussi traiter les exemples 1 et 2 au moyen du théorème de Lebesgue. Pour


l’exemple 2, on voit pour tout δ ∈ ]0, 2] que

Z Z √
√ δ 
δ n
y 2 n
2 n
Jn (δ) = n (1 − x /4) dx = √
1 − dy
−δ −δ n 4n

R 2
converge vers la limite ` = R e−y /4 dy, qui est indépendante de δ et non nulle ; cette
indépendance de δ donne√la condition (c) des approximations de l’unité pour
R la suite des
fonctions ϕn = Jn (2)−1 n 1|x|≤2 (1 − x2 /4)n . En effet, on a ϕn ≥ 0, R ϕn = 1 et de
plus, pour tout δ ∈ ]0, 2],
Z δ
ϕn (x) dx = Jn (δ)/Jn (2)
−δ
R
tend vers 1, ce qui implique que |x|>δ
ϕn (x) dx tend vers 0 pour tout δ > 0.

21
3.4.d. Théorème d’approximation de Weierstrass
On va commencer par le cas le plus simple et le plus important, celui de la droite réelle.
On suivra essentiellement la méthode présentée par Weierstrass lui même vers 1880.
Commençons par un peu de terminologie : une fonction entière est une fonction g sur
R qui est la somme d’une série entière de rayon de convergence infini : il existe des
coefficients (an ) tels que
+∞
X
∀x ∈ R, g(x) = a n xn .
n=0
x
C’est le cas de e , cos x, sin x, etc. Il est bien connu que la série converge alors pour tout
nombre complexe z et permet de prolonger la fonction g au plan complexe, mais ce n’est
pas ce qui nous intéressera ici. On sait aussi que les sommes partielles
n
X
Pn (x) = a k xk
k=0

de la série entière convergent uniformément vers g(x) sur tout compact de R. Or ce


sont des fonctions polynomiales ; donc, pour réaliser l’approximation polynomiale du
théorème d’approximation de Weierstrass, il suffit d’approcher par des fonctions entières.
Ces fonctions entières seront obtenues par convolution avec des noyaux gaussiens.
Théorème. Toute fonction f uniformément continue et bornée sur la droite R peut
être approchée uniformément sur R par des fonctions entières. Toute fonction continue
sur un intervalle fermé borné [a, b] peut être approchée uniformément par des fonctions
polynomiales.
Démonstration. Posons pour x ∈ R et n > 1
2
e−x /2
g1 (x) = √ , gn (x) = ng1 (nx).

On sait d’après (3) qu’on obtient ainsi une approximation de l’unité. D’après le théo-
rème 3.4.7, la suite hn = gn ∗ f converge uniformément vers f sur R. Il reste à montrer
que hn est une fonction entière. On a pour tout n ≥ 1
Z Z
−n2 (x−y)2 /2 dy −n2 x2 /2 2 2 2 dy
hn (x) = n e f (y) √ = ne en xy e−n y /2 f (y) √ .
R 2π R 2π
2 2
Comme x → e−n x /2 est entière, il suffit de montrer (par le théorème sur les produits
de séries entières) que Z
2 2 2
x→ en xy e−n y /2 f (y) dy
R

est entière, et pour le faire il suffit d’intervertir l’intégrale et le développement en série


2
entière de en xy . On a vu au théorème 1.3.2 qu’il suffit, pour pouvoir intervertir, que
Z X Z
(n2 |xy|)k 
+∞
−n2 y 2 /2 2
|xy| −n2 y 2 /2
e |f (y)| dy = en e |f (y)| dy
R k=0 k! R

22
soit fini ; or, puisque f est bornée, disons par M, l’intégrale précédente est finie (on pourra
noter que |xy| ≤ x2 + y 2 /4 pour majorer par
Z
n2 x2 2 2
Me e−n y /4 dy < +∞ ).
R

L’interversion étant justifiée, nous voyons que


X Z
dy 
+∞
−n2 x2 /2 k (n2 y)k −n2 y2 /2
hn (x) = n e x e f (y) √
R k! 2π
k=0

est une fonction entière, ce qui achève la preuve de la première partie.


Si f0 est continue sur [a, b], on peut la prolonger en fonction uniformément continue
bornée sur R en posant f (x) = f (a) si x < a, f (x) = f0 (x) si a ≤ x ≤ b et f (x) = f (b)
si x > b. On aura d’abord une approximation de f0 sur [a, b] par une fonction entière,
dont on prendra les sommes partielles comme expliqué précédemment.

Remarque. On pourrait donner une variante plus terre à terre qui utiliserait les noyaux
de la forme (1 − x2 /4)n sur [−2, 2] : pour tout n ≥ 1, définissons cn par
Z 2 Z 2
1 n 2
n n
=4 1 − x /4 dx = 4 − x2 dx.
cn −2 −2

Définissons ensuite la fonction ϕn d’intégrale 1 sur R par ϕn (x) = cn (4 − x2 )n lorsque


|x| ≤ 2, et ϕn (x) = 0 sinon. On a vu au lemme 3.4.8 qu’on obtient ainsi une approxima-
tion de l’unité. Si f est une fonction continue sur R, à support dans [−1, 1], on sait donc
que ϕn ∗ f converge uniformément vers f sur R, et en particulier sur [−1, 1] ; pour tout
x, on a
Z Z 1
(ϕn ∗ f )(x) = ϕn (x − t)f (t) dt = ϕn (x − t)f (t) dt ;
R −1

mais quand on suppose que |x| ≤ 1, on voit que l’intégrale précédente est égale à
Z 1
n
cn 4 − (x − t)2 f (t) dt ;
−1

en effet, pour les t qui interviennent dans l’intégrale, on a |x − t| ≤ |x| + |t| ≤ 2, et x − t


se trouve dans la région où ϕn est polynomiale. On développe maintenant
2n
X
n
cn 4 − (x − t)2 = ak,n (t) xk
k=0

et on obtient que dans l’intervalle [−1, 1], l’approximant uniforme ϕn ∗ f coı̈ncide avec
la fonction polynomiale
2n Z
X 1 
Pn (x) = ak,n (t)f (t) dt xk ,
k=0 −1

ce qui termine la description de cette variante.

23
Le théorème précédent ne règle pas le cas d’une fonction continue qui ne serait
pas définie sur un intervalle, mais sur un compact K ⊂ R peut-être compliqué, comme
l’ensemble de Cantor. Le lemme qui suit s’occupe de cette question, même en plusieurs
dimensions.
Lemme. Si f est une fonction réelle continue sur un compact K contenu dans la boule
unité ouverte de Rd , on peut trouver une fonction g continue sur Rd , à support dans la
boule unité et telle que |f − g| < ε sur K.
Preuve. Introduisons le fermé F réunion de K et du complémentaire Bc de la boule unité
ouverte B, et la fonction f1 sur F, égale à f sur K et à 0 sur Bc . On vérifie facilement
que f1 est uniformément continue sur F. Soit ε > 0, soit δ > 0 tel que |f1 (y) − f1 (y 0 )| < ε
pour tout couple (y, y 0 ) d’éléments de F tels que |y − y 0 | < δ ; supposons aussi que
δ < min{|x − y| : x ∈ K, y ∈ Bc } ;
choisissons ensuite N assez grand pour que Nδ > 2kf k∞ = 2kf1 k∞ , et posons
g(x) = min {f1 (y) + N |x − y|}.
y∈F

On va montrer que la fonction g convient : cette fonction g est lipschitzienne de constante


N sur Rd , comme inf de la famille des fonctions x → N|x − y| + f1 (y) dépendant du
paramètre y ∈ F, qui sont toutes N-lipschitziennes sur Rd . Fixons y0 ∈ F quelconque ;
on a évidemment f1 (y0 ) ≥ g(y0 ) (en prenant y = y0 comme constituant du min). Si
|y − y0 | ≥ δ,
f1 (y) + N|y0 − y| ≥ −kf k∞ + Nδ > kf k∞ ≥ f1 (y0 ),
et si |y − y0 | < δ l’uniforme continuité de f1 donne
f1 (y) + N|y0 − y| ≥ f1 (y) ≥ f1 (y0 ) − ε ;
il en résulte que g(y0 ) ≥ f1 (y0 ) − ε. La fonction g approche donc f sur K à moins de ε ;
de plus, g est nulle hors de B : si x est hors de la boule unité et y ∈ K, on a |x − y| ≥ δ
et
f1 (y) + N |x − y| = f (y) + N |x − y| ≥ −kf k∞ + N δ ≥ 0 ;
si y ∈ F \ K, on a f1 (y) + N |x − y| = N |x − y| ≥ 0, c’est-à-dire que g ≥ 0 hors de la
boule unité, mais on a vu aussi que g(x) ≤ f1 (x) = 0, donc g est bien nulle hors de B.
Une autre approche, qui utilise l’idée de partition de l’unité, fonctionne ainsi : soit
Bi = B(xi , δ), pour i = 1, . . . , N, une famille finie de boules ouvertes, centrées en des
points xi ∈ K et recouvrant K, et telles que |f (x) − f (xj )| < ε pour tout x ∈ Bj ; pour
chaque i, soit ϕi une fonction
PN continue telle que ϕi > 0 sur Bi et ϕi = 0 hors de Bi ; la
fonction continue Φ = j=1 ϕj est > 0 sur K, donc il existe δ > 0 tel que Φ ≥ δ sur le
compact K. On pose ensuite
N
X
ϕi
ψi = PN et g = f (xi )ψi .
εδ + j=1 ϕj i=1
d
La fonction g est définie
PN sur R , continue à support compact. On note que la fonction Ψ
définie par Ψ(x) = j=1 ψj (x) vérifie
εδ
0 ≤ 1 − Ψ(x) = ≤ ε.
εδ + Φ(x)

24
donc |f (x) − Ψ(x)f (x)| ≤ εkf k∞ , et
N
X
|g(x) − Ψ(x)f (x)| = (f (x) − f (xj )) ψj (x) ≤ εΨ(x) ≤ ε.
j=1

Remarques.
– On pourrait définir autrement une partition de l’unité formée de fonctions à petit
support. Découpons la boule B = B(0, R + ε) de rayon R + ε en ensembles boréliens Aj
deux à deux disjoints, de petit diamètre ≤ δ, de sorte que
n
X
1B = 1Aj .
j=1

Si ψ est une fonction de D(Rd ) à support dans la boule B(0, ε), on vérifie que 1B ∗ ψ est
C∞ à support compact, égale à 1 sur B(0, R). Mais 1B ∗ ψ est la somme des ϕj = 1Aj ∗ ψ,
et chaque ϕj a un support de diamètre ≤ δ + ε (voir l’exercice 3.1.2).
– En fait, on peut prolonger la fonction continue f définie sur K, en une fonction
continue sur Rd (c’est un cas particulier d’un théorème d’Urysohn, et c’est l’objet de
l’exercice qui suit), que l’on peut choisir à support compact si on veut.

Exercice. Si (X, d) est un espace métrique, si Y est un sous-ensemble fermé de X et si


f une fonction continue de Y dans [−1, 1], il existe un prolongement de f à X, continu
sur X.
La première étape est de trouver une fonction continue g0 de X dans [−1, 1], telle
que |f − g0 | ≤ 2/3 sur Y. On recommence ensuite avec f1 définie sur Y par (3/2)(f − g0 ),
qu’on approche par g1 définie sur X, à valeurs dans [−1, 1], telle que |f1 − g1 | ≤ 2/3 sur
Y, ce qui donne sur Y
|f − g0 − (2/3)g1 | ≤ (2/3)2 ,
P+∞ n
etc. . . La fonction g égale à n=0 (2/3) gn est continue sur X et prolonge f . Pour
construire g0 , on introduira les deux fermés F0 et F1 de X, respectivement formés des
points de Y où f ≤ −1/3 et où f ≥ 1/3, on prendra g0 égale à −1/3 sur F0 , à 1/3 sur
F1 , et −1/3 ≤ g0 ≤ 1/3 partout, par exemple

dist(x, F0 ) − dist(x, F1 )
g0 (x) = .
3(dist(x, F0 ) + dist(x, F1 ))

Théorème 3.4.9. Si f est une fonction réelle continue sur un compact K de Rd , on


peut trouver une fonction P polynomiale sur Rd telle que |f − P| < ε sur K.
Esquisse. On peut supposer que le compact K est contenu dans la boule unité ouverte,
et remplacer f par f1 , continue sur Rd , à support dans la boule unité, et qui soit telle
que |f − f1 | < ε/2 sur K. Dans le cas d = 1, on a montré que f1 peut être approchée
uniformément sur R par une fonction entière, donc approchée uniformément sur K par
des fonctions polynomiales.
Pour traiter le cas d > 1, on pourrait généraliser la preuve utilisée en dimension 1, en
convolant f1 avec une approximation de l’unité gaussienne. Le principe est exactement

25
le même mais l’écriture pénible. On peut aussi déduire la dimension d de la dimension 1
avec des partitions de l’unité ; esquissons le cas d = 2 : soit f une fonction continue
sur R2 , à support dans un carré [−A, A]2 , et telle que |f (x1 , y1 ) − f (x, y)| < ε quand
|x1 − x| < δ et |y1 − y| < δ. On peut trouver des fonctions continues ϕ1 , . . . , ϕN ≥ 0 sur
R, chacune à support dans un intervalle de longueur < δ, et telles que

N
X
∀x ∈ [−A, A], ϕj (x) = 1.
j=1

Les N2 fonctions ϕi (x)ϕj (y) ont des supports contenus dans des carrés de côté < δ, et
leur somme vaut 1 sur [−A, A]2 . Pour chaque i = 1, . . . , N, soit xi un point du support
de ϕi ; on vérifie que la fonction g définie par

N
X
g(x, y) = f (xi , xj )ϕi (x)ϕj (y)
i,j=1

approche f à ε près sur le carré [−A, A]2 . D’après le théorème de Weierstrass en di-
mension 1, on peut ensuite approcher chaque fonction ϕi uniformément sur [−A, A] par
une fonction polynomiale Pi . On en déduira une approximation de f sur [−A, A]2 par la
fonction polynomiale de deux variables

N
X
Q(x, y) = f (xi , xj )Pi (x)Pj (y).
i,j=1

Des polynômes aux polynômes trigonométriques


Pour tout entier n ∈ Z, on considère la fonction exponentielle complexe en définie par
en (x) = e i nx . Un polynôme trigonométrique est une combinaison linéaire de ces fonctions
(en ). On notera PN l’espace engendré par les ek , |k| ≤ N.
Théorème. Les polynômes trigonométriques sont denses dans l’espace des fonctions
continues 2π-périodiques.
Ce résultat, analogue au théorème de Weierstrass, peut être démontré par convolu-
tion périodique avec une approximation de l’unité périodique convenable (par exemple de
la forme cn (1+cos t)n ), mais on peut aussi passer de Weierstrass à Weierstrass périodique,
et inversement. Cette approche a le mérite de mettre en évidence les polynômes de
Tchebychev.
Supposons d’abord que f soit une fonction continue sur [−1, 1]. On lui associe une
fonction périodique continue g en posant

∀θ ∈ R, g(θ) = f (cos(θ)).

Si on connaı̂t le théorème de Weierstrass périodique,


PN on sait qu’on peut trouver un
polynôme trigonométrique Q, de la forme Q = k=−N ck ek , tel que |Q − g| < ε ; comme

26
on a g(−θ) = g(θ) pour tout θ, on peut remplacer Q par le polynôme trigonométrique
P défini par P(θ) = 12 (Q(θ) + Q(−θ)), qui est un polynôme de cosinus,
N
X
P(θ) = ak cos(kθ),
k=0

et satisfait la même approximation |P − g| < ε. La relation entre x et θ est θ = arccos x ;


on introduit la fonction tk définie par
∀x ∈ [−1, 1], tk (x) = cos(k arccos(x)),
qui est polynomiale en x (voir plus loin ; son degré est k) ; le polynôme p défini par
PN
p(x) = k=0 ak tk (x) approche uniformément la fonction f : tout point x de [−1, 1] peut
s’écrire sous la forme x = cos(θ), et
N
X N
X
|f (x) − p(x)| = g(θ) − ak tk (cos(θ)) = g(θ) − ak cos(kθ) = |g(θ) − P(θ)| < ε.
k=0 k=0

Pour voir que tk est un polynôme en x = cos θ, on écrit


2 cos(kθ) = e i kθ + e−i kθ = (cos θ + i sin θ)k + (cos θ − i sin θ)k ,

et en utilisant sin θ = 1 − x2 si 0 < θ < π, on voit que
√ √
(x + i 1 − x2 )k + (x − i 1 − x2 )k
tk (x) = ;
2
on utilise la formule du binôme et la disparition des puissances impaires de sin θ,
X k X  
k−2j 2j j k
tk (x) = cos(kθ) = (cos θ) (i sin θ) = (−1) xk−2j (1 − x2 )j .
2j 2j
0≤2j≤k 0≤2j≤k

Inversement, supposons connu le théorème de Weierstrass, et soit g une fonction 2π-


périodique paire continue ; on peut introduire une fonction f continue sur [−1, 1] telle
que f (cos θ) = g(θ) pour tout θ ; par Weierstrass, on peut approcher f par un polynôme
N
X
p(x) = ck xk
k=0

et P(θ) = p(cos(θ)) est un polynôme trigonométrique qui approche g. Si g est impaire,


on voit que g(0) = g(π) = 0. On peut approcher g par une fonction impaire g1 nulle au
voisinage de 0 et π ; alors
g1 (θ)
g2 (θ) =
sin θ
définit une fonction périodique paire continue, qu’on peut approcher par un polynôme
trigonométrique P d’après ce qui précède, et P1 (θ) = P(θ) sin θ est un autre polynôme
trigonométrique qui approche g1 , donc g. Comme toute fonction périodique continue
g est la somme d’une fonction paire et d’une fonction impaire, le résultat est établi :
le théorème de Weierstrass pour les polynômes implique le hh théorème de Weierstrass
trigonométrique ii.

27
Séries de Fourier et théorème de Fejér
On va travailler avec des séries de Fourier complexes sur l’intervalle [0, 2π], muni de
la mesure normalisée dx/(2π). On identifiera au besoin les fonctions définies sur [0, 2π[
à des fonctions 2π-périodiques sur R. Le produit scalaire de deux fonctions f et g de
L2 (T) ' L2 ([0, 2π], dx/(2π)) sera donné par
Z 2π
dt
hf, gi = f (t)g(t) .
0 2π

Pour tout n ∈ Z, posons en (x) = e i nx ; pour ce produit scalaire, la suite (en ) des
exponentielles complexes est orthonormée, puisque
Z 2π Z 2π
i nx dx dx
hem , en i = e e i mx = e i (n−m)x
0 2π 0 2π

est nul quand m 6= n, et vaut 1 si m = n. Si f ∈ L1 (T), on définit les coefficients de


Fourier (complexes) de la fonction f par
Z 2π
dx
∀n ∈ Z, cn (f ) = f (x) e−i nx .
0 2π

Il est clair que |cn (f )| ≤ kf k1 pour tout n. Si la fonction f est dans L2 (T), on peut aussi
écrire cn (f ) = hf, en i.
La convolution utilisée ici sera la convolution périodique
Z 2π
dt
(f ∗ g)(x) = f (x − t)g(t) .
0 2π

On note que f ∗ en = cn (f )en pour tout n ; ceci entraı̂ne que pour tout polynôme
PN
trigonométrique K = k=M ak ek (avec M ≤ N et M, N ∈ Z), on a

N
X
K∗f = ak ck (f )ek ,
k=M

ce qui montre que la convolution de f ∈ L1 (T) par un polynôme trigonométrique donne


un polynôme trigonométrique K ∗ f .
L’approximation de l’unité (ϕn ) construite avec les puissances de 1 + cos(t) permet
de montrer que les polynômes trigonométriques sont denses dans Cper (0, 2π), donc aussi
dans tous les Lp (on peut aussi utiliser le passage de Weierstrass à Weierstrass périodique
expliqué ci-dessus). Les résultats généraux sur la convolution donnent la proposition
suivante.

Proposition. Les polynômes trigonométriques sont denses dans l’espace C(T) des fonc-
tions continues 2π-périodiques ; pour tout p tel que 1 ≤ p < +∞, les polynômes
trigonométriques sont denses dans Lp (0, 2π).

28
Il est intéressant d’introduire une autre approximation périodique de l’unité, qui
a un statut historique plus affirmé et qui a aussi d’autres vertus, qui seront utilisées
au chapitre suivant sur les séries de Fourier : il s’agit du noyau de Fejér. Partons du
polynôme trigonométrique
fn = e0 + · · · + en−1 ,
pour lequel on a la formule

e i nx −1 e i nx/2 sin(nx/2)
fn (x) = = ;
e i x −1 e i x/2 sin(x/2)

le carré du module de fn est un polynôme trigonométrique, égal à

n−1
X n−1
X   sin(nx/2) 2
|fn (x)|2 = e i kx e−i kx = .
sin(x/2)
k=0 k=0

L’expression initiale de fn comme somme des n fonctions orthogonales e0 , . . . , en−1 de


norme 1 montre que
Z 2π
dx
|fn (x)|2 = n.
0 2π
Pour n ≥ 0, on posera
 
|fn+1 (x)|2 1  sin (n + 1)x/2 2
Kn (x) = = .
n+1 n+1 sin(x/2)

La fonction Kn est un polynôme trigonométrique, appelé noyau de Fejér ; c’est une


fonction réelle ≥ 0, paire, d’intégrale 1 sur chaque période (pour la mesure normalisée).
On voit facilement que la suite (Kn ) est une approximation de l’unité ; en effet, pour
tout δ > 0 fixé, plus petit que π, on a
Z Z π Z π
dx dx 1 dx 1
Kn (x) =2 Kn (x) ≤ ≤
{δ<|x|<π} 2π δ 2π (n + 1)π δ sin(x/2)2 (n + 1) sin(δ/2)2

quantité qui tend vers 0 quand n → +∞. On a par ailleurs


X
n X
n  n
X
(n + 1)Kn (x) = e i jx e−i kx = e i (j−k)x ;
j=0 k=0 j,k=0

la différence d = j − k varie de −n à n, et j = d + k doit rester entre 0 et n ; si d < 0,


cela impose |d| ≤ k ≤ n, et 0 ≤ k ≤ n − d si d ≥ 0 ; il en résulte que
n X
X n n
X
i dx

(n + 1)Kn (x) = 1{0≤k+d≤n} e = n + 1 − |d| e i dx .
d=−n k=0 d=−n

On a donc
n 
X |i| 
Kn = 1− ei .
i=−n
n+1

29
Si f est 2π-périodique intégrable sur chaque période, la convolution de f avec Kn est un
polynôme trigonométrique appelé nième somme de Fejér de f ,
n 
X |k| 
(σn f )(x) = (Kn ∗ f )(x) = 1− ck (f ) e i kx .
n+1
k=−n

Puisque la suite (Kn ) est une approximation de l’unité, le théorème 3.4.7 fournit le
théorème de Fejér.
Théorème de Fejér. Pour toute fonction 2π-périodique continue f , la suite des sommes
de Fejér (σn ∗ f ) converge uniformément vers f . Pour toute fonction 2π-périodique f
dont la restriction à chaque période est dans Lp , 1 ≤ p < +∞, la suite (σn ∗ f ) converge
vers f dans Lp (0, 2π).

Base hilbertienne de L2 (T)


Si f ∈ L2 (T), on considère pour tout entier N ≥ 0
N
X N
X
fN = hf, ek i ek = ck (f ) ek ∈ PN ;
k=−N k=−N

la différence f − fN est orthogonale à PN : en effet, pour tout j tel que |j| ≤ N on a


N
X
hf − fN , ej i = hf, ej i − hf, ek i hek , ej i = hf, ej i − hf, ej i hej , ej i = 0,
k=−N

donc f − fN est orthogonale à Vect(ej : |j| ≤ N) = PN . Si g est un élément quelconque


de PN , on a fN − g ∈ PN , donc f − fN lui est orthogonal et

kf − gk22 = k(f − fN ) + (fN − g)k22 = kf − fN k22 + kfN − gk22 ≥ kf − fN k22 .

D’après le théorème de Weierstrass trigonométrique et la densité des fonctions continues


dans L2 (T) (ou bien d’après Fejér), il existe pour tout ε > 0 un polynôme trigonométrique
g tel que kf − gk2 < ε ; cette fonction g est dans un certain espace PN0 , donc aussi dans
PN pour tout N ≥ N0 ; il en résulte que pour tout N ≥ N0 ,

kf − fN k2 ≤ kf − gk2 < ε,

ce qui signifie précisément que la suite (fN ) converge vers f dans L2 (T). On en déduit
que X
kf k22 = lim kfN k22 = |ck (f )|2 .
N
k∈Z

et on a aussi X
f= cn (f )en ,
n∈Z

où la série converge au sens de L2 . Ceci ne donne a priori aucune convergence ponctuelle
de la série de Fourier. Cette question de la convergence ponctuelle sera envisagée au
chapitre suivant.

30

Vous aimerez peut-être aussi