Convolution
Convolution
Contenu du chapitre
3.1. Convolution dans L1 (Rd )
— Autres cadres pour la convolution : le cadre périodique
3.2. Densité des fonctions continues
3.3. Inégalités
3.3.a. Inégalité de Jensen
3.3.b. Inégalité de Minkowski
3.3.c. Inégalité de Hölder
3.3.d. Isométrie dans le dual de Lq
3.3.e. Convolutions L1 ∗ Lp lorsque 1 ≤ p < +∞
3.3.f. Convolutions Lp ∗ Lq lorsque 1/p + 1/q = 1
3.4. Régularisation et approximation
3.4.a. Continuité, opérateurs de translation
— Continuité des translations sur Lp (Rd ), ou bien Lp (Td )
3.4.b. Convolution et dérivées
— La classe D de Schwartz
— Fonctions plateaux
3.4.c. Approximations de l’unité
— Densité de la classe D(Rd )
— Une approximation de l’unité utile
— Deux exemples
3.4.d. Théorème d’approximation de Weierstrass
— Des polynômes aux polynômes trigonométriques
— Séries de Fourier et théorème de Fejér
— Base hilbertienne de L2 (T)
Le résultat est à valeurs dans [0, +∞] ; la fonction f ∗g est mesurable d’après les résultats
de la section 2.2 (théorème de Fubini). Les propriétés d’invariance de la mesure de
Lebesgue entraı̂nent que
Z Z
(f ∗ g)(x) = f (x − y)g(y) dy = f (z)g(x − z) dz = (g ∗ f )(x)
Rd Rd
pour tout x. On veut ensuite montrer que l’intégrale ci-dessus est finie pour presque tout
x ∈ RRd , lorsque f et g ont des intégrales finies. On va obtenir ce résultat en montrant
que (f ∗ g)(x) dx < +∞. La fonction h : (x, y) → f (x − y)g(y) est mesurable ≥ 0 sur
1
le produit Rd × Rd , ce qui permet d’appliquer le théorème de Fubini positif. L’intégrale
double sur Rd × Rd de cette fonction h(x, y) est donc
Z Z Z Z Z
f (x − y)g(y) dy dx = (f ∗ g)(x) dx = f (x − y)g(y) dx dy.
Rd Rd Rd Rd Rd
R R
L’invariance par translation de la mesure de Lebesgue donne f (x − y) dx = f (x) dx
pour tout y, de sorte que
Z Z Z Z
(1) f (x − y)g(y) dx dy = f (x) dx g(y) dy < +∞.
Rd Rd Rd Rd
R
ce qui implique que |f (x − y)| |g(y)| dy est fini pour presque tout x ; ceci montre que la
fonction y → f (x − y)g(y) est intégrable pour presque tout x. On peut donc poser pour
presque tout x
Z
(f ∗ g)(x) = f (x − y)g(y) dy,
Rd
et on obtient ainsi une fonction mesurable définie presque-partout (c’est une partie de
l’énoncé du théorème de Fubini 2.2.2) ; les calculs obtenus en majorant par les modules
montrent que f ∗ g est intégrable ; plus précisément on obtient l’inégalité de normes
kf ∗ gk1 ≤ kf k1 kgk1 .
Si on reprend avec Fubini le calcul qui menait à la formule (1), on obtient pour deux
fonctions intégrables réelles ou complexes f et g que
Z Z Z
(f ∗ g)(x) dx = f (x) dx g(x) dx .
Rd Rd Rd
On note en passant que pour des fonctions intégrables positives, on a kf ∗gk1 = kf k1 kgk1 .
2
Exercice. Soient f, g ∈ L1 (Rd ) ; calculer la transformée de Fourier de f ∗ g.
d
Solution. On vient de voir R que si f1Ret g1Rsont deux fonctions intégrables surd R , alors
f1 ∗ g1 est intégrable et f1 ∗ g1 = ( f1 )( g1 ). On applique ceci, pour t ∈ R fixé, avec
f1 (x) = f (x) e−i x·t et g1 (x) = g(x) e−i x·t . On obtient
Z
(f1 ∗ g1 )(x) = f (x − y) e−i (x−y)·t g(y) e−i y·t dy = e−i x·t (f ∗ g)(x)
et Z Z Z
(fd
∗ g)(t) = (f1 ∗ g1 )(x) dx = f1 (x) dx g1 (x) dx = fb(t) b
g(t).
Quand f = 2a 1
1[−a,a] , a > 0, on calcule facilement fb(t) = sin(at)/at (pour t 6= 0,
2
et fb(0) = 1). On obtient donc sans calculs supplémentaires que sin(at)/at est la
transformée de Fourier de g = f ∗ f , la fonction en triangle telle que g(−2a) = g(2a) = 0,
g(0) = 1/(2a), et affine sur [−2a, 0] et [0, 2a], nulle hors de [−2a, 2a].
Exercice 3.1.2. Si f est une fonction borélienne sur Rd , disons que f est supportée par
un sous-ensemble A de Rd si f est nulle en dehors de A,
f (x) 6= 0 ⇒ x ∈ A
(ne pas confondre avec la notion de support d’une fonction continue, qui est par définition
l’adhérence de l’ensemble {f 6= 0}). Si f, g ∈ L1 (Rd ), si f est supportée par le borélien
A et g par le borélien B, montrer que la convolution f ∗ g est supportée par la somme
de Minkowski de A et de B, définie par
A + B = {a + b : a ∈ A, b ∈ B}
(on n’essaiera pas de prouver que A + B est borélien ; on pourra cependant vérifier, bien
que la question n’ait pas été posée, qu’il est Lebesgue-mesurable).
3
que e i θ ∈ U ne dépend que de la classe θb de θ dans R/2πZ, et l’application θb → e i θ
ainsi définie est un isomorphisme du groupe additif R/2πZ sur le groupe multiplicatif U.
Munissons le cercle U de son unique probabilité µ invariante par rotation. La formule de
convolution prend alors la forme suivante, pour deux fonctions F et G intégrables sur le
cercle unité U, Z
∀x ∈ U, (F ∗ G)(x) = F(xy −1 )G(y) dµ(y).
U
C’est une formule de ce type qu’il faut utiliser pour définir la convolution sur certains
groupes non commutatifs (comme O(n) par exemple), où la loi est toujours notée mul-
tiplicativement.
Si on paramétrise le cercle par x = e i θ , θ ∈ [0, 2π] et si on pose en plus f (θ) = F(e i θ ),
g(θ) = G(e i θ ) on retrouve l’écriture
Z 2π
dt
(f ∗ g)(θ) = f (θ − t)g(t) .
per 0 2π
Les fonctions f et g sont deux fonctions 2π-périodiques définies sur R, mais on peut aussi
les considérer simplement comme deux éléments de L1 (0, 2π).
Quand on parlera de T ou Td , on choisira selon les besoins l’une des trois présenta-
tions précédentes. On dira qu’une fonction 2π-périodique f sur R est dans Lp (T) si sa
restriction à une période quelconque [a, a + 2π] est dans Lp ([a, a + 2π], dx/(2π)). On
regardera Rd ou Td comme un groupe noté additivement, avec élément neutre noté 0,
et muni d’une distance d ; c’est si on veut la distance euclidienne pour Rd , et pour
Rd /(2πZ)d , la notation d(x, y) désignera la plus courte distance (euclidienne) entre deux
représentants x1 , y1 ∈ Rd des classes x, y ∈ Rd /(2πZ)d .
Exemple. Si on pose en (t) = e i nt , pour n ∈ Z, on a
(f ∗ en ) = cn (f ) en ,
per
4
Pour finir, il existe un dernier cadre de convolution qui se révèle intéressant, mais
où on ne rencontre pas de finesses de théorie de l’intégration : c’est le cas de la mesure
de comptage sur Z. Si a = (an )n∈Z et b = (bn )n∈Z sont deux éléments de `1 (Z), leur
convolution est définie par X
(a ∗ b)n = an−k bk ,
k∈Z
qui est l’analogue exact pour la mesure de comptage de la formule utilisée sur R.
Théorème 3.2.1. Les fonctions continues à support compact sont denses dans Lp (Rd ),
pour tout p tel que 1 ≤ p < +∞.
Il est évident que le résultat ne peut pas être vrai dans L∞ : une suite de Cauchy dans L∞ ,
formée de fonctions continues, est une suite de Cauchy uniforme, et la limite sera toujours
continue. Le cas de tous les espaces Lp (Rd ), pour 1 ≤ p < +∞ est essentiellement le
même et on écrira la preuve dans le cas p = 1.
Démonstration. Il est clair que les fonctions étagées sont denses dans L1 : pour toute
fonction f ∈ L1 (Rd ), il existe une suite de fonctions étagées (fn ) telle que |fn | ≤ |f |
et fn → f simplement (proposition 1.1.2) ; par convergence dominée, f est limite dans
L1 des fn . Pour montrer le théorème, il suffit de voir que toute indicatrice de borélien
peut être approchée par des fonctions continues à support compact : par linéarité on
obtiendra que toute fonction étagée peut être approchée par une fonction continue à
support compact, d’où le résultat puisque les fonctions étagées sont denses dans L1 (Rd ).
Soit A un borélien de Rd ; alors 1A est limite dans L1 (Rd ) d’une suite (1An ) cor-
respondant à des boréliens bornés (intersections de A avec des boules de rayon n par
exemple), et pour n assez grand on aura
Z
|1A (x) − 1An (x)| dx < ε.
Rd
ce qui termine la preuve, car le support de ϕ est contenu dans [−a, a]d, qui est compact.
5
Remarque. Les fonctions en escalier sont denses aussi (en plusieurs dimensions, on ap-
pelle ainsi toute combinaison linéaire de fonctions indicatrices de produits d’intervalles).
Pour montrer cette densité, on peut constater qu’une fonction continue à support
compact peut être approchée dans L1 par des fonctions en escalier (utiliser la continuité
uniforme ; procéder ainsi, c’est utiliser la stratégie mathématique qui consiste à toujours
commencer par raccrocher la casserole au mur, quand on ne sait faire cuire l’œuf qu’à
partir de cet état initial ; sinon, on peut vérifier que les boréliens de [0, 1] approchables
dans L1 par des fonctions en escalier forment une tribu qui contient les intervalles).
3.3. Inégalités
Il est possible que ϕ(f ) ne soit pas µ-intégrable, mais l’intégrale a toujours un sens (en
admettant la valeur +∞) parce que ϕ(f )− = max(−ϕ(f ), 0) est intégrable.
Pour obtenir cette inégalité dans le cas non trivial où ν(Ω) 6= 0, il suffit de raisonner sur
la probabilité dµ(ω) = ν(Ω)−1 dν(ω) et d’utiliser l’homogénéité de la fonction puissance.
6
3.3.b. Inégalité de Minkowski
Lemme. Si ν est une mesure σ-finie non nulle sur un espace mesurable (Y, B), on peut
trouver
R une fonction mesurable k strictement positive en tout point de Y, et telle que
Y
k dν = 1.
Preuve. Il existe une suite (An ) ⊂ B d’ensembles de mesure finie > 0 qui recouvre Y ; on
pose
+∞ −n−1
X 2
k= 1A .
n=0
ν(An ) n
R
On a k(y) > 0 pour tout y ∈ Y, et Y k(y) dν(y) = 1.
Théorème 3.3.2. Si f (x, y) est mesurable sur un espace produit (X × Y, A ⊗ B), si µ
et ν sont σ-finies sur X et Y respectivement, et si p ≥ 1, on a
Z Z p 1/p Z Z 1/p
p
|f (x, y)| dν(y) dµ(x) ≤ |f (x, y)| dµ(x) dν(y).
X Y Y X
Z X
n 1/p n
X n Z
X 1/p
p
fyj (x) dµ(x) = kFkp ≤ kfyj kp = |fyj (x)|p dµ(x) .
X j=1 j=1 j=1 X
Dans l’inégalité de Minkowski, on a une famille (fy ) de fonctions de Lp (X, µ), qui dépend
d’un paramètre continu y ∈ Y, famille définie par fy (x) = |f (x, y)|, et on considère son
intégrale F ∈ Lp (X, µ) par rapport au paramètre y, au lieu de la somme finie considérée
précédemment. Cette fonction de la variable x est égale à
Z Z
F(x) = fy (x) dν(y) = |f (x, y)| dν(y).
Y Y
L’inégalité de Minkowski dit que la norme de F dans Lp (X, µ) est majorée par l’intégrale
par rapport au paramètre y des normes dans Lp (X, µ) des morceaux fy . Il s’agit donc
d’une version continue de l’inégalité triangulaire.
Si M = +∞, la relation à démontrer est évidente. Soit t < 1 fixé, et supposons M ≤ t < 1 ;
posons
Z 1/p
p
g(y) = f (x, y) dµ(x) .
X
R
On a Y g(y) dν(y) = M < 1 ; l’ensemble N des y ∈ Y tels que g(y) = +∞ est donc
ν-négligeable, et on peut se ramener à N = ∅ en modifiant f sur X × N : si on pose
fe(x, y) = 0 lorsque y ∈ N et fe(x, y) = f (x, y) quand y ∈
/ N, la fonction ge correspondante
7
est finie partout, et les deux membres de l’inégalité de Minkowski sont inchangés. On
supposera donc que g(y) < +∞ pour tout y ∈ Y.
On va suivre une démarche analogue à celle qui nous a permis de voir que la norme
de Lp est bien une norme. Dans l’interprétation donnée avant la démonstration, g(y) est
la norme de la fonction fy . Puisque ν est σ-finie, on peut trouver h > g ≥ 0 telle que
R
h(y) dν(y) = 1 (prendre h = g + (1 − M)k, avec k donnée par le lemme). Écrivons
Z p Z p
f (x, y) dν(y) = h(y)−1 f (x, y) h(y) dν(y) ≤
Y Y
Z Z
−1
p
≤ h(y) f (x, y) h(y) dν(y) = f (x, y)p h(y)1−p dν(y),
Y Y
où on a utilisé Jensen pour la probabilité h(y) dν(y), puis avec Fubini on obtient
Z Z p Z Z
f (x, y) dν(y) dµ(x) ≤ f (x, y)p h(y)1−p dν(y)dµ(x) =
X Y X Y
Z Z Z Z
p
1−p p 1−p
= f (x, y) dµ(x) h(y) dν(y) = g(y) h(y) dν(y) ≤ h(y) dν(y) = 1.
Y X Y Y
8
Exercice. On suppose 0 < r < p < +∞. Montrer que
Z Z p/r 1/p Z Z r/p 1/r
r
|f (x, y)| dν(y) dµ(x) ≤ |f (x, y)|p dµ(x) dν(y) .
X Y Y X
Supposons maintenant 1 < p < +∞. Pour tous nombres réels t, u ≥ 0, on a la relation
1 p 1 q
tu ≤ t + u ;
p q
cette relation résulte immédiatement de la convexité de l’exponentielle : on pose tp = ex ,
uq = ey , et on obtient que
1 1 1 1 1 1
tu = exp x + y ≤ ex + ey = tp + uq .
p q p q p q
Il en résulte que pour tout s ∈ Ω
1 1
|f (s)g(s)| ≤ |f (s)|p + |g(s)|q ,
p q
ce qui montre que f g est intégrable, et que
Z Z Z
1 p 1
f (s)g(s) dµ(s) ≤ |f (s)| dµ(s) + |g(s)|q dµ(s).
Ω p Ω q Ω
L’inégalité cherchée est positivement homogène par rapportRà f et à g, donc R ilq suffit de
p
la démontrer lorsque kf kp = Rkgkq = 1. Mais dans ce cas, |f | = 1 et |g| = 1, et
l’inégalité précédente donne | Ω f g| ≤ 1/p + 1/q = 1, ce qui est le résultat voulu.
9
Corollaire. Soient p ∈ [1, +∞[ et q tels que 1/p + 1/q = 1 ; si f ∈ Lp (Ω, A, µ),
Z
kf kp = sup f g dµ : kgkq ≤ 1 .
Ω
Dans le cas p = +∞, le résultat reste vrai si tout ensemble B ∈ A tel que µ(B) = +∞
contient un A ∈ A tel que 0 < µ(A) < +∞.
Démonstration. L’inégalité de Hölder nous dit déjà que
Z
kf kp ≥ sup f g dµ : kgkq ≤ 1 ,
Ω
le problème est de montrer l’autre direction. On va voir qu’en fait le maximum est atteint
pour une certaine fonction g ∈ Lq , kgkq ≤ 1, lorsque 1 ≤ p < +∞. Si f = 0, le résultat est
évident, on supposera donc f 6= 0, et par homogénéité on peut se ramener à kf kp = 1. En
choisissant un représentant de la classe f , on se permettra de raisonner sur une hh vraie ii
fonction mesurable f ; définissons une fonction mesurable g sur l’ensemble Ω en posant
g(s) = |f (s)|p/f (s) sur l’ensemble mesurable A = {f 6= 0}, et g(s) = 0 lorsque s ∈ / A.
p−1 q q(p−1) p
R q |g(s)|
Alors R = |f (s)| pour tout s ∈ A ; pour p > 1, on a |g| = |f | = |f | , donc
|g| = |f |p = 1, soit encore kgkq = 1 ; pour p = 1, g(s) est de module 1 quand s ∈ A,
nul sinon, donc kgk∞ = 1. D’autre part
Z Z Z
p
f g dµ = |f (s)| dµ(s) = |f |p dµ = 1 = kf kp .
Ω A Ω
10
La condition σ-finie n’est pas une condition nécessaire pour la validité de l’énoncé
précédent, mais il faut imposer une condition minimale. En effet, pour la mesure patho-
logique µ qui vaut toujours +∞ sauf pour ∅, on a L1 = {0}, alors que L∞ 6= {0} (il
contient les fonctions bornées) ne peut pas être le dual de cet espace L1 . Pour terminer
cette discussion sur l’identification des duaux (topologiques) des espaces Lp , rappelons
que L1 n’est pas le dual de L∞ , sauf circonstance extraordinaire (quand L∞ est de
dimension finie, parce que l’ensemble Ω est fini par exemple).
Z Z 1/p
= f (y) g(x − y)p dx dy = kf k1 kgkp .
11
3.4. Régularisation et approximation
3.4.a. Continuité, opérateurs de translation
Commençons par les propriétés de continuité des convolées. Elles résultent du théorème
de convergence dominée de Lebesgue.
Proposition 3.4.1. Si f ∈ L1 (Rd ) et si g est continue bornée sur Rd , la convolée f ∗ g
est continue bornée sur Rd . Le même résultat est valable pour Td .
Preuve. Posons M = kgk∞ . Soient x un point de Rd et (xn ) une suite tendant vers
x ; on obtient pour tout y ∈ Rd l’inégalité |f (y)g(xn − y)| ≤ M |f (y)|, qui donne la
majoration par une fonction intégrable fixe, et hn (y) = f (y)g(xn − y) tend simplement
vers h(y) = f (y)g(x − y). La convergence des intégrales, justifiée par le théorème de
convergence dominée, donne (f ∗ g)(xn) → (f ∗ g)(x).
Notons τv l’opérateur de translation par un vecteur v ∈ Rd : si f est une fonction
sur Rd , on posera
∀x ∈ Rd , (τv f )(x) = f (x − v) ;
on définit aussi les translations τv sur Td , par la même formule. On emploiera aussi
la notation fv = τv f pour gagner de la place. Il est important de remarquer que les
translations commutent avec les convolutions, (f ∗ g)v = f ∗ gv = fv ∗ g.
Une fonction définie sur Rd est uniformément continue si et seulement si kfv − f k∞
tend vers 0 lorsque la norme |v| du vecteur v de la translation tend vers 0. Le module de
continuité ωf de la fonction f , défini par
ωf ∗g (δ) ≤ kf k1 ωg (δ)
pour les modules de continuité. De plus cette inégalité subsiste si g est uniformément
continue, non nécessairement bornée, mais telle que f ∗ g soit définie en tout point : par
exemple, si f ∈ L1 (Rd ) est nulle hors d’un borné, et g uniformément continue sur Rd .
Dans le cas de T, on a affaire à des fonctions continues périodiques, qui sont toujours
uniformément continues ; la proposition 3.4.2 et sa démonstration sont valables dans le
cas périodique, mais elles ne disent rien de plus que le premier résultat de continuité 3.4.1.
En revanche, l’information sur le module de continuité reste valable et pertinente dans
le cas périodique.
12
Continuité des translations sur Lp (Rd ), ou bien Lp (Td )
On considère la famille des translations τv , v ∈ Rd , agissant sur Lp (Rd ) ; il est clair que
les translations définissent des isométries de tous les espaces Lp (à cause de l’invariance
de la mesure de Lebesgue par translation).
Proposition 3.4.3. On suppose 1 ≤ p < +∞. Pour toute fonction f ∈ Lp (Rd ) on a
lim kτv f − f kp = 0.
v→0
par Hölder, et kfv − f kp → 0 d’après ce qui précède. Pour tout ε > 0, il existe donc
t0 > 0 tel que la condition |v| < t0 entraı̂ne k(f ∗ g)v − f ∗ gk∞ < ε.
Exercice. Soit A un borélien de mesure > 0 dans Rd ; montrer que l’ensemble différence
de Minkowski A − A = {a − b : a, b ∈ A} est un voisinage de 0 dans Rd .
13
3.4.b. Convolution et dérivées
En une variable, si f ∈ L1 et si g ∈ L∞ a une dérivée bornée, alors f ∗ g est dérivable et
(f ∗ g)0 = f ∗ g 0 (dérivation sous l’intégrale à la Lebesgue). On a des résultats analogues
pour les dérivées partielles ; il existe un grand nombre de variantes de ces résultats. On
va commencer par un cas simple. Soient u un vecteur 6= 0 dans Rd et g une fonction sur
Rd ; notons Du g la dérivée de g dans la direction u, définie au point x par
supposons que g soit mesurable, définie et bornée sur Rd , que Du g existe sur Rd et soit une
fonction bornée par M ; en appliquant le théorème des accroissements finis aux fonctions
d’une variable t ∈ R → g(x + tu), on voit que ces fonctions sont M-lipschitziennes ; on a
Z
(f ∗ g)(x + tu) − (f ∗ g)(x) g(x + tu − y) − g(x − y)
= f (y) dy.
t Rd t
En posant (pour x fixé) G(y, t) = t−1 g(x + tu − y) − g(x − y) on aura l’inégalité
|f (y)G(y, t)| ≤ M |f (y)| qui donne la majoration par une fonction intégrable fixe indé-
pendante du paramètre t, pendant que G(y, t) tend simplement vers Du g(x − y) quand
t → 0, pour tout y ; le théorème de convergence dominée montre que Du (f ∗ g)(x) existe,
et Z
Du (f ∗ g)(x) = f (y)(Dug)(x − y) dy = (f ∗ Du g)(x).
Rd
Dj (f ∗ g) = f ∗ Dj g, j = 1, . . . , d.
14
une dérivée directionnelle Du g ∈ Lq (Rd ), définie en tout point x ∈ Rd et telle que pour
tout t > 0 on ait s → (Du g)(x + su) intégrable sur [0, t] et
Z t
(2) g(x + tu) − g(x) = (Du g)(x + su) ds.
0
Il en résulte que f ∗ g admet f ∗ Du g comme dérivée directionnelle. En particulier, si
f ∈ Lp , si g ∈ Lq est de classe C1 et si toutes les dérivées partielles de g sont dans Lq ,
la fonction f ∗ g est de classe C1 et ses dérivées partielles sont données par
Dj (f ∗ g) = f ∗ Dj g, j = 1, . . . , d.
15
Exercice. Montrer que la fonction f définie sur R par f (x) = exp(−1/x) si x > 0 et
f (x) = 0 si x ≤ 0 est de classe C∞ sur R.
La classe D de Schwartz
C’est la classe D(Rd ) formée de toutes les fonctions sur Rd , de classe C∞ et à support
compact ; il n’est pas totalement évident de donner un élément non nul de cet espace.
À partir de la fonction f de l’exercice précédent, on peut construire des fonctions C∞ à
support compact sur R, par exemple la fonction ϕ définie par
∀x ∈ R, ϕ(x) = f 2(1 + x) f 2(1 − x) .
Cette fonction est à support dans [−1, 1], et pour |x| < 1 on a
1 1 1
ϕ(x) = exp − − = exp − .
2(1 + x) 2(1 − x) 1 − x2
ψa (x) = ψ(ax),
et en prenant a > 0 grand, on pourra trouver des fonctions dans D(Rd ), non identique-
ment nulles ≥ 0, et avec un support dans une boule B(0, ε) de rayon arbitrairement petit.
Retenons le fait essentiel suivant :
si ϕ ∈ D(Rd ) et si f ∈ Lp (Rd ), 1 ≤ p < +∞, la convolée f ∗ ϕ est de classe C∞ et
bornée sur Rd .
Fonctions plateaux
Lemme. Si K est un compact non vide de Rd et U un ouvert contenant K, il existe une
fonction θ ∈ D(Rd ) telle que 0 ≤ θ ≤ 1, θ = 1 sur K et θ = 0 hors de U.
Preuve. On pose
ε = min{dist(x, Uc ) : x ∈ K} = min{kx − x0 k : x ∈ K, x0 ∈
/ U} > 0,
puis
V = {x ∈ Rd : dist(x, K) < ε/2},
et on choisit une fonction ϕ ∈ D(Rd ) à support dans la boule B(0, ε/2), ϕ ≥ 0 et
d’intégrale égale à 1. On va montrer que θ = 1V ∗ ϕ convient. On a pour tout x
Z
θ(x) = 1V (x − y)ϕ(y) dy ;
Rd
16
il est clair sur cette formule que 0 ≤ θ ≤ 1. Supposons que x0 ∈/ U, et montrons que la
fonction h : y → 1V (x0 − y)ϕ(y) est identiquement nulle, ce qui donnera bien sûr
Z
0
θ(x ) = 1V (x0 − y)ϕ(y) dy = 0 ;
Rd
si ϕ(y) = 0, les deux fonctions sont nulles, donc égales au point y ; sinon, on aura
|y| < ε/2, dist(x − y, K) ≤ |y| < ε/2, donc x − y ∈ V et 1V (x − y) = 1.
Z
(b) ϕk = 1 pour tout k ≥ 1,
Z
(c) ∀α > 0, lim |ϕk | = 0.
k {y:d(y,0)>α}
On rappelle que d(y, 0) est égal à la norme |y| dans le cas Rd , et au minimum des |y 0 |
pour y 0 appartenant à la classe y, dans le cas du quotient Rd /(2πZ)d .
Théorème 3.4.7. On se place dans Rd ou Td , et on suppose que la suite (ϕk ) est une
approximation de l’unité, vérifiant les propriétés (a), (b) et (c) ci-dessus.
– Pour toute fonction mesurable bornée g et pour tout point de continuité x0 de g,
la suite (ϕk ∗ g)(x0 ) converge vers g(x0 ).
– Pour toute fonction uniformément continue bornée g, la suite (ϕk ∗ g) converge
uniformément vers g.
– Pour toute fonction g ∈ Lp , 1 ≤ p < +∞, la suite des convolées (ϕk ∗ g) converge
vers g dans Lp .
Démonstration. Soit g une fonction mesurable bornée sur Rd ou Td , et qui soit continue
au point x0 ; considérons
Z
dk (x0 ) = (ϕk ∗ g)(x0 ) − g(x0 ) = g(x0 − y) − g(x0 ) ϕk (y) dy ;
17
il faut montrer que dk (x0 ) tend vers 0 quand k → ∞. On a
Z
|dk (x0 )| ≤ g(x0 − y) − g(x0 ) |ϕk (y)| dy.
Posons M = supk kϕk k1 . Puisque g est continue au point x0 , on peut trouver α > 0 tel
que |g(x0 − y) − g(x0 )| < ε/(2M) pour tout y tel que d(y, 0) < α. On découpe alors
l’intégrale ci-dessus en intégrale sur B = B(0, α) et complémentaire et on obtient
Z Z
|dk (x0 )| ≤ |g(x0 − y) − g(x0 )| |ϕk (y)| dy + |g(x0 − y) − g(x0 )| |ϕk (y)| dy
B Bc
Z
ε
≤M + 2kgk∞ |ϕk (y)| dy.
2M Bc
La propriété (c) implique que pour k assez grand,
Z
ε
|ϕk (y)| dy <
Bc 1 + 4kgk∞
donc |dk (x0 )| ≤ ε/2 + ε/2 ; on a ainsi montré la convergence de (ϕk ∗ g)(x0 ) vers g(x0 ).
Pour montrer le deuxième point on va devoir se répéter un peu. Soit g une fonction
uniformément continue et bornée sur Rd ; il faut montrer que dk (x) = (ϕk ∗ g)(x) − g(x)
tend vers 0, uniformément en x ∈ Rd . On a pour tout x
Z Z
|dk (x)| ≤ g(x − y) − g(x) |ϕk (y)| dy ≤ kτy g − gk∞ |ϕk (y)| dy.
Puisque g est uniformément continue, on peut trouver α > 0 tel que kτy g−gk∞ < ε/(2M)
pour tout y ∈ Rd tel que |y| < α. En découpant comme avant, on obtient
Z Z
kdk k∞ ≤ kτy g − gk∞ |ϕk (y)| dy + kτy g − gk∞ |ϕk (y)| dy
B Bc
Z
ε
≤M + 2kgk∞ |ϕk (y)| dy,
2M Bc
qui sera < ε pour k assez grand d’après la condition (c) ; on obtient ainsi la convergence
uniforme de ϕk ∗ g vers g.
Démontrons la troisième partie. On doit montrer que kdk kp → 0 ; on utilise l’inégalité
de Minkowski (théorème 3.3.2) pour la mesure |ϕk (y)| dy pour obtenir que
Z Z p 1/p
kdk kp = g(x − y) − g(x) ϕk (y) dy dx ≤
Z Z 1/p Z
p
≤ g(x − y) − g(x) dx |ϕk (y)| dy = kτy g − gkp |ϕk (y)| dy.
18
Remarques.
– Dans le cas périodique, la deuxième partie de l’énoncé du théorème 3.4.7 s’applique
à toutes les fonctions continues périodiques, qui sont automatiquement uniformément
continues.
– Dans le cas de R, si la fonction mesurable bornée g admet des limites à droite et à
gauche au point x0 et si les fonctions (ϕk ) sont paires, on voit facilement par la preuve
ci-dessus que (ϕk ∗ g)(x0 ) tend vers la demi-somme 21 (g(x0 +) + g(x0 −)) des limites.
x → ψ(x/k)f (x)
19
est bornée par (M + 1)p |f (x)|p , fonction intégrable fixe. Par ailleurs pour tout x on a
gk (x) = 0 pour k assez grand, puisque x/k finit par entrer dans le voisinage de 0 dans
lequel ψ = 1.
En associant régularisation et troncature, on voit que D(Rd ) est dense dans tous
les Lp (Rd ), pour 1 ≤ p < +∞ : si f est dans Lp , on trouve d’abord une fonction C∞
de la forme f1 = ϕk0 ∗ f , telle que kf − f1 kp < ε/2 ; ensuite, par le lemme, on trouve
f2 (x) = ψ(x/k1 )f1 (x) telle que kf1 − f2 kp < ε/2 ; finalement, f2 est C∞ à support
compact, et kf − f2 kp < ε.
Une approximation de l’unité utile
Lemme 3.4.8. Si ϕ est une fonction continue ≥ 0 à support compact sur Rd (ou bien
une fonction continue ≥ 0 sur T = R/2πZ), telle que
x 6= 0 ⇒ ϕ(x) < ϕ(0),
la suite (ϕn ) construite à partir des puissances ϕn de la fonction ϕ par la formule
Z −1
ϕn (x) = ϕ(y)n dy ϕ(x)n
d’après l’hypothèse, donc l’un de ces compacts Ak est vide. En posant δ = tk pour un k
choisi assez grand, on aura donc Ak = ∅, c’est-à-dire que ϕ < δ sur le complémentaire
de la boule B(0, α). En désignant par M le volume du support de ϕ, on aura donc
Z
ϕ(x)n dx ≤ M δ n ;
{d(x,0)≥α}
d’un autre côté, choisissons δ1 tel que δ < δ1 < 1 ; l’ouvert V = {ϕ > δ1 } n’est pas vide,
donc |V| > 0, où |V| désigne le volume de l’ouvert V ; on a de plus
Z Z
−1 n
cn = ϕ(x) dx ≥ ϕ(x)n dx ≥ |V| δ1n .
V
n
On en déduit pour ϕn = cn ϕ l’inégalité
Z Z δ n
ϕn (x) dx = cn ϕ(x)n dx ≤ M|V|−1
{d(x,0)≥α} {d(x,0)≥α} δ1
qui tend vers 0 quand n → +∞.
20
Deux exemples
qui est bien ≥ 0 d’intégrale 1 pour la probabilité dt/(2π). L’intérêt de cet exemple est
que les fonctions de la suite sont des polynômes trigonométriques. On voit en effet que
1 −i t 1 1
1 + cos(t) = e +1 + e i t = (e−i t/2 + e i t/2 )2
2 2 2
n
ce qui implique que 1 + cos(t) est un polynôme trigonométrique pour tout n ≥ 0,
n
X
n −n −i t/2 i t/2 2n −n 2n
1 + cos(t) =2 (e +e ) =2 e i kt .
n+k
k=−n
Z Z √
√ δ
δ n
y 2 n
2 n
Jn (δ) = n (1 − x /4) dx = √
1 − dy
−δ −δ n 4n
R 2
converge vers la limite ` = R e−y /4 dy, qui est indépendante de δ et non nulle ; cette
indépendance de δ donne√la condition (c) des approximations de l’unité pour
R la suite des
fonctions ϕn = Jn (2)−1 n 1|x|≤2 (1 − x2 /4)n . En effet, on a ϕn ≥ 0, R ϕn = 1 et de
plus, pour tout δ ∈ ]0, 2],
Z δ
ϕn (x) dx = Jn (δ)/Jn (2)
−δ
R
tend vers 1, ce qui implique que |x|>δ
ϕn (x) dx tend vers 0 pour tout δ > 0.
21
3.4.d. Théorème d’approximation de Weierstrass
On va commencer par le cas le plus simple et le plus important, celui de la droite réelle.
On suivra essentiellement la méthode présentée par Weierstrass lui même vers 1880.
Commençons par un peu de terminologie : une fonction entière est une fonction g sur
R qui est la somme d’une série entière de rayon de convergence infini : il existe des
coefficients (an ) tels que
+∞
X
∀x ∈ R, g(x) = a n xn .
n=0
x
C’est le cas de e , cos x, sin x, etc. Il est bien connu que la série converge alors pour tout
nombre complexe z et permet de prolonger la fonction g au plan complexe, mais ce n’est
pas ce qui nous intéressera ici. On sait aussi que les sommes partielles
n
X
Pn (x) = a k xk
k=0
On sait d’après (3) qu’on obtient ainsi une approximation de l’unité. D’après le théo-
rème 3.4.7, la suite hn = gn ∗ f converge uniformément vers f sur R. Il reste à montrer
que hn est une fonction entière. On a pour tout n ≥ 1
Z Z
−n2 (x−y)2 /2 dy −n2 x2 /2 2 2 2 dy
hn (x) = n e f (y) √ = ne en xy e−n y /2 f (y) √ .
R 2π R 2π
2 2
Comme x → e−n x /2 est entière, il suffit de montrer (par le théorème sur les produits
de séries entières) que Z
2 2 2
x→ en xy e−n y /2 f (y) dy
R
22
soit fini ; or, puisque f est bornée, disons par M, l’intégrale précédente est finie (on pourra
noter que |xy| ≤ x2 + y 2 /4 pour majorer par
Z
n2 x2 2 2
Me e−n y /4 dy < +∞ ).
R
Remarque. On pourrait donner une variante plus terre à terre qui utiliserait les noyaux
de la forme (1 − x2 /4)n sur [−2, 2] : pour tout n ≥ 1, définissons cn par
Z 2 Z 2
1 n 2
n n
=4 1 − x /4 dx = 4 − x2 dx.
cn −2 −2
mais quand on suppose que |x| ≤ 1, on voit que l’intégrale précédente est égale à
Z 1
n
cn 4 − (x − t)2 f (t) dt ;
−1
et on obtient que dans l’intervalle [−1, 1], l’approximant uniforme ϕn ∗ f coı̈ncide avec
la fonction polynomiale
2n Z
X 1
Pn (x) = ak,n (t)f (t) dt xk ,
k=0 −1
23
Le théorème précédent ne règle pas le cas d’une fonction continue qui ne serait
pas définie sur un intervalle, mais sur un compact K ⊂ R peut-être compliqué, comme
l’ensemble de Cantor. Le lemme qui suit s’occupe de cette question, même en plusieurs
dimensions.
Lemme. Si f est une fonction réelle continue sur un compact K contenu dans la boule
unité ouverte de Rd , on peut trouver une fonction g continue sur Rd , à support dans la
boule unité et telle que |f − g| < ε sur K.
Preuve. Introduisons le fermé F réunion de K et du complémentaire Bc de la boule unité
ouverte B, et la fonction f1 sur F, égale à f sur K et à 0 sur Bc . On vérifie facilement
que f1 est uniformément continue sur F. Soit ε > 0, soit δ > 0 tel que |f1 (y) − f1 (y 0 )| < ε
pour tout couple (y, y 0 ) d’éléments de F tels que |y − y 0 | < δ ; supposons aussi que
δ < min{|x − y| : x ∈ K, y ∈ Bc } ;
choisissons ensuite N assez grand pour que Nδ > 2kf k∞ = 2kf1 k∞ , et posons
g(x) = min {f1 (y) + N |x − y|}.
y∈F
24
donc |f (x) − Ψ(x)f (x)| ≤ εkf k∞ , et
N
X
|g(x) − Ψ(x)f (x)| = (f (x) − f (xj )) ψj (x) ≤ εΨ(x) ≤ ε.
j=1
Remarques.
– On pourrait définir autrement une partition de l’unité formée de fonctions à petit
support. Découpons la boule B = B(0, R + ε) de rayon R + ε en ensembles boréliens Aj
deux à deux disjoints, de petit diamètre ≤ δ, de sorte que
n
X
1B = 1Aj .
j=1
Si ψ est une fonction de D(Rd ) à support dans la boule B(0, ε), on vérifie que 1B ∗ ψ est
C∞ à support compact, égale à 1 sur B(0, R). Mais 1B ∗ ψ est la somme des ϕj = 1Aj ∗ ψ,
et chaque ϕj a un support de diamètre ≤ δ + ε (voir l’exercice 3.1.2).
– En fait, on peut prolonger la fonction continue f définie sur K, en une fonction
continue sur Rd (c’est un cas particulier d’un théorème d’Urysohn, et c’est l’objet de
l’exercice qui suit), que l’on peut choisir à support compact si on veut.
dist(x, F0 ) − dist(x, F1 )
g0 (x) = .
3(dist(x, F0 ) + dist(x, F1 ))
25
le même mais l’écriture pénible. On peut aussi déduire la dimension d de la dimension 1
avec des partitions de l’unité ; esquissons le cas d = 2 : soit f une fonction continue
sur R2 , à support dans un carré [−A, A]2 , et telle que |f (x1 , y1 ) − f (x, y)| < ε quand
|x1 − x| < δ et |y1 − y| < δ. On peut trouver des fonctions continues ϕ1 , . . . , ϕN ≥ 0 sur
R, chacune à support dans un intervalle de longueur < δ, et telles que
N
X
∀x ∈ [−A, A], ϕj (x) = 1.
j=1
Les N2 fonctions ϕi (x)ϕj (y) ont des supports contenus dans des carrés de côté < δ, et
leur somme vaut 1 sur [−A, A]2 . Pour chaque i = 1, . . . , N, soit xi un point du support
de ϕi ; on vérifie que la fonction g définie par
N
X
g(x, y) = f (xi , xj )ϕi (x)ϕj (y)
i,j=1
approche f à ε près sur le carré [−A, A]2 . D’après le théorème de Weierstrass en di-
mension 1, on peut ensuite approcher chaque fonction ϕi uniformément sur [−A, A] par
une fonction polynomiale Pi . On en déduira une approximation de f sur [−A, A]2 par la
fonction polynomiale de deux variables
N
X
Q(x, y) = f (xi , xj )Pi (x)Pj (y).
i,j=1
∀θ ∈ R, g(θ) = f (cos(θ)).
26
on a g(−θ) = g(θ) pour tout θ, on peut remplacer Q par le polynôme trigonométrique
P défini par P(θ) = 12 (Q(θ) + Q(−θ)), qui est un polynôme de cosinus,
N
X
P(θ) = ak cos(kθ),
k=0
27
Séries de Fourier et théorème de Fejér
On va travailler avec des séries de Fourier complexes sur l’intervalle [0, 2π], muni de
la mesure normalisée dx/(2π). On identifiera au besoin les fonctions définies sur [0, 2π[
à des fonctions 2π-périodiques sur R. Le produit scalaire de deux fonctions f et g de
L2 (T) ' L2 ([0, 2π], dx/(2π)) sera donné par
Z 2π
dt
hf, gi = f (t)g(t) .
0 2π
Pour tout n ∈ Z, posons en (x) = e i nx ; pour ce produit scalaire, la suite (en ) des
exponentielles complexes est orthonormée, puisque
Z 2π Z 2π
i nx dx dx
hem , en i = e e i mx = e i (n−m)x
0 2π 0 2π
Il est clair que |cn (f )| ≤ kf k1 pour tout n. Si la fonction f est dans L2 (T), on peut aussi
écrire cn (f ) = hf, en i.
La convolution utilisée ici sera la convolution périodique
Z 2π
dt
(f ∗ g)(x) = f (x − t)g(t) .
0 2π
On note que f ∗ en = cn (f )en pour tout n ; ceci entraı̂ne que pour tout polynôme
PN
trigonométrique K = k=M ak ek (avec M ≤ N et M, N ∈ Z), on a
N
X
K∗f = ak ck (f )ek ,
k=M
Proposition. Les polynômes trigonométriques sont denses dans l’espace C(T) des fonc-
tions continues 2π-périodiques ; pour tout p tel que 1 ≤ p < +∞, les polynômes
trigonométriques sont denses dans Lp (0, 2π).
28
Il est intéressant d’introduire une autre approximation périodique de l’unité, qui
a un statut historique plus affirmé et qui a aussi d’autres vertus, qui seront utilisées
au chapitre suivant sur les séries de Fourier : il s’agit du noyau de Fejér. Partons du
polynôme trigonométrique
fn = e0 + · · · + en−1 ,
pour lequel on a la formule
e i nx −1 e i nx/2 sin(nx/2)
fn (x) = = ;
e i x −1 e i x/2 sin(x/2)
n−1
X n−1
X sin(nx/2) 2
|fn (x)|2 = e i kx e−i kx = .
sin(x/2)
k=0 k=0
On a donc
n
X |i|
Kn = 1− ei .
i=−n
n+1
29
Si f est 2π-périodique intégrable sur chaque période, la convolution de f avec Kn est un
polynôme trigonométrique appelé nième somme de Fejér de f ,
n
X |k|
(σn f )(x) = (Kn ∗ f )(x) = 1− ck (f ) e i kx .
n+1
k=−n
Puisque la suite (Kn ) est une approximation de l’unité, le théorème 3.4.7 fournit le
théorème de Fejér.
Théorème de Fejér. Pour toute fonction 2π-périodique continue f , la suite des sommes
de Fejér (σn ∗ f ) converge uniformément vers f . Pour toute fonction 2π-périodique f
dont la restriction à chaque période est dans Lp , 1 ≤ p < +∞, la suite (σn ∗ f ) converge
vers f dans Lp (0, 2π).
kf − fN k2 ≤ kf − gk2 < ε,
ce qui signifie précisément que la suite (fN ) converge vers f dans L2 (T). On en déduit
que X
kf k22 = lim kfN k22 = |ck (f )|2 .
N
k∈Z
et on a aussi X
f= cn (f )en ,
n∈Z
où la série converge au sens de L2 . Ceci ne donne a priori aucune convergence ponctuelle
de la série de Fourier. Cette question de la convergence ponctuelle sera envisagée au
chapitre suivant.
30