cours 13, le jeudi 11 mars 2010
Rappel. Une mesure µ sur (R, BR ), finie sur tous les boréliens bornés, est complètement
caractérisée par la donnée des valeurs µ(]a, b]) que prend la mesure µ sur les intervalles
de la forme
]a, b], a, b ∈ R, a ≤ b.
On peut caractériser une mesure finie µ sur R au moyen de la fonction
x ∈ R → Fµ (x) = µ(]−∞, x]) ;
en effet, si la fonction Fµ est donnée, on retrouve les mesures des intervalles ]a, b],
µ(]a, b]) = Fµ (b) − Fµ (a)
pour tous a ≤ b.
Exemple. La mesure de Dirac δc au point c ∈ R est définie en posant δc (B) = 1 si c ∈ B
et δc (B) = 0 si c ∈
/ B. La fonction F = Fδc correspondante est égale à F(x) = 0 pour
x < c et F(x) = 1 pour tout x ≥ c. Noter qu’au point de saut, la convention adoptée
donne la valeur 1, qui est égale aux valeurs de F aux points plus à droite : la fonction
est continue à droite.
Dans le cas d’une mesure infinie, on ne peut pas utiliser des intervalles partant
de −∞, dont la mesure peut être infinie et ne permet plus de calculer les µ(]a, b]) par
différence ; mais on a supposé que la mesure des bornés est finie pour µ, ce qui permet
de poser
Fµ,0 (x) = µ(]0, x]) si x ≥ 0, Fµ,0 (x) = −µ(]x, 0]) si x < 0 ;
notons que Fµ,0 (0) = µ(]0, 0]) = µ(∅) = 0. On a ici encore
µ(]a, b]) = Fµ,0 (b) − Fµ,0 (a)
pour tous a ≤ b. Vérifions le pour a ≤ 0 ≤ b, par exemple : l’intervalle ]a, b] est la réunion
disjointe de ]a, 0] et de ]0, b], donc
µ(]a, b]) = µ(]a, 0]) + µ(]0, b]) = −Fµ,0 (a) + Fµ,0 (b).
Si 0 < a ≤ b, l’intervalle ]0, b] est la réunion disjointe de ]0, a] et de ]a, b], donc on a dans
ce cas F(b) = F(a) + µ(]a, b]), et le dernier cas restant, a ≤ b < 0, est analogue.
Exemple. Pour Lebesgue, Fλ,0 (x) = x pour tout réel x.
Quand µ est une mesure finie sur R, on voit que Fµ,0 = Fµ − Fµ (0) : les deux
fonctions Fµ,0 et Fµ ne diffèrent que d’une constante, et elles auront donc les mêmes
propriétés de croissance, continuité, et le cas échéant, la même dérivée.
1
Proposition. Soit µ une mesure sur (R, B), finie sur les bornés ; la fonction Fµ,0 est
croissante et continue à droite. Si µ est finie, on a le même résultat pour Fµ .
Preuve. — Posons F = Fµ,0 . La croissance de F est facile à démontrer : si x ≤ y,
l’ensemble ]x, y] a une mesure ≥ 0, et on a dit que
F(y) − F(x) = µ(]x, y]) ≥ 0.
Montrons la continuité à droite en un point x ≥ 0, par exemple. Considérons une suite
(xn ) qui tend vers x par la droite, ce qui permet de supposer que xn décroı̂t vers x ;
pour tout n, on a 0 ≤ x ≤ xn , donc F(xn ) = µ(]0, xn ]). On voit que la suite d’ensembles
(]0, xn ]) décroı̂t vers l’ensemble ]0, x],
\
]0, x] = ]0, xn ]
n
(si t est dans l’intersection, on a 0 < t ≤ xn pour tout n, qui entraı̂ne 0 < t ≤ x
à la limite ; l’autre inclusion est claire) ; on sait que la continuité décroissante de la
mesure n’est pas toujours vraie, mais elle est vraie quand l’un des ensembles de la suite
décroissante est de mesure finie, ce qui est vrai pour tous les bornés ]0, xn ] d’après
l’hypothèse sur µ. On a donc bien
µ(]0, x]) = lim µ(]0, xn ]),
n
c’est-à-dire que F(x) = limn F(xn ). Cela prouve la continuité à droite de F.
On admettra (au niveau de ce cours de L3) le résultat important d’existence suivant,
qui complète le résultat facile précédent.
Théorème 1. Pour toute fonction F : R → R croissante (au sens large) et continue à
droite, il existe une mesure µ sur (R, B) telle que
∀a ≤ b ∈ R, µ(]a, b]) = F(b) − F(a).
De plus, cette mesure µ est uniquement déterminée par F.
L’existence de la mesure de Lebesgue est un cas particulier d’application de ce
théorème, celui où F(x) = x. Le cas général admet essentiellement la même preuve que
le cas Lebesgue. L’affirmation concernant l’unicité a été prouvée au cours précédent, et
rappelée au début de ce cours.
Autres propriétés de la mesure de Lebesgue
Proposition. La mesure de Lebesgue est, à multiple près, la seule mesure sur R inva-
riante par translation et finie sur les bornés. Autrement dit, la mesure de Lebesgue est
la seule mesure µ sur (R, B) invariante par translation telle que µ([0, 1]) = 1.
Preuve. — Supposons que µ est invariante par translation et µ([0, 1]) = 1. Si on donne
un entier n ≥ 1, les intervalles
]k/n, (k + 1)/n], k = 0, . . . , n − 1
sont tous de même mesure puisque µ est invariante par translation, et contenus dans [0, 1],
donc µ(]0, 1/n]) ≤ 1/n. On en déduit que µ(]−1/n, 1/n]) tend vers 0, donc µ({0}) = 0
et µ(]0, 1]) = 1 ; il en résulte que
µ(]0, 1/n]) = 1/n
2
pour tout entier n ≥ 1. Si x > 0, on écrit x = k/n + r, avec 0 ≤ r < 1/n donc
k/n ≤ µ(]0, x]) ≤ (k + 1)/n
et on en déduit µ(]0, x]) = x pour tout x > 0 ; il en résulte que µ(]a, b]) = b − a par
translation, pour tous a ≤ b. Donc µ est la mesure de Lebesgue.
Mesures à densité
On considère un espace mesuré (X, F , µ). On suppose que g, fonction définie sur X, est
F -mesurable à valeurs dans [0, +∞] ; on définit une nouvelle mesure ν = gµ sur F en
posant Z
∀A ∈ F , ν(A) = 1A g dµ.
X
On montre que ν est une mesure par le théorème des séries de fonctions ≥ 0 (version
séries du TCM) : si (An )n>0 ⊂SF est une suite d’ensembles deux à deux disjoints,
l’indicatrice de leur réunion A = n>0 An est la série des indicatrices, donc
Z Z X
+∞ +∞ Z
X X+∞
ν(A) = 1A g dµ = 1An g dµ = 1An g dµ = ν(An ).
X X n=0 n=0 X n=0
Lemme. Si µ est une mesure sur l’espace mesurable (X, F ) et si g est une fonction F -
mesurable définie sur X, à valeurs dans [0, +∞], l’intégrale par rapport à ν = gµ d’une
fonction F -mesurable f à valeurs dans [0, +∞] est donnée par la formule
Z Z
f (x) dν(x) = f (x)g(x) dµ(x).
X X
Si f est F -mesurable réelle ou complexe, elle est ν-intégrable si et seulement si f g est
µ-intégrable et on a la même formule pour l’intégrale.
Il est assez tentant de noter la mesure à densité en disant que dν(x) = g(x) dµ(x),
l’expression qui est remplacée textuellement dans le calcul de l’intégrale.
Preuve. — Si f = 1A , A ∈ F , la formule
Pn n’est qu’une traduction de la définition de ν.
On intègre ensuite une fonction ϕ = j=1 aj 1Aj F -étagée en
Z n
X n
X Z Z
ϕ dν = aj ν(Aj ) = aj 1Aj g dµ = ϕg dµ,
X j=1 j=1 X X
et on déduit le résultat général par limite croissante d’étagées : il existe une suite (ϕn )
de fonctions F -étagées positives qui tend vers f en croissant ; alors ϕn g tend en croissant
vers f g et on obtient en appliquant deux fois le théorème de convergence monotone, et
le cas étagé déjà traité,
Z Z Z Z
f dν = lim ϕn dν = lim ϕn g dµ = f g dµ.
X n X n X X
3
Exemples.
– La mesure µ(0,1) de densité uniforme sur [0, 1] s’obtient comme 1(0,1) (x) dλ(x), on
a pour cette mesure
Z Z 1
µ(0,1) (R) = 1(0,1) (x) dλ(x) = dx = 1.
R 0
C’est une probabilité sur R, c’est-à-dire une mesure finie sur R telle que µ(R) = 1.
– Pour tout α > 0, la mesure α 1[0,+∞[ (x) e−αx dx est une probabilité sur (R, B).
– La mesure gaussienne centrée réduite est la probabilité γ sur (R, B) qui est donnée
2
par dγ(x) = (2π)−1/2 e−x /2 dx ; elle est hh centrée ii et hh de variance égale à 1 ii,
Z Z Z +∞
2 2 dx
x dγ(x) = 0, x dγ(x) = x2 e−x /2
√ = 1,
R R −∞ 2π
calcul fait par intégration par parties,
Z +∞ h i+∞ Z +∞ √
−x2 /2
−x2 /2 2
/2
x xe dx = −x e + e−x dx = 0 + 2π.
−∞ −∞ −∞
Si on essayait le changement√de variable y = x2 /2, on se ramènerait à la fonction Γ, et
on trouverait que Γ(1/2) = π comme traduction de l’intégrale gaussienne,
Z +∞ Z +∞
2
1/2−1 /2
Γ(1/2) = e −y
y dy = e−x (x2 /2)−1/2 xdx
0 0
√
√ Z +∞
2π √
−x2 /2
√
= 2 e = π.
dx = 2
0 2
R +∞ 2
Par le même changement de variable on voit que Γ(s) = 21−s 0 e−x /2 x2s−1 dx. Le
calcul de l’intégrale de x2 pour dγ sera ainsi ramené à la relation Γ(3/2) = (1/2)Γ(1/2),
vue précédemment.
Remarque. Si N ∈ F est de mesure nulle pour µ, on aura
Z
ν(N) = 1N g dµ = 0
X
puisque la fonction 1N g sous l’intégrale est nulle µ-presque partout. Ainsi, quand on a
dν(x) = g(x) dµ(x) pour une certaine densité g,
µ(N) = 0 ⇒ ν(N) = 0.
Le théorème de Radon-Nikodym donne une réciproque, dont on va énoncer un cas limité :
si µ et ν sont finies et si tout ensemble µ-négligeable est ν-négligeable, alors il existe une
densité g µ-intégrable telle que dν(x) = g(x) dµ(x).
4
Caractérisation d’une mesure sur R, à densité par rapport à Lebesgue
On donne une mesure dµ(x) = g(x) dx, qu’on suppose finie sur tous les boréliens bornés.
Pour une telle mesure, on a pour tous a ≤ b
Z
µ(]a, b]) = 1]a,b] (t)g(t) dt
R
et µ([b, b]) = 0, ce qui légitime l’écriture habituelle hh avec des bornes d’intégration ii,
Z b
µ(]a, b[) = µ([a, b]) = g(t) dt.
a
On a donc Z x
Fµ,0 (x) = g(t) dt
0
(en prenant la convention des intégrales de Riemann quand x < 0) et dans le cas d’une
mesure µ finie sur R, Z x
Fµ (x) = g(t) dt.
−∞
On va donner une réciproque partielle et facile, qui donne la densité à partir de la
fonction F.
Proposition. Si µ est une mesure sur (R, B), finie sur les boréliens bornés, et si g est
une fonction borélienne ≥ 0 telle que pour tout x réel on ait
Z x
Fµ,0 (x) = g(t) dt,
0
(conventions de Riemann quand x < 0), alors dµ(x) = g(x) dx.
Si la fonction Fµ,0 est continue sur R, de classe C1 sur R privé d’un nombre fini de
points, alors la dérivée g de Fµ,0 est la densité de µ. Si la mesure µ est finie, on peut
donner le même énoncé avec Fµ .
Preuve. — La première partie de l’énoncé traduit simplement la propriété d’unicité,
exprimée au moyen de la fonction Fµ,0 , et qui résulte du théorème de classe monotone :
en effet, les fonctions F associées aux deux mesures µ et g(x) dx sont égales.
Pour la seconde partie de l’énoncé, on va se contenter de traiter un cas simple mais
significatif, en supposant que F est dérivable sauf en 0, de classe C1 sur l’ouvert R \ {0} ;
la fonction F = Fµ,0 est croissante, sa dérivée, définie en dehors de 0, est borélienne ≥ 0.
On va se ramener à la première partie en posant g(x) = F0 (x), borélienne R x ≥ 0 définie
pour tout x 6= 0, donc presque partout. Il faut donc vérifier que F(x) = 0 g(t) dt pour
tout x.
Calculons F(x) pour un x < 0, par exemple (le cas x > 0 est analogue). Pour tout
s < 0 et x ≤ s, on a puisque F est de classe C1 sur l’intervalle fermé [x, s] et que g = F0
Z s
g(t) dt = F(s) − F(x) ;
x
comme F est continue en 0 (et pas seulement continue à droite !) et par convergence
monotone, on obtient pour sn tendant en croissant vers 0
Z 0 Z sn
g(t) dt = lim g(t) dt = lim F(sn ) − F(x) = F(0) − F(x) = −F(x),
x n x n
5
Rx
ce qui confirme que F(x) = 0 g(t) dt (convention Riemann) dans le cas x < 0. On
procède de même pour x > 0, et on est ramené à la première partie de l’énoncé.
Le cas de µ finie est traité de la même façon.
Exemples.
— Considérons l’image µ de la mesure de Lebesgue λ[0,1] sur [0, 1] par l’application
T : [0, 1] → R définie pour tout t ∈ [0, 1] par T(t) = tn ∈ [0, 1] ; pour 0 ≤ x ≤ 1, on voit
que T−1 (]−∞, x]) = T−1 (]0, x]) = ]0, x1/n], donc
Fµ (x) = λ(]0, x1/n ]) = x1/n ,
et Fµ (x) = 0 pour x < 0, Fµ (x) = 1 pour x > 1. La fonction Fµ est C1 sur R \ {0, 1},
donc la mesure µ admet la densité g définie par g(x) = n1 x1/n−1 entre 0 et 1, et g(x) = 0
pour tout x en dehors de [0, 1].
— Considérons l’image µ de la mesure de Lebesgue λ[0,1]2 sur le carré [0, 1]2 , par
l’application T : [0, 1]2 → R définie par T(t1 , t2 ) = t1 + t2 .
On voit que Fµ (x) = x2 /2 si 0 ≤ x ≤ 1 : en effet, l’image inverse de ]−∞, x] dans ce
cas est le triangle des points (t1 , t2 ) tels que 0 ≤ t1 , t2 et t1 + t2 ≤ x, triangle rectangle
de côté x et de surface x2 /2. Ensuite, Fµ (x) = 1 − (2 − x)2 /2 = 2x − x2 /2 − 1 entre 1
et 2 ; dans ce cas il est plus facile de voir que l’image inverse de ]x, +∞] est à nouveau
un triangle, de côté 2 − x. Il en résulte que µ admet la densité g nulle en dehors de [0, 2],
et donnée par g(x) = x sur (0, 1) puis g(x) = 2 − x sur (1, 2).
p
— Image µ de la mesure de Lebesgue λ2 sur R2 par T(x, y) = x2 + y 2 . Les images
inverses des intervalles ]−∞, r] sont des disques. On trouve Fµ,0 (r) = πr 2 pour r ≥ 0,
donc g(r) = 2π1r≥0 r ; le calcul de l’intégrale des fonctions radiales
p en découle : si h est
2 2
une fonction borélienne ≥ 0 sur R qui ne dépend que r = x p + y 2 , c’est-à-dire qu’il
existe une fonction f borélienne ≥ 0 sur R telle que h(x, y) = f ( x2 + y 2 ), alors
Z Z Z +∞
h(x, y) dλ2 (x, y) = f (y) dµ(y) = 2π f (r)r dr.
R2 R 0
Changements de variables plus généraux, sur R
On considère deux intervalles ouverts non vides I et J, et une bijection croissante G de I
sur J ; on suppose qu’il existe une fonction g localement intégrable positive sur R et G
telle que pour tout x < y dans I, on ait
Z y
G(y) − G(x) = g(t) dt.
x
Dans le cas où g est continue, la fonction G est de classe C1 et le changement de
variable y = G(x) donne dy = g(x) dx.
On utilisera la variante suivante de la caractérisation de la mesure de Lebesgue : la
mesure de Lebesgue sur J est la seule mesure telle que µ([a, b]) = b − a pour tout a ≤ b,
a, b ∈ J.
Proposition. Pour toute fonction f borélienne positive sur J, on a
Z Z
f (G(x))g(x) dx = f (y) dy.
I J
6
Preuve. — Il suffit de voir que l’image par G de la mesure dµ(x) = g(x) dx sur I est la
mesure de Lebesgue sur J. Soient u < v donnés dans J ; comme G est une bijection de I
sur J, il existe a et b dans I tels que G(a) = u, G(b) = v et G−1 ([u, v]) = [a, b]. Alors
Z b
−1
µ(G ([u, v])) = g(x) dx = G(b) − G(a) = v − u.
a
Corollaire. On suppose que ϕ est une bijection croissante de classe C1 de l’intervalle
[a, b] sur [α, β] ; pour toute fonction f borélienne positive sur [α, β], on a
Z b Z β
0
f (ϕ(x))ϕ (x) dx = f (y) dy.
a α
Preuve. — On pose G(x) = ϕ(x) dans [a, b] et en dehors, G(x) = β + x − b si x > b et
/ [a, b] et g(x) = ϕ0 (x) dans [a, b].
G(x) = α + x − a si x < a ; on pose aussi g(x) = 1 si x ∈
Exemple. Autre calcul de l’image ν de Lebesgue sur [0, 1] par l’application x = T(u) =
un . Z Z Z 1
f (x) dν(x) = f (Tu) dλ(0,1) (u) = f (un ) du.
R R 0
On pose x = un , u = G(x) = x1/n , h(u) = f (un ), I = J = [0, 1],
Z Z 1 Z 1 Z
f (x) dν(x) = h(u) du = h(G(x))g(x) dx = f (x)1(0,1] (x)n−1 x1/n−1 dx.
R 0 0
Si pour toute fonction borélienne ≥ 0 on a l’égalité, etc.
Théorème de prolongement
On a évoqué à plusieurs reprises la question de la définition de la mesure de Lebesgue,
non pas seulement sur les ensembles simples de la théorie de Riemann, mais sur tous
les boréliens. Le problème n’est pas tellement que la mesure sur R soit infinie : la vraie
question est de définir la mesure pour tous les boréliens de [0, 1], il est facile de passer
à R en faisant la série des résultats obtenus sur chaque [n, n + 1], n ∈ Z.
La hh mesure de Riemann ii, provenant de la théorie de l’intégrale de Riemann, per-
mettait de définir une mesure finiment additive sur tous les ensembles d’une algèbre R
de parties, les ensembles R-intégrables. On voit que le problème qui se pose à nous est
d’étendre, si possible, une mesure donnée sur une algèbre en mesure σ-additive définie
sur la σ-algèbre engendrée F = σ(R).
Dans la situation du théorème 1, on part d’une fonction F croissante et continue à
droite sur [0, 1] ; on pourra définir une mesure sur les sous-ensembles B de ]0, 1] qui sont
réunion disjointe d’un nombre fini d’intervalles de la forme ]aj , bj ], 0 ≤ aj ≤ bj ≤ 1 et
j = 1, . . . , n, en posant
Xn
µ(B) = (F(bj − F(aj )).
j=1
Ces ensembles simples forment une algèbre de parties A. Si on veut étendre de façon σ-
additive cette mesure à la tribu borélienne, il est nécessaire de s’occuper du cas suivant :
7
les ensembles ]1/2, 1], ]1/4, 1/2], . . . , ]2−n−1 , 2−n ], . . . sont dans l’algèbre A, ils sont deux
à deux disjoints et il se trouve, par le plus grand des hasards, que leur réunion est
+∞
[
]2−n−1 , 2−n ] = ]0, 1],
n=0
un ensemble qui est déjà dans l’algèbre !
Si un prolongement σ-additif µ e existe, il devra donner à la réunion disjointe une
mesure égale à la série des mesures des morceaux ; mais si µe est un prolongement, il
donne la même mesure que la mesure initiale µ aux ensembles de l’algèbre. Il est donc
nécessaire qu’on ait au départ
+∞
X
µ(]2−n−1 , 2−n ]) = µ(]0, 1]).
n=0
C’est ici que la continuité à droite de F apparaı̂t, car
n−1
X
µ(]2−k−1 , 2−k ]) = µ(]2−n , 1]) = F(1) − F(2−n ),
k=0
qui tend vers F(1) − F(0) = µ(]0, 1]).
Ce qui est vraiment sympathique, c’est que cette condition évidemment nécessaire
est suffisante !
Théorème. Soit µ une mesure finiment additive positive finie sur une algèbre A de
parties de X ; pour qu’il existe un prolongement σ-additif de µ à la σ-algèbre engendrée
par A, il est nécessaire et suffisant que la condition suivante soit satisfaite : pour
S+∞ toute
suite (An )n>0 d’éléments de A, deux à deux disjoints et dont la réunion A = n=0 An
est un élément de A, on a
+∞
X
(∗) µ(A) = µ(An ).
n=0
Voici un résumé de la stratégie de la preuve. Il est certainement nécessaire
S+∞ de pro-
longer la mesure à la classe Aσ formée des réunions dénombrables B = n=0 Bn des
suites (Bn ) ⊂ A ; par découpage en couronnes dans l’algèbre A, on peut exprimer cette
réunion B comme réunion d’une suite disjointe (Cn )n>0 d’éléments de A, et on pose
+∞
X
µ
e(B) = µ(Cn ) ;
n=0
on doit vérifier que la somme ne dépend pas de la représentation particulière : on l’obtient
grâce à l’hypothèse (∗) (procéder à un redécoupage Cn ∩ Dm ), et par (∗) on sait aussi
que µe = µ pour les ensembles de l’algèbre.
Il est tout aussi nécessaire de prolonger à la classe Aδ formée des intersections
dénombrables de suites d’éléments de A, mais ici on utilise simplement le fait que A est
dans Aδ si et seulement si son complémentaire est dans Aσ , et on pose
e(Ac ) ;
e(A) = µ(X) − µ
µ
8
il y a une compatibilité à démontrer quand A est aussi dans Aσ : c’est encore l’hypo-
thèse (∗) qui règle la question.
On peut maintenant définir une tribu et un prolongement (ça ne ne voit pas immé-
diatement, il faut un travail assez long pour prouver, essentiellement en même temps,
qu’on a une tribu et une mesure). On définit la classe M des parties Y de X qui admettent
pour tout ε > 0 un encadrement
Aε ⊂ Y ⊂ B ε , avec Aε ∈ Aδ , Bε ∈ Aσ e(Bε \ Aε ) < ε,
et µ
et on pose pour tout Y ∈ M
e(Y) = sup {e
µ µ(A) : A ⊂ Y, A ∈ Aδ } = inf {e
µ(B) : Y ⊂ B, B ∈ Aσ }.