0% ont trouvé ce document utile (0 vote)
97 vues20 pages

Cours TD3

Le document traite des fonctions génératrices et de leur utilisation dans le cadre des variables aléatoires, en présentant des propriétés, des théorèmes et des exercices liés à ces fonctions. Il aborde également le processus de branchement de Galton-Watson pour modéliser l'extinction des populations, en fournissant des résultats sur la probabilité d'extinction. Enfin, des exercices pratiques sont proposés pour illustrer ces concepts.

Transféré par

ebodesedric
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
97 vues20 pages

Cours TD3

Le document traite des fonctions génératrices et de leur utilisation dans le cadre des variables aléatoires, en présentant des propriétés, des théorèmes et des exercices liés à ces fonctions. Il aborde également le processus de branchement de Galton-Watson pour modéliser l'extinction des populations, en fournissant des résultats sur la probabilité d'extinction. Enfin, des exercices pratiques sont proposés pour illustrer ces concepts.

Transféré par

ebodesedric
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Fonctions génératrices, Fonctions caractéristiques, Convolution

1 Fonctions génératrices
Si X est une variable aléatoire à valeurs dans N, la fonction génératrice de X est définie comme

X
GX (s) = E(sX ) = pk sk
k=0

où pk = P(X = k) et où on adopte la convention 00 = 1.

Proposition 1.1. La fonction génératrice vérifie les propriétés suivantes


(i) Son rayon de convergence est supérieur ou égal à 1 et elle est C ∞ sur (−1; 1).
(ii) Elle caractérise la loi de X (i.e. deux fonctions génératrices égales correspondantes à des v.a.
de même loi).
0
(iii) lims→1− GX (s) = E(X).
(iv) Si X et Y sont deux variables aléatoires à valeurs entières indépendantes alors GX+Y = GX .GY

On rappelle que si E(X) < ∞, la dérivée de GX est prolongeable par continuité en 1 et GX


devient dérivable à gauche en 1.

Théorème 1.1. Si X1 , X2 , ... est une suite de v.a.i.i.d. de fonction génératrice commune GX et
si N est une variable aléatoire à valeurs dans N indépendante des Xi et de fonction génératrice
GN , alors SN = X1 + X2 + . . . + XN a pour fonction génératrice

GSN (s) = GN (GX (s)).

1) Moyen mémotechnique : pour se souvenir de l’ordre dans lequel les fonctions sont composées,
remarquer que si N est déterministe (P(N = n) = 1) alors on doit retrouver la formule donnant la
fonction génératrice de n v.a.i.i.d. soit GSN (s) = GX (s)n , et l’on a GN (s) = sn .

1
2) Démonstration : Par le théorème de Fubini et indépendance de N et (Xi : i ∈ N),
X
GSN (s) = E([ 11(N = n)]sX1 +...+XN )
n≥0
X
= E(11(N = n)sX1 +...+Xn )
n≥0
X
= P(N = n)E(sX1 +...+Xn )
n≥0
X
= P(N = n)E(sX )n
n≥0
= GN (GX (s)).

1.1 Exercices
Exercice 1.1. On rappelle que si X est une variable aléatoire à valeurs dans N, la fonction
génératrice de X est définie comme

X
GX (s) = E(sX ) = pk sk
k=0

où pk = P(X = k) et où on adopte la convention 00 = 1.


0) Rayon de convergence de la série ?
1) Montrer que la fonction génératrice de X caractérise complètement sa loi.
2) Montrer que GX est C ∞ sur (−1; 1) et que si X est intégrable alors
0
lim GX (s) = E(X)
s→1−

Donner un résultat analogue pour la variance. Montrer de même que E(X(X − 1) . . . (X − k +


(k)
P d’Abel : Soit an ≥ 0 et G(s) =
P = G n(1−). Indication. On utilisera et montrera le théorème
1))
n∈N an s . Si G(s) est fini pour s < 1, alors lims→1 G(s) = n∈N an .

3) Montrer que si X et Y sont deux variables aléatoires à valeurs entières indépendantes alors la
fonction génératrice de X + Y est le produit de GX et de GY . Réciproque ?
4) Calculer les fonctions génératrices des distributions suivantes : v.a. constante X = c, variable
de Bernoulli de paramètre p, distribution géométrique (P(X = k) = p(1 − p)k−1 pour k ≥ 1),
distribution de Poisson, distribution binomiale B(n, p). Vérifier sans calcul que la somme de deux
variables indépendantes B(n, p) et B(m, p) est B(n + m, p).
5) On appelle fonction génératrice jointe de deux v.a. X1 et X2 à valeurs dans N la fonction
GX1 ,X2 (s1 , s2 ) = E(sX1 X2
1 s2 ).

Montrer que X1 et X2 sont indépendantes si et seulement si


GX1 , X2 (s1 , s2 ) = GX1 (s1 )GX2 (s2 )
pour tous s1 et s2 .

2
Solutions : 0) Le rayon de convergence de la série est supérieur ou égal à 1.

1 (k)
1) Remarquer que l’on a pk = k! GX (0).

2) GX est une série entière et donc en tant que telle C ∞ sur son disque de convergence. D’autre
part, pour tout s ∈ (−1, 1), on a (en utilisant le théorème d’Abel)
∞ ∞
0
X X
GX (s) = kpk sk−1 ↑s→1 kpk = E(X)
k=1 k=1

De même, on montre que si X a un moment d’ordre 2


h i
(2) (1) (1)
V ar(X) = lim GX (s) + GX (s) − [GX (s)]2
s→1

3) GX+Y (s) = E(sX sY ) = E(sX )E(sY ) = GX (s)GY (s) par indépendance de X et Y . La réciproque
est fausse (comme elle l’est pour les fonctions caractéristiques, cf Exo 2.5). Ce qui est en revanche
vrai, c’est que si la fonction génératrice du couple (X, Y ) (définie par G(X,Y ) (s1 , s2 ) = E(sX Y
1 s2 ))
s’écrit comme le produit direct de GX et GY (i.e. G(X,Y ) (s1 , s2 ) = GX (s1 )GY (s2 )) alors les deux
variables X et Y sont indépendantes (voir la question 5)).
4) On obtient successivement
P∞ k G(s) k−1 = sc (variable constante), G(s) = (1 − p) + ps (variable de
ps
Bernoulli), G(s) = k=1 s p(1 − p) = 1−s(1−p) (variable géométrique de paramètre p), G(s) =
P∞ k λk −λ λ(s−1)
k=0 s k! e = e (variable de Poisson), G(s) = (q + ps)n (variable binomiale B(n, p),
q = 1 − p.) On peut voir que la somme d’une B(n, p) et d’une B(m, p) indépendantes est une
B(n + m, p) de deux manières : d’une part on peut interpréter la somme comme la somme de n + m
variables de Bernoulli indépendantes. Mais on peut simplement multiplier les fonctions génératrices
en utilisant le 3)
5) Si X1 et X2 sont indépendantes, sX 1
1
et s2X2 aussi et on a donc E(s1X1 sX2 X1 X2
2 ) = E(s1 )E(s2 ).
Réciproquement, si cette relation est vraie, on a
X X X
P(X1 = m; X2 = n)sm n
1 s2 = ( P(X1 = m)sm1 )( P(X2 = n)sn2 ).
m,n m n

Il suffit de développer le deuxième membre et d’identifier terme à terme pour déduire que P(X1 =
m; X2 = n) = P(X1 = m)P(X2 = n).

Exercice 1.2. Une poule pond N oeufs, et N est une distribution de Poisson de paramètre λ.
Chaque oeuf éclôt avec probabilité p et les éclosions sont des évènements indépendants. Soit K
le nombre de poussins. Calculer la fonction génératrice de K et en déduire que K suit une loi de
Poisson de paramètre λp.

Solution : On a GX (s) = q+ps, GN (s) = ∞ n λn −λ = eλ(s−1) . Donc G (s) = G (G (s)) =


P
n=0 s n! e K N X
eλ(q+ps−1) =e λp(s−1) . K suit donc une loi de Poisson de paramètre λp.

3
1.2 Processus de branchement : l’extinction des grands noms
Source : Grimmett G., Stirzaker D., Probability and Random Processes, 5.4 pp.
171-174 On pourra aussi consulter l’Ouvrard tome II p 529 quand on connait les chaines de Mar-
kov et les martingales. Ou Modélisation stochastique et simulations - Bercu Chafai, p125, pour des
simulations.

Au dix-neuvième siècle, en 1873 exactement, H.W. Watson répond à une question posée par F.
Galton la même année. Il s’agit d’expliquer la tragique et progressive disparition des grands noms
de l’aristocratie anglaise. Des noms des grands personnages de Shakespeare, bien peu ont laissé
descendance : où sont maintenant les Gloucester, et les Buckingham ? Les processus de Galton-
Watson, appelés aussi processus de branchement, modélisent la reproduction et permettent de
calculer la probabilité d’extinction. On suppose qu’une population évolue par générations et que
Zn désigne le nombre d’individus de la n-ième génération. Chaque membre de la n-ième génération
donne le jour à une famille de membres de la n + 1-ième génération et la taille de cette famille est
une variable aléatoire. On fait les hypothèses suivantes :
(a) Les tailles Xi des familles de tous les individus sont des variables indépendantes
(b) Toutes ces tailles Xi ont même loi et on note G leur fonction génératrice et m leur moyenne.

On supposera dans la suite que Z0 = 1. On appelle Gn (s) = E(sZn ) la fonction génératrice de


Zn . Notre but est de savoir quand la population s’éteint, i.e. Zn stationne à zéro :

Théorème 1.2. Quand n → ∞, P(Zn = 0) → η = P(∃n ∈ N : Zn = 0). La probabilité d’extinction


η peut être calculée comme la plus petite racine positive de l’équation s = G(s).
De plus, η = 1 ssi m ≤ 1 et P(X = 1) < 1.

Interpréter ce résultat, que nous allons maintenant prouver (question 3.c)), et observer un
exemple de v.a. convergeant vers 0 sans que son intégrale ne le fasse.

Exercice 1.3. 1) Montrer que Gn (s) = G(G(. . . (G(s)) . . . )), l’itérée n fois de G.
2)On pose mn = E(Zn ) et σn2 = V ar(Zn ). En dérivant une fois, puis deux fois en s = 1 la relation
Gn (s) = G(Gn−1 (s)), montrer que E(Zn ) = mn , V ar(Zn ) = nσ 2 si m = 1,

σ 2 (mn − 1)mn−1
V ar(Zn ) = si m 6= 1.
m−1

3) a) Montrer que P(Zn = 0) = Gn (0) est une suite croissante qui converge vers η et que

η = P(∃n ∈ N : Zn = 0) = inf{s ∈ [0, 1] : G(s) = s}.

b) Montrer que si m ≤ 1, alors η < 1 implique P(X = 1) = 1.


c) Prouver le théorème énoncé plus haut.
4) On suppose que les tailles de familles ont la distribution géométrique P(X = k) = qpk , avec
q = 1 − p.

4
a) Avez-vous une interprétation pour cette hypothèse ? Vérifier que G(s) = q(1 − ps)−1 et, par
récurrence, que
n − (n − 1)s 1
Gn (s) = si p = q = ,
n + 1 − ns 2
q(pn − q n − ps(pn−1 − q n−1 ))
Gn (s) = si p 6= q.
pn+1 − q n+1 − ps(pn − q n )
b) En déduire que
n 1
P(Zn = 0) = si p = q = ,
n+1 2
n
q(p − q ) n
P(Zn = 0) = n+1 si p 6= q.
p − q n+1
c) En conclure que, sous les hypothèses précédentes, la probabilité d’extinction η de la population
des descendants vérifie
q
η = 1 si p ≤ q, η = si p > q.
p
Obtenir directement ce résultat à partir du théorème.

Solution
1) C’estP
très simple, mais la démonstration du Grimmett-Stirzaker est pourtant un peu confuse. On
a Zn = Z i=1 Xi , où Xi est la taille de la famille du i-ème individu de la génération n − 1. Il s’agit
n

d’une somme d’un nombre aléatoire de v.a.i.i.d. de fonctions génératrices G, ce nombre aléatoire
Zn−1 ayant une loi Gn . Donc par le théorème 1.1, on a Gn = Gn−1 ◦ G et on conclut parce que
G1 = G.
2) On rappelle que si X est une v.a. de fonction génératrice G, alors EX = G0 (1) et var(X) =
G00 (1) + G0 (1) − G0 (1)2 . En dérivant comme indiqué, on a G0n (1) = G0 (1)G0n−1 (1) et donc mn =
mmn−1 , soit mn = mn . En dérivant deux fois, on obtient G00n (s) = G00 (Gn−1 (s))G0n−1 (s)2 +
G0 (Gn−1 (s))G00n−1 (s), soit G00n (1) = G00 (1)m2(n−1) + mG00n−1 (1). On en tire la relation de récurrence
σn2 = σ 2 m2(n−1) + mσn−12 qui donne bien les résultats annoncés.
3) a) La croissante de la suite un = P(Zn = 0) vient de la croissance de G et du fait que u1 ≥ 0 = u0 .
Définir ensuite η comme le premier point fixe, et utiliser la stabilité de [0, η] pour conclure par crois-
sance majorée. Enfin l’événement {Zn = 0} croit vers {∃n ∈ N : Zn = 0}.

b) Faire un dessin : c’est la convexité de G. Utiliser que si m ≤ 1, la courbe est au dessus de


sa tangente donc au dessus de la première bissetrice. Pour qu’il y ait un point fixe avant 1, il faut
donc qu’elle se confonde avec la première bissectrice sur un segment, ce qui par analycité implique
G(s) = s et donc P(X = 1) = 1.
Si m > 1, alors il existe un point fixe strictement inférieur à 1 par TVI puisque G(0) ≥ 0 et
G(x) < x dans un voisinage de 1 (exclu).
4)a) Simple calcul.
b) On a P(Zn = 0) = Gn (0), ce qui donne tout de suite le résultat annoncé en utilisant la question
précédente.
Passons à l’interprétation, du point de vue de Galton et Watson : si p ≤ q, on a p ≤ 21 et donc la
distribution des tailles décroı̂t très vite. De plus on vérifie facilement que l’espérance du nombre de

5
p
descendants par individu est G0 (1) = 1−p . Donc si p < 12 , cette espérance est inférieure à 1. Dans ce
cas, il y extinction ! Si p ≥ 21 , l’espérance du nombre de descendants est supérieure à 1 et tend vers
l’infini quand p → 1. Dans ce cas, il y a une probabilité de ”survie du nom”. Mais la probabilité
d’extinction reste importante puisque elle est égale à pq . Il peut y avoir extinction même dans une
famille prolifique et les grands noms, donc, peuvent disparaı̂tre.

2 Fonctions caractéristiques

Bien que l’on présente souvent la transformée de Fourier de manière autonome en probabilités,
l’essentiel de la théorie, et en particulier les théorèmes d’inversion, sont plus complétement décrits
grâce à la théorie des distributions. Voir par exemple Bony J.M., Cours d’Analyse. Dans ce T.D.
nous suivrons essentiellement le Tome II d’Ouvrard (chapitre 12) car la fonction caractéristique y
est traitée pour des v.a. à valeurs dans Rd . Pour un traitement très élégant et rapide dans le cas
de v.a. réelles, voir le chapitre 16 de Williams, Probability with martingales. On a besoin de v.a.
vectorielles à cause, notamment, du traitement des vecteurs gaussiens.

2.1 Généralités
Définition 2.1. Soit µ une mesure finie sur Rd . On appelle transformée de Fourier de µ l’appli-
cation de Rd dans C définie par
Z
(Fµ)(t) = µ̂(t) = eix.t µ(dx).
Rd

(Ici, x.t est le produit scalaire usuel de x et t ∈ Rd )


On appelle fonction caractéristique d’une variable aléatoire X la transformée de Fourier de sa loi
µ = PX . Elle est notée ϕX et vaut

ϕX (t) = E(eiX.t ) = µ̂(t), (t ∈ Rd ).

Proposition 2.1. Propriétés élémentaires


1) µ̂(0) = µ(Rd ), ϕX (0) = 1.
2) ∀t ∈ Rd , |µ̂(t)| ≤ µ(Rd ), |ϕX (t)| ≤ 1.
3) ∀t ∈ Rd , µ̂(−t) = µ̂(t), ϕX (−t) = ϕX (t).
4) Soient A ∈ L(Rd , Rk ) et b ∈ Rk , alors

∀t ∈ Rk , ϕAX+b (t) = ϕX (A? t)eib.t ,

où A? désigne l’adjoint de A.

On va montrer pour deux mesures bornées µ1 , µ2 que


– µ̂1 = µ̂2 implique µ1 = µ2 .

– [F(µ1 ⊗ µ2 )] (t1 , t2 ) = [Fµ1 ](t1 )[Fµ2 ](t2 ).

6
Deux v.a. qui ont même transformée de Fourier sont égales (injectivité).
Pour deux v.a. aléatoires indépendantes X1 et X2 :

ϕ(X1 ,X2 ) (t1 , t2 ) = ϕX1 (t1 )ϕX2 (t2 ), ϕX1 +X2 (t) = ϕX1 (t)ϕX2 (t)

Exercice 2.1. Montrer que les fonctions µ̂ et ϕX sont uniformément continues sur Rd .
Indication : Fixer ε > 0 et choisir n tel que µ(B(0, n)c ) ≤ ε, montrer et utiliser l’inégalité |eix.u −
eix.t | ≤ ||u − t|| ||x||

Exercice 2.2. Exemple très important : la gaussienne


On pose
1 ||x||2
gσ (x) = √ e− 2σ2 .
(σ 2π)d
Vous devez savoir démontrer sans aucune hésitation les relations suivantes :
1) La fonction gd est une densité de probabilité sur Rd .
2) Pour tout f ∈ Cb (Rd ), limσ→0 (f ∗ gσ )(x) = f (x).
3) Montrer (de trois facons) que pour tout t ∈ Rd ,
||t||2 √
gˆ1 (t) = e− 2 = ( 2π)d g1 (t).

Solutions :
1) Se ramener au cas de la dimension 1 avec Fubini et et se souvenir comment l’on montre que
R −x2 /2 √
dx = 2π. Il faut pour cela regarder R2 exp(−[x2 + y 2 ]/2)dxdy en polaire
R
Re

2) Utiliser le théorème de Lebesgue après changement de variable y = σz.


3) On commence à se ramener au calcul en dimension 1 par le théorème de Fubini.
– Première méthode très simple que l’on peut trouver dansR le chapitre 9 de Bony, Cours d’Ana-
2
lyse, sur la transformée de Fourier. Poser g(s) = R eisx e−x dx et montrer en utilisant le
théorème de dérivation sous le signe somme que g est C 1 et déduire de l’expression de g 0 en
intégrant par parties que g est solution de l’équation différentielle 2g 0 (s) + sg(s) = 0.
– Une autre méthode utilise la formule de Cauchy appliquée à la fonction holomorphe g(z) =
exp(−z 2 /2) sur le circuit composé des segments [(−r, 0), (r, 0)], [(r, 0), (r, t)], [(r, t), (−r, t)],
[(−r, t), (−r, 0)] en faisant tendre r vers l’infini.
– Une troisième méthode élégante consiste à remarquer que
Z
1 (x−it)2 t2
ĝ1 (t) = √ e− 2 e− 2 dx.
2π R
On pose alors Z
(x−z)2
f (z) := e− 2 dx.
R
On démontre très soigneusement en utilisant le théorème de dérivation sous le signe somme

que f est holomorphe sur C. Comme f est constante et égale à 2π sur R par un changement
de variable trivial, on conclut par prolongement analytique.

7
2.2 Injectivité de la transformée de Fourier
Définition 2.2. (Convolution d’une mesure bornée et d’une fonction). Soit µ une mesure bornée
sur Rd et f une fonction borélienne telle que, pour tout x, la fonction y → f (y −x) soit µ-intégrable.
On pose Z
(f ∗ µ)(x) = f (x − y)µ(dy).
Rd

Exercice 2.3. Théorème d’injectivité de la transformée de Fourier sur les mesures


bornées
Il s’agit de montrer que deux mesures bornées sur Rd qui ont même transformée de Fourier sont
égales. Cette démonstration suit Ouvrard, Tome II, pp. 202-204.
1) Soit µ une mesure bornée sur Rd . Montrer en appliquant le théorème de Fubini et la relation (d)
de l’exercice précédent que
Z
1
(gσ ∗ µ)(y) = √ µ̂(v)g1 (σv)e−iy.v dv.
( 2π)d Rd

2) Expliquer pourquoi
R une mesure bornée sur Rd est déterminée par la donnée pour tout f ∈ CK (Rd )
des intégrales Rd f dµ. R
En déduire qu’il suffit de donner une expression de f dµ en fonction de µ̂ pour montrer l’unicité.
3) Montrer en appliquant le théorème de Lebesgue que
Z Z
f dµ = lim (f ∗ gσ )(x)dµ(x).
Rd σ→0 Rd

4) En appliquant le théorème de Fubini, en déduire que


Z Z
f dµ = lim f (y)(gσ ∗ µ)(y)dy.
Rd σ→0 Rd

5) En utilisant le 1), déduire que


Z Z Z 
1 −iy.v
f dµ = √ lim f (y) µ̂(v)g1 (σv)e dv dy.
Rd ( 2π)d σ→0

6) Enoncer le théorème d’injectivité de la transformée de Fourier.


7) Application : soit µ une mesure bornée sur Rd telle que µ̂ soit Lebesgue-intégrable. Alors µ est
absolument continue par rapport à la mesure de Lebesgue et sa densité est donnée par
Z
1
h(x) = µ̂(t)e−ix.t dt.
(2π)d Rd
Indication : √
ˆ
1) On utilise g1 (σ.)(y ˆ
− x) = g1 (σ.)(x − y) = 2πgσ (x − y) pour
Z Z Z Z
µ̂(v)g1 (σv)e−iy.v
dv = ix.v
e µ(dx)e −iy.v
dv = ˆ
µ(dx)g1 (σ.)(y − x)
Rd Rd Rd Rd

8
2) Il suffit de montrer que ces mesures coı̈ncident sur les ouverts car ils forment un π-système
des boréliens. On montrera brièvement que toute fonction caractéristique d’ouvert est une limite
croissante de fonctions continues à support compact (En effet, soit gr (x) = max(0, 1 − r||x||).
Quand r → 0, cette fonction tend en croissant vers 1. Posant hr (x) = inf(1, 1r d(x, Ωc )), puis
kr (x) = gr (x)hr (x), on vérifie que cette suite de fonctions convient, quand r → 0).
7) Commencer par montrer en appliquant le théorème de Lebesgue que
Z Z
−iy.v 1
µ̂(v)g1 (σv)e dv → √ µ̂e−iy.v dv
d ( 2π)d d
R R

Puis, appliquer à nouveau le théorème de Lebesgue dans la relation 5) avec f ∈ CK (Rd ).

Exercice 2.4. Transformée de Fourier et indépendance (Ouvrard, tome II, pp. 204-208).
On considère des mesures bornées µ1 et µ2 sur Rd1 et Rd2 et la mesure produit µ1 ⊗ µ2 .
1) Montrer en appliquant le théorème de Fubini (on rappelle que F désigne la tranformation de
Fourier) que
[F(µ1 ⊗ µ2 )] (t1 , t2 ) = [Fµ1 ](t1 )[Fµ2 ](t2 ).

2) Soit X = (X1 , X2 ) une v.a. à valeurs dans Rd1 × Rd2 . Déduire du 1) que X1 et X2 sont
indépendantes si et seulement si

ϕ(X1 ,X2 ) (t1 , t2 ) = ϕX1 (t1 )ϕX2 (t2 ).

On utilisera l’injectivité de la transformée de Fourier.


3) Remarquer que ϕX1 (t1 ) = ϕX1 ,X2 (t1 , 0).
4) Si µ1 et µ2 sont des mesures bornées sur Rd , on a F(µ1 ∗ µ2 ) = Fµ1 Fµ2 .
Rappel (Ouvrard p. 63) : la convolée de deux mesures µ1 et µ2 , µ1 ∗ µ2 est la mesure image de
µ1 ⊗ µ2 par l’application somme. Cela signifie que pour toute fonction mesurable positive,
Z Z
f µ1 ∗ µ2 = f (x1 + x2 )µ1 ⊗ µ2 (dx1 dx2 ).
Rd Rd ×Rd

Appliquer cette formule avec f (x) = eix.t et utiliser le théorème de Fubini.


Exercice 2.5. Un contrexemple (Brémaud P., Introduction aux probabilités : Modélisation des
phénomènes aléatoires, p. 134, exercice 13).
On considère le sous-ensemble de R2 ,
1 1
C = {(x, y) ∈ [0, 1]2 , x − ≤ y ≤ x ou y ≥ x + .}
2 2

1) Dessiner C.
2) Soit X et Y deux variables aléatoires de densité de probabilité fX,Y constante sur C, nulle
ailleurs. Calculer la valeur de la constante et les densités de X et Y . En déduire que X et Y ne
sont pas indépendantes.

9
3) Calculer les fonctions caractéristiques de X, Y et X + Y pour montrer que

ϕX (t)ϕY (t) = ϕX+Y (t).

Solution

Un calcul élémentaire montre que la constante vaut 2. On désigne par fX la densité de X et par
fY celle de Y . On a Z +∞
fX (x) = fX,Y (x, y)dy = 11[0,1] (x)
−∞
et
fY (y) = 11[0,1] (y).
X et Y ne sont pas indépendantes puisque

fX (x)fY (y) 6= fX,Y (x, y).

Or on a !2 !
eiu − 1 eiu − 1
ϕX+Y (u) = , ϕX (u) = ϕY (u) = .
iu iu

Exercice 2.6. (Williams, Probability with martingales p. 238) Calculer la fonction caractéristique
de la loi uniforme sur [−1, 1]. Montrer qu’il n’existe pas de variables aléatoires i.i.d. X et Y telles
que X − Y ait cette loi uniforme sur [−1, 1].

2.3 Fonctions caractéristiques : ce qu’il faut absolument savoir

1) La défénition d’une fonction caractérisque.


2) Retrouver rapidement les propriétés élémentaires sur les fonctions caractéristiques.
3) Connaı̂tre par coeur la fonction caractéristique de la Gaussienne et connaı̂tre une méthode pour
la retrouver. Savoir aussi comment calculer les fonctions caractéristiques des lois usuelles.
4) Savoir que la fonction caractéristique caractérise complètement la loi d’une v.a. (injectivité de
la transformée de Fourier) .
5) Etre au courant de la formule d’inversion de Levy. Aller y jeter un oeil, ou même les deux ([?],
pp. 175-177).
6) Savoir que si X et Y sont indépendantes alors la fonction caractéristique de (X, Y ) s’écrit comme
le produit direct des fonctions caractéristiques de X et Y et réciproquement.
7) Connaı̂tre le théorème de Lévy.
8) Savoir que si X possède un moment d’ordre n alors la fonction caractéristique de X est n-fois
dérivable et le théorème de dérivation sous le signe somme s’applique. Etre au courant aussi que la
réciproque est fausse : On peut avoir une fonction caractéristique dérivable en 0 sans que la variable
aléatoire X ait un moment d’ordre 1 (Voir ouvrard tome 2 par exemple).

10
3 Convolution de mesures

R La convolution de deux objets (fonctions/mesures, en discter ou en continu) en x est donné par


f (x − y)g(y)

Définition 3.1. (Convolution de deux fonctions). Soit f1 et f2 deux fonctions boréliennes intégrables
sur de Rd dans R. On pose
Z
(f1 ∗ f2 )(x) = f1 (x − y)f2 (y)dy.
Rd

Définition 3.2. (Convolution d’une mesure bornée et d’une fonction). Soit µ une mesure bornée
sur Rd et f une fonction borélienne telle que, pour tout x, la fonction y → f (y −x) soit µ-intégrable.
On pose Z
(f ∗ µ)(x) = f (x − y)µ(dy).
Rd

La convolée de deux mesures µ1 et µ2 , µ1 ∗ µ2 est la mesure image de µ1 ⊗ µ2 par l’application


somme. Cela signifie que pour toute fonction mesurable positive,
Z Z
f µ1 ∗ µ2 = f (x1 + x2 )µ1 ⊗ µ2 (dx1 dx2 ).
Rd Rd ×Rd

Plus spécifiquement, on peut définir la convolée de deux mesures sur R, µ1 et µ2 , par


Z ∞
µ1 ∗ µ2 (] − ∞, x]) = µ1 (] − ∞, x − y])µ2 (dy).
−∞

Proposition 3.1. Si X et Y sont deux variables aléatoires indépedantes de lois respectives µ et λ,


alors la loi de X + Y est la convolée de la loi de λ et µ.

Ce qui fait que la loi de la somme de n variables i.i.d. est la convolée nième de la loi commune.
Nous explorons dans le problème suivant la question de la répartition des points qui se trouvent à des
distances i.i.d. Les convolées successives jouent un rôle primordial dans l’approche fonctionnelle de
ce problème, dont les applications en modélisation et en statistiques sont multiples. Nous donnons
par ici une conséquance naturelle (le théorème de renouvellement) et une conséquence paradoxale
(le paradxe de l’autobus)

3.1 Problème : Théorie du renouvellement


Ce problème mélange différentes notions d’analyse : convolution, point fixe, uniforme continuité,
densité, espace de fonctions... Il est motivé par des questions de probabilités abordées à la fin. Il
s’inspire beaucoup de Feller tome II Introduction to probability. Parmi les applications possibles,
on donne à la fin la loi du temps d’attente du prochain bus passant à une station où les temps
d’interarrivées des bus sont i.i.d. : elle fait apparaitre un paradoxe flagrant puisque le temps moyen
d’attente n’est pas le temps moyen entre deux bus divisé par 2, mais peut même être supérieur au
temps moyen entre deux bus.

11
On considère une mesure positive λ sur les boréliens de R et on note supp λ son support :

supp λ := {x ∈ R : ∀ > 0, λ([x − , x + ]) > 0}

La convolution entre deux mesures positives λ et µ est notée λ ? µ et définie (quand elle existe) par
Z ∞
λ ? µ(] − ∞, x]) = λ(] − ∞, x − y])µ(dy).
−∞

On va s’intéresser dans ce problème aux convolées successives d’une mesure de probabilité λ à


support dans R+ :
λ(] − ∞, 0[) = 0, λ([0, ∞)) = 1
et l’on note λ?k la suite de mesure définie par

λ?0 = δ0 , λ?k+1 = λ ? λ?k

où δ0 est la masse de Dirac en 0. Plus précisement, on considère la mesure positive



X
U= λ?k
k=0

qui est la clef pour comprendre la répartition asymptotique des points disposés à intervalles
indépendants identiquement distribués.

3.2 Densité à l’infini


1) Vérifier que supp U = ∪∞ ?k
k=0 supp λ .
2) Montrer que supp U contient 0 et est stable par addition, i.e. 0 ∈ supp U et ∀a, b ∈
supp U, a + b ∈ suppU .

Le support de U est un ensemble qui tend à se densifier quand x augmente et on va déterminer


dans quel cas il devient dense à l’infini. On dit que D ⊂ [0, ∞[ est dense à l’infini ssi

∀ > 0, ∃x0 ≥ 0, ∀x ≥ x0 : D ∩ [x, x + ] 6= ∅.

On pose r = inf{b − a : a < b, a, b ∈ supp U }.


3) Montrer que si r > 0, alors supp U ⊂ rN.
4) Montrer que si r =√0 alors supp U est dense à l’infini.
5) Montrer que si {1, 2} ⊂ supp λ, alors suppU est dense à l’infini.

En conclusion, ou bien supp U est dense à l’infini, ou bien il est inclus dans un réseau. On se
place désormais dans le premier cas, c’est à dire que pour tout r > 0, supp U ( rN, et on dit que
λ n’est pas arithmétique.

12
3.3 Equation de convolution
On définit la convolution f ? µ entre une fonction f : R → R et une mesure positive µ comme
(quand elle existe) Z ∞
f ? µ(x) = f (x − y)µ(dy).
−∞
On cherche ici à résoudre l’equation

f =g+f ?λ (R)

où g est une fonction mesurable par rapport aux boréliens de R, bornée et à support compact inclus
dans R+ et λ est une mesure de probabilité à support dans R+ qui n’est pas arithmétique (voir la
question précédente). Pour cela on introduit la mesure Un définie par
n
X
Un = λ?k .
k=0

1) Montrer que pour tout h ≥ 0, il existe C ≥ 0 tel que pour tout x ≥ 0, U ([x, x + h]) ≤ C.
Ce résultat dit simplement que l’intensité du nuage de points n’explose pas quand x → ∞.
2) Montrer que fn = g ? Un converge simplement vers g ? U et est uniforment bornée en n sur
R.
3) Montrer que si ζ : R → R est bornée, uniformement continue et vérifie ζ = ζ ? λ et ∀x ∈ R :
ζ(x) ≤ ζ(0), alors ∀x ∈ R : ζ(x) = ζ(0).
4) Montrer que l’équation (R) admet une unique solution bornée sur tout compact qui est égale
à g ? U .
5) On suppose ici g continue à support dans [0, K] et on note f = g ? U la solution considérée
dans la précédente question.
a) Montrer que f est bornée et uniformement continue.
b) En supposant que g est C 1 à support dans [0, K], montrer que f est dérivable puis que lim supx→∞ f 0 (x) =
0 en considérant ζn (.) = f 0 (tn + .) avec limn→∞ f 0 (tn ) = lim supx→∞ f 0 (x).
En déduire que pour tout a ≥ 0, f (x + a) − f (x) → 0 quand x → ∞.
c) Montrer que pour tout a ≥ 0, f (x + a) − f (x) → 0 quand x → ∞.

3.4 Théoremes de renouvellement


1) On note CK (R) l’ensemble des fonctions continues sur R à support compact que l’on munit
de la norme infinie sur R. On dit qu’une suite de mesures νn converge faiblement vers ν quand pour
tout f ∈ CK (R), Z ∞ Z ∞
n→∞
f (x)νn (dx) −→ f (x)ν(dx).
−∞ −∞

Soit νn des mesures positives sur R telles que pour tout pour tout compact K, supn∈N νn (K) <
∞.
a) Montrer qu’il existe une sous suite extraite νφ(n) qui converge faiblement vers une mesure positive
ν.

13
b) Montrer que si νn converge faiblement vers la mesure de Lebesgue dx, que f est intégrable par
rapport à νn et directement Riemann intégrable sur R (voir la définition plus bas) alors,
Z ∞ Z b
n→∞
f (x)νn (dx) −→ f (x)dx.
−∞ a

2) Montrer
R ∞que si une mesure Rpositive ν est finie sur tout compact vérifie que pour tous z ∈ R et

f ∈ CK (R), −∞ f (x)ν(z +dx) = −∞ f (x)ν(dx), alors ν est proportionelle à la mesure de Lebsegue.

3) On peut maintenant démontrer le résultat fondamental de renouvellement, pour toute mesure


λ non arithmétique. Ce résultat indique que quand x → ∞, le nombre de points moyen du nuage
qui se trouve dans [x, x + h] devient proportionnel à h.
a) Montrer que si λ n’est pas arithmétique, pour toute fonction f Riemann directement intégrable
sur R+ , Z ∞ Z ∞
x→∞
f (x − y)U (dy) −→ m−1 f (y)dy
0 0
x→∞
En particulier, pour tout h > 0, U ([x, x + h]) −→ h/m.
b) Montrer que ce dernier résultat est faux si λ est arithmétique.

3.5 Interprétation probabiliste


On considère maintenant un espace de probabilité (Ω, P).
1) Pour tous λ, µ mesures de probabilité, vérifier que λ ? µ = µ ? λ puis que λ ? µ est la loi de
la somme de deux variables aléatoires indépendantes de loi respectives λ et µ.

R ∞ Dorénavant, λ est une mesure dont le support est inclus dans [0, ∞[ et de moyenne finie :
0 xλ(dx) < ∞.
On considère (Xi : i ≥ 1) des v.a. sur (Ω, P) indépendantes identiquement distribuées de loi
commune λ. On s’intéresse à l’ensemble aléatoire discret
k
X
E(ω) := { Xi (ω) : k ≥ 0}.
i=1

C’est à dire que à chaque ω on associe un ensemble E(ω) tel que la distance entre le ième et le
i + 1ème point est égale à Xi .

On note
Z ∞ k
X
m= xλ(dx) = E(X1 ), Nx = sup{k : Xi ≤ x}
0 i=1
On commence par un résultat simple qui dit que le nombre de points du nuage dans l’intervalle
[0, x] croit linéairement en x avec une vitesse inverse à m.
2) Montrer que Nx /x → 1/m p.s. quand x → ∞.

L’étude plus fine de ce nuage de points repose sur son intensité donnée par la mesure U définie
au début. En effet λk donne la loi de l’abscisse du kème points de E, U ([a, b]) donne le nombre
moyen de points de E entre a entre b.

14
3) Montrer que pour tout 0 ≤ a ≤ b, U ([a, b]) = E(#{z(ω) ∈ E ∩ [a, b]}).

Le résultat 3.3.a) indique donc que si la loi de X n’est pas arithmétique, alors le nombre moyen
de points de E entre x et x + t converge vers t/m. Ce qui est très naturel mais tout de même faut
si la loi de X est arithmétique et aboutit au paradoxe suivant.

3.6 Application au paradoxe de l’autobus


On suppose toujours que la loi de X n’est pas arithmétique et on considère maintenant que les
points de E sont les instants de passage d’un bus à une station. Ceci signifie que les temps suc-
cessifs entre deux bus sont indépendants et identiquement distribués comme la variable aléatoire X.

Lorsqu’un passager arrive à l’instant t ≥ 0, le bus suivant arrive lui à l’instant

Tt = inf{x ≥ t : x ∈ E}

et il attend donc un temps


At = Tt − t.
1) Montrer que pour tout x ≥ 0,
Z x
t→∞ −1
P(At ≤ x) −→ m P(X ≥ y)dy.
0

2) Montrer que si E(X 2 ) < ∞, alors

t→∞ E(X 2 )
E(At ) −→
2E(X)

Définition d’une fonction directement Riemann intégrable sur I C’est une notion plus
forte que Riemann intégrable, même si elles coincident sur un segment. Pour un recouvrement I
par des intervalles disjoints
I = ti∈N In
on définit les petites et grandes sommes de Darboux par
X X
d(f, (Ii : i ∈ N)) = |Ii | inf f (x), D(f, (Ii : i ∈ N)) = |Ii | sup f (x).
x∈Ii x∈Ii
i∈N i∈N
R
On dit alors que f est directement Riemann intégrable sur I d’intégrale I f (x)dx quand pour toute
suite de recouvrement ((Iin : i ∈ N)n ∈ N) dont le pas tend vers zéro :
n→∞
sup |Iin | −→ 0
i∈N

les sommes de Darboux convergent vers la même valeur, i.e.


n→∞
D(f, (Iin : i ∈ N)) − d(f, (Iin : i ∈ N)) −→ 0

et on note alors
Z
f (x)dx = lim D(f, (Iin : i ∈ N)) = lim d(f, (Iin : i ∈ N)).
I n→∞ n→∞

15
Par les méthodes usuelles, on vérifie que cette définition est bien indépendante de la suite de
recouvrement.

INDICATIONS.
1.2) Montrer d’abord que supp µ1 + supp µ2 ⊂ supp µ1 ? µ2 .
1.3) Poser h0 = b − a ∈ supp U où a < b et r ≤ h0 < 2r. Faire un dessin en remarquant que les
points de la forme na + k(b − a) ∈ supp U pour 0 ≤ k ≤ n. Montrer que h0 = r et supp U ⊂ h0 N.
1.4) Faire un dessin. Soit  > 0, il existe a, b ∈ supp U tel que a < b ≤ a + . Considérer alors n ∈ N
tel que (n + 1)a ≤ nb.
2.1) Considérer Un ([0, x]) − λ ? Un ([0, x]).
2.3) En utilisant ζ = ζ ? λk , montrer que ζ(−x) = ζ(0) pour x ∈ supp U puis ζ(−x) → ζ(0) quand
x → ∞.
3.1.a) Utiliser qu’il existe une suite de fonctions dense dans CK (R) (séparabilité). Faire alors une
extraction diagonale et utliser le théorème de Riesz.
3.1.b) Encadrer une fonction Riemann intégrable sur un segment par ses sommes de Darboux.
3.2) Construire une suite de fonctions qui converge en croissant vers la fonction indicatrice d’un
segment. Rx
4.1) Utiliser Fubini avec λ(] − ∞, x]) = −∞ λ(y).
4.2) Utiliser la loi des grands nombres.

CORRECTION.

1.3) On pose h0 = b − a avec a < b ∈ supp U et et r ≤ h0 < 2r. . Introduire ensuite n ≥ 0 tel
que (n + 1)a ≤ nb. Alors (n + 1)a ∈ [na, nb] et il existe 0 ≤ k ≤ n tel que |(n + 1)a − (na + kh0 )| < r.
Or (n + 1)a, (na + kh0 ) ∈ supp U par additivité de supp U . Donc (n + 1)a = na + kh0 . Ceci implique
a = kh0 et b = (k + 1)h0 . On en déduit de même que pour tout z ∈ supp U , il existe n ∈ N tel
que |z − nh0 | = |z + a − (a + nh0 )| < r et donc z = nh0 puisque z + a, (a + nh0 ) ∈ supp U . D’où
supp U ⊂ h0 N.

2.1) Pour tout n ∈ N et x ≥ 0,


Z x
Un ([0, x]) − λ ? Un ([0, x]) = λ([x − y, ∞[)Un (dy) = 1 − λ?n+1 ([x, ∞[)
0

En posant τ > 0 tel que λ([τ, ∞[) > 0, cette identité entraine que pour tous n ∈ N et x ≥ 0,
λ([τ, ∞[)Un ([x − τ, x]) ≤ 1. En faisant tendre n → ∞, on a pour tout x ≥ 0 :

U ([x − τ, x]) ≤ 1/λ([τ, ∞[).


n(h)
Le résultat est alors en obtenu en écrivant [x, x + h] ⊂ ∪i=0 [x + iτ, x + (i + 1)τ ] avec n(h) = inf{n ∈
N : (n + 1)τ ≥ h}. R∞
2.3) Pour tout k ∈ N, ζ = ζ ? λk et donc 0 [ζ(0) − ζ(−x)]λ?k (dx) = 0. En utilisant la continuité
de ζ et le fait que pour tout x ≥ 0, ζ(−x) ≤ ζ(0), on obtient que ζ(−x) = ζ(0) pour tout x ∈ suppλ?k
et donc pour tout x ∈ supp U .
Comme supp U est dense à l’infini et ζ est uniformement continue, ζ(−x) → ζ(0) quand x → ∞.

16
Fixons alors x ≥ 0 et notons M un majorant de |ζ|. Pour tout A ≥ 0,
Z ∞
|ζ(x) − ζ(0)| = |ζ(x − y) − ζ(−y)|λ?k (dy)
0
≤ 2M λk ([0, A]) + sup{|ζ(x − y) − ζ(−y)| : y ≥ A}.

Pour tout  > 0, on peut choisir A ≥ 0 tel que sup{|ζ(x − y) − ζ(−y)| : y ≥ A} ≤ . Grace à 2.1),
on peut ensuite trouver k tel que λk ([0, A]) ≤ . Ceci implique que ζ(x) = ζ(0).

2.4) On pose f = g ? U . Grâce à 2.2), fn → f simplement et par convergence dominée,


fn ? λ → f ? λ simplement. En utilisant fn+1 = g + fn ? λ, on obtient que f ? λ est solution
de (R).
Pour l’unicité, on remarque que si f = f ? λ, alors pour tout k ≥ 1, f = f ? λ?k . On conclut grace
à |f (x)| ≤ sup[0,x] |f |.λ?k ([0, x]) puisque le deuxième terme tend vers 0 quand k → ∞ par 2.1).

2.5.a) En remarquant que |f (x)| = |g ? U (x)| ≤ U ([x − K, x]) sup |g|, on obtient que f est bornée
sur R grace à 2.1). Comme pour tout a ≥ 0, f (a + .) − f (.) = [g(a + .) − g(.)] ? U , pour tout x ∈ R,

|g(x + a) − g(x)| ≤ U ([x − K, x + a]) sup |g(x + a − y) − g(x − y)|


y∈R

et le membre de droite tend vers 0 uniformement en x quand a → 0 en utilisant 2.1) et le théorème


de Heine qui assure l’uniforme continuité de g.

2.5.b) Grace à 2.1), on peut appliquer le théorème de dérivation sous le signe inétgrale et
f 0 = g 0 ? U = g 0 + f 0 ? λ. Comme g 0 est continue à support compact, la question précédente assure
que f 0 est bornée et uniformement continue.
On note L = lim supx→∞ f 0 (x) et on introduit une suite tn → ∞ tel que limn→∞ f 0 (tn ) = L.
Considérons la suite de fonctions sur R : ζn (.) = f 0 (tn + .). (ζn : n ∈ N) est une famille bornée
de fonctions en norme infinie car f 0 bornée. De plus c’est une famille equicontinue par uniforme
continuité de f 0 . Donc, par le théorème d’Ascoli Arzela, on peut extraire une sous suite qui converge
uniforment sur un compact donné. Par extraction diagonale, on peut extraire une suite qui converge
uniformement vers ζ sur tout compact de R.
Or ζn = g(tn + .) + ζn ? λ implique que ζ = ζ ? λ. De plus, pour tout x ∈ R, ζ(x) ≤ L = ζ(0) et
on peut appliquer 2.4). On obtient que pour tout x ∈ R, ζ(x) = L et donc f 0 (tn + x) → L quand
n → ∞. Ra
Alors pour tout a ≥ 0, f (tn + a) − f (tn ) = 0 f 0 (tn + x)dx → aL quand n → ∞ par convergence
dominée ou convergence uniforme sur un compact. Mais f bornée donc L = 0.
R a Par symétrie, on obtient que limx→∞ f 0 (x) = 0 et de même pour tout a ≥ 0, f (x + a) − f (x) =
0
0 f (x + y)dy → 0 par convergence dominée.

2.5.c) On considère une suite gn de fonctions C 1 à support dans [0, K + 1] qui converge uni-
formement vers g. Elle peut etre obtenue par exemple facilement à partir de g grace à un noyau
régularisant.
Alors fn = gn ? U converge uniformément vers f = g ? U en utilisant 2.1) et

|gn ? U (x) − g ? U (x)| ≤ U ([x − K − 1, x]) k gn − g k∞ .

17
Le résultat se dérive alors directement de la question précédente.

3.1.a) On construit d’abord une suite de fonctions continues denses dans les fonctions continues
à support dans [−N, N ] où N ∈ N. Pour cela, on peut utiliser la densité de la suite formée par
les polynomes à coefficients rationnels dans les fonctions continues pour la norme uniforme sur
[−N, N ]. On obtient alors une suite dense (fk : k ∈ N) dans CK (R) en faisant une extraction
diagonale à partir de ces suites pour N ∈ N.
OrR ∞par hypothèse, pour tout segment I, supn∈N νn (I) < ∞. Donc pour tout k ∈ N, la suite
( −∞ fk (x)νn (dx) : n ∈ N) est bornée. Elle admet donc une sous suite convergente et par extraction
diagonale, il existe une sous suite νen telle que
Z ∞
n→∞
∀k ∈ N, νn (dx) −→ αk .
fk (x)e
−∞

On définit ainsi une application φ de (fk : k ∈ N) dans R. Or cette application est uniformement
continue puisque pour tous k, k 0 ∈ N,
Z ∞ Z ∞
| ν (dx) −
fk (x)e ν (dx)| ≤k fk − fk0 k∞ . sup νen (I)
fk0 (x)e
−∞ −∞ n∈N

où I est un intervalle contenant le support de fk et de fk0 . De plus (fk : k ∈ N) est dense dans
CK (R) qui est complet donc φ se prolonge en une application uniformement continue de CK (R)
dans R.
Cette application est positive et le théorème
R ∞ de Riesz implique qu’il existe une mesure positive ν
telle que pour tout f ∈ CK (R), φ(f ) = −∞ f (x)ν(dx).
On conclut en montrant que pour tout f ∈ CK (R),
Z ∞ Z ∞
| f (x)νn (dx) − f (x)νn (dx)|
−∞ −∞
Z ∞ Z ∞
≤ sup νn (suppf ∪ suppfk ) k f − fk k∞ +| νn (dx) −
fk (x)e fk (x)ν(dx)|.
n∈N −∞ −∞

Le terme de gauche tend vers zéro quand n → ∞ en utilisant une sous suite de fk qui converge
uniformement vers f et qui est à support dans un segment [−N, N ] qui contient le support de f .
Ceci achève la preuve.

3.1.b) Commencons par montrer que la convergence a lieu pour f = 11([a, b]) la foncton indica-
trice du segment [a, b]. Pour cela, encadrons f par deux fonctions continues fk1 , fk2 dans [0, 1] qui
valent 0 sur ] − ∞, a] ∪ [b, ∞[ et 1 sur [a + 1/n, b − 1/n]. Alors
Z ∞ Z ∞
lim sup f (x)νn (dx) − f (x)νn (dx)
n→∞ −∞ −∞
Z ∞ Z ∞
2
≤ lim sup fk (x)νn (dx) − fk1 (x)ν(dx)
n→∞ −∞ −∞
Z ∞ Z ∞
≤ fk2 (x)ν(dx) − fk1 (x)ν(dx)
−∞ −∞
≤ ν(]a, a + 1/k[∪]b − 1/k, b[).

18
qui tend vers 0 quand k → ∞.
On obtient alors que la convergence a lieu pour les fonctions de la forme f = ki=1 λk 11([ai , bi ]) puis
P
pour les fonctions f directement Riemann intégrable sur R à nouveau par encadrement puisque
Rque

les petites et grandes sommes de Darboux dn (f ), Dn (f ) convergent vers la même valeur :
−∞ f (x)dx.

3.2)Pour tout a, b ∈ R, on construit fn une suite de fonctions à support dans [a, b] tel que pour
tout x ∈]a, b[, fn (x) croit vers 1. Ceci se fair par exemple en posant fn la fonction affine par mor-
ceaux
R ∞ qui vaut 0R sur ] − ∞, a] ∪ [b, ∞[ et 1 sur [a + 1/n, b − 1/n]. Alors en faisant tendre n → ∞ dans

−∞ fn ν(dx) = −∞ fn ν(z + dx), la convergence monotone implique que ν(]a, b[) = ν(]z + a, z + b[),
puis ν([a, b[) = ν([z + a, z + b[).
On peut maintenant prouver que ν est proportionelle à la mesure de Lebesgue. Posons C =
ν([0, 1[). Pour tout k, n ∈ N, ν([k/n, (k + 1)/n[) = ν([0, 1/n[) et par sommation on obtient
ν([k/n, (k + 1)/n[) = C/n. Enfin pour tout a < b, en écrivant [a, b[ comme limite croissante
d’ensemble de la forme ∪kk=k 2
1
[k/n, (k + 1)/n[, on en déduit ν([a, b[) = C(b − a).

3.3) Par 2.1), pour tout intervalle borné I, U (I + t) est borné pour t ∈ R. On sait que U (t + dx)
admet une valeur d’adhérence quand t → ∞ d’après 3.1.a). Pour obtenir la convergence faible de
U (t + dx) quand t → ∞, il suffit de prouver que l’unique valeur d’adhérence possible de cette suite
est dx/m.
Soit donc une suite tk → ∞ telle que U (tk + dx) converge faiblement vers ν(dx).
Pour tout g à support compact, pour tout a, k ≥ 0
Z ∞ Z ∞
k→∞
f (tk + a) = g(−a)U (dx + tk + a) −→ g(−y)ν(a + dx).
−∞ −∞
R∞
D’après 2.5.c), f (tk + a) − f (tk ) → 0 quand k → ∞ et on obtient −∞ g(−y)ν(a + dx) =
R∞
−∞ g(−y)ν(dx). D’après 3.3), il existe donc c > 0 tel que ν(dx) = cdx.
Il reste à prouver que c = 1/m. On considère pour cela g(x) = λ([x, ∞[) pour x ≥ 0 et g(x) = 0
pour x < 0. On constate que f (x) = g ? U (x) = 1 pour x ≥ 0. De plus on peut appliquer 3.1.b)
puisque g est monotone
R ∞ d’intégrale finie sur R et donc directement intégrable sur R. On obtient
que f (tk + x) → c −∞ g(−y)dy = cm quand x → ∞.
Pn
4.2) En notant Sn = k=1 Xk , on a SNx ≤ x < SNx +1 . Or par la loi des grands nombres,
Sn /n → m quand n → ∞ et Nx → ∞ quand x → ∞. Donc SNx /Nx → m et SNx +1 /Nx → m quand
x → ∞ p.s. Le précédent encadrement implique que Nx /x converge p.s. vers 1/m.
Pn
5.1) On note Tn := i=1 Xi le temps de passage du nième bus à la station. Alors

X ∞
X
P(At ≥ x) = P(Tk < t, Tk+1 ≥ t + x) = P(Tk < t, Xk+1 ≥ t + x − Tk )
k=0 k=0
∞ Z
X t Z t
= P(Xk ∈ dy)P(X ≥ t + x − y) = P(X ≥ t + x − y)U (dy)
k=0 0 0
Z t
→ m−1 P(X ≥ t + x − y)dy.
0

19
en utilisant 3.3.a). En intégrant cette limite, on obtient la convergence de l’espérance de At quand
t → ∞.

20

Vous aimerez peut-être aussi