Processus de Galton-Watson
Référence : A peu près : Benaïm El-Karoui : Promenade aléatoire [BEN] p. 153 et Cottrel etc. Exercices de proba-
bilités [COT] p. 72
Lecons : 206, 223, 226, 229, 241, 243, 253, 260, 261, 264
Problème
Cadre : De nombreux phénomènes d’évolution de population peuvent être modélisés en première approximation par un
processus de branchement (réactions nucléaires en chaine, étude des gènes, survivance des noms de famille...).
Modélisation mathématique :
Soit X une variable aléatoire intégrable à valeurs dans N.
X∞
On note, pour k ∈ N, pk = P(X = k) et m = E[X] = kpk < ∞.
k=0
Soit (Xi,j )i,j∈N une famille de va iid, suivant la loi PX .
On définit la suite (Zn )n∈N de la façon suivante :
Z0 = 1
Zn
X
∀n ∈ N, Zn+1 =
Xi,n
i=1
On définit
πn := P(Zn = 0) ; Pext := P(∃n ∈ N, Zn = 0)
Lien avec les individus
Des particules sont capables de générer des particules de la même famille.
Chaque particule a la probabilité pk d’engendrer k particules indépendantes (cette probabilité est constante au cours des
générations).
Une particule originale représente la génération 0. Les descendants de la n-ième génération forment la (n + 1)-ième géné-
ration.
Zn est le nombre d’individus à la génération n.
Chaque individu i de la n-ième génération a un nombre Xi,n de descendants (1 6 i 6 Zn ) (logique donc que les Xi,n
soient iid).
πn est la probabilité d’extinction à la génération n.
Pext est la probabilité d’extinction de la population.
Ce développement étudie la suite (Zn ), en particulier s’il existe un n tel que Zn = 0, la population s’éteint.
Hypothèses
Si p0 = 0, alors on a ∀n ∈ N∗ , Zn > 1 ps et Pext = 0 (par exemple si X = 1 p.s. alors p1 = 1 et p0 =0).
.
Si p0 = 1, alors on a ∀n ∈ N∗ , Zn = 0 ps et Pext = 1.
On suppose donc désormais p0 ∈]0, 1[.
1 Fonction génératrice de X
Pour 0 6 s 6 1, on définit la fonction génératrice de X par
∞
X
G(s) = E[sX ] = pk sk 6 1
k=0
Comme somme de probabilités, G(1) = 1 .
Merci S. Rostam, P. Derennes et F. Lemonnier p.1 6 juin 2015
Proposition 1
1. G est bien définie sur [0, 1] et y est de classe C 1 .
2. (a) G est strictement croissante sur ]0, 1[.
(b) G est convexe sur ]0, 1[.
(c) G est strictement convexe sur ]0, 1[ ⇔ p0 + p1 < 1.
Preuve :
X X
1. ∀k ∈ N, s 7→ pk sk est de classe C 1 sur [0, 1], la série pk 1k converge (vers 1), et la série de fonctions kpk sk−1
k>0 k>1
converge normalement (carX X est intégrable) donc uniformément sur [0, 1].
Par conséquent, la série pk sk converge uniformément vers G, de classe C 1 sur [0, 1].
k>0
X
2. [COT question 2.] La série entière pk sk ayant un rayon de convergence > 1, on a, par théorème de dérivation
k>0
terme à terme d’une série entière, :
∞
X ∞
X
∀s ∈ [0, 1[, G0 (s) = kpk sk−1 et G00 (s) = k(k − 1)pk sk−2
k=1 k=2
Comme p0 < 1, on a : ∃k0 > 0, pk0 > 0.
(a) Ainsi : ∀s ∈]0, 1[, G0 (s) > k0 pk0 sk0 −1 > 0 et G est strictement croissante sur ]0, 1[.
(b) Aussi : ∀s ∈]0, 1[, G00 (s) > k0 (k0 − 1) pk0 sk0 −2 > 0 et G est convexe sur ]0, 1[.
(c) Si p0 + p1 = 1, alors on a k0 = 1 et G est affine donc n’est pas strictement convexe sur ]0, 1[.
Si p0 + p1 < 1, alors on peut avoir k1 > 1 tq pk1 > 0 et G00 > 0 sur ]0, 1[ d’où la stricte convexité.
On a m = E[X] = G0 (1).
2 Fonction génératrice de Zn , relation de récurrence
∞
X
Pour n ∈ N, notons Gn = GZn la fonction génératrice de Zn ie Gn (s) = E[sZn ] = P (Zn = k) sk .
k=0
Comme précédemment, on peut montrer que Gn est bien définie sur [0, 1].
Déjà, Gn (0) = P(Zn = 0) donc πn = Gn (0)
On obtient également G0n (1) = E[Zn ] .
Lemme 1
Pour n ∈ N∗ , pour i ∈ N, la variable Zn est indépendante de Xi,n .
Preuve :
Soit n ∈ N∗ ; Zn ne dépend que de Zn−1 et de la famille (Xi,n−1 )i∈N .
Ainsi, par une récurrence immédiate, il vient : Zn ne dépend que de la famille (Xi,j )i>0,j<n .
Et, par indépendance des variables Xi,j , on obtient que ∀i ∈ N, Zn ⊥⊥ Xi,n .
Proposition 2
Pour n ∈ N∗ , on a Gn = G
| ◦ ·{z
· · ◦ G} (sur [0, 1]).
n fois
Merci S. Rostam, P. Derennes et F. Lemonnier p.2 6 juin 2015
Preuve :
(inspiré de [COT] question 1 1 )
On a :
∞
X
Gn+1 (s) = P(Zn+1 = k)sk
k=0
On procède par récurrence.
Initialisation : G1 (s) = E[sZ1 ] = E[sX1,0 ] = E[sX ] = G(s)
Récurrence : supposons Gn = G ◦ · · · ◦ G.
PZ
n
Zn+1 Xi,n
Gn+1 (s) = E s = E s i=1
"Z #
Yn
Xi,n
=E s
i=1
"+∞ k !#
X Y
=E sXi,n 1Zn =k
k=0 i=1
+∞
" k
#
X Y
Xi,n
= E s 1Zn =k (tout s’inverse comme on veut -Fubini Tonelli- car c’est > 0)
k=0 i=1
+∞
" k
#
X Y
Xi,n
= E s E [1Zn =k ] (car Zn ⊥⊥ Xi,n )
k=0 i=1
k
+∞ Y
X
E sXi,n P(Zn = k) (car les Xi,n ⊥⊥)
=
k=0 i=1
+∞
X k
= E sX P(Zn = k) (car les Xi,n ont même loi)
k=0
+∞
X
= P(Zn = k)G(s)k = Gn (G(s))
k=0
On conclut par hypothèse de récurrence.
Ceci nous donne, par récurrence immédiate, πn+1 = G(πn ) .
3 Étude de la probabilité d’extinction
3.1 Réécriture et convergence
On remarque que si Zn = 0 alors Zn+1 = 0, autrement dit la suite d’évènements ({Zn = 0})n∈N est croissante donc πn
aussi. Cette suite étant majorée par 1, elle converge en croissant vers une limite Pext ∈]0, 1] (la stricte positivité de Pext
résulte de Pext > π1 = p0 > 0, cela signifie que l’extinction est un évènement possible). L’extinction ne se produit pas
avec probabilité 1 à la première génération (p0 < 1).
En obtenant des renseignements sur (πn ), on obtiendra donc des renseignements sur la probabilité d’extinction Pext , le
but étant de savoir si elle est égale à 1 ou non.
Proposition 3
La probabilité d’extinction Pext est le plus petit point fixe de G.
Preuve :
— Comme, πn+1 = G(πn ), par continuité de G sur [0, 1], Pext = G(Pext ).
1. Salim se complique ici.
On peut également l’écrire avec les probas au lieu des espérances mais c’est trop moche.
Merci S. Rostam, P. Derennes et F. Lemonnier p.3 6 juin 2015
— Soit u > 0 un autre point fixe de G.
Montrons par récurrence que πn < u.
• Par croissance de G, π1 = p0 = G(0) 6 G(u) = u.
• si πn < u, πn+1 = G(πn ) 6 G(u) = u.
La récurrence est vérifiée.
Par passage à la limite on a nécessairement que Pext est le plus petit point fixe de G sur ]0, 1].
3.2 La population va-t-elle presque sûrement s’éteindre ?
Théorème 1
Si m 6 1, alors Pext = 1.
Si m > 1, alors Pext est l’unique point fixe de G sur ]0, 1[.
Preuve :
Puisque G(1) = 1, le graphe de G coupe la droite y = x sur l’intervalle [0, 1] au moins au point (1, 1). On rappelle
qu’on a deux cas :
• Si p0 + p1 = 1, le graphe de G est une droite et ce point d’intersection est le seul puisque G(0) = p0 6= 0.
• Sinon, G est strictement convexe (Proposition ??) et il existe au plus 2 un autre point d’intersection sur ]0, 1[.
∞
X
0
Rappelons : G (1) = npn = m, G0 (0) = p1 .
n=1
1 × 1 × 1 ×
p0 CG y=x
y=x
p0 CG y=x
p0 pente m > 1 pente m < 1
CG
0 Pext 1 0 1 0 1
Figure 1 : Cas m > 1 Figure 2 : Cas m < 1 Figure 3 : Cas m = 1 avec p0 + p1 < 1
Supposons m > 1.
Alors G0 − 1 est une fonction croissante de
p1 − 1 < 0 (car p1 = 1 ⇒ m = 1 ou bien x 0 Pext α 1
plus simplement car p0 > 0) à m − 1 > 0, donc
elle s’annule en un point α ∈]0, 1[. G0 (x) − 1 p1 − 1 − 0 + m−1
La fonction G−Id est alors décroissante sur
[0, α] puis croissante sur [α, 1]. Comme G(0) − p0 0
0 = p0 > 0 et G(1) − 1 = 0, il existe un point
dans l’intervalle ]0, α] où G−Id s’annule. G(x) − x 0
Pext est donc l’unique point fixe de G sur l’in-
tervalle ]0, 1[ (car G en a au plus 2).
2. Par l’absurde, soit y1 et y2 (y1 < y2 ) deux autres points fixes de G (différents de 1). Posons f : x 7→ G(x) − x. Alors f (y1 ) = f (y2 ) =
f (1) = 0 Donc (Rolle) ∃c1 ∈]y1 , y2 [, c2 ∈]y2 , 1[, tels que f 0 (c1 ) = f 0 (c2 ) = 0. Donc (Rolle) ∃c3 ∈]c1 , c2 [ tel que f 00 (c3 ) = 0 (donc c3 < 1. Donc
G00 (c3 ) = 0. Absurde car G strictement convexe.
Merci S. Rostam, P. Derennes et F. Lemonnier p.4 6 juin 2015
Supposons m 6 1.
Alors G0 − 1 est une fonction croissante sur [0, 1], négative ou nulle
en 1 ; donc négative sur [0, 1].
Donc G−Id est décroissante sur [0, 1], et s’annule en 1. Comme cette
fonction admet au plus 2 annulations, elle ne s’annule qu’en 1 (car x 0 1
sinon elle s’annulerait sur un intervalle non-réduit à un singleton).
Par conséquent, Pext = 1.
Ou bien : [COT] G0 (x) − 1 p1 − 1 − m−1
Pour s < 1 on a G0 (s) < 1 et
p0
Z 1
G0 (x)dx = 1 − G(s) < 1 − s. G(x) − x
s
0
c’est à dire G(s) > s : le graphe de G est entièrement situé au-dessus
de la diagonale sur [0, 1[ et l’équation x = G(x) n’a que 1 comme
racine de sorte que Pext = 1.
Petit truc en plus :
Supposons que l’équation G(x) = x admette une solution 0 < p < 1. On a alors p = Pext par la proposition précédente. De plus, puisque
G(p) − p = 0 et G(1) − 1 = 0, le théorème de Rolle appliqué à x 7→ G(x) − x montre qu’il existe z ∈]p, 1[ tel que G0 (z) = 1. Comme G est
strictement convexe on a nécessairement m = G0 (1) > 1.
4 Bonus : Espérance de Zn
On donne ici une première idée de l’évolution de la taille de la population, i.e. de la suite Zn .
Proposition 4
On a E[Zn ] = mn .
Logique avec le théorème ?? lorsque m 6 1 et Pext = 1.
Preuve :
On va raisonner par récurrence.
• Z0 = 1 donc E[Z0 ] = 1 = m0 .
• Pour n ∈ N, supposons que E[Zn ] = mn .
Méthode 1 : Méthode 2 :
E [Zn+1 ]
On peut dériver Gn (comme pour G), et on a, pour s ∈ [0, 1], "Z
X n
# " "Z
X n
## " "∞
X
##
=E Xi,n = E E Xi,n Zn = E E 1i6Zn Xi,n Zn
i=1 i=1 i=1
G0n+1 (s) = G0 (s)(G0n ◦ G(s)) " ∞
#
X
=E 1i6Zn E [Xi,n |Zn ] (FT car > 0 ps ⊕ 1i6Zn Zn -mesurable)
i=1
Donc en 1 : "Z #
Xn
=E E [Xi,n ] (Xi,n ⊥⊥ Zn )
G0n+1 (1) = E[X](G0n (G(1)) = mG0n (1) = mn+1 i=1
"Z #
Xn
=E m = mE [Zn ] = mn+1
i=1
Ce qui conclut la récurrence.
Merci S. Rostam, P. Derennes et F. Lemonnier p.5 6 juin 2015
Notes :
X A l’oral, on n’explique pas du tout l’histoire : juste brut de maths (ce sera forcément une question du jury). On
va vite sur le 1 (6’), on ne fait pas le lemme du 2 (9’27), on fait le 3.2 géométriquement (13’51). Temps donné en allant
hyper vite.
X On parle également de processus de branchement.
X En fait, la suite (Zn ) est une chaîne de Markov issue de 1, dont l’espace d’états est dénombrable. L’état 0 est absorbant.
La chaîne est transciente. La question est ici de savoir si elle “sort ” de N par 0 ou par l’infini.
X À l’origine, ce modèle a été introduit par Galton en 1873 en vue d’étudier la statistique des patronymes dans l’An-
gleterre victorienne.
♣ Francis Galton (1822 - 1911) est un homme de science britannique. Il fut anthropologue, explorateur, géographe,
inventeur, météorologue, proto-généticien, psychométricien et statisticien. Il est entre autres fondateur de la psychologie
différentielle ou comparée. Il a également mis en place de façon systématique la méthode d’identification des individus
par empreintes digitales. Il fut anobli en 1909 et reçut la médaille Copley, décernée par la Royal Society.
♣ Henry Watson (1827 - 1903) est un mathématicien britanique. Il a écrit de nombreux livres sur les mathématiques
appliquées à l’électricité et le magnétisme. A ne pas confondre avec George, célèbre pour ses travaux sur les fonctions
spéciales.
Merci S. Rostam, P. Derennes et F. Lemonnier p.6 6 juin 2015