Chaos et Modèles Logistiques
Chaos et Modèles Logistiques
Daniel PERRIN
1 Modélisation
1.1 Historique et sources
1
Je remercie aussi François Sauvageot (resp. Étienne Ghys) pour m’avoir indiqué la
référence à Coppel (resp. à Lyubich). Par ailleurs, le livre [Buzzi] fournit un panorama
élémentaire de ces questions.
1
1.1.1 Introduction
Le type même de problèmes qui est à l’origine de la théorie des systèmes
dynamiques est celui de l’évolution d’une population en fonction du temps.
Le mot population est à prendre ici en un sens très large. Il peut aussi bien
s’agir d’une population humaine, qu’animale, des victimes d’une épidémie,
d’un ensemble de molécules, de particules, etc. Les modèles dont je vais parler
sont des modèles2 déterministes. Cela signifie qu’ils sont régis par une loi
bien déterminée, qui doit permettre, en théorie, de décrire leur évolution à
partir d’un état initial connu. On sait depuis Poincaré que, malgré cette hy-
pothèse restrictive, le comportement de ces modèles peut être excessivement
compliqué, en particulier à cause de la sensibilité du système aux conditions
initiales. C’est la fameuse phrase prêtée au météorologiste Edward Lorenz
en 1972 : Le battement d’ailes d’un papillon au Brésil peut-il provoquer une
tornade au Texas ? qui a donné naissance à beaucoup de spéculations ha-
sardeuses sur le fameux effet papillon3 . Dans ce qui suit nous essayerons de
manière très modeste, sur l’équation très particulière un+1 = µun (1 − un ), de
montrer comment se manifeste le chaos et de discuter un point qui semble
essentiel d’un point de vue philosophique : le chaos est-il générique ?
2
[Euler] p. 152 ou ci-dessous Annexe 7.1) de vivre k années dans la région
donnée et λ = qn+1 /qn le rapport entre le nombre de naissances de l’année
n + 1 et de l’année n, supposé indépendant de n. Le nombre de naissances
qn
à l’année n − k est donc k , ce qui donne la formule ci-dessus. Euler arrête
λ
généralement la sommation à 100, considérant qu’au-delà la probabilité de
survie est négligeable5 . Avec cette formule, il est clair que le rapport entre la
population à l’année n+1 et celle à l’année n est égal au rapport des nombres
de naissances donc à λ. Ainsi, on a la formule pn+1 = λpn , qui conduit à une
suite géométrique6 .
L’idée d’un accroissement exponentiel de la population est reprise et
développée en 1798 par Thomas Robert Malthus (1766-1834). Son analyse
conduit à modéliser la population humaine comme une suite géométrique,
tandis que la capacité de production se comporterait, elle, comme une suite
arithmétique. La distorsion entre les deux, à terme, le conduit à une propo-
sition de limitation des naissances qui est depuis attachée à son nom.
1.1.3 Verhulst
Le modèle malthusien est remis en cause vers 1840 par Pierre François
Verhulst (1804-1849) qui propose un modèle dit logistique7 qui prend en
compte la limitation de la population. Le principe est simple : l’accroissement
de la population n’est proportionnel à la population que pour les petites va-
leurs de celle-ci. Lorsqu’elle croı̂t, des facteurs limitants apparaissent8 (place
5
Les chiffres de mortalité sont assez frappants. Par exemple la probabilité d’atteindre
l’âge canonique de 61 ans – le mien – n’est que de 26%.
6
On a donc un accroissement (ou une diminution) exponentiel selon la position de λ
par rapport à 1.
7
Il semble bien que c’est Verhulst qui, le premier, applique le mot logistique à l’équation
en question (voir le travail de Bernard Delmas sur Verhulst). Le sens courant de ce mot
fait référence au transport et au ravitaillement des armées, mais il me semble qu’il faut le
prendre ici en un sens plus ancien signalé dans le Littré, qui concerne la pratique des quatre
opérations usuelles de l’arithmétique, voir François Hetman Le langage de la prévision.
8
Le point de départ de mon intérêt pour la question est un exercice proposé par une
étudiante de CAPES, dans lequel une population de canards en Scandinavie suivait une
loi en 6n . Il est clair que ce type de modèle est absurde. Le seul contre-exemple que je
connaisse est celui de la population des lapins en Australie. En effet, 27 lapins furent
introduits en 1859 dans le pays. N’ayant pas de prédateurs et une place quasiment infinie,
ils se sont développés de manière exponentielle (ils étaient 22 millions 6 ans plus tard),
dévorant une bonne partie de la végétation. L’introduction de renards comme prédateurs
n’ayant pas été concluante, la seule façon d’enrayer cette invasion a été de répandre la
myxomatose, avec un résultat foudroyant. Cette méthode est évidemment à employer avec
précaution, un médecin français d’Eure-et-Loir l’ayant utilisée en 1952 pour se débarrasser
des lapins qui ravageaient son jardin a répandu l’épidémie dans toute la France. Ceux qui,
3
ou quantité de nourriture disponible, etc.) qui font qu’il y a une population
maximale M . Verhulst postule alors que l’accroissement de la population x
est proportionnel à la quantité x(M − x). Ce modèle lui permet de donner
en 1837 une prévision de la population de la France en 1930 de 40 millions,
prévision somme toute raisonnable puisque la population de la France9 , en
réalité, est de 41,5 millions en 1931.
1.1.4 Aujourd’hui
Le modèle logistique de Verhulst est encore utilisé aujourd’hui dans nombre
de questions (en démographie, biologie10 , médecine, etc.) et il est assez pro-
bant11 . On utilise d’ailleurs en statistique une régression logistique, ana-
logue à la régression linéaire pour modéliser les évolutions de populations
qui suivent des courbes “en S”. Ce modèle est important car il permet, avec
une fiabilité relativement bonne, de prévoir l’évolution future de la popula-
tion.
Nous allons voir qu’il y a deux modèles logistiques, selon qu’on fait varier
le temps de manière continue ou discrète. Le modèle à temps continu conduit
à une équation différentielle très simple, on en connaı̂t parfaitement les so-
lutions et on sait les interpréter. En revanche, le modèle discret peut mener,
pour certaines valeurs des paramètres, à des comportements beaucoup plus
compliqués, voire chaotiques. Cette étude est relativement récente et elle est
partie des applications12 . On peut citer un biologiste, Robert May (1974), un
physicien, Mitchell Feigenbaum13 (1975), etc. Les problèmes mathématiques
qu’elle pose sont absolument passionnants14 et constituent le sujet de cet
exposé.
4
1.2.1 Les principes
Notre objectif est de modéliser une population p qui dépend du temps de
manière déterministe, c’est-à-dire avec une loi parfaitement définie. Les deux
cas essentiels sont les suivants :
• Le temps est continu, t ∈ R, et on a une fonction p(t), à valeurs
réelles15 . Dans ce cas, on suppose que si on connaı̂t la population au temps
t, on la connaı̂t au temps t + dt, avec dt “infinitésimal”. Cela revient à se
p(t + dt) − p(t)
donner la dérivée16 p0 (t) = en fonction de p(t).
dt
• Le temps est discret, n ∈ N (n désigne un nombre de minutes, d’heures,
voire d’années) et on a une suite pn là encore à valeurs réelles. Dans ce cas,
on se donne l’accroissement pn+1 − pn en fonction de pn (ce qui revient à se
donner pn+1 ).
On ne s’intéresse ici qu’aux cas où la population suit un modèle dit au-
tonome au sens où elle ne dépend que d’elle-même et non du temps. On
aura donc une équation de la forme p0 = f (p) ou pn+1 = f (pn ), la fonction f
étant indépendante du temps.
Le modèle discret s’applique17 notamment aux populations dont les généra-
tions ne se chevauchent pas. C’est le cas de nombreuses populations d’in-
sectes18 des zones tempérées où les parents sont morts lorsque les chrysalides
nouvelles éclosent.
15
Ce point est discuté au paragraphe suivant.
16
Je note les choses comme les physiciens.
17
Par ailleurs, il y a deux façons naturelles de passer d’un modèle continu à un modèle
discret. L’une est la méthode de discrétisation d’Euler, bien connue, l’autre consiste à
utiliser ce qu’on appelle l’application de “premier retour” inaugurée par Poincaré, voir
[Collet-Eckmann].
18
Il y a plusieurs exemples d’espèces de cigales qui présentent des cycles de vie de 13,
voire 17 ans.
5
1.2.2 Un paradoxe ?
Attention, nous considérerons toujours que la population pn envisagée
est un nombre réel et non pas un entier. Cela peut sembler paradoxal19 , mais
ce n’est pas essentiel. Je vois plusieurs arguments en ce sens.
• Quand on parle de l’effectif d’une population nombreuse, par exemple
des bactéries, même s’il s’agit d’un nombre entier, le plus souvent cette
donnée ne résulte pas d’un comptage de toute la population, mais d’une
moyenne entre données statistiques, qui fournit, au moins, un nombre ra-
tionnel.
• Une façon un peu spécieuse de se débarrasser des fonctions à valeurs
entières est de remplacer le nombre par la masse. Je dis que c’est spécieux car
un physicien nous dira que tout est discret si on se ramène aux particules.
• Les phénomènes sont-ils aussi discrets qu’ils en ont l’air ? Exemple :
l’accroissement d’une unité de la population humaine, ça s’appelle une gros-
sesse et, si mes lointains souvenirs sont bons, ça dure 9 mois pendant lesquels
on passe, plus ou moins continûment, de 0 à 1.
• Le point principal, en fin de compte, c’est que cette extrapolation aux
réels donne des résultats plausibles : c’est l’ordre de grandeur de la population
qui compte et on peut retrouver des entiers en prenant la partie entière des
valeurs obtenues. Je signale cependant un problème mathématique sérieux
à cet égard. Il y a deux façons de retrouver des entiers si on a une suite
pn+1 = f (pn ), avec un point de départ p0 entier, mais des pn réels ensuite.
La plus triviale consiste à regarder la suite des parties entières [pn ]. Mais, il
peut sembler plus plausible de considérer la suite d’entiers qn avec q0 = p0
mais qn+1 = [f (qn )] dans laquelle on actualise la valeur à chaque pas. Il n’est
cependant pas du tout évident que cette suite soit proche de pn . Si f est
lipschitzienne de rapport k < 1, ce qui correspond au cas d’un point fixe
attractif, on montre facilement que la différence entre pn et qn reste bornée
par 1/(1− k), mais, sinon, elle peut croı̂tre indéfiniment. Le lecteur regardera
le cas d’une suite arithmético-géométrique pn+1 = apn + b, avec a > 1, pour
s’en convaincre.
6
la résolution est facile. Si on appelle p0 la population au temps 0, on trouve
p(t) = p0 ekt dans le cas continu et pn = p0 (1 + k)n dans le cas discret. Le
comportement asymptotique de p est du même ordre :
• Si k est positif, la fonction et la suite tendent vers l’infini.
• Si k est négatif, la fonction et la suite tendent vers 0.
0
Figure 1: La courbe logistique
7
entre la population pn et la population maximum µ/λ, on trouve l’équation
logistique standard : un+1 = µun (1 − un ). On note que cette équation ne
dépend plus que de µ.
Comme un doit rester compris entre 0 et 1, puisque c’est le rapport entre
la population et la population maximale, on vérifie qu’il faut que µ soit
compris entre 0 et 4, voir plus loin Figure 3.
8
Y
f 0 (aj ) = λ (ai − aj ) et la position d’équilibre aj est stable si et seulement
i6=j
si n − j est impair.
Dans le cas discret, avec la même fonction f , et la relation un+1 − un =
f (un ), ce qui compte ce sont encore les zéros de f , c’est-à-dire les points fixes
a de g(x) = x + f (x). Mais ce qui gouverne la stabilité, c’est la position par
rapport à 1 de la dérivée en a de g : si on a |g 0 (a)| < 1 le point fixe est stable
(on dit attractif) si on a |g 0 (a)| > 1 il est instable (ou répulsif). Comme on
a g 0 (a) = 1 + f 0 (a) on retrouve les conditions f 0 (a) > 0 ou < 0, mais il
apparaı̂t aussi la condition g 0 (a) > −1, donc f 0 (a) > −2.
Cette fois, avec une fonction polynomiale f et des racines a1 , . . . , an , on
a alternance de valeurs positives et négatives de f 0 (ai ), mais ces dernières
ne sont pas nécessairement attractives (pour cela il faut avoir f 0 (ai ) > −2).
Autrement dit, dans ce cas, on peut tout à fait avoir deux points fixes répulsifs
de suite. C’est cela qui provoque les phénomènes que nous allons étudier, et
notamment la périodicité21 et le chaos. y
x
1
a1 a2 a3 a4
21
Il y a un domaine où la périodicité est la norme et où l’apparition du chaos est por-
teuse de difficultés, c’est la physiologie. On consultera le livre [Glass-Mackey] pour voir
apparaı̂tre des phénomènes chaotiques, peut-être modélisables par des équations logis-
tiques, dans le fonctionnement des stimulateurs cardiaques (pacemakers), domaine dans
lequel la périodicité est éminemment souhaitable.
9
À partir de maintenant, on étudie la suite logistique introduite ci-dessus. Il
s’agit de la suite (un ), définie par récurrence par une valeur initiale u0 ∈ I et
par la formule un+1 = µun (1 − un ) avec 0 < µ ≤ 4. De manière plus savante,
on parle aussi de l’étude du système dynamique défini par la fonction f (x) =
µx(1−x), c’est-à-dire de l’étude de la suite des itérés x, f (x), f (f (x)), f n (x)
pour x ∈ I (on a noté f n = f ◦ f ◦ · · · ◦ f , n fois). L’ensemble de tous ces
transformés est l’orbite de x. Ce qu’il faut garder en tête, lorsqu’on pense
système dynamique, c’est qu’on va faire varier le x, ou le u0 , ainsi que le
paramètre µ, l’objectif étant d’étudier le comportement asymptotique d’un
x générique22 , pour un µ générique. Il y a d’ailleurs deux sens possibles à
ce mot : celui des topologues, pour lequel générique signifie “sur un ouvert
dense” et celui des ergodiciens, pour lequel il veut dire “hors d’un ensemble
de mesure nulle”. Nous reviendrons sur ce point plus loin.
Il faut comprendre aussi que les calculs explicites des itérés de f de-
viennent très vite compliqués. De plus, le fait que la dynamique soit parfois
chaotique fait que les calculs approchés sont rapidement suspects. C’est ce qui
conduit à préférer un traitement qualitatif et géométrique.
10
1
µ/4
0 1/2 τ 1
Figure 3: Le graphe de fµ
un+1 = f (un ) associée converge vers l et on a une inégalité |un −l| ≤ k n |u0 −l|
avec 0 < k < 1. Le point l sera dit super-attractif si f 0 (l) est nul. Dans ce
cas, la convergence de la suite (un ) est rapide23 .
4) Si on a |f 0 (l)| = 1 (point fixe parabolique), la convergence de la
suite est possible, mais non assurée, et si elle a lieu, elle est lente (en n−α ).
5) Si f 0 (l) est > 0, la suite est monotone à partir d’un certain rang
(convergence en escalier). Au contraire, si f 0 (l) est < 0 les suites des
termes pairs et impairs sont monotones de monotonies opposées. On parle
d’une convergence en escargot.
Démonstration. C’est essentiellement l’inégalité des accroissements finis.
11
et douteux pour µ = 1. Du côté de τ , on note déjà que f 0 (τ ) est positif
pour µ < 2, nul pour µ = 2 et négatif au-delà. Le point τ est attractif pour
1 < µ < 3, douteux pour µ = 1 ou 3, répulsif pour µ > 3. En particulier,
au-delà de 3, les deux points fixes de f sont répulsifs.
2.2 Proposition.
1) On suppose µ ≥ 2. On définit par récurrence
p une suite (vn ) de points de
2
µ − µ − 4µvn
[0, 1/2] en posant v0 = 1/µ et vn+1 = . On a f (vn+1 ) = vn ,
2µ
de sorte que si on prend u0 = vn , on a up = τ pour p > n. La suite (vn )
décroı̂t et converge vers 0.
2) Soit α ∼ 3.67857351043 la racine différente de 2 du polynôme µ4 −4µ3 +16.
On suppose µ > α. On pose w0 = 1/µ et on définit par récurrence une suite
(wn )pde points qui sont dans [1/2, µ/4] (pour n ≥ 1) en posant wn+1 =
µ + µ2 − 4µwn
. On a f (wn+1 ) = wn , de sorte que si on prend u0 = wn ,
2µ
on a up = τ pour p > n. La suite (wn ) converge en escargot vers τ .
12
2.4 Théorème. On suppose 0 < µ ≤ 3. Alors, pour toute valeur initiale
u0 ∈ I, la suite (un ) est convergente.
2.2.2 Le cas µ = 1
Pour u0 ∈ I, on montre encore que la suite converge vers 0, mais la
convergence est en 1/n.
13
2.2.3 Le cas 1 < µ < 2
Le cas 1 < µ < 2 se ramène au cas 0 < µ < 1 en vertu du lemme suivant :
2.7 Théorème. On suppose 1 < µ < 2 (donc 0 < τ < 1/2). Soit u0 ∈ I.
1) Pour u0 = 0 ou u0 = τ , la suite est constante. Pour u0 = 1 (resp.
u0 = 1/µ), elle est constante et égale à 0 (resp. τ ) à partir du rang 1.
2) On suppose u0 ∈]0, τ [ (resp. u0 ∈]τ, 1/2]). La suite (un ) est croissante
(resp. décroissante) et converge vers τ .
3) On suppose u0 ∈]1/µ, 1[ (resp. u0 ∈]1/2, 1/µ[). Alors on a u1 ∈]0, τ [ (resp.
]τ, 1/2]) et on est ramené au cas 2).
2.2.4 Le cas µ = 2
Cette fois, on a τ = 1/2 et f 0 (τ ) = 0 de sorte que τ est un point super-
attractif.
14
2.2.5 Le cas 2 < µ < 3
Le point τ est encore attractif, mais avec une dérivée négative. On a donc,
au moins au voisinage de τ , un comportement “en escargot”.
3 Le doublement de période
Pour µ > 3, les points fixes de f = fµ sont tous deux répulsifs. Dans
ce cas, cf. 2.1, une suite récurrente associée à f ne peut converger vers l’un
15
Figure 6: La convergence pour 2 < µ < 3
de ces points fixes que si elle est stationnaire. Comme f est polynomiale,
cela ne peut concerner qu’un nombre dénombrable de points de départ u0 ,
de sorte que la plupart des suites (un ) associées à f vont maintenant être
divergentes. Cependant, la manière dont s’opère cette divergence va se révéler
très diverse. Le premier phénomène qui apparaı̂t est l’existence de points
périodiques attractifs (ou de cycles attractifs) à commencer par des points
de période 2. En effet, ceux-ci sont un point de passage obligé en vertu du
théorème de Coppel que nous prouvons maintenant et qui éclaire beaucoup la
situation.
16
Le cycle sera dit super-attractif si l’on a Df n (xi ) = 0. La convergence
de la suite (un ) vers le cycle est alors une convergence rapide.
Démonstration. C’est encore l’inégalité des accroissements finis, appliquée
cette fois à f n .
Le lemme suivant donne une méthode pour construire des valeurs de µ
qui donnent des cycles super-attractifs :
3.3 Lemme. On suppose qu’on a f = fµ . Un n-cycle a1 , . . . , an relatif
à f (i.e. vérifiant ai+1 = f (ai ) avec les indices pris modulo n) est super-
attractif si et seulement s’il contient 1/2. Les valeurs de µ qui donnent des
n-cycles super-attractifs sont obtenues en résolvant l’équation polynomiale en
µ, fµn (1/2) = 1/2.
Démonstration. En effet, on a Df n (ai ) = 0 = f 0 (a1 ) · · · f 0 (an ) et le seul point
où f 0 s’annule est 1/2.
17
intervalle, sont “comme en c”, autrement dit, pour d < x < c, on a f (x) > x
et f 2 (x) < x. On choisit alors e avec d < e < c vérifiant d < e < f (e) < c.
C’est possible car on a f (d) = d < c donc encore f (e) < c pour e voisin de
d. Comme f (e) est aussi entre d et c on a f (f (e)) = f 2 (e) > f (e) > e, mais
c’est une contradiction.
On peut alors finir la preuve du théorème de Coppel. Soit x0 ∈ I quel-
conque. S’il existe n tel que xn+1 = xn , la suite est stationnaire donc conver-
gente. On peut donc supposer qu’on a xn 6= xn+1 pour tout n. Si on a, disons,
xn < xn+1 à partir d’un certain rang, la suite est croissante et majorée, donc
convergente. On peut donc supposer qu’il existe une infinité d’entiers n tels
que xn < xn+1 et une infinité tels que xn > xn+1 . Appelons (yn ) (resp. (zn ))
la sous-suite des premiers (resp. des seconds). Ces deux sous-suites ont pour
réunion la suite (xn ). Si on a yp = xn , on a xn+1 > xn et, en vertu du
lemme, xn+k > xn pour tout k > 0. En particulier, on a yp+1 > yp , de sorte
que la suite (yp ) est croissante. On montre de même que la suite (zq ) est
décroissante. Comme ces suites sont confinées dans [a, b], elles convergent
respectivement vers y et z. Comme la suite des zq est infinie, il existe une
infinité d’indices n tels que xn soit un yp mais xn+1 un zq . Appelons (wp ) la
sous-suite des yp en question. Elle converge aussi vers y et, comme f (wp ) est
une sous-suite des zq , elle converge vers z. On en déduit f (y) = z. Le même
raisonnement (avec d’autres sous-suites, bien entendu) donne f (z) = y, donc
f 2 (y) = y. Mais, comme f n’a pas de 2-cycle, on en déduit f (y) = y = z et
les deux sous-suites (yp ) et (zq ) ont même limite. Comme elles épuisent (xn ),
cette dernière suite converge vers y.
18
Itérée double
1
µ/4
3/4
1/2
f(f(x))
0 x f(x) 1
19
de x1 et x2 . Cela signifie que la suite des termes pairs u2p (resp. des termes
impairs u2p+1 ) converge par exemple vers x1 (resp. x2 ). Comme ces deux
suites sont des suites récurrentes associées à f 2 , il s’agit de voir si les points
fixes x1 , x2 de f 2 sont attractifs26 pour f 2 , donc si la dérivée de f 2 en xi est
plus petite que 1 en valeur absolue, voir 3.2 :
√
3.11 Corollaire. On suppose 3 < µ < 1 + 6 et u0 6= 0, 1, τ, 1/µ. Soit (un )
la suite récurrente associée à u0 . Alors, les suites (u2p ) et (u2p+1 ) convergent
vers les points fixes de f 2 .
Démonstration. Pour être sûr qu’il n’y a pas d’exceptions, voir le paragraphe
suivant.
26
En vertu de 3.7, ils le sont tant qu’il n’y a pas de cycles d’ordre 4.
20
3.3 Les points fixes de f 4
Lorsque le cycle d’ordre 2 cesse d’être attractif, le théorème de Coppel,
appliqué à f 2 , montre qu’il y a un cycle d’ordreOn2a tracé
pour
seconde
les courbes
et itérée doncitérée
f 2 ,quatrième d’ordre 4
pour f . À partir de maintenant, on a à résoudre des équations algébriques
de plus en plus compliquées et on va utiliser la calculatrice.
Résultat : 3,578274714203157
1 Attendu : 3,449
µ/4
3/4
4
0 x 3 f(x)f(f(x)) 1
√
3.12 Proposition. Pour µ ≤ 1 + √ 6, f 4 n’a pas de point fixe (autre que
ceux de f et f 2 ). Pour µ > 1 + 6 = µ2 , f admet un cycle d’ordre 4
unique et ce cycle est attractif tant que l’on a µ < µ3 ∼ 3, 544090. Pour
µ = ν2 ∼ 3, 49856169933, le cycle d’ordre 4 est super-attractif.
µ12 x12 − 6µ12 x11 + 3µ11 (5µ + 1)x10 − µ9 (20µ3 + 15µ2 + 1)x9
21
Il n’est pas évident de montrer les assertions de la proposition. Avec une
calculatrice ou un ordinateur, on peut calculer les racines de Qµ de manière
approchée lorsque µ est fixé. Par exemple, pour µ = 3, 45, on trouve quatre ra-
cines : 0, 852428087575, 0, 433991655785, 0, 847467675925, et 0, 445967663053
qui forment un cycle d’ordre 4 attractif27 .
On peut alors trouver, expérimentalement, les valeurs√ µ2 et µ3 . Pour
montrer que la valeur limite µ2 est exactement 1 + 6, il faut comprendre
le phénomène de bifurcation (ou de ramification) illustré par la figure 10.
Décrivons le phénomène. Pour µ < µ2 il n’y a pas de 4-cycle, en revanche, il
y en a pour µ > µ2 . Dans ce cas, appelons x1 (µ) < x2 (µ) < x3 (µ) < x4 (µ) un
tel cycle. Lorsque µ tend vers µ2 , x1 et x2 tendent vers un même point y1 et
x3 et x4 vers un même point y2 , (y1 , y2 ) étant un 2-cycle de fµ2 . Autrement
dit, pour µ = µ2 , le polynôme Qµ admet en facteur le polynôme Fµ (x) =
µ2 x2 − µ(µ + 1)x + µ + 1 qui donne les 2-cycles.
Si
√ l’on admet que les choses se passent bien ainsi, on trouve la valeur
2
1 + 6 : on divise Qµ par F√µ , le reste est égal à − µ + 2µ + 5 dont l’unique
racine positive est µ = 1 + 6. En fait, plus précisément, le polynôme Fµ est
au carré dans Qµ , avec comme quotient :
√
Pour voir qu’il n’y a pas de 4-cycle dans le cas µ = 1 +√ 6, il reste à
trouver les racines de ce polynôme28 lorsque µ est égal à 1 + 6. On vérifie
qu’il n’y en a pas.
Pour trouver un cycle super-attractif, on applique 3.3 en résolvant en
µ l’équation Qµ (1/2) = 0. On trouve la valeur de l’énoncé et une autre,
3, 960270272187 que l’on reverra.
Enfin, il reste à calculer la valeur µ3 ∼ 3, 544090. C’est le plus difficile.
Une technique est d’étudier le comportement de la suite et de repérer selon
les valeurs de µ si elle admet un 4-cycle limite (pour µ < µ3 ) ou un 8-cycle
limite (pour µ > µ3 ), mais c’est assez imprécis à cet endroit de bifurcation.
27
Il est commode (et facile) d’écrire un petit programme qui permet d’afficher les r
termes qui suivent le millième (par exemple).
28
En fait, le mieux pour faire ces calculs est de conjuguer fµ à x2 − 5/4 (voir 7.1). Le
calcul des racines du polynôme qui correspond à Qµ est plus facile dans ce cas sur la
calculatrice et on trouve qu’il n’a que deux racines qui sont les points du 2-cycle.
22
En effet, lorsque µ se rapproche de µ3 par valeurs supérieures, le 8-cycle tend
vers un 4-cycle et il faut aller très loin pour savoir si les 8 valeurs que l’on
examine sont celles d’un cycle d’ordre 8 ou si elles vont se rapprocher pour
donner un 4-cycle.
Une autre méthode consiste à repérer la dérivée en le cycle d’ordre 4 et à
voir quand elle atteint la valeur − 1.
Par exemple, avec µ = 3, 544089, en partant de la valeur x = 0, 8841
donnée par l’étude de (un ), on trouve, par approximations successives une
valeur de l’un des points du 4-cycle à 10−12 près : a = 0, 88404930742571 et,
pour cette valeur on a Df 4 (a) = −0, 999969.
23
αn le point de ce cycle, différent de 1/2, et le plus proche de 1/2, et posons
dn
dn = 21 − αn . Alors, on a lim = −α avec α ∼ 2, 502907875.
n→+∞ dn+1
4) Pour µ < µ∞ , fµ n’a pas de cycle d’ordre p si p n’est pas une puissance
de 2.
Maintenant, il est clair que la suite µn est croissante31 . En effet, soit > 0
et soit µ vérifiant µn+1 < µ < µn+1 + tel que fµ admette un 2n+1 -cycle.
Alors, par le lemme, fµ admet aussi un 2n -cycle donc on a µ ≥ µn . Comme
cela vaut pour tout on a bien µn+1 ≥ µn .
Nous verrons dans la section suivante que f4 admet des cycles de tous
ordres, ce qui montre que la suite des µn est majorée par 4, donc converge.
31
Mais un peu moins clair qu’elle l’est strictement.
24
3.15 Remarques.
1) Ce qui est extraordinaire dans le théorème de Feigenbaum, c’est qu’il
vaut pour beaucoup d’autres familles de fonctions f que la famille logistique,
voir [Collet-Eckmann-Lanford]. En ce sens, les constantes δ et α sont des
constantes universelles.
2) Si µ est dans ]µn , µn+1 [, la fonction admet des cycles d’ordre 2k pour tout
k ≤ n, mais d’aucun autre ordre en vertu du théorème de Sarkovsky 5.4.
3) En chaque µn on a une bifurcation : on passe d’un régime à un autre.
n
Précisément, pour f 2 on passe d’un point fixe attractif à un point fixe
répulsif en passant par un point “parabolique” (avec une dérivée égale à
− 1 ici). On parle d’une bifurcation du genre selle-nœud.
µn − µn−1
4) Une conséquence du résultat c’est qu’on a lim = δ et la
n→+∞ µn+1 − µn
même formule avec νn . La convergence est assez rapide. Si on calcule ν3 à
partir de ν1 et ν2 avec cette formule, on trouve 3, 5547, ce qui ne semble pas
loin de la vérité.
4 Le cas µ = 4 et le chaos
4.1 Définir le chaos ?
Dans ce paragraphe, on pose I = [a, b] avec a < b.
25
4.1.1 Les orbites denses
Il y a de nombreuses notions de chaos, différentes selon les auteurs (chaos
au sens de Devaney, de Li-Yorke, etc.). Une excellente référence sur le sujet
est le (projet de) livre de Sylvie Ruette [Ruette]. J’adopte dans ce qui suit
la définition suivante :
4.1 Définition. Soit f : I → I une fonction continue. La dynamique as-
sociée à f sera dite chaotique s’il existe u0 ∈ I tel que la suite récurrente
(un ) associée à f et u0 soit partout dense dans I.
4.2 Remarque. Si cette propriété est vraie, les u0 dont l’orbite est dense sont
eux-mêmes denses dans I. En effet, si u0 convient, tous les un de la suite
associée à u0 conviennent aussi (l’orbite de un est dense, car si l’on retire un
nombre fini de points à une partie dense dans un intervalle, elle reste dense).
Une propriété équivalente est la suivante :
4.3 Définition. Soit f : I → I une fonction continue. On dit que f est
topologiquement transitive ou simplement transitive si étant donnés
deux ouverts non vides U, V de I il existe un entier p tel que f p (U ) ∩ V 6= ∅.
26
4.1.2 Chaos, sensitivité et densité des points périodiques
Le chaos au sens précédent implique deux autres propriétés fondamen-
tales. Donnons d’abord une autre définition :
Démonstration. Voici l’idée de la preuve de 1), voir [Ruette] 2.1.16 pour des
précisions. On suppose qu’il y a un intervalle [c, d] ⊂ I, avec c < d qui ne
contient aucun point périodique. Comme la dynamique est chaotique, il existe
un x ∈]c, d[ dont l’orbite est dense, donc un entier p tel que x < f p (x) < d. De
même il existe un y avec c < f q (y) < y < x. On montre alors que, pour tout
m > 0, on a f mp (x) > x. Sinon, il y a un intervalle [x, f mp (x)] qui augmente33
quand on applique f p et, par le lemme de l’intervalle gourmand 5.2, il y a
un point périodique. Le même raisonnement montre qu’on a f nq (y) < y pour
tout n > 0. Mais alors, on a f pq (y) < y < x < f pq (x) et le lemme de
l’intervalle gourmand conclut.
Pour 2), voir par exemple [Ruette] 2.2.3.
27
• Il est indécomposable. Cela signifie qu’on ne peut pas le partager en
deux intervalles indépendants et stables. C’est, bien entendu, la transitivité
qui interdit cela.
• Il n’est pas aléatoire. En effet, il a des éléments de régularité, à savoir
les points périodiques, qui sont partout denses.
4.8 Remarque. Attention, le chaos, s’il impose la densité des points périodiques,
n’implique pas qu’il en existe de toutes les périodes. En particulier l’exemple
de Ruelle, voir 6.5.1, est chaotique sur un intervalle mais n’a pas de points
de période 3.
28
4.10 Proposition. Tout nombre x ∈ [0, 1] s’écrit de manière unique sous
la forme x = sin2 θ, avec θ ∈ [0, π/2]. On a les formules f (x) = f (sin2 θ) =
sin2 (2θ) et, plus généralement, f n (x) = f n (sin2 θ) = sin2 (2n θ).
4.2.2 La transitivité
4.13 Théorème. Il existe a ∈ I tel que l’orbite de a par f4 soit partout
dense dans I. Autrement dit, la dynamique de f4 est chaotique sur I.
29
en base 2 de α/π = 0, a1 . . . an . . ., en choisissant n tel que 2−n < /π. La
suite a1 . . . an apparaı̂t entre N + 1 et N + n dans le développement de m :
m = 0, b1 . . . bN a1 . . . an bN +n+1 . . .
de sorte que la différence |2N mπ−α−pπ| est < π2−n < . Comme la fonction
sin2 est lipschitzienne de rapport 1, on a aussi | sin2 2N mπ − sin2 α| < soit
|f N (a) − x| < .
30
4.3.1 La sensibilité
On a vu que la transitivité implique la sensibilité. Dans le cas de f4 , il est
facile de prouver celle-ci directement :
31
manière formelle38 . Cette belle théorie s’effondre car la calculatrice trouve
encore un cycle d’ordre 4 si on lui donne u0 de manière approchée :
u0 = 0, 033763885297822.
En regardant les arrondis des itérés de cette valeur, on tombe sur un cycle
d’ordre 4 (pour la calculatrice), formé des valeurs :
v0 = 0, 033763885297826, v1 = 0, 13049554138968,
v2 = 0, 45386582026838 et v3 = 0, 99148654984195.
En étudiant de près le calcul de ces itérés avec M uP AD (qui calcule exac-
tement avec ce nombre de décimales), on s’aperçoit que la calculatrice ne
trouve un cycle que parce qu’elle commet une erreur dans le calcul de f (v2 )
qui devrait donner v3 = 0, 99148654984196(232)... (le dernier chiffre de la cal-
culatrice est donc faux), valeur qui conduirait à une orbite partout dense39 .
Si l’on regarde de plus près le calcul de f (v2 ) on voit que l’erreur provient
d’une erreur d’arrondi. Il semble que la machine calcule d’abord 4v2 . Comme
elle ne garde que 14 chiffres significatifs et que 4v2 commence par 1, 81...,
elle néglige le chiffre des 10−14 , commettant une erreur de 2 × 10−14 qui, en
multipliant par 1 − v2 ∼ 0, 54 donne une erreur de plus de 10−14 . D’ailleurs,
si l’on oblige la calculatrice à faire le calcul dans l’ordre 4 × (v × (1 − v)), elle
donne un résultat correct !
• Une expérience très proche de cette dernière remarque consiste à rentrer,
sur la TI Voyage 200, les deux suites un+1 = 4un (1 − un ) et vn+1 = 4vn −
4vn2 , avec le même point de départ 0, 23 par exemple. Ce sont évidemment
les mêmes, pourtant, les arrondis sont différents et on voit ces deux suites
diverger dès le 11-ième coup et, au 48-ième coup, différer de plus de 0, 5.
Question : l’une des valeurs de f 48 (0, 23) est-elle exacte ? laquelle ? Réponse :
elles sont toutes deux fausses. Si on effectue ces deux calculs avec MuPAD
et 100 décimales, on obtient les mêmes décimales jusqu’à la 93-ième, ce qui
semble indiquer que ce résultat est fiable. Or, si on compare ce que donne la
Voyage et ce que donne MuPAD, on a, pour n = 48, sur TI :
u48 = 0, 99455195753 et v48 = 0, 3879228736
et sur MuPAD u48 = v48 = 0, 8436149560.
Avec la suite (vn ), le point de départ u0 = sin2 π
17
conduit à une suite
chaotique.
38
Ce qui pouvait être corroboré par le fait que lorsqu’on lui rentre une valeur trigo-
nométrique, elle peut lui faire subir une transformation. Par exemple si l’on rentre sin2 5π
17 ,
elle écrit cos2 7π .
34
39
D’ailleurs, si l’on part de sin2 (4π/17) ou sin2 (8π/17) on obtient des orbites denses !
32
4.4 Les points périodiques pour µ = 4
Comme pour la sensibilité, la densité des points périodiques est une
conséquence du chaos, mais il est facile de la prouver directement.
4.18 Proposition. Les points u0 ∈ [0, 1] qui sont tels que la suite (un ) soit
kπ
périodique de période ≥ 1 sont les points u0 = sin2 n , avec n ∈ N∗ et
2 ±1
0 ≤ k ≤ 2n−1 (resp. 0 ≤ k < 2n−1 ) si le signe est + (resp. si le signe est −).
La période de la suite associée à un tel point est égale à n sauf s’il existe un
k l
entier p < n et un entier l ≤ 2p−1 tel que l’on ait n = p . Si la
2 ±1 2 ±1
k
fraction n est irréductible, ce cas ne peut se produire.
2 ±1
Démonstration. Posons u0 = sin2 θ avec θ ∈ [0, π/2]. Dire que la suite admet
la période n signifie qu’on a f n (u0 ) = u0 , c’est-à-dire sin2 (2n θ) = sin2 θ.
On a ainsi, en vertu du lemme 4.17, 2n θ = ±θ + kπ. On a donc bien u0 =
kπ
sin2 n .
2 ±1
4.19 Remarque. Le cas de diminution de la période peut effectivement se
produire. Par exemple avec u0 = sin2 215π 8 −1 on a la période 4 à cause de
4.20 Proposition. Les points périodiques sont partout denses dans [0, 1]. Si
(pn ) est une suite d’entiers tendant vers + ∞, on peut même préciser que
les points admettant les pn comme périodes sont denses dans [0, 1]. C’est le
cas de la suite pn = 2n .
33
Démonstration. Soit x ∈ [0, 1] que l’on écrit x = sin2 θ0 et soit > 0. Il s’agit
de montrer que l’intervalle J =]x − , x + [ contient un point périodique.
Comme la fonction θ 7→ sin2 θ est lipschitzienne de rapport 1 sur [0, π/2], il
suffit de trouver un θ correspondant à un point périodique tel que |θ−θ0 | < .
Si on choisit n assez grand pour que 2nπ+1 soit < 2, il y a un k tel que 2nkπ+1
soit dans l’intervalle ]θ0 − , θ0 + [ et le point périodique sin2 2nkπ+1 est alors
dans J.
34
4.24 Remarque. On notera, comme conséquence du résultat précédent, la
superbe identité, avec = ±1 :
2kπ 4kπ 2j kπ 2n kπ
cos n × cos n × · · · × cos n × · · · × cos n = − n.
2 + 2 + 2 + 2 + 2
35
5.1.2 Les lemmes du gourmand et de l’ajusté
5.2 Lemme. (Lemme de l’intervalle gourmand43 ) Soit g : I → I une
fonction continue. On suppose qu’il existe un intervalle [a, b] ⊂ I vérifiant
g([a, b]) ⊃ [a, b]. Alors, g admet un point fixe dans [a, b].
Démonstration. Il existe c, d ∈ [a, b] tels que g(c) = a et g(d) = b. On a alors
g(c) − c ≤ 0 et g(d) − d ≥ 0, de sorte que g(x) − x s’annule entre c et d en
vertu du du théorème des valeurs intermédiaires, donc aussi entre a et b.
1 1
b
d
a c
36
5.1.3 Sarkovsky : l’existence d’un cycle d’ordre 2
On suppose qu’on a un 3-cycle a, b, c et, par exemple44 , qu’on a a < b < c
avec f (a) = b, f (b) = c, f (c) = a. Si on pose I0 = [a, b] et I1 = [b, c], on a
f (I0 ) ⊃ I1 et f (I1 ) ⊃ I0 ∪ I1 .
a x d f2(x) b f(x) c
Figure 13: L’intervalle [a, d] s’envoie sur [b, c]. Comme on a f ([b, c]) = [a, c] et
que [a, c] contient [a, d], cet intervalle est gourmand pour f 2 , donc contient
un point fixe pour f 2 .
44
Il y a un autre cas de figure que le lecteur traitera lui-même.
37
c
a x b f5(x) c
qu’il est différent de b. Alors, on a f n−m−1 (p) = f n−m−1 (f m (p)) = f n−1 (p).
Mais, comme on a n − m − 1 ≤ n − 2, l’image de p par f n−m−1 est dans I1
et c’est absurde.
Si on a f n−1 (p) = b, on a f n (p) = f (b) = c = p. Mais, comme n est > 3,
on a n − 2 > 1 et p est dans A1 . On devrait donc avoir a = f (p) ∈ A0 = I1
et c’est absurde.
3 5 7 9 . . . 2.3 2.5 . . . 22 .3 22 .5 . . . 2n . . . 23 22 2 1.
38
Alors, si une fonction f : I → I admet un point de période n, elle admet des
points de période p pour tous les p ≺ n dans l’ordre de Sarkovsky.
39
5.2.1 Le polynôme qui donne les points fixes
5.7 Proposition. Les points fixes de fµ3 non points fixes de fµ sont les ra-
cines du polynôme :
Q3,a (x) = x6 +x5 −(3a−1)x4 −(2a−1)x3 +(3a2 −3a+1)x2 +(a2 −2a+1)x−a3 +2a2 −a+1.
40
On cherche donc les points de C à tangente horizontale. Pour cela, il faut
éliminer x entre Q et sa dérivée partielle par rapport à a. Je l’ai fait avec
Maple, on obtient un polynôme en a :
5.10 Exemple. Pour µ = 3, 82843, le polynôme admet 6 racines dans [0, 1]. On
repère facilement que trois d’entre elles forment un 3-cycle attractif (il suffit
de calculer les termes de la suite de point de départ u0 = 0, 5 jusqu’à 1000
et on voit apparaı̂tre ce cycle à 10−7 près). Je les note a1 = 0, 159769931604,
a2 = 0, 513941845577, a3 = 0, 9563633394772.
Les autres sont b1 = 0, 160087452099, b2 = 0, 514768628867 et b3 =
0, 956272485874. Ils forment un cycle répulsif47 .
5.11 Remarques. √ √
1) On peut trouver la valeur µ3 = 1 + 8 = 1 + 2 2 d’une autre manière, si
on a l’intuition de la genèse des 3-cycles. Comme on l’a vu ci-dessus, quand
on est au-delà de la valeur limite µ3 , on a deux cycles d’ordre 3, l’un attractif,
l’autre répulsif. Ce qu’on imagine, c’est que, lorsque µ tend vers µ3 , ces deux
cycles vont se coller en un seul 3-cycle, et comme l’un est répulsif et l’autre
attractif, le 3-cycle limite sera parabolique, i.e. avec une dérivée 1.
Or, si on a un cycle x1 , x2 , x3 , et si on pose P (x) = a(x−x1 )(x−x2 )(x−x3 ),
la dérivée en un quelconque des points du cycle Df 3 (xi ) est :
(2µ)3
µ3 (1 − 2x1 )(1 − 2x2 )(1 − 2x3 ) = P (1/2).
a
47
Il y a au plus un 3-cycle attractif, cf. 5.14.
41
Si les points du 3-cycle sont tous racines doubles de P3,µ , on aura, de même
(Df 3 (xi ))2 = 26 P3,µ (1/2). Si la situation est bien telle qu’on l’envisage, µ3
sera donc racine de l’équation 26 P3,µ (1/2) = 1. Or on a :
µ6 3µ5 µ4 3µ3 µ2 µ
P3,µ (1/2) = − + − − + + +1
64 32 16 8 4 2
√
et on retrouve µ = 1 + 8.
On vérifie effectivement que, pour cette valeur de µ, le polynôme P3,µ (x)
est un carré parfait, précisément, c’est le carré de :
√ √ √ √
(25 + 22 2)x3 − (42 + 35 2)x2 + (21 + 14 2)x − (3 + 2)
comme on le voit en calculant les coefficients de ax3 + bx2 + cx + d de proche
2 3 2
en proche : a = µ3 , b = − µ (3µ+1 , c = µ(3µ+1)(µ+3) , d = µ −7µ16−5µ−5 et pour
2 8 √
que le carré de d soit µ2 + µ + 1 il faut avoir µ = 1 + 2 2.
2) Là encore, les calculs sont beaucoup plus faciles avec la version ga (x) =
x − a. On a ga0 (x) = 2x. Pour un cycle d’ordre 3, x1 , x2 , x3 , formé des racines
2
42
5.3 Les résultats fondamentaux : Jakobson, Graczyk-
Swiatek, Lyubich
Il y a beaucoup de résultats, tous très difficiles50 , qui décrivent le compor-
tement des fµ pour µ voisin de 4. J’en ai choisi trois que j’espère emblématiques.
Les deux premiers, d’une certaine façon, vont en sens inverse, l’un de l’autre :
43
5.16 Remarques.
1) Il est clair qu’on a C ∩ H = ∅ en vertu de 4.9 et Lyubich montre que leur
réunion est “presque” tout. Les résultats ci-dessus ne sont – heureusement –
pas incompatibles. Le théorème d’hyperbolicité dit que H est dense, ce qui
montre que C est d’intérieur vide. Mais on sait bien qu’il y a des ensembles de
Cantor d’intérieur vide et de mesure > 0. Le C doit donc être nécessairement
un ensemble totalement discontinu.
2) Le lecteur se demande peut-être ce qu’il y a hors de C et de H. Pas grand-
chose répond Lyubich. En fait, il se passe des choses plus compliquées avec
notamment des Cantor attractifs, voir [De Melo-Van Strien].
3) C’est ici que la réflexion philosophique sur le chaos devient intéressante
et qu’elle oppose topologues et ergodiciens : un ensemble de mesure > 0,
mais d’intérieur vide peut-il être considéré comme générique ? Je laisse le
lecteur méditer sur cette grave question. Pour ma part, j’aurais tendance
à penser comme les topologues qu’un ensemble générique doit être ouvert
et dense (pour qu’une petite modification du paramètre ne change pas la
dynamique). En ce sens, le chaos serait non générique. Mais d’autres, depuis
Kolmogorov, et notamment des physiciens, mesurent la généricité en termes
de mesures. Je me garderai de prendre une position trop catégorique sur ce
sujet.
44
5.17 Proposition-Définition. On pose Pn (µ) = fµn (1/2) − 1/2. C’est un
polynôme de degré 2n en µ et si µ est une racine de ce polynôme, 1/2 fait
partie d’un n-cycle super-attractif pour fµ .
Démonstration. Le fait que Pn soit un polynôme de degré 2n est immédiat
par récurrence. Si µ annule ce polynôme, on a fµn (1/2) = 1/2, de sorte que
1/2 fait partie d’un cycle d’ordre divisant n. Comme la dérivée de f est nulle
en 1/2, ce cycle est super-attractif (voir 3.2).
Pour ces valeurs on a bien des 5-cycles attractifs, qui ne passent pas exacte-
ment par 0, 5 à cause des erreurs d’arrondi et dont la dérivée n’est pas nulle
(mais voisine de 0). Par exemple, pour la deuxième valeur, le cycle passe par
0, 500617 avec une dérivée − 0, 22.
Pour trouver des 7-cycles attractifs, il suffit de modifier un peu la méthode
en rentrant la fonction fµ7 dans la calculatrice et en cherchant un µ tel que
f 7 (1/2) = 1/2 par une méthode de calcul approché (par exemple simplement
un balayage). Par ce procédé, j’ai obtenu ainsi 3, 9221934 < µ < 3, 9221935.
Avec la valeur de gauche, on a un 7-cycle passant presque par 1/2 (il passe
par 0, 499999853047), avec une dérivée 0, 00000048748. Il faut de la patience
54
Dans un premier temps, j’avais cru que les cycles d’ordre 2n n’étaient plus jamais
attractifs après µ∞ . La source – bien imprudente
√ – de cette idée fausse est le cas du
2-cycle, qui cesse d’être attractif pour µ > 1 + 6 et ne le redevient jamais.
45
pour déterminer le bassin d’attraction du cycle. Avec 0, 51 comme u0 , le cycle
est stabilisé au 1000-ième coup, avec u0 = 0, 52 il est stabilisé au 2000-ième.
On trouve aussi, pour µ = 3, 8008, un 8-cycle attractif dont l’un des points
est 0, 936217614607. On vérifie que l’intervalle :
est stable par f 8 et que la dérivée de f 8 sur J est à peu près égale à − 0, 392.
5.20 Proposition. Soient α, β vérifiant 3 < α < β < 4. On suppose que les
suites de mixages K(α) et K(β) ne sont pas égales. Alors, il existe µ ∈]α, β[
tel que fµ admette un cycle super-attractif.
55
On note [x] la partie entière de x.
56
On dit kneading sequence en anglais, mixage est ma proposition de traduction, mais
j’ai vu aussi la version “suite de pétrissage” dans une note CRAS de Gillot.
46
Démonstration. Dire que les suites ne sont pas égales c’est dire qu’on a, par
exemple, sn = 0 et tn = 1, ou encore fαn (1/2) < 1/2 et fβn (1/2) > 1/2, soit
Pn (α) < 0 et Pn (β) > 0. On conclut par les valeurs intermédiaires.
5.21 Corollaire. Pour tout nombre premier n ≥ 2 il existe un µ ∈]3, 4[ tel
que fµ admette un n-cycle57 super-attractif.
Démonstration. En effet, on a K(3)n = 1 et K(4)n = 0.
Ce qui précède montre que le théorème cherché est une conséquence du
résultat suivant :
5.22 Théorème. Soient µ∞ < α, β < 4 deux réels58 distincts. Alors on
a K(α) 6= K(β), ou, à défaut, il existe α0 , β 0 ∈ [α, β] qui vérifient cette
condition.
Que cette assertion soit vraie résulte de [Graczyk-Swiatek] (mais c’est
tout à fait non trivial). On peut s’en convaincre expérimentalement59 . Ainsi,
on voit que les suites de mixage K(3, 91) et K(3, 92) diffèrent pour n = 8, de
sorte qu’on doit avoir un point attractif de période 8 pour un paramètre µ
compris entre ces valeurs. Entre 3, 9157863 et 3, 9157864 les suites diffèrent au
26-ème coup. On a donc quelque part un point de période 26 super-attractif
entre les deux60 . Plus près de µ∞ , j’ai fait l’expérience entre 3, 57 et 3, 571 et
ça marche au 49-ième coup.
47
Démonstration. On considère Pn (µ). On a Pn (4) = −1/2 pour n ≥ 2. En
effet, on a f (1/2) = 1, donc f 2 (1/2) = 0 et on reste indéfiniment en 0 :
f n (1/2) = 0 pour n ≥ 2, ou encore Pn (4) = −1/2. S’il existe un n ≥ 2
tel que Pn (a) > 0, il y a une racine µ entre a et 4 et on a gagné. Sinon,
cela signifie que, pour tout n ≥ 2, un = f n (1/2) reste < 1/2. Mais alors la
suite un est croissante et majorée par 1/2, donc converge, ce qui est absurde
puisque les points fixes de f sont 0 et τ > 1/2.
6 Mesures invariantes
Ce paragraphe a pour objectif d’éclairer le lecteur, voire l’auteur lui-même,
sur la formulation des théorèmes affirmant l’existence du chaos, tels qu’on
les trouve dans la littérature. En effet, ces résultats, comme par exemple le
théorème de Jakobson 5.12, sont énoncés le plus souvent en prouvant l’exis-
tence d’une mesure invariante ergodique pour l’application f . Nous allons
voir que cette situation est bien synonyme de chaos. Les résultats de cette
partie seront parfois donnés sous une forme un peu elliptique. On renvoie le
lecteur à [Walters] ou [Halmos] 61 pour toutes précisions.
Dans toute cette section on considère un intervalle compact I et une
application continue f : I → I.
6.1 Introduction
6.1.1 Définitions
Pour le confort du lecteur, donnons quelques définitions dont l’intérêt
n’apparaı̂tra que dans un instant :
61
Le petit livre de Halmos est particulièrement agréable.
48
6.1.2 La problématique : systèmes dynamiques ergodiques
Lorsqu’on étudie les suites récurrentes un+1 = f (un ), en faisant varier
u0 ∈ I, et que leur comportement n’est pas simple, on peut chercher si ces
suites présentent au moins une régularité statistique. L’idée est de regarder si
la suite passe plus fréquemment dans telle ou telle partie de I. Cela conduit
à la définition suivante :
6.4 Remarques.
1) La définition précédente signifie bien que le système considéré se comporte
statistiquement de manière régulière : quel que soit le point de départ, ou
presque, le système va visiter aussi souvent chaque partie A de I.
2) Le mot “presque” est essentiel pour se prémunir contre les points qui ont
un comportement particulier. Le lecteur pensera au cas des points périodiques
ou stationnaires du cas µ = 4.
3) Si f n’est pas ergodique c’est qu’il y a plusieurs zones dans I avec des
comportements √ radicalement différents. C’est le cas par exemple de la fonc-
tion f (x) = x sur [−1, 1] pour laquelle f n (x) tend vers 1 si x est > 0 et
3
vers − 1 si x est < 0. On voit aisément que la valeur de F (x, [1/2, 1]) est 1
si x est > 0 et 0 sinon, et inversement pour F (x, [−1, −1/2]). Dans ce cas,
on pourra en général décomposer le système en plusieurs systèmes stables et
ergodiques (comme ici avec x ≥ 0 et x ≤ 0).
62
Cette appellation n’est pas homologuée !
49
6.2 Le lien entre systèmes ergodiques et mesures inva-
riantes : le théorème de Birkhoff
La proposition suivante fait le lien entre la notion de fonction ergodique
et celle de mesure invariante :
6.5 Proposition. On suppose que f est ergodique. Alors, l’application ν
définie en 6.3 est une mesure de probabilité sur I, invariante par f et ergo-
dique.
Démonstration. Montrons déjà que ν est une mesure sur I, de masse totale 1.
En effet, si A et B sont disjoints on a N (x, A∪B, n) = N (x, A, n)+N (x, B, n)
pour tous x et n et on en déduit ν(A ∪ B) = ν(A) + ν(B). De plus, on a
N (x, I, n) = n, donc ν(I) = 1.
Cette mesure est invariante par f . En effet, N (x, f −1 (A), n) est égal à
N (x, A, n + 1) à une unité près et il en résulte ν(f −1 (A)) = ν(A).
Enfin, la mesure est ergodique. En effet, supposons A = f −1 (A) et ν(A) >
0. On a aussi f (A) = A et on voit aussitôt que pour une partie stable A et
un x de A, on a F (x, A) = 1. Comme on a, pour presque tout x de A,
F (x, A) = ν(A), on voit que ν(A) est bien égal à 1.
6.6 Remarques.
1) Si on suppose que presque toutes les suites récurrentes associées à f
convergent vers un même point τ , on obtient pour ν la mesure de Dirac
associée à τ .
2) Si on suppose que presque toutes les suites récurrentes associées à f
convergent vers un cycle attractif d’ordre n on obtient une mesure équirépartie
sur les n points du cycle.
3) Pour le cas chaotique, on a le résultat suivant, qui explique le lien entre
les mesures invariantes et le chaos (voir aussi 6.14).
50
6.8 Théorème. (Birkhoff ) On suppose que f admet une mesure de pro-
babilité ν invariante et ergodique. Alors, pour presque tout x ∈ I, F (x, A)
existe et on a F (x, A) = ν(A), autrement dit f est ergodique.
6.9 Proposition.
1) Pour montrer que ν est invariante par f il suffit de montrer la formule
ν(A) = ν(f −1 (A)) lorsque A est un intervalle.
2) On suppose que f est la fonction logistique fµ et que la fonction h vérifie
pour tout x, 2h(x) = h(f (x))|f 0 (x)|. Alors, la mesure ν = h(x)dx est inva-
riante par f .
6.10 Théorème. La mesure de Lebesgue sur [0, 1] est invariante par l’ap-
plication t et ergodique.
51
1
2/3
0 1/2 1
52
6.3.3 Le cas de la fonction logistique pour µ = 4
On a vu en 4.12 que la fonction logistique f4 (x) = 4x(1−x) est conjuguée
de l’application tente. On en déduit le théorème :
6.12 Théorème. On suppose qu’on a I = [0, 1] et f (x) = 4x(1 − x). On
1
pose : h(x) = p .
π x(1 − x)
La fonction h est intégrable, la mesure ν = h(x)dx est absolument continue
par rapport à la mesure de Lebesgue, invariante par f et ergodique.
√
Démonstration. Avec les notations de 4.12, posons ψ(x) = ϕ−1 (x) = π2 Arcsin x.
On vérifie qu’on a ψ 0 (x) = h(x). Si on dérive la formule t ◦ ψ(x) = ψ ◦ f (x) on
obtient : t0 (ψ(x))h(x) = h(f (x))f 0 (x), soit 2h(x) = h(f (x))|f 0 (x)| en prenant
les valeurs absolues. On conclut que la mesure ν est invariante en vertu de
6.9.
Montrons l’ergodicité de ν. Soit A ⊂ I tel que f −1 (A) = A. On en
déduit t−1 (ϕ−1 (A)) = ϕ−1 (A) par conjugaison. Il en résulte que ϕ−1 (A) est
de mesure de Lebesgue nulle en vertu de 6.10, donc aussi A et c’est encore
vrai pour ν qui est absolument continue par rapport à la mesure de Lebesgue.
2n h(x) = h(f n (x))|f 0 (x)||f 0 (f (x))| · · · |f 0 (f n−1 (x)| = h(f n (x))|(f n )0 (x)|.
53
l’ensemble R des x ∈ I dont l’orbite O(x) = {f k (x), k ∈ N} est dense dans
I est de mesure 1 (et donc non vide). En particulier, la dynamique de f est
chaotique.
Démonstration. On
\ considère
[ une base dénombrable (Un )n∈N d’ouverts de
−k
I. On pose A = f (Un ). Dire que x est dans R, donc que l’orbite
n∈N k∈N
O(x) est partout dense, c’est dire que tout Un contient un point de O(x)
ou encore qu’il existe k ∈ N tel que f k (x) ∈ Un . C’est exactement la même
chose de dire que x est dans A. On a donc [ R = A et il s’agit de calculer
la mesure de A. Mais, si on pose Vn = f −k (Un ), on a f −1 (Vn ) ⊂ Vn .
k∈N
L’ergodicité de la mesure montre que Vn est de mesure 0 ou 1, voir le lemme
ci-dessous. Comme il contient Un qui est un ouvert non vide, donc de mesure
(de Lebesgue ou invariante, c’est pareil) non nulle, on voit que Vn est de
mesure 1. L’intersection A des Vn est alors aussi de mesure 1 (en effet, si
on appelle Zn le complémentaire de Vn , il est de mesure nulle et il en est de
même de la réunion des Zn ).
6.15 Lemme. On suppose qu’on a une mesure µ invariante et ergodique et
un A tel que f −1 (A) ⊂ A. Alors, on a µ(A) = 0 ou 1.
Démonstration. Posons B = A − f −1 (A). L’ensemble B est l’ensemble des
x ∈ A tels que f (x) /∈ A. Comme la mesure est invariante, on a µ(A) =
µ(f −1 (A)) et donc µ(B) = 0. On considère alors B b = B ∪ f −1 (B) · · · ∪
−k −k
f (B) · · · . Comme la mesure est invariante, les f (B) sont de mesure nulle,
donc aussi B.b On a B b ⊂ A. Je dis que A − B b vérifie f −1 (A − B)
b = A − B. b
Si x est dans A et pas dans B, b il s’agit de voir qu’il en est de même de f (x).
Comme x n’est pas dans B, on a f (x) ∈ A. Si f (x) était dans B b on aurait
k
un k tel que f (f (x)) ∈ B, mais alors x serait dans B. Inversement, si f (x)
b
est dans A − B, b x est dans f −1 (A), donc dans A. S’il était dans B, b de deux
choses l’une. Ou bien x est dans B, mais alors f (x) n’est pas dans A et c’est
absurde. Ou bien il existe k > 0 avec x ∈ f −k (B) donc f k (x) ∈ B. Mais alors
on a f k−1 (f (x)) ∈ B et f (x) ∈ B
b : contradiction.
On en déduit µ(A− B) b = 0 ou 1. Comme on a µ(A) = µ(A− B)+µ( b B)
b =
µ(A − B),
b on a le résultat.
54
L’exemple suivant, dû à Ruelle (voir [Ruelle]) est l’un des premiers exemples
de dynamique chaotique pour la fonction logistique fµ avec µ < 4. Le prin-
cipe est le suivant. On cherche pour quel µ le troisième itéré de 1/2 tombe sur
1 µ2 (µ − 4)
le point fixe 1 − . On a f 2 (1/2) = f (µ/4) = et il y a deux façons
µ 16
de tomber sur le point fixe au coup suivant : soit on y tombe tout de suite,
ce qui mène à l’équation µ4 − 4µ3 + 16µ − 16 = 0 = (µ − 2)3 (µ + 2), soit on
tombe sur 1/µ qui s’envoie sur le point fixe au coup suivant. On obtient alors
l’équation µ4 − 4µ3 + 16 = 0 qui admet encore la racine 2 et une autre, racine
de l’équation (µ − 2)2 (µ + 2) = 16. On trouve µ = 3, 67857351043. Ruelle a
montré alors que fµ envoie l’intervalle [1/µ, 1 − 1/µ] sur [1 − 1/µ, µ/4] et que
fµ admet une mesure invariante sur l’intervalle stable minimum (voir Annexe
7.4) [1/µ = f (µ/4), µ/4]. Avec u0 = 0.4, le résultat est spectaculaire.
55
1
2/3
0 1/2 1
1) Supposons que J =]a, b[ contienne le point fixe 2/3. Tous les intervalles
f n (J) contiennent aussi 2/3. Il suffit de montrer qu’il existe un entier n tel
que f n (J) contient 1 (car le suivant contiendra 0 et leur union sera égale à
I). Comme on a f (3/4) = 1/2 et f (1/2) = 1, il suffit même de montrer qu’un
itéré de J contient 1/2 ou 3/4. Sinon, c’est que tous les f n (J) sont contenus
dans ]1/2, 3/4[. Mais, sur cet intervalle, on a f (x) = 2 − 2x et f multiplie
par 2 les distances. On a donc ν(f n (J)) ≥ 2n ν(J) et cet intervalle ne peut
être inclus dans ]1/2, 3/4[ pour n assez grand.
2) Si l’intervalle J contient 0, ou 1, ou 1/2, la conclusion de la proposition
est encore vraie (car on a f (1/2) = 1, f (1) = 0 et f (0) = 2/3)).
3) On raisonne par l’absurde en supposant qu’il existe un intervalle J de
longueur > 0 qui ne vérifie pas la conclusion de la proposition. Soit l la borne
supérieure des longueurs des contre-exemples. Il existe un contre-exemple J
de longueur λ > 3l/4. Cet intervalle est contenu, soit dans ]0, 1/2[, soit dans
]1/2, 1[. Dans ce deuxième cas, f (J) est de longueur 2λ (car f est affine
de multiplicateur 2 sur l’intervalle). C’est encore un contre-exemple et on a
2λ > 3l/2 > l, ce qui est absurde. Si au contraire J est contenu dans ]0, 1/2[,
f (J) est de longueur 2λ/3, contenu dans ]2/3, 1[ et f 2 (J) est de longueur
4λ/3 et c’est encore un contre-exemple. Mais on a 4λ/3 > l et c’est absurde.
56
7 Annexes
7.1 La table de mortalité utilisée par Euler
57
7.2 Mise en équation logistique
Voici la justification adoptée en général pour valider le modèle logistique.
On postule qu’il y a, pour la population pn , une valeur idéale, une valeur
d’équilibre e et que si la population s’écarte de la valeur d’équilibre, elle tend
à y revenir : si pn est > e (resp. < e), on a pn+1 − pn < 0 (resp. > 0) et
le retour de balancier est d’autant plus fort qu’on s’est plus écarté de e. En
pn+1 − pn
termes mathématiques, on postule que le taux d’accroissement est
pn
proportionnel à l’écart pn − e, avec un coefficient < 0 :
pn+1 − pn
= −k(pn − e)
pn
avec k > 064 . Avec le choix opéré ci-dessus on a donc :
58
a ν = 2 − µ. L’ensemble E/G est en bijection avec le quotient de M par
l’involution µ 7→ 2 − µ, ou encore avec M + = {f ∈ M | µ ≥ 1 }.
Démonstration. C’est facile : on se donne f et on résout en α, β, γ l’équation
hf = gh avec g(x) = x2 + γ. Pour le dernier point on résout µ/2 − µ2 /4 =
ν/2 − ν 2 /4.
7.2 Remarque. En vérité, le paramétrage par x2 + γ doit être plutôt plus
commode. Je n’en veux pour preuve que les valeurs de γ qui correspondent
aux valeurs remarquables de µ : µ = 4 donne γ = −2, µ = 2 donne γ = 0,
µ = 3, correspond à γ = −3/4,
√ et les
√ valeurs de γ : −1, −5/4, −7/4
√ suivantes√
correspondent à µ = 1 + 5, 1 + 6, 1 + 8 = 1 + 2 2.
7.3 Remarque. Le fait que les fonctions fµ , pour µ ≥ 1 ne soient pas deux à
deux conjuguées est l’une des raisons qui fait que la famille logistique est un
exemple particulièrement riche, voir [Lyubich2].
59
• Les intervalles√[a, b] avec a ≤ 1/2 ≤ τ et la condition (∗∗) ci-dessus.
5) On suppose 1 + 5 < µ < 4. Les intervalles stables sont les intervalles
µ µ2 (4 − µ) 1
[a, b] avec a ≤ f = < et la condition (∗∗) ci-dessus. Parmi
4 16 2
µ µ
ces intervalles, le plus petit est f , .
4 4
6) On suppose µ = 4. Le seul intervalle stable est I.
60
est µ3 − 4µ2 + 16a < 0. C’est la condition imposée en 5). Elle est inutile dans
2 √
4) car on a µ (4−µ)
16
≥ 1/2 pour µ ≤ 1 + 5.
6) Si J est un intervalle stable non réduit à un point, il contient un point
dont l’orbite est dense dans I en vertu de 4.2. On a donc I = J.
61
1) Si n est une puissance de 2, u+ 0 (n, k) est un point de période exactement
n pour tout k.
2) Si n est premier, u− 0 (n, k) est un point de période exactement n pour
tout k.
3) Si k et 2n + 1 (resp. 2n − 1) sont premiers entre eux, u+ 0 (n, k) (resp.
−
u0 (n, k)) est un point de période exactement n, sauf dans le cas n = 2, k = 1
où il est de période 1.
4) Si n admet un facteur impair > 1, il existe k tel que u+ 0 (n, k) soit de
0
période < n. Précisément, pour tout facteur impair n de n, distinct de 1,
on pose p = n/n0 , on a alors 2n + 1 = k(2p + 1) et u+ 0 (n, lk) est de période p
p−1
pour l compris entre 1 et 2 .
5) Si n n’est pas premier, il existe k tel que u− 0 (n, k) soit de période < n.
Précisément, si p est un diviseur de n, avec p < n, on a 2n − 1 = k(2p − 1) et
u−
0 (n, lk) est de période p pour 0 < l < 2
p−1
. Si 2p est un diviseur pair de n,
−
n 0 p
on a 2 − 1 = k (2 + 1) et u0 (n, l k ) est de période66 p pour 0 < l0 ≤ 2p−1 .
0 0
8 Références
La bibliographie sur le sujet est monstrueuse : il y a des centaines d’ar-
ticles qui tournent autour des systèmes dynamiques associés à un polynôme
quadratique. J’ai donc dû faire un choix drastique.
[Buzzi] Jérôme Buzzi Chaos et stabilité Le pommier (2005).
[Collet-Eckmann] Pierre Collet et Jean-Pierre Eckmann Iterated maps
on the interval as dynamical systems Progress in Physics, Birkhäuser (1980).
62
[Euler] Leonhard Euler Recherches generales sur la mortalite et la mul-
tiplication du genre humain Mémoires de l’académie des sciences de Berlin
16, 144-164 (1767) ou Opera Omnia : Series 1, Volume 7, 79 - 100.
[Glass-Mackey] Leon Glass et Michael C. Mackey From clocks to
chaos : The Rhythms of Life Princeton University Press (1988).
[Graczyk-Swiatek1] Jacek Graczyk et Grzegorz Swiatek, Generic hy-
perbolicity in the logistic family Ann. Math. (2) 146, No.1, 1-52 (1997).
[Graczyk-Swiatek2] Jacek Graczyk et Grzegorz Swiatek, The real
Fatou conjecture Annals of Mathematics Studies 144, Princeton University
Press (1998).
[Halmos] Halmos Paul R. Lectures on ergodic theory The mathematical
society of Japan (1956).
[Jakobson] M.V. Jakobson Absolutely continuous invariant measures
for one-parameter families of one-dimensional maps Commun. Math. Phys.
81, 39-88 (1981).
[Langlois-Daude] Patrice Langlois et Éric Daude, Concepts et modélisations
de la diffusion géographique, Revue européenne de géographie, N◦ 364 (2007).
63