View
View
3.1. Introduction
Dans le diagramme de Lexis classique, les variables en jeu sont temporelles ; les variations en
cause sont également temporelles. Dans ce point, nous allons progressivement passer d’un
diagramme exprimant des variations temporelles de variables temporelles à des figures
proposant d’étudier la variation non temporelle de variables non temporelles. Le premier
point abordera cette problématique par le biais de la variation temporelle de variables non
temporelles, comme, par exemple, la taille ou le poids, variables dont la valeur se modifie
dans le temps, notamment durant la première partie de la vie. Le point suivant servira à
s’affranchir de la contrainte « variation temporelle », même si cette voie ne nous semble pas,
a priori, très intéressante pour la suite du travail. Finalement, un dernier point, à notre avis
également très peu porteur a priori pour la suite, montrera la possibilité d’établir des
trajectoires forcées de pente non unitaire. Suite à ces différentes étapes, la généralisation du
diagramme de Lexis aura atteint un très haut degré, ce qui est notre objectif.
Pour rappel, le diagramme de Lexis classique réduit le volume initial défini par les axes des
trois variables en un plan et ce, sans perte d’information. Par ailleurs, ce diagramme comporte
Chapitre 3. Généralisation du diagramme de Lexis 121
des trajectoires forcées pour les unités d’observation. Les trois variables campant sur les axes
du volume initial (avant réduction) se doivent de respecter des conditions très précises pour
obtenir une construction plane ayant les caractéristiques voulues :
- la relation entre elles doit correspondre à une combinaison linéaire, ce qui autorise la
réduction du volume en plan ;
- une des trois doit rester constante individu par individu, ce qui assure la présence de
trajectoires forcées.
1
Les trois variables « taille », « taille à la naissance » et « gain de taille depuis la naissance »
satisfont pleinement les deux conditions :
- elles forment une combinaison linéaire : gain de taille = taille – taille à la naissance ;
- la taille à la naissance est constante pour un individu donné.
Des observations classées selon ces trois variables peuvent sans difficulté aucune se localiser
sur un diagramme de Lexis (cf. figure 3.1). L’axe des abscisses y indiquera la taille (en
remplacement du temps) ; celui des ordonnées, le gain de taille (en remplacement de l’âge) et
finalement, la taille à la naissance tiendra le rôle du moment de naissance, en parasitant l’axe
de la taille2. Pour chaque individu, il est possible de tracer une trajectoire de taille, figurant
l’évolution du gain de taille depuis la naissance en fonction de la taille en lieu et place de la
classique évolution de l’âge en fonction du temps.
Temps Taille
Vu les relations entre les trois variables de taille et l’identité des unités sur les deux axes, les
trajectoires se présenteront toutes sous forme d’obliques croissantes inclinées à 45 degrés. La
connaissance d’un seul point de la trajectoire est suffisante pour la déterminer dans son
1
L’on pourrait s’étonner de trouver une référence temporelle explicite dans le nom de cette variable. En fait,
nos mesures s’opèrent très généralement dans un contexte temporel précis. Ainsi, le temps est d’une certaine
façon bien présent dans le contexte des trois variables choisies : la taille et le gain de taille depuis la
naissance se mesurent à un moment donné ; la taille à la naissance se réfère à un moment bien précis. Cette
constatation ne transforme pas pour autant les trois variables en variables temporelles. Elles s’expriment
bien en unités de longueurs (centimètres) et nullement de temps (années, jours, secondes…) comme il sied
aux variables temporelles.
2
Pour les graphiques, nous avons toujours opté pour les substitutions d’axes donnant le résultat le plus
immédiatement comparable à un diagramme de Lexis classique. Un diagramme en taille peut se décliner
sous trois – ou six – visages, exactement comme le diagramme en temps. Il ne nous a pas paru indispensable
de développer les versions concurrentes, d’autant que pour ce faire, il suffirait de suivre la logique qui a été
exposée au point 2.4 du précédent chapitre à propos de la construction du diagramme de Lexis.
Chapitre 3. Généralisation du diagramme de Lexis 122
ensemble. À tous égards, ces trajectoires « forcées » jouissent des mêmes propriétés que les
classiques lignes de vie. Et les cohortes dans tout cela ? Une cohorte regroupera tous les
individus partageant une même gamme de taille à la naissance, par exemple entre 50 et 52
3
centimètres exacts (50->52 cm). Elle sera délimitée par les trajectoires forcées correspondant
aux tailles à la naissance de 50 et 52 centimètres exacts (cf. figure 3.2).
Cohorte 50-<52 cm
50 52 Taille
Autant il est possible de localiser des évènements sur les lignes de vie d’un diagramme
de Lexis classique, autant il est possible de le faire sur un diagramme de Lexis en taille. Quels
évènements ? Tous, aussi bien les évènements démographiques (le décès, l’émigration…) que
non démographiques (le doublement du poids depuis la naissance, le premier anniversaire, le
début de la marche, la perte du premier hochet…). Ainsi, sur la figure 3.3, la perte du premier
hochet a été localisée sur les trajectoires d’âge et de taille d’un individu ; l’évènement localisé
pourrait tout aussi bien être la contraction d’une maladie qu’une migration ou le doublement
de poids depuis la naissance.
Figure 3.3. Localisation d’un évènement sur des diagrammes en temps et en taille
Âge Gain de taille
Temps Taille
= perte du premier hochet
3
La taille à la naissance est théoriquement une variable continue. Dans la pratique, elle s’exprime en
centimètres. La cohorte en cause regroupera donc les individus dont la taille déclarée à la naissance était soit
de 50, soit de 51 centimètres. La gamme de valeurs effectivement couverte par la cohorte dépendra de la
façon dont la valeur est approximée, par arrondi ou troncature.
Chapitre 3. Généralisation du diagramme de Lexis 123
Il est à noter que la localisation sur le diagramme en taille se fait indépendamment du temps.
Pour un individu, un évènement peut correspondre à un âge et pour un autre individu, à un
âge tout à fait différent. De même, sur le diagramme en temps, la localisation se fait en
gommant complètement la notion de taille.
Le tableau 3.1 reprend différents exemples de variables qui satisfont aux deux conditions. La
première colonne reprend l’exemple classique (temps, moment de naissance et âge) ; il est
ainsi aisé de comparer les différents exemples. Le cas 2 reprend l’exemple du diagramme en
taille. Pour les cas 3, 4 et 5, il est évidemment possible de produire un diagramme de Lexis et
de constituer des cohortes respectivement de poids, de chiffre d’affaire et d’effectif de
personnel.
Tableau 3.1. Différents exemples de variables
Cas 1 Cas 2 Cas 3 Cas 4 Cas 5
Temps Taille Poids Chiffre d’affaire Nombre d’employés
Moment de Taille à la naissance Poids à la Chiffre d’affaire à un Nombre d’employés à un
naissance naissance évènement-origine évènement-origine
Age Gain de taille depuis Gain de poids Gain du chiffre d’affaire Gain dans le nombre
la naissance depuis la depuis l’évènement- d’employés depuis
naissance origine l’évènement-origine
En fait tous ces exemples sont semblables. Même si ce n’est pas habituel dans le langage
courant, le moment de naissance correspond au « temps à la naissance », la naissance étant
l’évènement-origine ; l’âge correspond, quant à lui, à « un gain de temps depuis la
naissance ». Chacun des cas se compose donc des mêmes trois éléments :
- une variable « absolue » de référence (le temps, la taille…), expression généralisant la
durée de référence utilisée dans le point 2.5.3. Généralisation du concept de « cohorte » ;
- la valeur de cette variable absolue à un évènement-origine ;
- la variation de cette variable absolue depuis l'évènement-origine.
Ensemble, ces trois variables constituent le cadre de référence dans lequel l’analyse se
déroule. Même si cela peut paraître évident, il nous semble utile d’insister sur le fait que la
variable absolue doit remplir certaines caractéristiques pour pouvoir jouer son rôle :
- elle doit être susceptible de prendre, individu par individu, des valeurs différentes au
moment de l’évènement-origine ; dans le cas contraire, il ne sera pas possible de définir
plusieurs cohortes puisque sa valeur à l’évènement-origine sera la même pour toutes les
unités d’observation ;
- elle doit être susceptible de varier dans le temps ; dans le cas contraire, il ne sera pas
possible d’utiliser la troisième coordonnée, équivalente à l’âge.
À propos de l’évènement-origine, dans les trois premiers cas, il s’agit du même, à savoir la
naissance. Par contre dans les deux autres, cet évènement-origine n’est pas précisé. Il pourrait
tout aussi bien s’agir d’une date précise (correspondant à l’entrée en vigueur d’une nouvelle
loi économique ou sociale ou à un crac boursier, par exemple) ou alors d’un moment variable
d’une firme à l’autre correspondant, par exemple, au moment où la firme commence à
exporter ; dans ce dernier cas, il s’agirait donc d’une référence temporelle « flottante » par
rapport au temps-calendrier.
Par ailleurs, si l’on veut quitter le point de vue purement théorique pour atteindre
éventuellement une certaine portée pratique, l’évènement-origine devrait correspondre à un
phénomène au moins potentiellement significatif pour les unités d’observation et leur
Chapitre 3. Généralisation du diagramme de Lexis 124
Si, sur le plan théorique, nous venons de montrer que des variables non temporelles pouvaient
remplacer les variables classiques des démographes, il n’en faut pas moins souligner des
différences. Dans le diagramme de Lexis classique, le temps, ainsi que les lignes de vie et
l’âge, présentent un déroulement immuable, linéaire, et continu : ils progressent de manière
4
régulière et inexorable . Qu’en est-il pour d’autres types de trajectoires ?
Cela ne remet pas en cause le caractère forcé des trajectoires : si, vu son évolution, une unité
d’observation se déplace, elle ne peut le faire qu’en suivant sa trajectoire, avec
éventuellement des allers et retours. De même, la localisation d’évènements sur ces
trajectoires reste licite sur le plan théorique et potentiellement significative sur le plan
pratique. Nous reviendrons sur ce sujet au point 3.2.4.
Pour les besoins d’une recherche à propos du gradient de température, supposons une série
d’endroits sélectionnés à la surface du globe. Ces endroits se situent à différentes latitudes,
longitudes et altitudes. Pour chacun d’eux, la température a été enregistrée simultanément au
sol et à 1 000 mètres au-dessus du sol (ci-après dénommée « température à 1 000 mètres »).
Ces données permettent évidemment de calculer une variation de température (« ∆T° ») :
∆T° = T° à 1 000 mètres – T° au sol.
Ainsi définie, la variation peut être aussi bien positive que négative. Supposons que la
température ait aussi été mesurée à 2 000 mètres au-dessus du sol (toujours en respectant la
simultanéité des relevés de température pour un même point géographique). La variation par
4
On reviendra plus loin sur ces caractéristiques du temps (cf. point 3.2.5 et annexe 3.1).
5
À ce sujet, cf. notamment B. Lepettre (1995).
Chapitre 3. Généralisation du diagramme de Lexis 125
rapport au sol pourra aussi se calculer, la base de référence – soit la température au sol – étant
immuable pour un endroit, vu la simultanéité des mesures.
Les trois variables « température », « température au sol » et « variation de température par
rapport au sol » (qui forment, dans le cas présent, le cadre de référence de l’étude) respectent
les deux conditions à l’établissement d’un diagramme de Lexis :
- elles se combinent dans une relation additive : ∆T° = T° – T° au sol ;
- pour une unité d’observation (soit un endroit à la surface du globe), une variable a une
valeur constante : la température au sol.
En conséquence, des observations réalisées dans un tel cadre de référence peuvent se disposer
sur un diagramme de Lexis (cf. figure 3.4.a). L’axe des abscisses y supporte à la fois la
température et la température au sol et celui des ordonnées, la variation de température par
rapport au sol. Par référence à la terminologie introduite sous le tableau 3.1, la température
joue le rôle de variable absolue ; la température au sol, celui de la mesure de cette variable
absolue à l’évènement-origine que constitue le sol et la variation de température, celui de la
variation de la variable absolue par rapport à l’évènement-origine.
Figure 3.4. Variation non temporelle et diagramme de Lexis
Figure a. Figure b.
Variation de température Variation d’altitude
2 000 m
2 000 m
= température à une altitude
Dans une telle figure, un point sur une trajectoire peut représenter, par exemple, une altitude
au dessus du sol par rapport à un endroit géographique, altitude pour laquelle on a relevé la
température. Une altitude (c’est-à-dire un évènement6) se localise en fonction de ces
coordonnées : température, température au sol et/ou variation de température depuis le sol.
Par ailleurs, quelle que soit l’altitude par rapport au sol, tous les points attachés à un endroit
géographique ne peuvent que se distribuer le long d’une oblique croissante de pente unitaire
et interceptant l’axe des abscisses à la valeur de la température au sol. Ces obliques
constituent donc des trajectoires forcées.
Sur cette figure 3.4.a, les trajectoires forcées se développent aussi bien au-dessus qu’au-
dessous de l’axe des abscisses ; en effet, les variations peuvent aussi bien être négatives que
positives. La trajectoire de gauche illustre le cas d’un endroit surmonté d’une masse d’air où
la température diminue avec l’altitude (température plus basse à 2 000 mètres qu’à 1 000 ou à
1 000 qu’au sol) et la deuxième, celui d’une inversion de température : à 2 000 mètres, la
température est plus élevée qu’à 1 000 ou même qu’au sol.
6
Sur toutes ces figures, un point indique la localisation d’un évènement ; à ce sujet, cf. le point 3.2.4.
Évènements et coordonnées : généralisation.
Chapitre 3. Généralisation du diagramme de Lexis 126
Comme le montrent ces exemples, une unité d’observation peut opérer des allers et retours sur
sa trajectoire, mais sans jamais pouvoir la quitter. Par ailleurs, un même point d’une
trajectoire peut supporter plusieurs évènements : ce serait le cas si, suite à une inversion de
température, les températures au sol et à 2 000 mètres étaient identiques et supérieures à celle
mesurée à 1 000 mètres. Il s’agit là d’une différence par rapport au diagramme de Lexis
classique, situation déjà rencontrée au point précédent avec le diagramme de Lexis en poids
par exemple.
Comme le suggère la figure 3.4.b, une cohorte regroupera l’ensemble des endroits du sol
partageant une même gamme de températures (par exemple entre 10 et 12°C).
Mis à part l’altitude, d’autres phénomènes pourraient aussi se représenter sur un tel
7
diagramme de Lexis, par exemple, l’apparition des nuages. Comment se forment les nuages ?
L’air contient généralement une certaine quantité de vapeur d’eau. Selon sa température, une
masse d’air ne peut dépasser une certaine teneur en vapeur d’eau ; cette quantité dite
« maximale » vaut, par exemple, 9,36 et 17,15 grammes par mètre cube à respectivement
10°C et 20°C. Quand la quantité maximale est atteinte et dépassée, la condensation d’une
partie de la vapeur d’eau en gouttelettes forme des nuages de façon à ajuster la quantité de
vapeur résiduelle à la quantité maximale.
Supposons une masse d’air homogène verticalement en ce qui concerne l’humidité qu’elle
contient (soit 9,36 grammes par mètre cube) et dont la température au sol est de 20°C. Si son
gradient de température est de 1°C par 100 mètres, à 1 000 mètres, la température sera de
10°C. Si l’on s’élève encore, la température, en diminuant, fera passer la quantité maximale
sous les 9,36 grammes par mètre cube. En conséquence, la condensation se produira. Les
nuages commenceront donc à se former à 1 000 mètres et à la température de 10°C.
Selon les conditions de température au sol ainsi que selon l’évolution verticale de la
température et celle de l’humidité (supposée constante par hypothèse), le point à partir duquel
les nuages se formeront peut varier d’un endroit à l’autre. Ces points pourraient se disposer
sur un diagramme de Lexis (cf. figure 3.5.a).
Température et Altitude et
température au sol Altitude au sol
Le même phénomène pourrait donner lieu à l’établissement d’un autre diagramme de Lexis en
altitude cette fois (cf. figure 3.5.b) : l’altitude et l’altitude au sol se disposeraient sur l’axe des
7
À ce sujet, cf. notamment B. Lepettre (1995).
Chapitre 3. Généralisation du diagramme de Lexis 127
Par ailleurs, ces exemples respectent le schéma qui a été proposé sous le tableau 3.1, à savoir,
qu’on y retrouve :
- une variable absolue, soit la température ou l’altitude ;
- la valeur de cette variable absolue à un évènement-origine, soit la température ou
l’altitude au sol ;
- la variation de cette variable absolue par rapport à l’évènement-origine, soit la variation de
température par rapport au sol ou la variation d’altitude par rapport au sol.
Bref, de telles observations peuvent très bien s’agencer sur une figure ayant toutes les
caractéristiques du diagramme de Lexis, faisant apparaître des trajectoires forcées et des
cohortes. Il s’agit donc bien de diagrammes de Lexis sans variation temporelle, puisque les
différentes mesures y intervenant se font simultanément.
Ce type de diagramme nous permet donc de passer à une figure construite non plus en
fonction de la variation temporelle d’une variable de nature quelconque (point précédent),
mais bien en fonction de la variation de nature quelconque d’une variable de nature quelcon-
que. De la sorte, la généralisation atteint un degré élevé, du moins sur le plan théorique, ce qui
était notre objectif, et indépendamment donc de toute portée pratique immédiate.
Comme dans le point précédent, et même bien plus encore, l’exemple utilisé ici ne cherche
pas à montrer la portée pratique de l’élaboration d’un diagramme de Lexis, mais vise à
illustrer la possibilité théorique d’obtenir des diagrammes de Lexis présentant une
caractéristique particulière, à savoir des obliques à pente quelconque.
Soit une entreprise bénéficiant chaque année d’une aide publique (« A »), qui s’ajoute à son
bénéfice (« B »). Pour un de ses employés, le salaire (« S ») correspond à un quart du bénéfice
augmenté d’un tiers de l’aide publique :
S = 1/4 B + 1/3 A
Les trois variables en jeu remplissent bien les conditions pour opérer la réduction d’axes.
Décidons de porter le bénéfice en abscisse, de supprimer l’axe de l’aide et de reporter cette
variable sur l’axe des abscisses, le salaire occupant l’axe des ordonnées (cf. figure 3.6). Sur un
tel diagramme, une valeur donnée de la variable « aide » (soit k) se traduira par une oblique
d’équation :
S = 1/4 B + 1/3 k
La pente de cette droite vaut 1/4 ; les valeurs à mettre sous celles du bénéfice pour créer
l’échelle de l’aide se calculent en annulant le salaire :
Chapitre 3. Généralisation du diagramme de Lexis 128
S = 1/4 B + 1/3 A
⇒ 0 = 1/4 B + 1/3 k
⇒ k = -3/4 B
Par exemple, si le bénéfice vaut 10, l’aide vaut -7,5 ; si le bénéfice vaut -4, l’aide vaut 3 (cf.
figure 3.6). Supposons que :
- la façon de calculer le salaire de l’individu en cause reste la même d’une année à l’autre ;
- l’aide reçue par l’entreprise s’élève constamment à 3 ;
- le bénéfice de l’entreprise a varié comme suit : 1995 : 0 ; 1996 : 4 ; 1997 : 8 ; 1998 : 12.
1998
1997
6
1996
1995
4
2
0
-4 -2 0 2 4 6 8 10 12 14 16 Bénéfice
3 1,5 0 -1,5 -3 -4,5 -6 -7,5 -8 -10,5 -12 aide
Si les bénéfices ont fluctué comme indiqué plus haut, la valeur de l’aide s’est élevée
successivement à 9 en 1995 ; 6 en 1996 ; 3 en 1997 et 0 en 1998. Décidons, pour créer un
diagramme de Lexis avec ces données, de supprimer l’axe du salaire et de reporter cette
variable sur l’axe du bénéfice mis en abscisse, l’aide étant sur l’axe vertical. Le salaire s’y
matérialisera par une oblique décroissante :
Sa pente sera donc de -3/4. Ensuite, en annulant l’aide, on détermine que les valeurs à mettre
sous l’échelle du bénéfice pour créer celle du salaire se calculent en prenant un quart du
montant du bénéfice (cf. figure 3.7). Pour l’individu en cause, les points représentant les
Chapitre 3. Généralisation du diagramme de Lexis 129
années ne pourront s’écarter d’une trajectoire forcée passant par les points de coordonnées
(bénéfice = 0 ; aide = 9) et (bénéfice = 12 ; aide = 0).
Si, pour un employé d’une autre firme suivant les mêmes règles pour le calcul des
rétributions, le salaire doit toujours valoir 2, les points ne pourront jamais s’écarter d’une
oblique décroissante d’équation :
A = 6 – 3/4 B.
Sa pente sera donc aussi de -3/4. Cette oblique sera parallèle à la précédente et interceptera
l’axe des abscisses à la valeur 8 en termes de bénéfice et 2 en termes de salaire (cf. figure 3.7).
Comment définir dans ce contexte des cohortes ? Une cohorte regroupera l’ensemble des
individus qui partagent la même gamme de salaire. Ainsi, sur la figure 3.7, les deux
diagonales délimitent la cohorte des individus disposant d’un salaire compris entre 2 et 3. Ne
pourront entrer dans cette cohorte que les individus dont le salaire est compris entre 2 et 3 et
correspond à un quart du bénéfice augmenté d’un tiers de l’aide, ce qui limite de beaucoup la
portée pratique potentielle de la figure, mais ce n’était pas l’objectif poursuivi.
Figure 3.7. Diagramme de Lexis à obliques de pente non unitaire. Deuxième cas
Aide
1995
8
1996
6
4
1997
1998
2
0
0 2 4 6 8 10 12 14 16 Bénéfice
0 0,5 1 1,5 2 2,5 3 3,5 4 salaire
Les deux dernières figures montrent des exemples de diagrammes de Lexis à obliques de
pente non unitaire ; du point de vue purement théorique, ces figures sont bien des diagrammes
de Lexis à part entière, avec possibilité d’identifier des trajectoires forcées et des cohortes. En
fait, ces figures nous ramènent à l’exemple purement mathématique exposé au point 2.4.
Conditions mathématiques de l’élaboration d’un diagramme de Lexis. À notre sens, il s’agit
de la généralisation la plus haute qui puisse être proposée pour l’élaboration de diagrammes
en plan permettant le recours à trois coordonnées et comportant des trajectoires forcées.
Il est à noter ici que les éléments en jeu ne suivent pas le schéma proposé sous le tableau 3.1 :
aucune variable ne peut se qualifier d’absolue et donc la valeur de cette variable à un
évènement-origine ou sa variation ne peuvent trouver de correspondance. Nonobstant cette
remarque, les figures qui précèdent présentent bien toutes les caractéristiques d’un diagramme
de Lexis.
Il est à rappeler que ce qui vient d’être développé dans ce point 3.2.3 ne poursuivait qu’un but
purement théorique de généralisation de l’élaboration du diagramme de Lexis. Sans réelle
portée pratique exploitable, cet aspect (pente non unitaire) est à considérer comme une
parenthèse purement théorique et le cas envisagé sera abandonné dans la suite de l’exposé,
pour laquelle la généralisation atteinte en fin de point 3.2.2 est largement suffisante.
Chapitre 3. Généralisation du diagramme de Lexis 130
Au cours de la généralisation proposée dans les points précédents (et sans prendre en compte
le point 3.2.3), certains concepts ont été employés en dehors de leur contexte habituel. Ainsi,
la notion d’évènement a été utilisée pour désigner des éléments aussi disparates que la perte
du premier hochet, l’altitude à la verticale d’un point ou la formation des nuages. Un
évènement est ici compris comme un fait de nature quelconque affectant une unité
d’observation. Un évènement se définit donc de manière moins stricte qu’en situation
classique. Pour Allison, par exemple :
« an event consists of some qualitative change that occurs at a specific point in
time. One would not ordinarily use the term ‘event’ to describe a gradual change
in some quantitative variable. The change must consist of a relatively sharp
disjunction between what precedes and what follows »8.
Le premier mariage est un bon exemple d’évènement suivant cette définition : l’individu
change de statut en quittant l’état de célibataire pour accéder à celui de personne mariée, ce
qui marque une rupture sur le plan social. Dans l’exemple de la figure 3.4, les points
représentent des altitudes. « 1 000 mètres au-dessus du sol » ne marque pas une rupture
qualitative pour une unité d’observation, soit un point géographique ; de plus, une altitude est
un point particulier dans le changement graduel d’une variable franchement quantitative !
Bref, les critères identifiés au départ de la définition d’Allison ne sont pas respectés. Serait-ce
une raison suffisante pour retirer la qualité d’évènement à ce fait ?
À notre avis, non. L’objectif du diagramme de Lexis et des analyses qui y font généralement
suite est l’étude de la survenance d’un fait affectant des unités d’observation et se déroulant
dans un cadre de référence précis. Le tableau 3.2 reprend six exemples d’évènements en
identifiant à chaque fois le fait étudié, les unités d’observation concernées et le cadre de
référence défini par les trois variables le constituant.
Dans chacun des cas, la localisation des faits ou évènements sur un diagramme de Lexis
approprié s’opère selon les mêmes principes que sur un diagramme classique. Les faits en
cause se matérialisent tous par des points sur les trajectoires forcées définies dans le cadre de
référence choisi. Il n’y a aucune raison a priori de distinguer de ce point de vue un cas des
autres, à tout le moins sur le plan théorique. Par ailleurs, ces exemples peuvent déboucher sur
des questions à notre avis équivalentes et toutes aussi licites les unes que les autres, toujours
sur un plan théorique :
- cas 1 : quel est l’âge moyen au 1er mariage ?
- cas 2 : quel est l’âge moyen à la perte du 1er hochet ?
- cas 3 : quel est le gain de taille moyen à la perte du 1er hochet ?
8
P. Allison (1984), p. 9. À ce sujet, cf. aussi C. Vandeschrick (2004), p. 195.
Chapitre 3. Généralisation du diagramme de Lexis 131
Ces exemples montrent, à notre avis, qu’un évènement étudié peut être de nature quelconque
et ne pas supposer une rupture pour l’individu sous observation. Notons toutefois que la perte
du 1er hochet peut, à la limite, être considérée comme une rupture autant que le 1er mariage, en
faisant passer l’individu du statut de disposant encore de son 1er hochet à celui de n’en
disposant plus ! La même remarque peut aussi valoir pour deux autres faits du tableau 3.2 :
- l’altitude de 1 000 mètres fait quitter à l’unité d’observation sa 1re tranche de 1 000 mètres
pour la faire entrer dans la deuxième9 ;
- l’apparition des nuages marque le passage de la non-saturation de l’air en vapeur d’eau à
sa saturation.
Ces ruptures sont certes inégalement spectaculaires ; toutefois, rien n’empêche, sur le plan
théorique de nouveau, de les considérer en tant que rupture au même titre qu’un 1er mariage
ou une migration. Pour la suite de ce texte, nous garderons donc une définition la plus large
possible pour le concept d’évènement. Nous proposons la définition suivante : « circonstance
pour laquelle les coordonnées formant le cadre de référence choisi ont été enregistrées pour
les unités d’observation » ; si un fait répond à cette définition, il est localisable sur la
trajectoire de l’individu et sa survenance peut être analysée dans le cadre de référence choisi.
9 er re e
Le 1 anniversaire fait quitter à l’individu sa 1 année de vie pour l’introduire dans la 2 . Cet exemple est en
fait très proche de l’altitude de 1 000 mètres ; dans les deux cas, il s’agit d’une valeur particulière dans le
changement progressif d’une variable quantitative. Cela n’empêchera nullement les démographes de
er er
calculer, par exemple, la probabilité d’atteindre le 1 anniversaire, soit de survivre de la naissance au 1
anniversaire !
Chapitre 3. Généralisation du diagramme de Lexis 132
Cette définition large, voire lâche, du concept d’évènement offre l’avantage d’inclure sa
conception classique tout en laissant une grande latitude pour le choix des faits à analyser et
des cadres de références pour mener ces analyses.
En abandonnant l’aspect purement théorique de la question, ajoutons toutefois que, sur le plan
pratique, la pertinence d’une analyse ne pourra être assurée que dans la mesure où
l’évènement étudié est potentiellement porteur de sens pour les individus observés et que le
cadre de référence reprend des variables potentiellement explicatives du phénomène étudié
dans la population visée. Par ailleurs, pour constituer des cohortes sur base de la proximité de
la variable de référence à l’évènement-origine, il faut au moins suspecter que cette cordonnée
est susceptible d’influencer le comportement des individus par rapport au phénomène étudié.
La généralisation du concept d’évènement qui vient d’être proposée doit rejaillir aussi sur
certaines expressions pour éviter de retomber sous la coupe d’un réflexe exclusivement
temporel et assurer ainsi la généralisation en ce qui concerne le cadre de référence. Par
exemple, la localisation d’un décès sur le diagramme classique peut se faire via les deux
coordonnées suivantes : la date et l’âge au moment du décès. Si la localisation devait se faire
sur un diagramme en taille, ces deux coordonnées pourraient être remplacées par la taille et le
gain de taille au moment du décès. Dans ces énoncés, l’expression « au moment du » nous
semble superflue ; par ailleurs, elle rappelle trop l’idée de référence au temps qui est soit déjà
comprise naturellement dans l’âge et le temps, soit sans réel intérêt quand on veut travailler
dans un cadre de référence en taille et non plus en temps. Nous proposons donc d’adopter des
énoncés simplifiés :
- date et âge au décès ;
- taille et gain de taille au décès.
Tous ces exemples suivent bien la même structure générale : valeur de la variable absolue à
l’évènement ; par ailleurs, ils soulignent la nature très disparate des évènements à localiser sur
un diagramme de Lexis. Le remplacement de la mention « au moment de l’évènement » par
« à l’évènement » a été proposé pour s’affranchir par rapport à la tyrannie du temps, phase
indispensable pour parvenir à concevoir des cadres de référence non basés sur le temps. Ces
notions bien établies permettent de généraliser le diagramme de Lexis en passant de la
représentation classique de la variation temporelle d’une variable temporelle à celle de la
variation de type quelconque d’une variable de nature quelconque.
Chapitre 3. Généralisation du diagramme de Lexis 133
Jusqu’à présent, nous avons utilisé la seule notion de trajectoire pour décrire le parcours d’un
individu sur le diagramme de Lexis. Suite à la généralisation qui vient d’être proposée à son
sujet et dans l’optique de la généralisation des méthodes de l’analyse démographique, il faut
introduire la notion supplémentaire de trajet ; c’est l’objet de ce point. On partira de la notion
de trajectoire pour définir ensuite ce qu’est un trajet.
L’exemple de la température (point 3.2.2) propose des trajectoires se développant aussi bien
en dessous qu’en dessus de l’axe des abscisses. En effet, la température peut aussi bien varier
à la hausse qu’à la baisse quand l’altitude augmente. En tous points, la trajectoire indique la
valeur de la variation de température par rapport au sol pour une température donnée. La
trajectoire se présente sous la forme d’une fonction linéaire croissante continue de pente 45°
et interceptant l’axe des abscisses à la valeur de la variable absolue à l’évènement-origine.
La trajectoire se définit comme l’ensemble des points du diagramme qu’un individu peut en
théorie fréquenter étant donné la valeur de la variable absolue à l’évènement-origine qui l’a
fait rentrer dans l’observation. A priori, il n’y a pas de raison de limiter une trajectoire10 : elle
peut se prolonger (indéfiniment) vers le haut ou vers le bas ; quelle que soit la valeur de la
variable absolue, la trajectoire montrera toujours la variation de la variable absolue (par
rapport à sa valeur à l’évènement-origine) y correspondant.
Un individu va-t-il fréquenter tous les points de sa trajectoire ? Pas forcément : en se limitant
à la basse atmosphère, la température à la verticale d’un point ne dépassera pas certaines
limites, ni vers le haut, ni vers le bas. Une unité d’observation n’exploitera qu’une partie de sa
trajectoire. Les points fréquentés par un individu ne le seront-ils qu’une seule fois ? Pas
forcément : en suivant la verticale d’un point, la température peut passer successivement par
des épisodes de croissance et de décroissance de température et donc passer plusieurs fois par
la même valeur. Comme le montre cet exemple, il faut distinguer la trajectoire d’un individu
(ensemble des points théoriquement accessibles pour une unité d’observation) de son trajet
effectif sur sa trajectoire (l’ensemble des points de la trajectoire effectivement fréquentés par
une unité d’observation).
Le trajet ne peut donc se dessiner que sur la trajectoire, mais ces deux notions ne sont pas
assimilables. Les caractéristiques d’une trajectoire et d’un trajet sont en rapport
respectivement avec celles de la variable absolue et celles de la variation de la variable
absolue par rapport à l’évènement-origine. Pour expliciter ce point, nous allons prendre trois
exemples : la situation classique avec le temps comme variable absolue, la température à la
verticale d’un point, le salaire dont disposent les individus.
Ces trois variables absolues (le temps, la température et le salaire) peuvent être considérées
comme (implicitement) continues. En conséquence, sur un diagramme de Lexis, les trajec-
toires apparaîtront sous forme de fonctions linéaires continues croissantes de pente unitaire,
pour autant que l’on attribue les axes des abscisses et des ordonnées respectivement à la
variable absolue et à sa variation par rapport à l’évènement-origine. Le fait que la température
ou le salaire peuvent aussi bien varier à la hausse qu’à la baisse par rapport à la valeur à
l’évènement-origine se traduira par une trajectoire se développant aussi bien au-dessus qu’au-
dessous de l’axe des abscisses11, ce qui ne modifie en rien les caractéristiques de la fonction.
10
Dans le cas de la température, on évitera de descendre sous le zéro absolu, soit – 273,15 degrés centigrades.
11
À la limite, en acceptant des âges négatifs, les trajectoires du cas classique partagent aussi ce caractère :
pour une date antérieure à sa date de naissance, l’âge d’un individu serait négatif !
Chapitre 3. Généralisation du diagramme de Lexis 134
Pour obtenir une trajectoire non continue, il faudrait que la variable absolue soit elle-même
non continue, comme dans le cas du nombre de travailleurs ayant signé un contrat d’emploi
dans une entreprise (cf. tableau 3.1) ; dans ces circonstances, la trajectoire ne serait définie
que pour les nombres entiers. Par contre, la trajectoire suivra un alignement linéaire croissant
de pente unitaire, la seule caractéristique perdue étant bien la continuité. En définitive, pour
autant que l’on respecte les règles d’attribution des axes, les trajectoires seront toujours de
tendance linéaire, croissante de pente unitaire ; la seule différence qui puisse se marquer porte
sur le caractère continu ou pas de la trajectoire. Par ailleurs, une trajectoire pourra toujours
s’interpréter comme étant l’évolution de la variation de la variable absolue par rapport à sa
valeur à l’évènement-origine en fonction des valeurs de la variable absolue.
Venons-en maintenant aux trajets effectivement suivis par les individus sur leurs trajectoires.
Les caractéristiques des trajets sont déterminées par la façon dont évolue la variation de la
variable absolue pour un individu par rapport à la valeur à l’évènement-origine. Pour régler la
question du transfert des méthodes (cf. chapitre 4), il faudra déterminer les caractères uni- ou
bidirectionnelle, irréversible ou pas et continu ou pas de cette variation.
Dans le cas classique, l’âge ne peut qu’augmenter après la naissance12 ; les trajets ne peuvent
comporter que des variations positives par rapport à la valeur de départ ; ils sont
unidirectionnels et se développent tous uniquement au-dessus de l’axe des abscisses. Par
contre, dans l’exemple du salaire, si les individus sous observation disposaient d’un salaire
non nul à l’évènement-origine, la variation peut aussi bien être positive que négative ; il en va
de même dans le cas de la température. Dans ces circonstances, les trajets seront donc bidirec-
tionnels ; ils peuvent se développer aussi bien au-dessus qu’au-dessous de l’axe des abscisses.
D’une manière générale, si, les variations enregistrées par rapport à la valeur à l’évènement-
origine ne sont que d’un seul signe (soit positif, soit négatif), les trajets seront unidirectionnels
et bidirectionnels, si ces variations peuvent être positives ou négatives.
Le cas classique des trajets en âge est irréversible : quelqu’un qui a dépassé un âge ne pourra
y revenir. L’exemple des températures et celui du salaire montrent au contraire des trajets
réversibles : en s’élevant progressivement à la verticale d’un point, on peut passer par une
température, la dépasser et y revenir ; pour le salaire, la situation est identique. Un trajet sera
réversible si un individu sous observation peut revenir à un point de son trajet après l’avoir
« dépassé » vers le haut ou vers le bas ; cela signifie donc qu’il aura connu des variations
partielles de sens opposés le long de son trajet. L’irréversibilité consacre l’impossibilité de
revenir plusieurs fois à une même variation par rapport à la valeur à l’évènement-origine.
Même si les notions d’irréversibilité et d’unidirectionnalité sont proches, il ne faut pas les
confondre, car leurs conséquences sur le transfert des méthodes diffèrent. Le plus souvent, ces
caractères vont de pair, mais sans que ce ne soit automatique. L’unidirectionnalité signifie
que, par rapport à la valeur à l’évènement-origine, les individus ne peuvent connaître que des
variations d’un seul signe ; si à l’intérieur de ces variations d’un seul signe, des allers-retours
sont envisageables, les trajets juxtaposent les caractères unidirectionnel et réversible.
Par exemple, à la naissance, le salaire qu’un individu peut percevoir pour son travail vaut 0. À
partir du moment où il travaille, il percevra un salaire qui pourra varier au gré des
circonstances à la hausse ou à la baisse, mais jamais en passant dans des valeurs négatives. On
pourrait résumer cette situation en définissant la réversibilité comme une espèce de
« bidirectionnalité partielle », se cantonnant éventuellement dans une gamme de variations
12
Du point de vue de la physique, les caractéristiques du temps sont discutables, mais cela nous semble sans
conséquence concrète sur le travail des démographes. À ce sujet, cf. annexe 3.1.
Chapitre 3. Généralisation du diagramme de Lexis 135
d’un seul signe par rapport à la valeur à l’évènement-origine. En théorie, un trajet peut aussi
bien être réversible ou irréversible qu’il soit uni- ou bidirectionnel.
Pour avoir une chance d’être continu, un trajet doit se dessiner sur une trajectoire elle-même
continue. La continuité suppose que pour passer d’une variation à une autre, un individu est
obligé de passer par toutes les valeurs intermédiaires ; autrement dit, le trajet reprendra tous
les points intermédiaires de la trajectoire. Le cas classique de l’âge correspond bien à cette
définition : pour passer d’un âge à un autre, un individu passe par tous les âges intermédiaires.
On peut aussi considérer que les changements de température à la verticale d’un point
s’opèrent progressivement. Par contre, dans le cas du salaire, la variation n’est pas continue :
suite à une indexation ou une augmentation du temps de travail, le salaire d’un individu
passera sans transition d’une valeur à une autre, en ignorant les valeurs intermédiaires sur la
trajectoire.
Quelle relation existe-t-il entre la trajectoire et le trajet ? Dans le cas classique, le trajet de
l’individu terminé par son décès est simplement un extrait de la trajectoire, parcourue de
manière continue et irréversible : le trajet et la trajectoire peuvent s’assimiler l’un à l’autre, du
moins dans la partie de la trajectoire exploitée par le trajet. Par contre, dans le cas de la
température, la possibilité des allers-retours fait qu’un trajet effectif pourra reprendre
plusieurs fois un même tronçon de la trajectoire dans des sens de déplacement opposés. Le
trajet n’est donc plus un simple extrait de la trajectoire ; il peut être plus compliqué tout en en
respectant le caractère continu.
Dans le cas du salaire, aux éventuels allers-retours s’ajoute le fait qu’un trajet sera constitué
par une série de points disjoints sur la trajectoire, sans continuité. La figure 3.8 montre en
pointillé la trajectoire en salaire pour un individu et les points numérotés, son trajet.
Trajectoire en salaire
0
Salaire et
salaire à l’évènement-origine
Les particularités qui viennent d’être évoquées ne remettent pas en cause la validité du
diagramme de Lexis, ni son utilisation comme système de référence pour localiser des
évènements. Par contre, il faudra garder à l’esprit les caractéristiques des trajets au moment de
passer aux calculs d’indices (probabilités ou taux) en suivant ce que les démographes ont
l’habitude de faire, comme ce sera montré dans le quatrième chapitre.
3.2.6. Conclusions
Le point 3.2 nous aura permis de progresser dans l’optique de la généralisation. Par rapport au
chapitre précédent, la généralisation proposée ici nous affranchit du caractère temporel des
variables intervenant dans un diagramme de Lexis :
- la durée de référence se généralise via une variable absolue de nature quelconque ;
- la variation (temporelle) de la durée de référence depuis l’évènement-origine se généralise
via la variation de nature quelconque de la variable absolue par rapport à sa valeur à
l’évènement-origine
On passe ainsi résolument d’un diagramme montrant la variation temporelle d’une variable
temporelle à la variation de nature quelconque d’une variable de nature quelconque. Pour
construire un diagramme de Lexis, il suffit donc de disposer de la mesure non pas d’une
même variable temporelle à au moins deux moments différents, mais bien d’une même
variable en deux circonstances différentes.
Cette généralisation se reflète directement dans certaines expressions. Ainsi, la « valeur d’une
variable temporelle au moment de l’évènement » devient la « valeur d’une variable à l’évène-
ment ». Pour anodin qu’il puisse paraître, le changement dans l’expression le rend d’un
emploi général, non dépendant du caractère temporel de la variable absolue et de sa variation.
Cette généralisation dans la définition du cadre de référence trouve un prolongement dans le
concept d’évènement. La définition classique, qui suppose un changement qualitatif affectant
les individus, peut se généraliser dans une circonstance les affectant et pour laquelle les
coordonnées du cadre de référence choisi pour l’étude ont été enregistrées ; de la sorte, la
localisation sur un diagramme devient possible.
Ces généralisations du cadre de référence et de la notion de concept nous auront aussi poussé
à différencier la trajectoire d’un individu (ensemble des points qu’il peut fréquenter étant
donné la valeur de la variable absolue à l’évènement-origine) et son trajet (ensemble des
points qu’un individu a effectivement fréquentés sur sa trajectoire). Le caractère continu ou
non de la trajectoire dépend du caractère continu ou pas de la variable absolue. C’est la
variation de la variable absolue par rapport à l’évènement-origine qui détermine les
caractéristiques du trajet :
- si elle est toujours de même signe, le trajet sera unidirectionnel, mais bidirectionnel dans
le cas contraire ;
- si elle est continue, le trajet sera un extrait continu de la trajectoire ; si elle se produit par
sauts, le trajet sera constitué par les points disjoints effectivement fréquentés par
l’individu sur sa trajectoire ;
- si elle est réversible, le trajet pourra comporter des allers-retours sur la trajectoire.
Si les différences que nous venons de signaler ne perturbent pas l’élaboration du diagramme
de Lexis en tant que telle, ni son utilisation, il sera crucial d’en tenir compte au moment
d’élaborer le calcul de certains indices, comme on le verra dans le chapitre 4.
Chapitre 3. Généralisation du diagramme de Lexis 137
3.3.1. Introduction
Dans le point 3.2, nous avons montré, sur un plan essentiellement théorique, la possibilité de
construire des diagrammes de Lexis sans variable temporelle. Le point 3.3 aborde, pour sa
part, le volet pratique de l’utilisation effective de ce type de construction pour la localisation
de données réelles. Pour une question de disponibilité des données, un seul cas de cadre de
référence non temporel sera envisagé ; il portera sur la variation temporelle de variables non
temporelles, sans pouvoir atteindre, donc, un niveau de généralisation plus élevé qui porterait
sur la variation non temporelle d’une variable non temporelle. De manière spécifique, les
figures proposées porteront d’abord sur l’évolution de la taille et du poids des nourrissons
depuis la naissance, exemples de variation temporelle de variables non temporelles (point
3.3.2). Ensuite, un exemple de diagramme de Lexis qui s’ignore sera proposé, ce qui nous
ramènera dans le domaine des variations temporelles de variables temporelles, puisque cet
exemple portera sur l’espérance de vie à différents moments (point 3.3.3).
Les données proviennent de la Banque de Données médico-sociale (BDMS), base gérée par
l’Office de la Naissance et de l’Enfance de la Communauté française de Belgique (ONE)13.
Si l’ONE a mis sur pied la BDMS, c’est d’abord dans un double souci d’évaluation interne
pour apprécier les résultats de ses actions et d’orientation de ses futures politiques en faveur
de la petite enfance. Par ailleurs, les données de la BDMS sont mises à la disposition des
chercheurs, des acteurs en matière de santé et de toute autre personne intéressée par les
questions de santé de la petite enfance, moyennant une demande officielle adressée à l’ONE.
Les données sont récoltées initialement sur fiches standardisées par les Travailleurs médico-
sociaux (TMS), c’est-à-dire le personnel de l’ONE qui assure le travail de suivi des grossesses
et des naissances sur le terrain. La collecte peut comporter un maximum de quatre fiches pour
une naissance : un « Volet prénatal » ; un « Avis de naissance » ; un « Premier contact » et un
« Volet 0-1 an ». Le Volet prénatal est rempli pour les femmes qui se rendent aux
consultations prénatales organisées par l’ONE ; en 1999, ce premier volet a été rempli pour
19 % des naissances14. L’Avis de naissance est complété à la maternité ; ce volet a été rempli
pour 91 % des naissances en 1999. Le premier contact est proposé à toutes les mamans
connues de l’ONE. En 1999, 82 % ont accepté ce contact. Finalement, sur base volontaire, les
mamans peuvent bénéficier du suivi organisé par l’ONE via ses consultations de nourrissons
13
Pour une description de cette base de données et une analyse de contenu, cf. Office de la Naissance et de
l’Enfance (2000 et 2001). Nous nous sommes largement inspiré de cette publication pour la présentation
générale des données. L’extrait de la BDMS, que nous avons reçu dans le cadre d’une convention avec
l’ONE, ne comporte aucune information permettant d’identifier les personnes en cause, ce qui assure le
strict anonymat des données. Par ailleurs, il est à noter que le schéma de collecte décrit a été d’application
jusqu’en 2002. Depuis, un nouveau schéma a été adopté.
14
Office de la Naissance et de l’Enfance (2001), p. 12.
Chapitre 3. Généralisation du diagramme de Lexis 138
ou, selon les besoins, de visites à domicile. Pour tous les enfants vus au moins deux fois dans
ce circuit, un Volet 0-1 an est ouvert. Il sera complété soit au fur et à mesure des visites, soit à
la fin de l’observation. Ce dernier volet a été rempli pour 40 % des naissances en 199915.
Les données ainsi collectées sont rassemblées par les « Comités sub-régionaux » au nombre
de six (les cinq provinces wallonnes et la région de Bruxelles-Capitale ; la province de Liège
est amputée de la région germanophone). C’est à ce niveau que l’encodage est réalisé. Chaque
sub-région dispose donc d’une base indépendante et intégrant les renseignements collectés sur
les quatre fiches. Ces bases subrégionales sont regroupées à l’administration centrale de
l’ONE pour constituer la BDMS (gestion via SPSS). La qualité des données est contrôlée une
première fois lors de l’encodage et une deuxième fois à l’administration centrale de l’ONE.
Les données reçues de l’ONE portent sur les naissances des années 1994 à 2000, soit 116 309
enregistrements (liste des variables en annexe 3.2). Elles proviennent pour l’essentiel du Volet
0-1 an, éventuellement complétées par l’Avis de naissance. Le fichier était au format SPSS.
Le Volet 0-1 an indique la taille des enfants à la naissance et à leur sortie de l’observation.
Cette dernière se produit soit au premier anniversaire, qui correspond à la fin « normale » du
suivi, soit antérieurement à cet âge par décision de la mère d’arrêter le suivi organisé par
l’ONE avant l’échéance normale. L’évènement « sortie d’observation » pourra se localiser en
fonction de trois coordonnées en taille de l’enfant, à savoir sa taille au moment de
l’évènement et à la naissance ainsi que la variation de taille depuis la naissance. Ces trois
coordonnées formeront le cadre de référence de l’analyse ; comme elles se combinent
linéairement, les données à analyser pourront se localiser sur un diagramme de Lexis avec la
taille en tant que variable absolue (cf. figure 3.3).
La sortie d’observation est le seul évènement - avec la naissance - pour lequel la base indique
le poids et la taille16. Il n’est donc pas possible d’étudier un autre évènement que la sortie du
champ d’observation (par cohorte de taille à la naissance). En fait, cette étude portant sur la
sortie de l’observation est similaire à celle classique portant sur la mortalité : dans ce cas, le
diagramme de Lexis sert à localiser les sorties d’observation par décès. Par ailleurs, la
technique qui va être développée ici pourrait tout autant s’appliquer à d’autres évènements
(comme l’acquisition d’une capacité physique, la contraction d’une maladie, la perte du
premier hochet…) pour autant que la taille soit connue à ces évènements.
15
Le suivi des nourrissons s’opère donc sur une base volontaire. Or, il est possible qu’une sélection des
observations, notamment sur base de critères socio-économiques, s’opère à cette occasion. Il est donc
possible que les nourrissons dont le suivi est repris dans le fichier ne soient pas représentatifs de l’ensemble,
les enfants des classes favorisées étant sans doute sous-représentés. Toutefois, vu la nature des analyses qui
seront menées ci-après, il ne nous a pas semblé qu’il s’agissait là d’un point important à développer.
16
Le Dossier médical confidentiel, rempli lors de chaque consultation (hors structure ONE), offre des
possibilités intéressantes. Ce dossier sert à enregistrer une série d’évènements concernant la vie de l’enfant
jusqu’à l’âge de 7 ans, comme, par exemple, les changements de son régime alimentaire, l’acquisition d’une
série de capacités/facultés (contrôle de la tête ; maintien de la posture debout…), etc. Vu la structure du
dossier, il est possible de mettre en rapport ces évènements avec le suivi du poids, de la taille et du périmètre
céphalique (également repris sur le formulaire). Il serait donc possible de cohortiser l’étude de certains
évènements en fonction de ces trois variables. Nous n’avons pas eu accès à ces dossiers, dont les données ne
sont par ailleurs pas encodées et/ou centralisées.
Chapitre 3. Généralisation du diagramme de Lexis 139
La variation de taille depuis la naissance a été obtenue en retirant bien évidemment la valeur
initiale (à la naissance) de celle mesurée à la fin de l’observation. Ce calcul fournit une
variation qui correspondrait à un âge par différence de millésimes dans le cas classique. À
titre d’exemple, les individus mesurant respectivement 50 et 53 centimètres à la naissance et à
la fin de l’observation ont enregistré une variation de taille de 3 centimètres en différence de
tailles. Comme le montre la figure 3.9, cette variation recouvre en fait des gains de taille
allant de 2 à 4 centimètres exacts.
50 51 52 53 54 55
Cette figure permet aussi de comprendre pourquoi nous avons décidé de considérer les tailles
en centimètres révolus. En les considérant comme des tailles exactes, toutes les sorties
d’observation d’individus de taille de naissance 50 centimètres et de taille de sortie
d’observation égale à 53 centimètres se regrouperaient en un seul point de coordonnées 53 en
abscisse et 3 en ordonnée. Les observations se regrouperaient à chaque fois sur des
intersections de droites, le reste du graphique n’en comportant aucune.
Pour la taille finale, la limite inférieure a été fixée à 39 centimètres de façon à ne pas avoir de
taille finale inférieure à la taille initiale et la limite supérieure à 90 centimètres. Cette limite a
été choisie notamment parce que les cas deviennent très rares pour ces valeurs et surtout parce
17
On aurait aussi pu considérer que les données avaient été arrondies, mais cette option aurait compliqué
inutilement la suite des opérations, dont l’établissement des diagrammes de Lexis.
Chapitre 3. Généralisation du diagramme de Lexis 140
que la valeur 99 est une des façons (avec le 0) d’indiquer une donnée manquante ; certaines
valeurs dans la dizaine des 90 pourraient être en fait des données manquantes mal encodées.
Finalement, pour la variation de taille, seules les valeurs strictement supérieures à 0 ont été
18
retenues pour éviter le problème du premier triangle . L’application croisée de ces trois
critères laisse 82 523 observations qui se répartissent comme indiqué dans le tableau 3.3.a.
La cohorte de taille à la naissance la moins nombreuse compte 180 individus (40 centimètres),
et la plus nombreuse, 16 906 (50 centimètres). Les effectifs à chaque variation de taille ont été
divisés par l’effectif des cohortes concernées pour obtenir les évènements réduits. Ce sont ces
derniers, exprimés en « pour dix mille » qui serviront pour établir les diagrammes de Lexis
(cf. tableau 3.3.b).
18
Comme montré en annexe 3.5, il serait possible de travailler avec les triangles dans le cas des diagrammes
en taille, mais, outre le fait que le travail de préparation des données est beaucoup plus lourd, la
représentation des données n’est pas plus précise vu que, au départ, le calcul s’opère en différence de
« millésimes ». Le peu d’intérêt de la démarche dans la précision de la représentation des données comparé
à la lourdeur des opérations nous a amené à privilégier les diagrammes en différence de millésimes sans
premier triangle pour le cas de la taille.
Chapitre 3. Généralisation du diagramme de Lexis 141
19
Ce graphique – ainsi que tous les suivants – a été élaboré sur base du programme « Lexis », mis au point par
K. Andreev. Ce programme est d’accès libre (renseignements auprès de K. Andreev, adresse :
[email protected] ou auprès du Max Planck Institute for Demographic Research, adresse :
http://www.demogr.mpg.de/). La figure 3.10 a été construite sur base d’un tableau croisé SPSS montrant la
distribution des évènements en fonction de la cohorte de taille à la naissance et de la variation de taille à la
sortie de l’observation ; ce tableau croisé a été importé en Excel. Les évènements réduits calculés au départ
de ces données ont été arrangés adéquatement sur une feuille Excel qui a été ensuite sauvée au format TXT.
Moyennant quelques petits traitements, ce fichier TXT a été importé dans le logiciel Lexis.
Chapitre 3. Généralisation du diagramme de Lexis 142
montrent ces chiffres, le fait d’avoir rejeté les valeurs nulles avant le calcul des quartiles nous
a pratiquement donné des valeurs de quintiles sur les 688 valeurs initiales20 !
Figure 3.10. Taille à la fin de l’observation (en cm) – Tous sexes – Quartiles
(évènements réduits en pour dix mille)
44
40
394.87
Variation de taille depuis la naissance
30
52.63
20
25.11
10
0.00
40 50 60 70 80 90 99
20
On aurait donc pu préférer calculer directement des quintiles. Toutefois, dans le cas du poids (cf. point
suivant), l’application des quintiles aurait été plus délicate car la classe des valeurs nulles est trop
importante : à elle seule elle dépasse les 20 % des valeurs. Dans ce cas, la procédure suivie (rejet des valeurs
nulles avant calcul des quartiles) n’en est que plus indispensable.
Chapitre 3. Généralisation du diagramme de Lexis 143
Figure 3.11. Taille à la fin de l’observation (en cm) – Tous sexes (évè. réduits en pour dix mille)
44
40
1100
Variation de taille depuis la naissance
30
300
20
50
10
0
40 50 60 70 80 90 99
La systématique de la distribution des évènements réduits dans les différentes cohortes nous
semble mieux mise en évidence visuellement sur ce deuxième graphique, notamment à
l’intérieur des valeurs les plus fortes, initialement regroupées en une seule classe. Nous avons
21
privilégié ce critère visuel et adopté ces limites de classe pour les autres graphiques en taille .
La figure 3.11 montre que les données s’organisent sous l’influence principale de deux effets :
- un premier effet de variation de taille (qui se dénommerait « effet d’âge » dans la
configuration classique du diagramme de Lexis) : dans chacune des cohortes, la densité
des évènements varie en fonction du gain de taille depuis la naissance ; par ailleurs, la
dispersion des évènements épouse des schémas proches dans les différentes cohortes ;
- un deuxième effet de cohorte de taille à la naissance (dont la correspondance dans la
configuration classique est immédiate) : à mesure que la taille à la naissance augmente,
les évènements se localisent pour des gains de taille de plus en plus faibles22.
Les trois caractéristiques signalées (effet de variation de taille, même schéma dans les
différentes cohortes et effet de cohorte) peuvent être illustrées par quelques données
complémentaires (cf. tableau 3.4). La variation moyenne décroît de manière continue à
mesure que la taille à la naissance augmente : elle passe de 30,106 à 22,125 centimètres de la
cohorte de 40 à celle de 55 centimètres. Le mouvement est relativement régulier. Ces chiffres
attestent l’effet de cohorte : plus la taille à la naissance augmente, moins le gain de taille est
important. L’écart type est plutôt constant, passant d’un minimum de 4,049 pour la cohorte 55
21
Il est à noter que passer à d’autres limites de classe s’opère très rapidement ; il suffit de modifier l’échelle
sur le graphique et le logiciel Lexis exécute toutes les modifications nécessaires. Par ailleurs, nous aurions
pu décider de construire les diagrammes de Lexis en privilégiant d’autres couples de variables, mais, à notre
avis, la version de Brasche est la plus efficace (cf. annexe 3.6).
22
Cet effet pourrait être un effet de « régression sur la moyenne » ; à ce sujet, cf. annexe 3.4).
Chapitre 3. Généralisation du diagramme de Lexis 144
La figure 3.12 montre bien l’effet de la variation de taille sur la distribution (l’équivalent d’un
effet d’âge) ; en définitive, il s’agit tout simplement de la dispersion des observations autour
d’une valeur centrale. Pour les cohortes retenues, les courbes sont fort semblables ; elles se
décalent progressivement vers la gauche à mesure que la taille à la naissance augmente. En
définitive, ce graphique illustre bien à lui seul les trois caractéristiques signalées.
1200
800
400
0
0 10 20 30 40 50
Variation de taille depuis la naissance (en cm)
44 47 51 54
Les figures 3.11 et 3.12 poursuivent le même objectif : représenter la distribution des
évènements réduits par cohorte de taille à la naissance et par variation de taille. Dans le cas de
la figure 3.12, nous avons dû nous limiter à 4 cohortes ; en effet, à cause de l’enchevêtrement
des courbes, si le graphique en avait contenu plus, il serait devenu illisible, ou du moins
difficile à lire. Au contraire, la figure 3.11 reprend toutes les cohortes tout en mettant bien en
évidence les caractéristiques essentielles des distributions d’évènements. La différence vient
Chapitre 3. Généralisation du diagramme de Lexis 145
de ce que dans le diagramme de Lexis, un espace particulier est réservé à chacune des
cohortes, ce qui n’est pas le cas dans la figure 3.11. Sans vouloir en rien nier l’intérêt de la
figure 3.11, cette discussion tendrait à attribuer certaines qualités particulières à une
représentation de données de ce type en recourant à un diagramme de Lexis.
Les points qui vont suivre serviront à vérifier si le constat établi sur base de la figure 3.11
résiste à ces remarques.
Dans un premier temps, on a sélectionné les seules observations pour lesquelles la dernière
consultation a eu lieu approximativement au moment du premier anniversaire. Dans les
données initiales, pour beaucoup d’observations, la date de la dernière consultation n’a pas été
notée. En définitive, ce renseignement n’est disponible que pour les naissances des années
1999 et 2000. Par ailleurs, pour obtenir un nombre suffisant d’observations, il a été décidé
d’assimiler au premier anniversaire toutes les durées d’observation comprises entre 51 et 52
semaines, soit 5 369 cas.
Figure 3.13. Taille à un an (en cm) – Tous sexes (évènements réduits en pour dix mille)
44
40
1100
Variation de taille depuis la naissance
30
200
20
50
10
0
40 50 60 70 80 90 99
Comme le montre la figure 3.13, l’effet de cohorte reste bien visible : à mesure que la taille de
naissance augmente, la gain de taille dans la première année de vie diminue. L’effet de
variation de taille est moins net23, mais toujours bien présent. Le comportement des cohortes
semble moins homogène, mais il ne faut pas oublier ici les petits nombres en jeu (minimum :
cohorte de 40 centimètres, 14 cas ; maximum : cohorte de 50 centimètres, 1 085 cas).
La figure 3.13 se singularise par rapport à la figure 3.11 par le fait que la dispersion des
observations est moins importante : suite au contrôle de l’âge, elles se regroupent en grande
majorité dans une zone centrale précise. Quelques rares cas se situent à des valeurs très faibles
de variation de taille (8 observations pour une variation inférieure à 15 centimètres). Il s’agit
sans doute d’erreurs d’encodage pour la plupart.
Enfin, le comportement erratique des cohortes extrêmes est à mettre en relation avec leurs
(très) faibles effectifs, avec respectivement 14, 18, 27, 46 et 29 cas pour les cohortes de 40,
41, 42, 43 et 55 centimètres !
Des graphiques semblables à la figure 3.13 ont été établis pour des durées d’observation
d’une part de 47 et 48 semaines, et, d’autre part, de 49 et 50 semaines. Ces deux figures – non
proposées dans le texte – présentent les mêmes caractéristiques que la figure 3.13.
Il faut toutefois signaler un décalage logique vers des gains moyens de plus en plus élevés à
mesure que la durée d’observation augmente (avec grosso modo une augmentation de 0,25
24
centimètre par semaine d’observation en plus ; cf. tableau 3.5). Bref, le constat émis sur base
de la figure 3.11 n’est pas contredit quand la durée d’observation est contrôlée.
23
Un autre choix de limites de classe pourrait le rendre plus apparent ; cet autre choix pour les limites pourrait
aussi se justifier par une moins grande dispersion des évènements suite au contrôle de l’âge. Toutefois, nous
avons préféré conserver les mêmes limites pour l’ensemble des graphiques pour en assurer la comparabilité.
24
Ce rythme de croissance est conforme aux courbes standard proposées dans la littérature. À ce sujet, cf.
notamment R. Kuczmarski, C. Ogden, S. Guo et al. (2002) ; en p. 11, ces auteurs comparent notamment un
standard ancien (The 1977 NCHS Growth Charts) avec le nouveau qu’ils proposent (The 2000 CDC Growth
Curves). Un graphique comparant ces deux standards est proposé en p. 115 ; aucune différence notable ne
les oppose. On pourra aussi consulter à ce sujet les courbes utilisées en Belgique francophone dans D.
Lecleir (2003), pp. 72-73 ; il s’agit de courbes de croissance établies sur base d’un suivi longitudinal
d’enfants durant la période 1955-1972.
Chapitre 3. Généralisation du diagramme de Lexis 147
Figure 3.14. Taille à la fin de l’observation (en cm) – Sexes séparés (évènements réduits
en pour dix mille)
a. Sexe féminin
44
40
1100
Variation de taille depuis la naissance
30
300
20
50
10
0
40 50 60 70 80 90 99
b. Sexe masculin
44
40
1100
Variation de taille depuis la naissance
30
300
20
50
10
0
40 50 60 70 80 90 99
25
Pour 137 naissances, le sexe est inconnu.
Chapitre 3. Généralisation du diagramme de Lexis 148
La figure 3.15 propose la distribution des évènements réduits pour les durées de gestation de
36 (2 763 cas) et de 40 semaines (26 022 cas). Les mêmes tendances générales se dessinent.
Ainsi, à mesure que la taille à la naissance augmente, la variation de taille en fin
d’observation diminue. Il est à noter que les cohortes à comportement erratique se constatent
pour les valeurs élevées de taille à la naissance dans le cas des courtes durées de gestation
(avec en plus la première cohorte) et de valeurs faibles pour les longues durées. Cela
s’explique par le très faible nombre de cas dans ces cohortes : à 36 semaines, respectivement
5, 15, 6 et 2 observations pour les cohortes 40, 53, 54 et 55 centimètres et à 40 semaines, 19, 6
et 13, pour les cohortes 40, 41 et 42 centimètres.
Figure 3.15. Taille à la fin de l’observation (en cm) par durée de gestation (évènements
réduits en pour dix mille)
a. 36 semaines de durée de gestation
44
40
Variation de taille depuis la naissance (en cm)
1100
30
300
20
50
10
0
40 50 60 70 80 90 99
40
Variation de taille depuis la naissance (en cm)
1100
30
300
20
50
10
0
40 50 60 70 80 90 99
En résumé, cette analyse sur la variation de taille indique que les cohortes les plus grandes à
la naissance grandissent moins dans la première année de leur vie que les cohortes de plus
petite taille26. Avant de revenir sur ce sujet d’un point de vue plus théorique, il nous a paru
utile de montrer la distribution des évènements en prenant, cette fois, les variables en poids
comme cadre de référence.
Les poids à la naissance et en fin d’observation ont été exprimés en multiples de 5 grammes, à
de rares exceptions près, mais ils présentent une forte attraction pour les multiples de 10,
encore mieux marquée pour ceux de 50 ou 100 (cf. annexe 3.7). Malgré cela, pour les calculs,
nous avons considéré que les données étaient individuellement exactes et exprimées en
grammes exacts. La variation de poids depuis la naissance a été obtenue bien évidemment en
retirant la valeur à la naissance de celle à la fin de l’observation.
Pour éviter un trop grand nombre de cohortes, l’amplitude des cohortes a été fixée à 200
grammes pour le poids. En optant pour des cohortes de 200 grammes, la cohorte la plus
nombreuse (entre 3 200 et 3 400 grammes) compte un effectif de 19 927, soit le même ordre
de grandeur que dans le cas de la taille (pour rappel, la cohorte de 50 centimètres compte
22 496 observations).
Le poids final et la variation de poids ont aussi été regroupés par classes de 200 grammes.
Même si ce choix ne s’imposait pas, nous avons opté pour une représentation des données de
poids en fonction du poids de naissance et de la variation de poids depuis la naissance. De la
sorte, les données se distribuent dans des parallélogrammes reposant sur une base27. Ainsi, sur
la figure 3.16, le parallélogramme correspondant à une variation de poids comprise entre 400
et 600 grammes pour des individus de la cohorte 3000 à 3200 grammes à la naissance a été
mis en évidence.
26
Il est à noter que nous avons aussi produit des graphiques en contrôlant l’âge des mères (par groupes
quinquennaux), la parité, la situation par rapport au tabagisme. Le constat reste toujours le même, à quelques
détails près. Il n’a pas été jugé utile de tous les reproduire, d’autant que nous reviendrons sur cette question
dans le chapitre 4. Nous aurions voulu aussi croiser toutes ces caractéristiques, mais le contrôle d’une seule
à la fois nous a déjà confronté régulièrement au piège des petits nombres…
27
Dans le cas de la taille, le choix a été différent, mais surtout forcé vu la nature des données. Nous avons
préféré travailler ici entre valeurs exactes de la variation de poids. De toutes façons, le choix de
parallélogrammes sur pointe ou sur base ne change pratiquement rien à l’impression visuelle qui se dégage
d’une distribution (cf. annexe 3.8).
Chapitre 3. Généralisation du diagramme de Lexis 150
800
600
Variation :
400-600 gr
400
200
Pour la variation du poids, il a fallu inclure des valeurs négatives pour tenir compte de la perte
de poids suivant la naissance. Cette perte peut aller jusqu’à 10 % du poids initial avec une
moyenne de l’ordre de 6 %28). La cohorte au poids de naissance le plus élevé retenue va
jusqu’à 4 600 grammes. Le choix de la limite de – 800 pour la variation représente donc une
marge de sécurité. L’observation des effectifs aurait pu nous conduire à une autre limite
(– 600 grammes) et à considérer qu’au-delà il s’agissait d’erreur d’encodage. Par (excès de)
sécurité, nous avons conservé la limite de – 800 grammes. Finalement, les données ont été
filtrées selon les critères suivants :
- poids de naissances compris entre 2 000 et 4 600 grammes ;
- poids final compris entre 1 600 et 18 000 grammes ;
- variation de poids comprise entre – 800 et 16 000 grammes.
Ces différents choix ont été posés afin d’éviter de trop petits nombres (cf. tableau 3.6). Le
croisement des différents critères laisse 89 392 observations, réparties en 13 cohortes. Après
ce filtrage, la cohorte la plus nombreuse (3 200 à 3 400 grammes) compte 15 667
observations et la moins nombreuse (4 400 à 4 800), 522. Les effectifs à chaque variation de
poids ont été divisés par celui de la cohorte correspondante pour obtenir les évènements
réduits. À titre d’exemple, parmi les 3 017 individus de la cohorte 4 000 à 4 200 grammes, un
est sorti d’observation pour une variation comprise entre – 800 et – 600 grammes, ce qui
donne 3,31 pour dix mille en termes d’évènements réduits (soit 1/0,3017).
Un premier graphique a été établi sur la base des quartiles après retrait des valeurs nulles
(avec les limites suivantes : 0 ; 17,59 ; 41,81 et 284,12). Toutefois, afin de mieux mettre en
évidence ce qui se passe au centre de la distribution, nous avons opté, après différents essais,
pour d’autres limites (0 ; 25 ; 200 et 525). Celles-ci ont été adoptées définitivement pour tous
les graphiques en poids. Ce choix de limites est donc arbitraire ; toutefois, un autre choix ne
devrait pas remettre en cause les analyses qui seront faites.
28
Cf. D. Secker (1999), p. 3.
Chapitre 3. Généralisation du diagramme de Lexis 151
Avant de commenter la figure 3.17, il convient d’attirer l’attention sur l’axe des abscisses et
spécialement sur ses étiquettes. En effet, vu la présence de valeurs négatives de variation du
poids depuis la naissance, l’axe des ordonnées doit comporter des valeurs négatives (jusque
– 800 grammes). Toutefois, dans le programme « Lexis », nous n’avons pas trouvé la
possibilité de localiser l’échelle de l’axe horizontal ailleurs qu’à hauteur de l’extrémité
inférieure de l’axe des ordonnées, soit à – 800 grammes.
En conséquence, la valeur du poids à la naissance correspond à la valeur du poids (en tant que
variable absolue) augmentée de 800 grammes. Par exemple, à un poids (absolu) de 1 200
grammes correspond un poids de naissance de 2 000 grammes. L’indication « + 800 » n’a pas
été reproduite au-delà de 3 200 grammes de poids (absolu) étant donné qu’il n’y avait pas de
cohorte correspondant à l’étiquette suivante sur l’axe, soit 5 200 (la dernière cohorte prise en
compte dans le graphique est celle qui va de 4 400 à 4 600 grammes). Tous les graphiques en
poids seront construits selon ce principe.
La figure 3.17 montre l’équivalent d’un effet d’âge dans le diagramme classique : dans une
cohorte, la densité des évènements réduits varie en fonction de la variation de poids. De plus,
toutes les générations suivent un schéma de distribution très semblable. Au contraire des
diagrammes en taille, l’effet de cohorte est presque totalement absent : quelle que soit la
cohorte, c’est toujours pour approximativement la même gamme de variation de poids que les
fortes densités s’enregistrent ; toutefois, une légère tendance à la diminution du gain de poids
se dessine à mesure que le poids de naissance augmente.
Figure 3.17. Poids en fin de l’observation (en grammes) – Tous sexes (évènements
réduits en pour dix mille)
13800
12000
525
Variation de poids depuis la naissance
10000
8000 200
6000
25
4000
2000 0
-800
1200 (+800) 3200 (+800) 5200 7200 9200 11200 13200 15200 17200 18200
Le tableau 3.7 confirme bien ces constats : d’une part, la variation moyenne décline très
légèrement, mais régulièrement, quand le poids de naissance augmente ; par ailleurs, l’écart
type ne se modifie pratiquement pas d’une cohorte à l’autre.
Chapitre 3. Généralisation du diagramme de Lexis 153
La figure 3.18 montre aussi le peu de différence entre les distributions dans les différentes
cohortes retenues. La répartition par variation de poids suit le même schéma dans toutes les
cohortes ; aucun décalage notoire ne permet de bien distinguer les courbes. La situation est
donc bien différente de ce que nous avions constaté pour le diagramme en taille, où un effet
de cohorte était nettement visible.
600
300
0
-800 -< -600 2200 -< 2400 5200 -< 5400 8200 -< 8400 11200 -< 11400
2600 -< 2800 3000 -< 3200 3400 -< 3600 3800 -< 4000
Comme signalé pour les diagrammes en taille, les figures 3.17 et 3.18 poursuivent le même
objectif : représenter la densité des évènements réduits par cohortes et par variation de poids.
Il est à noter ici que la figure 3.18 ne laisse pas deviner le petit effet de cohorte alors que le
diagramme de Lexis le laisse entrevoir. Outre une meilleure individualisation des cohortes
(pas de croisement des courbes), ce dernier permettrait donc de mieux voir les choses. Il s’agit
incontestablement d’une qualité en faveur de ce type de graphique.
Comme le montre la figure 3.19, cette description reste valable en contrôlant l’âge à la fin de
l’observation (sélection des âges de 51 et 52 semaines, soit 5 798 cas). Le même constat
s’impose en cas de contrôle de l’âge des mères, de la durée de gestation, de la parité ou de la
situation de la mère par rapport au tabagisme (les figures y correspondant n’ont pas été
Chapitre 3. Généralisation du diagramme de Lexis 154
reproduites ici). Bref, le constat concernant l’effet de variation non accompagné d’un effet de
29
cohorte marqué résiste à des analyses plus précises .
Figure 3.19. Poids à un an (en grammes) – Tous sexes (évè. réduits en pour dix mille)
13800
12000
525
Variation de poids depuis la naissance
10000
8000 200
6000
25
4000
2000 0
-800
1200 (+800) 3200 (+800) 5200 7200 9200 11200 13200 15200 17200 18200
Les deux points précédents ont établi que la répartition des évènements réduits subissait
l’équivalent d’un effet d’âge aussi bien dans le cas de la taille que dans celui du poids ; par
contre, si un effet de cohorte apparaît clairement sur les diagrammes en taille, ceux en poids
30
n’en montrent – pratiquement – pas . Comment rendre compte de ces caractéristiques ?
La croissance en taille ou en poids des nourrissons dépend d’un grand nombre de facteurs
aléatoires de natures diverses concernant aussi bien des caractéristiques individuelles (une
tendance, éventuellement en partie génétique, à être plus ou moins gros ou grand) que
d’autres « environnementales » liées aux conditions de vie (comme le régime alimentaire, par
exemple31). Dans ces circonstances, il n’est pas étonnant que, au sein des cohortes, le gain de
poids ou de taille se distribue avec une certaine variabilité autour d’une valeur centrale.
L’effet « d’âge », présent aussi bien dans les diagrammes en taille qu’en poids, traduit
simplement cette variabilité. Il est à noter que cet effet se retrouve dans toutes les cohortes ; il
est donc indépendant de la valeur de la variable de référence à la naissance.
L’effet de cohorte trouvé dans le cas de la taille porte donc uniquement sur une différence de
tendance centrale : à mesure que la taille à la naissance augmente, la variation centrale de
taille s’amenuise. Du côté du poids, rien de semblable n’apparaît. Nous reviendrons plus loin
sur ce constat.
29
Les graphiques en poids et en taille ne reprennent pas exactement les mêmes observations suite aux
filtrages. Des graphiques ont été exécutés sur les données doublement filtrées. Les conclusions demeurent.
30
Ce constat se retrouve dans certaines recherches sur le sujet. À ce sujet, cf. notamment A. Lartay et al.
(2000), p. 45 où il est montré que la vitesse de croissance en taille entre 1 et 6 mois est négativement
corrélée avec la taille à 1 mois alors que du côté du poids, on ne retrouve pas cette corrélation.
31
À ce sujet, cf. notamment D. Secker (1999), p. 4.
Chapitre 3. Généralisation du diagramme de Lexis 155
Dans une partie précédente de ce texte (cf. point 2.3), nous avons montré que, si le diagramme
de Lexis est bien un diagramme cartésien, il n’en présente pas moins des particularités qui
débouchent sur la possibilité de cohortiser les phénomènes pour les mesurer. Dans la
littérature, on peut rencontrer des diagrammes cartésiens qui en fait mériteraient d’être
qualifiés « de Lexis » sans que la cohortisation ne soit mise à profit, ce qui pourrait, le cas
échéant, améliorer la qualité de certaines mesures (cf. le point 5.5).
Dans ce point, nous allons partir de figures extraites de la publication suivante : Caselli G.,
Meslé F. et Vallin J., Les entorses au schéma de la transition épidémiologique.
Communication présentée à la séance 18 : « Nouvelles menaces sanitaires », du Congrès
international de la population. Salvador. Brésil. Août 2002, Rome/Paris, 44 p. En fait, les
figures reprises ci-après ont été légèrement modifiées par rapport aux figures originales sans
que cela ne remette en cause le raisonnement qui sera suivi.
10
0
-10
0 20 40 60 80
e(0) en 50-55
60
40
20
0
0 20 40 60 80 100
e(0) en 95-00
32
La figure originale (figure 3 en p. 7 de la publication de G. Caselli et al. (2002)) diffère par le fait que le
gain d’espérance de vie portait sur la période allant de 1950-1955 à 1970-1975.
33
La figure originale (la figure 14 en p. 19 de la publication de G. Caselli et al. (2002)) reprenait les
espérances de vie en 1965 sur l’axe des abscisses et en 1995 sur l’axe des ordonnées. Nous avons mis en
abscisses les données les plus récentes et non les plus anciennes ; on comprendra par la suite la raison de
cette inversion.
Chapitre 3. Généralisation du diagramme de Lexis 156
Pour montrer que ces deux dernières figures méritent le qualificatif « de Lexis », nous allons
en proposer… une troisième reprenant le même ensemble de données. Dans cette figure,
l’espérance de vie jouera le rôle dévolu classiquement au temps, l’espérance de vie en 1950-
1955, celui du moment de naissance et le gain d’espérance depuis 1950-1955, celui de l’âge
(cf. figure 3.22).
Sur ce diagramme, une trajectoire a été ajoutée ; elle montre l’évolution du gain d’espérance
de vie en fonction de l’espérance de vie pour une espérance de vie en 1950-1955 donnée
(expression équivalente à celle d’application dans le diagramme de Lexis classique : évolution
de l’âge en fonction du temps pour un moment de naissance donné). Un seul point de cette
trajectoire suffit pour la déterminer dans son ensemble. Autrement dit, ce type de trajectoire
est comparable à une ligne de vie classique.
Comment dans ce contexte définir une cohorte ? Une cohorte regroupera des trajectoires
présentant une gamme de valeurs voisines pour leur espérance de vie en 1950-1955, par
exemple, l’ensemble des trajectoires pour lesquelles cette espérance variait entre 45 et 50 ans.
La figure 3.23 a été élaborée selon cette méthode de construction ; les diagonales y délimitent
des cohortes quinquennales d’espérance de vie en 1950-1955.
35
30
25
20
gain
15
10
-5
30 40 50 60 70 80 90
Espérance de vie et espérance en 50-55
Quel est l’évènement matérialisé par les points de la figure 3.23 ? En fait, ces points
permettent de connaître pour chaque pays à la fois l’espérance de vie en 1995-2000 en
dessinant une verticale jusqu’à l’axe horizontal ; le gain d’espérance de vie entre 1950-1955
et 1995-2000 en traçant une horizontale jusqu’à l’axe vertical et finalement l’espérance de vie
en 1950-1955 en traçant une diagonale jusqu’à l’horizontale en face d’un gain nul. Un point
représente donc la période 1995-2000 pour une unité d’observation34.
Attention, l’axe horizontal est bien dévolu à l’espérance de vie (et non à l’espérance de vie en
1995-2000) ; l’espérance de vie joue le rôle de variable « absolue » telle que définie sous le
tableau 3.1. L’on pourrait être tenté d’en rester à la dénomination « espérance de vie en 1995-
2000 » pour cet axe, mais cela équivaudrait, dans un diagramme de Lexis classique, à baptiser
l’axe horizontal « moment du mariage » si les points sur le diagramme devaient représenter
cet évènement.
Insistons, la situation décrite par la figure 3.23 est comparable à un diagramme de Lexis
classique où les points représenteraient, par exemple, le décès des individus ou leur premier
mariage : par une verticale, on connaîtra la date de l’évènement ; par une horizontale, leur âge
à l’évènement et par une oblique, leur date de naissance. À notre avis, ceci suggère que le
graphique 3.23 est un diagramme de Lexis, illustrant une analyse avec un cadre de référence
en espérance de vie.
Espérance
Espérance en
1950-1955
Gain
Qu’en est-il des figures 3.20 et 21 ? Il s’agit aussi de diagrammes de Lexis. En fait, la figure
3.20, correspond à un diagramme de Lexis tel que présenté au point 2.3.4.1, avec des
trajectoires (et donc des cohortes) en position verticale et une coordonnée parasite (la valeur
de l’espérance de vie) se matérialisant par des obliques décroissantes (cf. figure 3.24.a). Pour
sa part, la figure 3.21 peut s’assimiler à un diagramme de Lexis tel que présenté au point
2.3.4.2, avec des trajectoires (et donc des cohortes) en position horizontale et une coordonnée
parasite (le gain d’espérance de vie) se matérialisant par des obliques croissantes (cf. figure
3.24.b).
En fait, tout graphique mettant en relation des données individuelles d’une même variable à
deux moments différents constitue un diagramme de Lexis, qui éventuellement s’ignore. Pour
s’en rendre compte, il suffit de faire émerger, moyennant quelques calculs intermédiaires, la
variable absolue (qui remplacera le temps du diagramme de Lexis classique), la valeur de
cette variable à l’évènement-origine (qui remplacera le moment de naissance) et le gain en
termes de cette variable par rapport à sa valeur à l’évènement-origine (qui remplacera l’âge).
34
Pour l’interprétation des trajectoires forcées et des points, cf. annexe 3.9 ou le point 3.2.4.
Chapitre 3. Généralisation du diagramme de Lexis 158
3.3.4. Conclusions
Le point 3.3 a été consacré à l’utilisation de diagrammes de Lexis avec des données
inhabituelles. Par défaut d’autres possibilités, la généralisation s’est limitée à la représentation
d’évènements classés en fonction de variables certes non temporelles, mais dont les variations
prises en compte étaient, elles, bien temporelles : le poids ou la taille des nourrissons ont été
enregistrés au moment de la naissance et au moment de la fin d’observation, avec une
variation mesurée entre ces deux moments.
Les diagrammes proposés portent sur l’évènement que constitue la sortie d’observation, le
seul avec la naissance pour lequel les données nécessaires sont connues. Si le poids ou la
taille étaient également enregistrés à d’autres évènements (comme l’acquisition d’une
capacité, la contraction d’une maladie, la perte de la première dent, le premier anniversaire, la
perte du premier hochet…), des diagrammes construits selon les mêmes principes pourraient
en montrer la distribution, ce qui pourrait en retour augmenter sensiblement la portée pratique
de l’ouverture du diagramme de Lexis au monde des variables non strictement temporelles.
Les diagrammes en taille et en poids proposés ont mis en évidence des effets de la variation
de la variable absolue (désignés par « effets d’âge » dans le diagramme classique) ainsi que,
surtout dans le cas de la taille, des effets de cohorte (sans changement d’appellation, donc, par
rapport à la situation classique).
Les premiers effets montrent simplement que, au sein des cohortes, les évènements se
dispersent autour d’une valeur centrale ; les seconds révèlent pour leur part que les cohortes
adoptent, selon leur état initial, des comportements en matière de croissance nettement mieux
différenciés en matière de taille qu’en matière de poids.
Dans un dernier point, nous avons montré que certaines figures sont en fait des diagrammes
de Lexis. Il en va ainsi chaque fois qu’un graphique vise à mettre en relation les valeurs d’une
même variable à deux dates différentes. Dans un tel contexte, les conditions mathématiques
de l’établissement d’un diagramme de Lexis sont réunies (trois variables formant une
combinaison linéaire ; une des trois invariable pour chaque unité d’observation).
Chapitre 3. Généralisation du diagramme de Lexis 159
Initialement conçu pour figurer des variations temporelles de variables temporelles, il a été
montré que le diagramme de Lexis pouvait très bien s’adapter à un environnement constitué
de variations de type quelconque d’une variable de nature quelconque. En définitive, pour
construire une figure ayant les caractéristiques d’un diagramme de Lexis, il suffit de disposer
de la mesure d’une même variable en deux circonstances différentes. La variable en cause
joue le rôle classiquement dévolu au temps ; la valeur de cette variable à l’une des
circonstances, celui du moment de naissance et sa variation entre les deux circonstances, celui
de l’âge, l’évènement étudié étant la « deuxième » circonstance.
Au-delà de la simple construction d’un diagramme de Lexis avec variables non temporelles,
la généralisation a aussi porté sur son utilisation effective. À l’aide d’exemples portant sur la
taille et le poids des nourrissons, nous avons montré l’intérêt de diagrammes de Lexis pour
montrer la distribution d’évènements même en cas de cadre de référence non temporel.
L’équivalent d’effets d’âge et de cohorte a pu être mis en évidence. Par ailleurs, il a aussi été
montré que certains graphiques sont en fait des diagrammes de Lexis qui s’ignorent.
Bref, ce chapitre a montré non seulement qu’il était possible d’élaborer sur le plan théorique
des diagrammes de Lexis sur la base de variables de nature quelconque, mais en plus que de
telles constructions pouvaient se révéler utiles pour représenter d’une manière originale de
grandes masses de données et d’y faire apparaître des régularités potentiellement
significatives dans l’analyse des phénomènes.
Ces points étant bien établis, le chapitre suivant abordera la généralisation des techniques
d’analyse des démographes, à savoir, selon l’appellation proposée dans le premier chapitre, la
cohortisation.