UNIVERSITE JOSEPH-KI-ZERBO
INSTITU SUPERIEUR DES SCIENCES
DE LA POPULATION
LICENCE PROFESSIONNELLE EN
ANALYSE STATISTIQUE
Exposé : Logit et probit multivarié
Membres du Groupe :
Enseignant :
LAPAS 2 YAMEOGO Madihatou
Dr Israël
KONANE Ilyassa
Sawadogo
NANA Hervé
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
Table des matières
Introduction .................................................................................................................... 2
I) Motivation pour l'utilisation de modèles multivariés ............................................................. 2
II) Spécification et méthodes d’estimation des modèles ............................................................. 2
1) Logit multivarié ................................................................................................... 2
a) Spécification du modèle................................................................................................... 2
b) Estimation des paramètres .............................................................................................. 4
i. Méthode de maximum de vraisemblance .................................................... 4
ii. Probabilité conditionnelle composite ......................................................... 5
III) Probit multivarié .................................................................................................................. 6
1) Spécification(formalisation) du modèle.............................................................. 6
2) Méthodes d'estimation des modèles probit ......................................................... 7
a) Estimateur du maximum de vraisemblance simulé......................................................... 7
b) Estimateur bayésien ........................................................................................................ 9
IV) Limites des deux modèles ................................................................................................... 9
V) Domaines d’application ......................................................................................................... 10
Conclusion .................................................................................................................... 10
10/08/2024 Page 1 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
Introduction
Le modèle logit et le modèle probit sont deux types de modèles statistiques utilisés
pour analyser les données binaires ou ordinales. Ils sont souvent utilisés pour estimer
les probabilités de défaut ou de réussite dans des contextes tels que la finance, la santé,
ou les sciences sociales. La régression logistique multivariée est une extension de la
régression logistique simple pour les variables qualitatives à plusieurs modalités (plus
de deux). Le probit multivarié est aussi une extension de probit simple. Les modèles
logit et probit multivariés permettent de modéliser des événements qui peuvent
prendre plusieurs valeurs alternatives, comme par exemple les préférences de
consommation, les choix de vote, etc.
I) Motivation pour l'utilisation de modèles multivariés
Les modèles logit et probit multivariés permettent d'analyser les choix multiples (ou
simultanés) effectués par des individus lors d'une même décision. Contrairement aux
modèles logit et probit simples qui ne permettent d'étudier qu'un seul choix binaire
(par exemple, acheter ou ne pas acheter), les modèles multivariés peuvent prendre en
compte plusieurs choix simultanés (par exemple, acheter le produit A, le produit B, ou
ne rien acheter).Ils permettent de relâcher l’hypothèse contraignante faite dans les
modèles multinomial Logit et Probit selon laquelle la maximisation de l’utilité passe
par un choix unique .Ils relâchent l’hypothèse du choix unique (comme dans les
modèles multinomiaux Logit et Probit) et sont utiles pour explorer la dynamique
concurrentielle (recherche de variété, complémentarité, substituabilité) dans une
catégorie
II) Spécification et méthodes d’estimation des modèles
1) Logit multivarié
a) Spécification du modèle
10/08/2024 Page 2 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
En principe le logit multivarié utilise la fonction logit. Avec celle-ci, la probabilité
d’appartenance à une catégorie est modélisée par une fonction logistique, ce qui
permet de relier cette probabilité à une combinaison linéaire des variables explicatives.
Dans cette section, nous discutons de la spécification du modèle MVL. Nous utilisons
la spécification comme introduit par Cox (1972) et mis en œuvre par Russell et
Petersen (2000). Suivant Russell, nous laissons Yi désigner la variable aléatoire à K
dimensions décrivant l'ensemble conjoint de choix pour le individu i=1,…, N défini
comme Yi = {Yi1 , . . . , YiK },où Yik désigne le kème choix binaire pour l'individu i, pour
k = 1, . . . , K.
L'ensemble des réalisations possibles de Yi est appelé S qui contient 2K éléments. On
peut immédiatement voir que le nombre de réalisations possibles augmente de façon
exponentielle avec le nombre de choix binaires K. Les choix en Yi peuvent être
corrélés. Pour décrire ces dépendances, Russell et Petersen (2000) spécifient les
probabilités conditionnelles de la kième variable aléatoire Yik étant donné tous les
autres choix, c'est-à-dire yil pour l ≠ 𝑘.Ces probabilités conditionnelles sont une
fonction Logit des caractéristiques individuelles Xi, paramètres du modèle α, β et ψ, et
𝑦𝑖𝑙 , c'est-à-dire,
𝑒𝑥𝑝(𝑍𝑖𝑘 )
𝑃𝑟[𝑌𝑖𝑘 = 1|𝑦𝑖𝑙 , . . . , 𝑦𝑖𝑘−1 , 𝑦𝑖𝑘+1 , . . . , 𝑦𝑖𝐾 , 𝑋𝑖 ] = (1)
1 + 𝑒𝑥𝑝(𝑍𝑖𝑘 )
Avec 𝑍𝑖𝑘 = 𝛼𝑘 + 𝑋𝑖 𝛽𝑘 + ∑l ≠𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 (2)
Où 𝑦𝑖𝑙 est la réalisation de 𝑌𝑖𝑙 , 𝛼𝑘 sont des interceptions spécifiques alternatives, Xi est
un vecteur (1×p) de variables explicatives avec le vecteur de paramètre correspondant
𝛽𝑘 , et où 𝜓𝑘𝑙 sont des paramètres d'association. Les paramètres d'association capturent
la corrélation entre 𝑌𝑖𝑘 , et 𝑌𝑖𝑙 , pour l ≠ 𝑘.
L'indépendance conditionnelle entre 𝑌𝑖𝑘 et 𝑌𝑖𝑙 , se produit lorsque 𝜓𝑘𝑙 = [Link] nous
ne pouvons considérer que les corrélations et aucun impact causal, nous devons
imposer 𝜓𝑘𝑙 = 𝜓𝑙𝑘 pour la symétrie, voir aussi Russell et Petersen (2000). Le modèle
peut être étendu en incluant des variables explicatives qui diffèrent d'un individu à
l'autre et les différents choix binaires. Une telle extension est simple, mais pour
simplifier la notation, nous n'incluons pas de telles variables ici. En utilisant les
résultats de Besag (1974), la distribution conjointe de Yi découle directement de
l'ensemble complet des distributions conditionnelles. Russell et Petersen (2000)
montrent que les distributions conditionnelles en (1) impliquent une spécification
MNL pour la distribution conjointe de Yi, c'est-à-dire :
𝑒𝑥𝑝(𝜇𝑦𝑖 )
𝑃𝑟 [𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] = (3)
∑𝑠𝑖 ∈𝑆 𝑒𝑥𝑝(𝜇𝑠𝑖 )
10/08/2024 Page 3 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
Où 𝑦𝑖 est une réalisation possible à partir de l'espace de résultat S et où 𝜇𝑦𝑖 est défini
comme
𝐾
𝜇𝑦𝑖 = ∑ 𝑦𝑖𝑘 (𝛼𝑘 + 𝑋𝑖 𝛽𝑘 ) + ∑ 𝑦𝑖𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 . (4)
𝑘=1 𝑙>𝑘
Par conséquent, les paramètres αk et βk n'apparaissent que dans le numérateur de la
fonction de probabilité pour 𝑦𝑖𝑘 = 1. De plus, le paramètre d'association ψkl ne se
produit que dans le numérateur lorsque 𝑦𝑖𝐾 = 1 et 𝑦𝑖𝑙 = [Link] que cela implique
que toutes les paires devraient apparaître dans les données disponibles pour pouvoir
estimer ces paramètres d'association.
L'interprétation de l'impact des paramètres d'interception et de Xi découle du rapport
de cotes logarithmiques
𝐾
𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ]
𝑙𝑜𝑔 ( ) = ∑ 𝑦𝑖𝑘 (𝛼𝑘 + 𝑋𝑖 𝛽𝑘 ) + ∑ 𝑦𝑖𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 . (5)
𝑃𝑟[𝑌𝑖 = (0, … ,0)|𝑋𝑖 ]
𝑘=1 𝑙>𝑘
Où nous utilisons ce 𝜇(0,…,0) = 0 pour l'identification. De toute évidence, le rapport
de cotes est égal à 𝜇𝑦𝑖 tel que défini en (4) et fournit la probabilité d'observer 𝑦𝑖 par
rapport à l'ensemble de base des choix où tous les choix sont 0.
Le paramètre d'association 𝜓𝑘𝑙 est en théorie un paramètre non limité et ne
représente donc pas directement une corrélation. Cependant, les ratios de cotes
logarithmiques donnent une interprétation directe de ces paramètres d'association.
C'est-à-dire qu'il est facile de montrer que
𝑃𝑟[𝑌𝑖 =(0,…,0,𝑦𝑘 =1,0,…,0,𝑦𝑙 =1,0,…,0)|𝑋𝑖 ]∗𝑃𝑟[𝑌𝑖 =(0,…,0)|𝑋𝑖 ]
𝐿𝑜𝑔 ( )=𝜓𝑘𝑙 (6)
𝑃𝑟⌈𝑌𝑖 =(0,…,0,𝑦𝑘 =1,0,…,0)|𝑋𝑖 ⌉∗𝑃𝑟[𝑌𝑖 =(0,…,0,𝑦𝑙 =1,0,…,0)|𝑋𝑖 ]
Un 𝜓𝑘𝑙 positif implique donc que les choix k et l se déplacent plus souvent
ensemble que séparés.
b) Estimation des paramètres
Il y a 4 méthodes d’estimation des paramètres du modèle, mais dans
Cette section nous allons proposer deux méthodes d'estimation pour la spécification
du modèle MVL. La première approche est une procédure standard d'estimation de
l'apprentissage automatique. Cette approche, cependant, est computationnelle
impossible lorsque le nombre de choix K est important.
i. Méthode de maximum de vraisemblance
La première méthode d'estimation suit directement Russell et Petersen (2000). Pour
estimer les paramètres du modèle, ils suggèrent d'utiliser les probabilités conjointes
10/08/2024 Page 4 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
en (3). C'est-à-dire que Russell et Petersen (2000) utilisent la spécification MNL
sur l'espace de résultat complet S qui se traduit par la fonction de vraisemblance
logarithmique
𝑁
𝑙𝑟 (𝜃; 𝑦) = ∑ 𝑙𝑜𝑔𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] , (7)
𝑖=1
Où les probabilités conjointes 𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] sont données en (3). En outre, θ
résume tous les paramètres du modèle. Pour faire la distinction entre les différentes
méthodes, nous ajoutons le r en exposant à la fonction de vraisemblance. Les
erreurs standard de l'estimateur peuvent être obtenues de la même manière que
pour les modèles MNL standard.
Cette approche d'estimation est très appropriée lorsque le nombre de choix K est
faible. Cependant, le nombre d'alternatives S augmente de façon exponentielle avec
K. Par exemple, 10 choix binaires conduisent déjà à 210 = 1024 ressorts potentiels
de Yi. Cela conduit à de très petites probabilités en (3) et à la somme de nombreux
termes dans le dénominateur, ce qui peut à la fois conduire à des problèmes de
calcul. En outre, le temps de calcul des probabilités et donc la fonction de
vraisemblance logique augmentera rapidement avec le nombre de choix. Le facteur
dominant dans le temps passé à calculer la fonction de vraisemblance
logarithmique pour une seule observation en (7) est la somme sur les exposants, qui
a l'ordre de complexité 2K . Nous proposons ensuite une nouvelle méthode
d'estimation alternatives qui évite le calcul de toutes les probabilités conjointes.
ii. Probabilité conditionnelle composite
Compte tenu de la structure du modèle MVL, il est possible d'utiliser CCL
(Lindsay, 1988) pour l'estimation des paramètres. Lorsque la méthode de Russell et
Petersen (2000) écrit le modèle MVL comme une spécification Logit multinomiale
sur un grand espace de résultats, la représentation CCL utilise les probabilités
conditionnelles dans (1) comme des choix distincts, néanmoins corrélés.
Après Molenberghs et Verbeke (2005, chapitre 12), les probabilités conditionnelles
dans (1) conduisent à la fonction log composite de vraisemblance pour le modèle
MVL, c'est-à-dire,
𝑁 𝑁 𝐾
𝐿𝑐 (𝜃; 𝑦) = ∑ 𝑙𝑐 (𝜃; 𝑦𝑖 ) = ∑ ∑ 𝑙𝑐 (𝜃; 𝑦𝑖𝑘 )
𝑖=1 𝑖=1 𝑘=1
= ∑𝑁 𝐾
𝑖=1 ∑𝑘=1 𝐿𝑜𝑔𝑃𝑟 [𝑌𝑖𝑘 = 𝑦𝑖𝑘 |𝑦𝑖𝑙 𝑝𝑜𝑢𝑟 𝑙 ≠ 𝑘, 𝑋𝑖 ] (11)
Où le superscript c signifie CCL. L'estimateur θˆ qui découle de la maximisation (11)
Bien que le CCL ne corresponde pas à la bonne fonction de vraisemblance, il prend
néanmoins en compte les dépendances du modèle MVL. L’avantage par rapport à la
10/08/2024 Page 5 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
représentation multinomiale complète dans (3) est que CCL évite la grande sommation
au dénominateur. L'ordre de complexité d'une contribution de vraisemblance est
encore réduit à K en raison de la séparation des choix conditionnels. Il est donc
possible de calculer le CCL même lorsqu’il existe un grand nombre de choix.
Néanmoins, puisque l’on utilise la fonction composite au lieu de la fonction de
vraisemblance vraie, l’estimateur n’est pas efficace.
III) Probit multivarié
Le modèle probit multivarié est un modèle à m équations où chaque variable dépendante
représente un choix ou un état discret. Ce type de modèle permet d’étudier par exemple
la possession de m biens durables de façon simultanée ou la possession d'un bien durable
sur m périodes différentes. On suppose que les valeurs des variables dépendantes sont
la représentation discrète d'une variable continue sous-jacente non observée appelée
variable latente. Dans le cas d'un bien durable, la variable latente représenterait l'utilité
supplémentaire procurée par la possession d'un bien durable quelconque.
1) Spécification(formalisation) du modèle
Soit 𝑌𝑖 = (𝑦𝑖1 , 𝑦𝑖2 , . . . , 𝑦𝑖𝑚 ) 𝑒𝑡 𝑤𝑖 = (𝑤𝑖1 , 𝑤𝑖2 , . . . , 𝑤𝑖𝑚 ) les vecteurs de
dimensions m des réponses discrètes observées et des variables latentes non observées
d’un individu i = 1, ... , n. Soit Xi la matrice m x k des variables explicatives et β le
vecteur k x 1 des coefficients de régression. Le modèle probit multivarié peut s'écrire
de la façon suivante : 𝑤𝑖 = 𝑋𝑖 β+𝜀𝑖 i=1, .. . ,n
1 𝑠𝑖 𝑤𝑖𝑗 ≥0
𝑦𝑖𝑗 = {0 𝑠𝑖 𝑤
𝑖𝑗 <0
j=1, ... ,m
Dans ce modèle, le vecteur des termes d'erreur 𝜀𝑖 = ( 𝜀 𝑖1 , 𝜀𝑖2 , . . . , 𝜀𝑖𝑚 ) suit une
distribution normale multivariée avec moyennes zéro et la matrice de corrélation R.
Contrairement au modèle SURE (seemingly unrelated regression equation), le
modèle probit multivarié doit être contrainte pour permettre l’identification. Pour
comprendre le problème d’identification, multiplions le modèle par la matrice
λw𝑖 = λX 𝑖 𝛽 + λε𝑖
𝛼1 0 … 0
0 𝛼2 :
λε𝑖 ~𝑁𝑚 (0, λRλ). λ=[ ]
⋮ ⋱ ⋮
0 ⋯ 𝛼𝑚
Nous voyons que les paramètres {𝛼1 , 𝛼2 ,••• , 𝛼𝑚 } ne sont pas identifiables, car quelle
que soit leurs valeurs, ils ne permettent pas de modifier le signe de la variable latente
et par conséquent :
10/08/2024 Page 6 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
𝛾𝑖 (𝑤𝑖 ) = 𝛾𝑖 (λw𝑖 ).
Les choix du vecteur Yi sont les mêmes pour tous les modèles. Il n'y a donc aucune
information dans les données qui nous permettrait d'estimer simultanément les
paramètres β et la variance du terme d'erreur. Pour cette raison, on choisit de
contraindre la matrice de variances-covariances à une matrice de corrélation.
Les hypothèses du modèle probit multivarié supposent que les facteurs non
observables 𝜀𝑖 = [ 𝜀𝑖1 , 𝜀𝑖2 , 𝜀𝑖3 • • • 𝜀𝑖𝑚 ] sont distribués conjointement selon une
normale multivariée :
1 1
𝜑𝑚 (𝜀𝑖 ) = 𝑚 ⁄ 2 1⁄ 2
𝑒 2 𝜀𝑖′ 𝑅−1 𝜀𝑖
(2𝜋) |𝑅 |
Sous cette hypothèse, la probabilité d'observer 𝑦𝑖 = 𝑌𝑖 est égale à :
. .
𝑝(𝑦𝑖 = 𝑌𝑖 ⁄𝑋𝑖 , 𝛽, 𝑅) = ∫𝐴 … ∫𝐴 𝜑𝑚 (𝑤𝑖 ⁄𝑋𝑖 ,β,R)d𝑤𝑖1 … 𝑑𝑤𝑖𝑚
𝑖𝑚 𝑖1
Dans cette équation, 𝐴𝑖𝑗 prend une valeur comprise entre ]0,+oo[si 𝑦𝑖𝑗 = 1 et une valeur
comprise entre –oo et 0 sinon. Étant donné qu'il n'existe pas de solution analytique
pour cette expression, nous devons utiliser des méthodes numériques pour approximer
cette probabilité.
2) Méthodes d'estimation des modèles probit
a) Estimateur du maximum de vraisemblance simulé
Les modèles probits multivariés sont très difficiles à estimer par maximum de
vraisemblance car il n'existe pas de forme analytique à la fonction de vraisemblance.
Pour estimer ce modèle, il est nécessaire d’approximer la fonction de vraisemblance
Pour présenter cette méthode, considérons un modèle probit trivarié et imaginons que
nous observons pour un individu i les choix 𝑌𝑖 = (𝑦𝑖1 = 1, 𝑦𝑖2 = 1, 𝑦𝑖3 = 1). La
probabilité d'observer ce choix est égale à :
P(𝑦𝑖 = 𝑌𝑖 )=p(𝑦𝑖1 = 1, 𝑦𝑖2 = 1, 𝑦𝑖3 = 1)
Si nous laissons tomber l’indice i est que nous développons cette probabilité à partir de
la définition d'un probit multivarié, nous obtenons :
p(𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
=p(𝜀3 < 𝑋3 𝛽3 |𝜀2 < 𝑋2 𝛽2 , 𝜀1 < 𝑋1 𝛽1 ) × 𝑝(𝜀2 < 𝑋2 𝛽2 |𝜀1 < 𝑋1 𝛽1 ) × 𝑝(𝜀1 < 𝑋1 𝛽1 )
On voit qu'il est possible de calculer la probabilité de cette fonction de façon récursive
à partir des probabilités conditionnelles. En utilisant la décomposition de Cholesky de
la matrice de corrélation :
10/08/2024 Page 7 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
𝜀1 𝑐11 0 0 𝑒1
𝜀
[ 2 ]=[𝑐21 𝑐22 0 ] [𝑒2 ]
𝜀3 𝑐31 𝑐32 𝑐33 𝑒3
Nous pouvons échantillonner le vecteur des termes d’erreur à partir de valeurs tirées
d'une normale centrée-réduite 𝑒1 , 𝑒2 , 𝑒3 ~ N (0,1). La probabilité devient donc :
p (𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1
= p(𝑒3 < |𝑒2 < , 𝑒1 < )
𝑐33 𝑐22 𝑐11
𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1 𝑋1 𝛽1
× p(𝑒2 < |𝑒1 < )×p(𝑒1 < )
𝑐22 𝑐11 𝑐11
Étant donné que (𝑒1 , 𝑒2 , 𝑒3 ) ne sont pas corrélés entre eux, cette probabilité devient :
p(𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1
=p(𝑒3 < )×p(𝑒2 < )×p(𝑒1 < )
𝑐33 𝑐22 𝑐11
Pour simuler cette probabilité, on tire les valeurs e1 ,e2 et e3 de façon récursive à
𝑋1 𝛽1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1
partir d’une normale centrée-réduite tronquée à , et
𝑐11 𝑐22 𝑐33
respectivement Ces valeurs peuvent être générées aléatoirement à partir d'une
distribution uniforme tronquée. Malgré la simplicité de cette méthode, il faut un
nombre important de tirages pour couvrir en totalité la probabilité simulée. Il existe par
contre des méthodes qui permettent de réduire le nombre de tirages. Les deux
méthodes fréquemment utilisées sont les tirages antithétiques et les tirages à partir
d'une séquence Halton (Train, 2003). Cappellari et Jenkins (2006) ont montré que la
méthode GHK nécessite 10 fois moins de tirages si elle utilise des tirages de type
Halton au lieu de tirages pseudo-aléatoires.
Avec ces valeurs en poche, on peut maintenant évaluer les probabilités p(e3 <
X3 β3 −c32 e2 −c31 e1 X2 β2 −c21 e1
) et p(e2 < ) avec la méthode de la fonction de répartition
c33 c22
inverse et après avoir répété ce processus B fois, on peut calculer la probabilité
moyenne de ces deux termes. Finalement, on multiplie ces deux probabilités avec le
X1 β1
dernier terme p(e1 < ) pour obtenir p(y1 = 1, y2 = 1, y3 = 1).
c11
On estime le modèle en maximisant la fonction log de vraisemblance à partir des
probabilités simulées de l'échantillon complet :
𝑛
𝐿𝐿(𝜃) = ∑ ln 𝑝(𝑦𝑖 = 𝑌𝑖 )
𝑖=1
Plusieurs difficultés sont associées à l'estimateur du maximum de vraisemblance
simulé qui limite énormément la liberté du chercheur. La première difficulté est liée
aux problèmes numériques découlant de la maximisation de la fonction de
10/08/2024 Page 8 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
vraisemblance. Un mauvais choix des valeurs de départ est généralement à l'origine de
ce problème. La convergence peut être lente voire impossible si certaines valeurs sont
éloignées des maximums. La deuxième difficulté concerne l'estimation des paramètres
qui peuvent converger à un maximum local au lieu du maximum global de la fonction
de vraisemblance. Il n' y a donc aucune certitude que les paramètres aient convergé
vers leur maximum global (Train, 2003).
b) Estimateur bayésien
À partir du théorème de Bayes, nous pouvons développer la distribution a
posteriori du pro bit multivarié :
𝑝(𝛽, 𝑅|𝑌, 𝑋 ) ∝ 𝑝(𝑌, 𝑋|𝛽, 𝑅)𝑝(𝛽, 𝑅)
Où β sont les coefficients de régression et R sont les paramètres de corrélation des
termes résiduels du modèle, p(β, R|Y) ∝ p(Y|β, R)p(β, R)
Pour estimer les paramètres de cette distribution, une méthode possible est la
simulation de cette distribution par l' échantillonneur de Gibbs. Cette méthode consiste
à « briser » la distribution jointe (inconnue) en plusieurs blocs de distributions
conditionnelles (connues) et de former une chaîne de Markov qui va générer une
séquence de tirages de variables aléatoires chacun conditionné sur les précédents
Si la chaîne de Markov est bien formulée, alors la séquence de 𝛽 tirages convergera
vers la vraie distribution
(Rossi, Allenby et McCulloch, 2005).
IV) Limites des deux modèles
Le principal inconvénient de ce modèle est que le calcul des probabilités de
choix implique des intégrales de haute dimension qui ne peuvent pas être résolues
analytiquement. Les méthodes d'intégration numérique ne sont pas très précises et
lentes dans les grandes dimensions, et les méthodes d'estimation basées sur la
simulation sont souvent utilisées à la place (Cappellari et Jenkins, 2006. Cependant,
les efforts de calcul pour effectuer une estimation basée sur la simulation deviennent
excessifs lorsqu’un grand nombre de choix corrélés sont pris en compte
Pour éviter ces difficultés, nous optons pour le modèle Multivariate Logit (MVL)
(Cox, 1972). Le problème de MVL est que le temps de calcul, augmente de façon
exponentielle avec le nombre de choix. D'un point de vue pratique, l'estimation
standard des paramètres du maximum de vraisemblance (ML) devient
informatiquement irréalisable, même pour un nombre modéré de choix. De plus,
des problèmes numériques peuvent survenir lorsque les probabilités deviennent
trop petites pour une utilisation pratique
10/08/2024 Page 9 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024
V) Domaines d’application
Le modèle logit multivarié trouve des applications dans divers domaines où l'on étudie
simultanément les effets de plusieurs variables indépendantes sur plusieurs variables
dépendantes catégorielles (binaires ou multinomiales). Voici quelques domaines
d'application typiques :
❑ Économie et finance :
➢ Choix discret des consommateurs : Modélisation des choix des
consommateurs parmi plusieurs alternatives (par exemple, marques de
produits) en fonction de caractéristiques démographiques et
comportementales.
➢ Études de marché : Analyse des préférences des consommateurs pour
différents produits ou services en fonction de caractéristiques comme le
prix, la qualité, etc.
❑ Finance : Modélisation des choix d'investissement ou de financement des
entreprises en fonction de facteurs économiques et financiers
❑ Santé publique et sciences médicales :
➢ Épidémiologie : Modélisation de la probabilité de présence de certaines
maladies ou conditions de santé en fonction de facteurs de risque comme
l'âge, le sexe, les antécédents médicaux, etc.
➢ Comportement de santé : Analyse des choix de comportement de santé
(par exemple, tabagisme, exercice) en fonction de variables
démographiques et de facteurs de risque.
Conclusion
Les modèles de logit et probit multivariés représentent des extensions puissantes
des modèles binaires traditionnels, permettant de modéliser efficacement des
variables dépendantes catégorielles avec plus de deux niveaux distincts. Le logit
multivarié utilise la fonction logistique pour estimer les probabilités de chaque
catégorie par rapport à une catégorie de référence, tandis que le probit multivarié
utilise la fonction de distribution normale cumulative inverse. Ces modèles sont
particulièrement adaptés pour analyser des données où les réponses sont ordonnées
ou non ordonnées mais présentent plusieurs niveaux.
10/08/2024 Page 10 sur 10