100% ont trouvé ce document utile (1 vote)
724 vues11 pages

Exposé Logit Probit Multivarié

Transféré par

ouedraogoouedson
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
724 vues11 pages

Exposé Logit Probit Multivarié

Transféré par

ouedraogoouedson
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

UNIVERSITE JOSEPH-KI-ZERBO

INSTITU SUPERIEUR DES SCIENCES


DE LA POPULATION
LICENCE PROFESSIONNELLE EN
ANALYSE STATISTIQUE

Exposé : Logit et probit multivarié

Membres du Groupe :
Enseignant :
LAPAS 2 YAMEOGO Madihatou
Dr Israël
KONANE Ilyassa
Sawadogo
NANA Hervé
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

Table des matières


Introduction .................................................................................................................... 2
I) Motivation pour l'utilisation de modèles multivariés ............................................................. 2
II) Spécification et méthodes d’estimation des modèles ............................................................. 2
1) Logit multivarié ................................................................................................... 2
a) Spécification du modèle................................................................................................... 2
b) Estimation des paramètres .............................................................................................. 4
i. Méthode de maximum de vraisemblance .................................................... 4
ii. Probabilité conditionnelle composite ......................................................... 5
III) Probit multivarié .................................................................................................................. 6
1) Spécification(formalisation) du modèle.............................................................. 6
2) Méthodes d'estimation des modèles probit ......................................................... 7
a) Estimateur du maximum de vraisemblance simulé......................................................... 7
b) Estimateur bayésien ........................................................................................................ 9
IV) Limites des deux modèles ................................................................................................... 9
V) Domaines d’application ......................................................................................................... 10
Conclusion .................................................................................................................... 10

10/08/2024 Page 1 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

Introduction
Le modèle logit et le modèle probit sont deux types de modèles statistiques utilisés
pour analyser les données binaires ou ordinales. Ils sont souvent utilisés pour estimer
les probabilités de défaut ou de réussite dans des contextes tels que la finance, la santé,
ou les sciences sociales. La régression logistique multivariée est une extension de la
régression logistique simple pour les variables qualitatives à plusieurs modalités (plus
de deux). Le probit multivarié est aussi une extension de probit simple. Les modèles
logit et probit multivariés permettent de modéliser des événements qui peuvent
prendre plusieurs valeurs alternatives, comme par exemple les préférences de
consommation, les choix de vote, etc.

I) Motivation pour l'utilisation de modèles multivariés


Les modèles logit et probit multivariés permettent d'analyser les choix multiples (ou
simultanés) effectués par des individus lors d'une même décision. Contrairement aux
modèles logit et probit simples qui ne permettent d'étudier qu'un seul choix binaire
(par exemple, acheter ou ne pas acheter), les modèles multivariés peuvent prendre en
compte plusieurs choix simultanés (par exemple, acheter le produit A, le produit B, ou
ne rien acheter).Ils permettent de relâcher l’hypothèse contraignante faite dans les
modèles multinomial Logit et Probit selon laquelle la maximisation de l’utilité passe
par un choix unique .Ils relâchent l’hypothèse du choix unique (comme dans les
modèles multinomiaux Logit et Probit) et sont utiles pour explorer la dynamique
concurrentielle (recherche de variété, complémentarité, substituabilité) dans une
catégorie

II) Spécification et méthodes d’estimation des modèles


1) Logit multivarié

a) Spécification du modèle

10/08/2024 Page 2 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

En principe le logit multivarié utilise la fonction logit. Avec celle-ci, la probabilité


d’appartenance à une catégorie est modélisée par une fonction logistique, ce qui
permet de relier cette probabilité à une combinaison linéaire des variables explicatives.
Dans cette section, nous discutons de la spécification du modèle MVL. Nous utilisons
la spécification comme introduit par Cox (1972) et mis en œuvre par Russell et
Petersen (2000). Suivant Russell, nous laissons Yi désigner la variable aléatoire à K
dimensions décrivant l'ensemble conjoint de choix pour le individu i=1,…, N défini
comme Yi = {Yi1 , . . . , YiK },où Yik désigne le kème choix binaire pour l'individu i, pour
k = 1, . . . , K.
L'ensemble des réalisations possibles de Yi est appelé S qui contient 2K éléments. On
peut immédiatement voir que le nombre de réalisations possibles augmente de façon
exponentielle avec le nombre de choix binaires K. Les choix en Yi peuvent être
corrélés. Pour décrire ces dépendances, Russell et Petersen (2000) spécifient les
probabilités conditionnelles de la kième variable aléatoire Yik étant donné tous les
autres choix, c'est-à-dire yil pour l ≠ 𝑘.Ces probabilités conditionnelles sont une
fonction Logit des caractéristiques individuelles Xi, paramètres du modèle α, β et ψ, et
𝑦𝑖𝑙 , c'est-à-dire,
𝑒𝑥𝑝(𝑍𝑖𝑘 )
𝑃𝑟[𝑌𝑖𝑘 = 1|𝑦𝑖𝑙 , . . . , 𝑦𝑖𝑘−1 , 𝑦𝑖𝑘+1 , . . . , 𝑦𝑖𝐾 , 𝑋𝑖 ] = (1)
1 + 𝑒𝑥𝑝(𝑍𝑖𝑘 )
Avec 𝑍𝑖𝑘 = 𝛼𝑘 + 𝑋𝑖 𝛽𝑘 + ∑l ≠𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 (2)
Où 𝑦𝑖𝑙 est la réalisation de 𝑌𝑖𝑙 , 𝛼𝑘 sont des interceptions spécifiques alternatives, Xi est
un vecteur (1×p) de variables explicatives avec le vecteur de paramètre correspondant
𝛽𝑘 , et où 𝜓𝑘𝑙 sont des paramètres d'association. Les paramètres d'association capturent
la corrélation entre 𝑌𝑖𝑘 , et 𝑌𝑖𝑙 , pour l ≠ 𝑘.
L'indépendance conditionnelle entre 𝑌𝑖𝑘 et 𝑌𝑖𝑙 , se produit lorsque 𝜓𝑘𝑙 = [Link] nous
ne pouvons considérer que les corrélations et aucun impact causal, nous devons
imposer 𝜓𝑘𝑙 = 𝜓𝑙𝑘 pour la symétrie, voir aussi Russell et Petersen (2000). Le modèle
peut être étendu en incluant des variables explicatives qui diffèrent d'un individu à
l'autre et les différents choix binaires. Une telle extension est simple, mais pour
simplifier la notation, nous n'incluons pas de telles variables ici. En utilisant les
résultats de Besag (1974), la distribution conjointe de Yi découle directement de
l'ensemble complet des distributions conditionnelles. Russell et Petersen (2000)
montrent que les distributions conditionnelles en (1) impliquent une spécification
MNL pour la distribution conjointe de Yi, c'est-à-dire :
𝑒𝑥𝑝(𝜇𝑦𝑖 )
𝑃𝑟 [𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] = (3)
∑𝑠𝑖 ∈𝑆 𝑒𝑥𝑝(𝜇𝑠𝑖 )

10/08/2024 Page 3 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

Où 𝑦𝑖 est une réalisation possible à partir de l'espace de résultat S et où 𝜇𝑦𝑖 est défini
comme
𝐾

𝜇𝑦𝑖 = ∑ 𝑦𝑖𝑘 (𝛼𝑘 + 𝑋𝑖 𝛽𝑘 ) + ∑ 𝑦𝑖𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 . (4)


𝑘=1 𝑙>𝑘

Par conséquent, les paramètres αk et βk n'apparaissent que dans le numérateur de la


fonction de probabilité pour 𝑦𝑖𝑘 = 1. De plus, le paramètre d'association ψkl ne se
produit que dans le numérateur lorsque 𝑦𝑖𝐾 = 1 et 𝑦𝑖𝑙 = [Link] que cela implique
que toutes les paires devraient apparaître dans les données disponibles pour pouvoir
estimer ces paramètres d'association.
L'interprétation de l'impact des paramètres d'interception et de Xi découle du rapport
de cotes logarithmiques

𝐾
𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ]
𝑙𝑜𝑔 ( ) = ∑ 𝑦𝑖𝑘 (𝛼𝑘 + 𝑋𝑖 𝛽𝑘 ) + ∑ 𝑦𝑖𝑘 𝑦𝑖𝑙 𝜓𝑘𝑙 . (5)
𝑃𝑟[𝑌𝑖 = (0, … ,0)|𝑋𝑖 ]
𝑘=1 𝑙>𝑘

Où nous utilisons ce 𝜇(0,…,0) = 0 pour l'identification. De toute évidence, le rapport


de cotes est égal à 𝜇𝑦𝑖 tel que défini en (4) et fournit la probabilité d'observer 𝑦𝑖 par
rapport à l'ensemble de base des choix où tous les choix sont 0.
Le paramètre d'association 𝜓𝑘𝑙 est en théorie un paramètre non limité et ne
représente donc pas directement une corrélation. Cependant, les ratios de cotes
logarithmiques donnent une interprétation directe de ces paramètres d'association.
C'est-à-dire qu'il est facile de montrer que
𝑃𝑟[𝑌𝑖 =(0,…,0,𝑦𝑘 =1,0,…,0,𝑦𝑙 =1,0,…,0)|𝑋𝑖 ]∗𝑃𝑟[𝑌𝑖 =(0,…,0)|𝑋𝑖 ]
𝐿𝑜𝑔 ( )=𝜓𝑘𝑙 (6)
𝑃𝑟⌈𝑌𝑖 =(0,…,0,𝑦𝑘 =1,0,…,0)|𝑋𝑖 ⌉∗𝑃𝑟[𝑌𝑖 =(0,…,0,𝑦𝑙 =1,0,…,0)|𝑋𝑖 ]

Un 𝜓𝑘𝑙 positif implique donc que les choix k et l se déplacent plus souvent
ensemble que séparés.

b) Estimation des paramètres

Il y a 4 méthodes d’estimation des paramètres du modèle, mais dans


Cette section nous allons proposer deux méthodes d'estimation pour la spécification
du modèle MVL. La première approche est une procédure standard d'estimation de
l'apprentissage automatique. Cette approche, cependant, est computationnelle
impossible lorsque le nombre de choix K est important.

i. Méthode de maximum de vraisemblance

La première méthode d'estimation suit directement Russell et Petersen (2000). Pour


estimer les paramètres du modèle, ils suggèrent d'utiliser les probabilités conjointes
10/08/2024 Page 4 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

en (3). C'est-à-dire que Russell et Petersen (2000) utilisent la spécification MNL


sur l'espace de résultat complet S qui se traduit par la fonction de vraisemblance
logarithmique
𝑁

𝑙𝑟 (𝜃; 𝑦) = ∑ 𝑙𝑜𝑔𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] , (7)


𝑖=1

Où les probabilités conjointes 𝑃𝑟[𝑌𝑖 = 𝑦𝑖 |𝑋𝑖 ] sont données en (3). En outre, θ


résume tous les paramètres du modèle. Pour faire la distinction entre les différentes
méthodes, nous ajoutons le r en exposant à la fonction de vraisemblance. Les
erreurs standard de l'estimateur peuvent être obtenues de la même manière que
pour les modèles MNL standard.
Cette approche d'estimation est très appropriée lorsque le nombre de choix K est
faible. Cependant, le nombre d'alternatives S augmente de façon exponentielle avec
K. Par exemple, 10 choix binaires conduisent déjà à 210 = 1024 ressorts potentiels
de Yi. Cela conduit à de très petites probabilités en (3) et à la somme de nombreux
termes dans le dénominateur, ce qui peut à la fois conduire à des problèmes de
calcul. En outre, le temps de calcul des probabilités et donc la fonction de
vraisemblance logique augmentera rapidement avec le nombre de choix. Le facteur
dominant dans le temps passé à calculer la fonction de vraisemblance
logarithmique pour une seule observation en (7) est la somme sur les exposants, qui
a l'ordre de complexité 2K . Nous proposons ensuite une nouvelle méthode
d'estimation alternatives qui évite le calcul de toutes les probabilités conjointes.

ii. Probabilité conditionnelle composite

Compte tenu de la structure du modèle MVL, il est possible d'utiliser CCL


(Lindsay, 1988) pour l'estimation des paramètres. Lorsque la méthode de Russell et
Petersen (2000) écrit le modèle MVL comme une spécification Logit multinomiale
sur un grand espace de résultats, la représentation CCL utilise les probabilités
conditionnelles dans (1) comme des choix distincts, néanmoins corrélés.
Après Molenberghs et Verbeke (2005, chapitre 12), les probabilités conditionnelles
dans (1) conduisent à la fonction log composite de vraisemblance pour le modèle
MVL, c'est-à-dire,
𝑁 𝑁 𝐾

𝐿𝑐 (𝜃; 𝑦) = ∑ 𝑙𝑐 (𝜃; 𝑦𝑖 ) = ∑ ∑ 𝑙𝑐 (𝜃; 𝑦𝑖𝑘 )


𝑖=1 𝑖=1 𝑘=1

= ∑𝑁 𝐾
𝑖=1 ∑𝑘=1 𝐿𝑜𝑔𝑃𝑟 [𝑌𝑖𝑘 = 𝑦𝑖𝑘 |𝑦𝑖𝑙 𝑝𝑜𝑢𝑟 𝑙 ≠ 𝑘, 𝑋𝑖 ] (11)
Où le superscript c signifie CCL. L'estimateur θˆ qui découle de la maximisation (11)
Bien que le CCL ne corresponde pas à la bonne fonction de vraisemblance, il prend
néanmoins en compte les dépendances du modèle MVL. L’avantage par rapport à la

10/08/2024 Page 5 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

représentation multinomiale complète dans (3) est que CCL évite la grande sommation
au dénominateur. L'ordre de complexité d'une contribution de vraisemblance est
encore réduit à K en raison de la séparation des choix conditionnels. Il est donc
possible de calculer le CCL même lorsqu’il existe un grand nombre de choix.
Néanmoins, puisque l’on utilise la fonction composite au lieu de la fonction de
vraisemblance vraie, l’estimateur n’est pas efficace.

III) Probit multivarié


Le modèle probit multivarié est un modèle à m équations où chaque variable dépendante
représente un choix ou un état discret. Ce type de modèle permet d’étudier par exemple
la possession de m biens durables de façon simultanée ou la possession d'un bien durable
sur m périodes différentes. On suppose que les valeurs des variables dépendantes sont
la représentation discrète d'une variable continue sous-jacente non observée appelée
variable latente. Dans le cas d'un bien durable, la variable latente représenterait l'utilité
supplémentaire procurée par la possession d'un bien durable quelconque.

1) Spécification(formalisation) du modèle

Soit 𝑌𝑖 = (𝑦𝑖1 , 𝑦𝑖2 , . . . , 𝑦𝑖𝑚 ) 𝑒𝑡 𝑤𝑖 = (𝑤𝑖1 , 𝑤𝑖2 , . . . , 𝑤𝑖𝑚 ) les vecteurs de


dimensions m des réponses discrètes observées et des variables latentes non observées
d’un individu i = 1, ... , n. Soit Xi la matrice m x k des variables explicatives et β le
vecteur k x 1 des coefficients de régression. Le modèle probit multivarié peut s'écrire
de la façon suivante : 𝑤𝑖 = 𝑋𝑖 β+𝜀𝑖 i=1, .. . ,n
1 𝑠𝑖 𝑤𝑖𝑗 ≥0
𝑦𝑖𝑗 = {0 𝑠𝑖 𝑤
𝑖𝑗 <0

j=1, ... ,m
Dans ce modèle, le vecteur des termes d'erreur 𝜀𝑖 = ( 𝜀 𝑖1 , 𝜀𝑖2 , . . . , 𝜀𝑖𝑚 ) suit une
distribution normale multivariée avec moyennes zéro et la matrice de corrélation R.
Contrairement au modèle SURE (seemingly unrelated regression equation), le
modèle probit multivarié doit être contrainte pour permettre l’identification. Pour
comprendre le problème d’identification, multiplions le modèle par la matrice
λw𝑖 = λX 𝑖 𝛽 + λε𝑖

𝛼1 0 … 0
0 𝛼2 :
λε𝑖 ~𝑁𝑚 (0, λRλ). λ=[ ]
⋮ ⋱ ⋮
0 ⋯ 𝛼𝑚
Nous voyons que les paramètres {𝛼1 , 𝛼2 ,••• , 𝛼𝑚 } ne sont pas identifiables, car quelle
que soit leurs valeurs, ils ne permettent pas de modifier le signe de la variable latente
et par conséquent :
10/08/2024 Page 6 sur 10
Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

𝛾𝑖 (𝑤𝑖 ) = 𝛾𝑖 (λw𝑖 ).
Les choix du vecteur Yi sont les mêmes pour tous les modèles. Il n'y a donc aucune
information dans les données qui nous permettrait d'estimer simultanément les
paramètres β et la variance du terme d'erreur. Pour cette raison, on choisit de
contraindre la matrice de variances-covariances à une matrice de corrélation.
Les hypothèses du modèle probit multivarié supposent que les facteurs non
observables 𝜀𝑖 = [ 𝜀𝑖1 , 𝜀𝑖2 , 𝜀𝑖3 • • • 𝜀𝑖𝑚 ] sont distribués conjointement selon une
normale multivariée :
1 1
𝜑𝑚 (𝜀𝑖 ) = 𝑚 ⁄ 2 1⁄ 2
𝑒 2 𝜀𝑖′ 𝑅−1 𝜀𝑖
(2𝜋) |𝑅 |
Sous cette hypothèse, la probabilité d'observer 𝑦𝑖 = 𝑌𝑖 est égale à :
. .
𝑝(𝑦𝑖 = 𝑌𝑖 ⁄𝑋𝑖 , 𝛽, 𝑅) = ∫𝐴 … ∫𝐴 𝜑𝑚 (𝑤𝑖 ⁄𝑋𝑖 ,β,R)d𝑤𝑖1 … 𝑑𝑤𝑖𝑚
𝑖𝑚 𝑖1

Dans cette équation, 𝐴𝑖𝑗 prend une valeur comprise entre ]0,+oo[si 𝑦𝑖𝑗 = 1 et une valeur
comprise entre –oo et 0 sinon. Étant donné qu'il n'existe pas de solution analytique
pour cette expression, nous devons utiliser des méthodes numériques pour approximer
cette probabilité.

2) Méthodes d'estimation des modèles probit

a) Estimateur du maximum de vraisemblance simulé

Les modèles probits multivariés sont très difficiles à estimer par maximum de
vraisemblance car il n'existe pas de forme analytique à la fonction de vraisemblance.
Pour estimer ce modèle, il est nécessaire d’approximer la fonction de vraisemblance
Pour présenter cette méthode, considérons un modèle probit trivarié et imaginons que
nous observons pour un individu i les choix 𝑌𝑖 = (𝑦𝑖1 = 1, 𝑦𝑖2 = 1, 𝑦𝑖3 = 1). La
probabilité d'observer ce choix est égale à :
P(𝑦𝑖 = 𝑌𝑖 )=p(𝑦𝑖1 = 1, 𝑦𝑖2 = 1, 𝑦𝑖3 = 1)
Si nous laissons tomber l’indice i est que nous développons cette probabilité à partir de
la définition d'un probit multivarié, nous obtenons :
p(𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
=p(𝜀3 < 𝑋3 𝛽3 |𝜀2 < 𝑋2 𝛽2 , 𝜀1 < 𝑋1 𝛽1 ) × 𝑝(𝜀2 < 𝑋2 𝛽2 |𝜀1 < 𝑋1 𝛽1 ) × 𝑝(𝜀1 < 𝑋1 𝛽1 )
On voit qu'il est possible de calculer la probabilité de cette fonction de façon récursive
à partir des probabilités conditionnelles. En utilisant la décomposition de Cholesky de
la matrice de corrélation :

10/08/2024 Page 7 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

𝜀1 𝑐11 0 0 𝑒1
𝜀
[ 2 ]=[𝑐21 𝑐22 0 ] [𝑒2 ]
𝜀3 𝑐31 𝑐32 𝑐33 𝑒3
Nous pouvons échantillonner le vecteur des termes d’erreur à partir de valeurs tirées
d'une normale centrée-réduite 𝑒1 , 𝑒2 , 𝑒3 ~ N (0,1). La probabilité devient donc :
p (𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1
= p(𝑒3 < |𝑒2 < , 𝑒1 < )
𝑐33 𝑐22 𝑐11

𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1 𝑋1 𝛽1
× p(𝑒2 < |𝑒1 < )×p(𝑒1 < )
𝑐22 𝑐11 𝑐11

Étant donné que (𝑒1 , 𝑒2 , 𝑒3 ) ne sont pas corrélés entre eux, cette probabilité devient :
p(𝑦1 = 1, 𝑦2 = 1, 𝑦3 = 1)=p(𝜀1 < 𝑋1 𝛽1 , 𝜀2 < 𝑋2 𝛽2 , 𝜀3 < 𝑋3 𝛽3 )
𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋1 𝛽1
=p(𝑒3 < )×p(𝑒2 < )×p(𝑒1 < )
𝑐33 𝑐22 𝑐11

Pour simuler cette probabilité, on tire les valeurs e1 ,e2 et e3 de façon récursive à
𝑋1 𝛽1 𝑋2 𝛽2 −𝑐21 𝑒1 𝑋3 𝛽3 −𝑐32 𝑒2 −𝑐31 𝑒1
partir d’une normale centrée-réduite tronquée à , et
𝑐11 𝑐22 𝑐33
respectivement Ces valeurs peuvent être générées aléatoirement à partir d'une
distribution uniforme tronquée. Malgré la simplicité de cette méthode, il faut un
nombre important de tirages pour couvrir en totalité la probabilité simulée. Il existe par
contre des méthodes qui permettent de réduire le nombre de tirages. Les deux
méthodes fréquemment utilisées sont les tirages antithétiques et les tirages à partir
d'une séquence Halton (Train, 2003). Cappellari et Jenkins (2006) ont montré que la
méthode GHK nécessite 10 fois moins de tirages si elle utilise des tirages de type
Halton au lieu de tirages pseudo-aléatoires.
Avec ces valeurs en poche, on peut maintenant évaluer les probabilités p(e3 <
X3 β3 −c32 e2 −c31 e1 X2 β2 −c21 e1
) et p(e2 < ) avec la méthode de la fonction de répartition
c33 c22
inverse et après avoir répété ce processus B fois, on peut calculer la probabilité
moyenne de ces deux termes. Finalement, on multiplie ces deux probabilités avec le
X1 β1
dernier terme p(e1 < ) pour obtenir p(y1 = 1, y2 = 1, y3 = 1).
c11

On estime le modèle en maximisant la fonction log de vraisemblance à partir des


probabilités simulées de l'échantillon complet :
𝑛

𝐿𝐿(𝜃) = ∑ ln 𝑝(𝑦𝑖 = 𝑌𝑖 )
𝑖=1

Plusieurs difficultés sont associées à l'estimateur du maximum de vraisemblance


simulé qui limite énormément la liberté du chercheur. La première difficulté est liée
aux problèmes numériques découlant de la maximisation de la fonction de

10/08/2024 Page 8 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

vraisemblance. Un mauvais choix des valeurs de départ est généralement à l'origine de


ce problème. La convergence peut être lente voire impossible si certaines valeurs sont
éloignées des maximums. La deuxième difficulté concerne l'estimation des paramètres
qui peuvent converger à un maximum local au lieu du maximum global de la fonction
de vraisemblance. Il n' y a donc aucune certitude que les paramètres aient convergé
vers leur maximum global (Train, 2003).

b) Estimateur bayésien

À partir du théorème de Bayes, nous pouvons développer la distribution a


posteriori du pro bit multivarié :
𝑝(𝛽, 𝑅|𝑌, 𝑋 ) ∝ 𝑝(𝑌, 𝑋|𝛽, 𝑅)𝑝(𝛽, 𝑅)
Où β sont les coefficients de régression et R sont les paramètres de corrélation des
termes résiduels du modèle, p(β, R|Y) ∝ p(Y|β, R)p(β, R)
Pour estimer les paramètres de cette distribution, une méthode possible est la
simulation de cette distribution par l' échantillonneur de Gibbs. Cette méthode consiste
à « briser » la distribution jointe (inconnue) en plusieurs blocs de distributions
conditionnelles (connues) et de former une chaîne de Markov qui va générer une
séquence de tirages de variables aléatoires chacun conditionné sur les précédents
Si la chaîne de Markov est bien formulée, alors la séquence de 𝛽 tirages convergera
vers la vraie distribution
(Rossi, Allenby et McCulloch, 2005).

IV) Limites des deux modèles


Le principal inconvénient de ce modèle est que le calcul des probabilités de
choix implique des intégrales de haute dimension qui ne peuvent pas être résolues
analytiquement. Les méthodes d'intégration numérique ne sont pas très précises et
lentes dans les grandes dimensions, et les méthodes d'estimation basées sur la
simulation sont souvent utilisées à la place (Cappellari et Jenkins, 2006. Cependant,
les efforts de calcul pour effectuer une estimation basée sur la simulation deviennent
excessifs lorsqu’un grand nombre de choix corrélés sont pris en compte
Pour éviter ces difficultés, nous optons pour le modèle Multivariate Logit (MVL)
(Cox, 1972). Le problème de MVL est que le temps de calcul, augmente de façon
exponentielle avec le nombre de choix. D'un point de vue pratique, l'estimation
standard des paramètres du maximum de vraisemblance (ML) devient
informatiquement irréalisable, même pour un nombre modéré de choix. De plus,
des problèmes numériques peuvent survenir lorsque les probabilités deviennent
trop petites pour une utilisation pratique

10/08/2024 Page 9 sur 10


Econométrie des variables qualitatives ISSP-LPAS2 2023-2024

V) Domaines d’application
Le modèle logit multivarié trouve des applications dans divers domaines où l'on étudie
simultanément les effets de plusieurs variables indépendantes sur plusieurs variables
dépendantes catégorielles (binaires ou multinomiales). Voici quelques domaines
d'application typiques :
❑ Économie et finance :
➢ Choix discret des consommateurs : Modélisation des choix des
consommateurs parmi plusieurs alternatives (par exemple, marques de
produits) en fonction de caractéristiques démographiques et
comportementales.
➢ Études de marché : Analyse des préférences des consommateurs pour
différents produits ou services en fonction de caractéristiques comme le
prix, la qualité, etc.
❑ Finance : Modélisation des choix d'investissement ou de financement des
entreprises en fonction de facteurs économiques et financiers
❑ Santé publique et sciences médicales :
➢ Épidémiologie : Modélisation de la probabilité de présence de certaines
maladies ou conditions de santé en fonction de facteurs de risque comme
l'âge, le sexe, les antécédents médicaux, etc.
➢ Comportement de santé : Analyse des choix de comportement de santé
(par exemple, tabagisme, exercice) en fonction de variables
démographiques et de facteurs de risque.

Conclusion
Les modèles de logit et probit multivariés représentent des extensions puissantes
des modèles binaires traditionnels, permettant de modéliser efficacement des
variables dépendantes catégorielles avec plus de deux niveaux distincts. Le logit
multivarié utilise la fonction logistique pour estimer les probabilités de chaque
catégorie par rapport à une catégorie de référence, tandis que le probit multivarié
utilise la fonction de distribution normale cumulative inverse. Ces modèles sont
particulièrement adaptés pour analyser des données où les réponses sont ordonnées
ou non ordonnées mais présentent plusieurs niveaux.

10/08/2024 Page 10 sur 10

Common questions

Alimenté par l’IA

Bayesian estimation in the Multivariate Probit model provides the advantage of incorporating prior information and allows for the estimation of complex models where traditional maximum likelihood estimation faces difficulties, such as handling high-dimensional integrals. By using methods like the Gibbs sampler, Bayesian estimation can break down complex posterior distributions into manageable conditional distributions, simplifying computations and improving convergence to the true parameter distribution. However, challenges include the necessity for appropriate prior selection and the computational intensity of simulating posterior distributions, particularly in models with large parameter spaces .

The exponential increase in possible realizations, specifically 2^K for K binary choices, significantly affects the computation of probabilities in the MVL model as it leads to very small probabilities and a large summation in the denominator. This situation can cause computational difficulties, particularly as it becomes infeasible to calculate the joint probabilities when K is large. The computational expense involves handling 2^K possible outcomes, increasing both time and complexity for calculating the likelihood functions .

In the MVL model, the association parameters ψkl capture the correlation between different binary choices, specifically between Yik and Yil for l ≠ k. These parameters appear in the likelihood function's numerator only when both binary choices are equal to one. Therefore, a positive ψkl indicates that the choices k and l are more likely to occur together than separately, influencing the model's joint probability estimates by accounting for dependencies among choices .

The computational limitations of the MVL model when using a large number of correlated choices are primarily due to the exponential growth of possible realizations (2^K) and the resultant small probabilities which lead to complex likelihood functions. This complexity causes computational inefficiencies and potentially inaccurate parameter estimates. Mitigating these limitations can involve using alternative estimation methods such as the Conditional Composite Likelihood that reduces complexity by treating each choice independently yet retaining the correlations. Also, employing more efficient numerical methods, parallel computing, or approximations like variational techniques can help alleviate the computational burden, improving estimability and accuracy .

The use of latent variables in economic modeling enhances the interpretation of consumer choice behavior by positing an underlying continuous utility measure that determines observed discrete outcomes. This approach allows for capturing both the observed choice and the unobserved influences driving the decision, offering a nuanced view of how consumers would act under different circumstances. Latent variable frameworks enable identifying and quantifying the effects of various determinants on consumer decisions, particularly through their ability to model unobserved heterogeneity and correlated preferences that wouldn't otherwise be captured in standard binary choice models .

The latent variable in the Multivariate Probit model represents an unobserved continuous measure underlying the observed binary outcomes, such as utility in a decision-making context. This latent variable allows the model to compute the probability of observing particular combinations of binary outcomes as thresholds of this continuous latent variable. Accurately estimating the model requires considering the correlations among these latent variables, typically through a multivariate normal distribution of error terms. The estimation, particularly through maximum likelihood, relies on approximating integrations over these multivariate normal distributions .

The Cholesky decomposition is crucial in the simulation approach for estimating probabilities in the Multivariate Probit model as it simplifies the sampling of correlated error terms from a multivariate normal distribution. By decomposing the correlation matrix into a lower triangular matrix, the Cholesky decomposition allows the generation of uncorrelated standard normal variables, which can then be transformed into correlated variables matching the desired distribution. This process facilitates calculating the probability of observed choices by using the decomposed structure to model correlations accurately, further allowing recursive probability calculations .

The Conditional Composite Likelihood (CCL) method reduces complexity by using conditional probabilities as distinct yet correlated choices, unlike the full Multinomial Logit specification. This separation decreases the computational burden by reducing the likelihood evaluation's order of complexity from 2^K to K, as it avoids summing over all possible outcomes, which is necessary in the full model. Therefore, the CCL method efficiently handles a large number of choices, albeit at the cost of estimator efficiency .

The Multivariate Logit (MVL) model offers practical advantages in applications where multiple correlated binary outcomes need to be simultaneously analyzed. It is particularly useful in scenarios like consumer choice modeling, where dependencies between choices are evident but less structural complexities are desired. The MVL model efficiently captures the correlation between these choices via association parameters without requiring the computation-intensive integrations of the Multivariate Probit model. Therefore, it is often preferred in studies where simplifying the model complexity and computational feasibility is prioritized despite the trade-off in capturing underlying latent structures .

The Maximum Likelihood Estimation (MLE) is challenging for the Multivariate Logit model when the number of binary choices is large because the likelihood function becomes complex with a sum of 2^K terms in its denominator, where K is the number of binary choices. This complexity leads to small probabilities and computational problems, as it becomes difficult to manage and calculate the probabilities required for MLE. Furthermore, it results in computational infeasibility due to excessive time and complexity required for processing such a large amount of data .

Vous aimerez peut-être aussi