0% encontró este documento útil (0 votos)

204 vistas59 páginas

Modelos de Probabilidad en Econometría

Este documento presenta modelos de probabilidad binaria y lineales índice para explicar variables dependientes discretas. Los modelos binarios estiman una regresión lineal de la probabilidad condicional, mientras que los modelos lineales índice transforman primero la probabilidad usando una función de distribución acumulada como probit o logit para garantizar valores entre 0 y 1. Estos modelos se estiman usando máxima verosimilitud debido a la naturaleza no lineal de la esperanza condicional.

Cargado por

Richard Gacitúa

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

204 vistas59 páginas

Modelos de Probabilidad en Econometría

Cargado por

Richard Gacitúa

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Métodos Econométricos para el Análisis de

Políticas Públicas
Clase 3. Modelos de probabilidad

Nerys Ramírez Mordán

Economía Aplicada y Políticas Pública - MacroPol

28 July de 2022

Clase 3 MacroPol 28 July de 2022 1 / 59

Contenido

1 Modelos de respuesta binaria

2 Modelos lineales índice

3 Interpretación de coeficientes

4 Bondad de ajuste

5 Aplicaciones

6 Referencias

Clase 3 MacroPol 28 July de 2022 2 / 59

Modelos de respuesta binaria

Section 1

Modelos de respuesta binaria

Clase 3 MacroPol 28 July de 2022 3 / 59

Modelos de respuesta binaria

Introducción

Los modelos de probabilidad considerar intentan explicar (dependiente) toma

valores discretos, donde el MCO puede resultar no adecuado.
La variable dependiente asume valores discretos.
Binaria (trabajar o no; comprar o no; dejar de pagar un crédito o no, . . . ).
Nominales: discreta sin orden (elegir un medio de transporte).
Ordinales: discretas ordenadas (calificación de riesgo).

Clase 3 MacroPol 28 July de 2022 4 / 59

Modelos de respuesta binaria

Modelo lineal de probabilidad

En estos modelos (el caso más sencillo), la variable dependiente (Y ) puede
tomar dos valores, “siendo usualmente 1 la categoría de interés”:

(
1 Pr(y = 1) = p
Yi =
0 Pr(y = 0) = (1 − p)

Donde Yi ∼ Bernnulli, con esperanza:

E(Y ) = Pr(Y = 1) = p

Cuando se tiene una predictora X , la esperanza condicional de Yi también

sigue esta distribución. Es decir, dadas las características del individuo, cual
es la probabilidad de que Yi =1:

E(Y |X = x ) = Pr(Y = 1|X = x ) = p

Clase 3 MacroPol 28 July de 2022 5 / 59
Modelos de respuesta binaria

Modelo lineal de probabilidad

El modelo lineal, como primera aproximación, supone una función lineal de la

esperanza condicional de la variable binaria:

E(Y |X = x ) = Pr(Y = 1|X = x ) = β0 + β1 X

Es decir, estima una regresión múltiple en que la variable dependiente es

binaria:

Yi = β0 + β1 X1,i + ... + βk Xk,i + ui , i = 1, 2, 3, ..., n

Clase 3 MacroPol 28 July de 2022 6 / 59

Modelos de respuesta binaria

Modelo lineal de probabilidad

Se verifica:

E[Yi |X = x ] = Pr[Y = 1|X = x ] ∗ 1 + Pr[Y = 0|X = x ] ∗ 0

Siendo E[Yi |X = x ] = Pr[Y = 1|X = x ], se estima a partir de un modelo de

regresión lineal:

E[Yi |X = x ] = E[β0 + β1 X1,i + ... + βk Xk,i + ui |X = x ]

E[Yi |X = x ] = Pr[Y = 1|X = x ] = β0 + β1 X1,i + ... + βk Xk,i

Clase 3 MacroPol 28 July de 2022 7 / 59

Modelos de respuesta binaria

Modelo lineal de probabilidad

E[Yi |X = x ] = β0 + β1 X1,i + ... + βk Xk,i

Donde aplican los conocimientos de econometría vistos hasta el momento.

Los β ′ s recogen el efecto parcial de una variación de la variable explicativa
correspondiente sobre la probabilidad de ocurrencia del evento estudiado, una
vez controlado el resto de factores incluidos en el modelo.

Clase 3 MacroPol 28 July de 2022 8 / 59

Modelos de respuesta binaria

Modelo lineal de probabilidad. Dificultades

Heterocedasticidad. Dado que

Var (Y ) = p(x )(1 − p(x )) = (β0 + β1 X )(1 − β0 − β1 X ).
Valores de p(x ) no acotados [0,1]. Por lo que, la probabilidad esperada de Y
puede no tener sentido.
El modelo asume una relación lineal. Sin embargo, cuando y este cerca de 1,
se espera una menor variación en p(x ) proveniente de un cambio en x .
El carácter dicótomo de y, impide el error se comporte como una normal.

Clase 3 MacroPol 28 July de 2022 9 / 59

Modelos lineales índice

Section 2

Modelos lineales índice

Clase 3 MacroPol 28 July de 2022 10 / 59

Modelos lineales índice

Una alternativa al modelo anterior es utilizar los denominados modelos

lineales índices que utilizan la función de distribución acumulada, para
garantizar probabilidades condicionales acotadas entre 0 y 1.

(Y |X = x ) = Pr(Y = 1|X = x ) = F (β0 + β1 X ) + e(x )

Por tanto, como E [e(x )] = 0, el modelo se expresa en términos de esperanzas

condicionales, como:

Pr(x ) = Y = F(β0 + β1 X )

η(x) = g (E[Y | X = x])

Clase 3 MacroPol 28 July de 2022 11 / 59

Modelos lineales índice

Ahora se busca una función F (x ), cuya inversa transforme las probabilidades

condicionales p(x ), para luego modelar esta transformación.

F −1 (Pr(x )) = β0 + β1 X

Primero se utiliza una función lineal índice que ofrezca un único valor aunque
este fuera del intervalo [0,1], posteriormente se utiliza la función de
distribución.
Se busca una función F, cuya inversa transforme las probabilidades
condicionales p(x ) y posteriormente, se modela linealmente esta
transformación.

Clase 3 MacroPol 28 July de 2022 12 / 59

Modelos lineales índice

Variables aleatorias

Sea X una variable aleatoria definida en (Ω, σ, p), la función en el rango

[0,1], definida por:

F (xi ) = Px ((− inf, xi ]) = Pr(X ≤ xi ) xi ∈ X

Llamada Función de distribución de X , cumple las siguientes propiedades:

F(.) es no decreciente.
limxi →−∞ F (X ) = 0 y Limxi →+∞ F (X ) = 1
F(.) es continua por la derecha.

Clase 3 MacroPol 28 July de 2022 13 / 59

Modelos lineales índice

Variables aleatorias en R
par(mfrow=c(1,2))

my.normal <- function(x) dnorm(x, mean = 5, sd = 2)

curve(my.normal, xlim = c(0, 10), xlab = " ", ylab = "Probability")

my.normal2 <- function(x) pnorm(x, mean = 5, sd = 2)

curve(my.normal2, xlim = c(0, 10), xlab = " ", ylab = "Cumulative probability")
0.20

1.0
Cumulative probability

0.8
0.15
Probability

0.6
0.10

0.4
0.05

0.2
0.0

0 2 4 6 8 10 0 2 4 6 8 10

Clase 3 MacroPol 28 July de 2022 14 / 59

Modelos lineales índice

Posteriormente, se aplica una función acumulada al índice. De todas las

posibilidades de F (.), las más utilizadas suelen ser:
La función de distribución de la normal (Probit):

Z z Z z
1 − 1 x2
Φ(Z ) = ϕ(x )dx = e 2 dx
−∞ −∞ 2π

La función de distribución logística (Logit), que forma parte de los modelos

paramétricos lineales generalizados, introducidos por McCullagh y Nelder
(1989):

ez
Λ(Z ) =
1 − ez

Clase 3 MacroPol 28 July de 2022 15 / 59

Modelos lineales índice

Estimación de máxima verosimilitud

Debido a la naturaleza no lineal de E (y |x ), MCO no es aplicable. Por ende,
los parámetros del modelo se estiman a partir de la función de verosimilitud
L(β; y1 , ..., yn ), donde y ∼ B(p, p(1 − p)) es decir,
F (y ) = Pr (Y = y ) = p y (1 − p)(1−y ) .
Siempre que la serie sea iid, la probabilidad conjunta es:

N
Y
Pr(Yi = yi |xi ; βi , ..., βk )
i=1

N
Y
[ϕ(βX )]yi [1 − ϕ(βX )]1−yi
i=1

Suele ser conveniente utilizar la función en logaritmo:

i=1
X
log L(β; y1 , ..., yn ) = yi log(ϕ(βX )) + (1 − yi )log(1 − ϕ(βX ))
N
Clase 3 MacroPol 28 July de 2022 16 / 59
Modelos lineales índice

Estimación de máxima verosimilitud

Sea Y una variable binaria, la E [Y = 1|X = x ] = Pr[x ], se modeliza

mediante la regresión logística simple:

e α+βx
Logit(p(x )) = = exp(β0 + β1 x )
1 − e α+βx

Equivalente a la transformación Logit:

Pr(x )
Logit(Pr(x )) = ln = β0 + β1 x
1 − Pr(x )

Clase 3 MacroPol 28 July de 2022 17 / 59

Modelos lineales índice

Comparación de modelos

Fuente: Dalpiaz, 2022.

Ordinary vs Logistic Regression

1.0

Ordinary
Estimated Probability

Logistic
0.8

Data
0.6
0.4
0.2
0.0

−2 −1 0 1

Clase 3 MacroPol 28 July de 2022 18 / 59

Modelos lineales índice

Ejemplo: Modelos de probabilidad. Coca-Cola

Probabilidad de seleccionar Coca Cola en función de su precio relativo
(pratio) y de los productos mostrados durante las ventas (dispcoke, dispcoke).

Dependent variable: coke

OLS logistic probit
∗∗∗ ∗∗∗
pratio −0.40 −2.00 −1.15∗∗∗
(0.06) (0.31) (0.18)
dispcoke 0.08∗∗ 0.35∗∗ 0.22∗∗
(0.03) (0.16) (0.10)
disppepsi −0.17∗∗∗ −0.73∗∗∗ −0.45∗∗∗
(0.04) (0.17) (0.10)
Constant 0.89∗∗∗ 1.92∗∗∗ 1.11∗∗∗
(0.07) (0.33) (0.19)
Observations 1,140 1,140 1,140

Clase 3 MacroPol 28 July de 2022 19 / 59

Modelos lineales índice

Modelos de probabilidad en R

library(tidyverse)
coke<-read.csv("coke1.csv")
attach(coke)

head(coke)

## coke prpepsi prcoke disppepsi dispcoke pratio

## 1 1 1.79 1.79 0 0 1.000000
## 2 1 1.79 0.89 0 1 0.497207
## 3 1 1.41 0.89 0 0 0.631206
## 4 1 1.79 1.33 0 0 0.743017
## 5 1 1.79 1.79 0 0 1.000000
## 6 1 0.99 1.79 1 0 1.808081

Clase 3 MacroPol 28 July de 2022 20 / 59

Modelos lineales índice

Modelos de probabilidad en R
glm: Fitting Generalized Linear Models.

Y | X = x ∼ N(β0 + β1 x1 + . . . + βp−1 xp−1 , σ 2 )

coke.MLP <- lm(coke~pratio+dispcoke+disppepsi, data=coke) #mco

coke.logit <- glm(coke~pratio+dispcoke+disppepsi, #Logit

data=coke, family=binomial(link="logit"))

coke.Probit <- glm(coke~pratio+dispcoke+disppepsi, #Probit

data=coke, family=binomial(link="probit"))

summary(coke.logit)$coef

## Estimate Std. Error z value Pr(>|z|)

## (Intercept) 1.9229722 0.3258169 5.902003 3.591150e-09
## pratio -1.9957418 0.3145688 -6.344372 2.233341e-10
## dispcoke 0.3515994 0.1585345 2.217809 2.656784e-02
## disppepsi -0.7309858 0.1678302 -4.355509 1.327578e-05

Clase 3 MacroPol 28 July de 2022 21 / 59

Modelos lineales índice

Modelos de probabilidad en R
library(stargazer)
stargazer(coke.MLP, coke.logit, coke.Probit, type="text",
title="Tabla 1. Modelos de probabilidad", digits=2,
single.row=FALSE, intercept.bottom=TRUE, df = FALSE)

Table 1: Modelos de probabilidad

Dependent variable: coke

OLS logistic probit
pratio −0.40∗∗∗ −2.00∗∗∗ −1.15∗∗∗
(0.06) (0.31) (0.18)
dispcoke 0.08∗∗ 0.35∗∗ 0.22∗∗
(0.03) (0.16) (0.10)
disppepsi −0.17∗∗∗ −0.73∗∗∗ −0.45∗∗∗
(0.04) (0.17) (0.10)
Constant 0.89∗∗∗ 1.92∗∗∗ 1.11∗∗∗
(0.07) (0.33) (0.19)
Observations 1,140 1,140 1,140

Clase 3 MacroPol 28 July de 2022 22 / 59

Modelos lineales índice

Comparar coeficientes entre modelos

Las magnitudes de las estimaciones de los coeficientes a través de los

modelos no son comparables directamente (Wooldrige, 2009, p.584). Una
regla práctica seguida para comparar el logit con el probit, es multiplicar los
coeficientes probit por 1.6.
Para comparar las estimaciones logit y probit con las del MPL, Estos factores
escalares son de cerca de .301 (probit) y .179 (logit).

Clase 3 MacroPol 28 July de 2022 23 / 59

Modelos lineales índice

Test de significancia

H 0 : βj = 0 vs H1 : βj ̸= 0

β̂j − βj
z=
SE[β̂j ]

Intervalo de confianza

β̂j ± zα/2 · SE[β̂j ]

confint(coke.logit, level = 0.95)

## 2.5 % 97.5 %
## (Intercept) 1.29354162 2.5719347
## pratio -2.62458498 -1.3903293
## dispcoke 0.04170077 0.6636823
## disppepsi -1.06190761 -0.4034356

Clase 3 MacroPol 28 July de 2022 24 / 59

Interpretación de coeficientes

Section 3

Interpretación de coeficientes

Clase 3 MacroPol 28 July de 2022 25 / 59

Interpretación de coeficientes

Pr(Y = 1|x )
Logit i = ln = β′X + µ
1 − Pr(Y = 1|x )

Como βi se interpreta como un efecto aditivo derivado de un cambio unitario

en la variable Xi sobre el logaritmo natural de la ratio de probabilidades
(Scotti, 2012), no es directamente interpretable.
Por tanto, se suele recurrir a dos estrategias:
Razón de probabilidades.
Efectos marginales.

Clase 3 MacroPol 28 July de 2022 26 / 59

Interpretación de coeficientes

Ratios de probabilidad

Los ratios o cocientes de probabilidades, resultan del cociente entre la

probabilidad de que Pr[Y = 1], frente a la que no suceda Pr[Y = 1 − 1].

exp (zh)
= e β1 (xjh −xjl ) [0, ∞]
exp (zl)

El odd ratio indica el número de veces que es probable que ocurra el

fenómeno, frente a que no ocurra. El odd ratio asociado a un cambio de xjh a
xjl , en la variable xj , manteniendo el resto de variables constantes.

Clase 3 MacroPol 28 July de 2022 27 / 59

Interpretación de coeficientes

Ratios de probabilidad

El signo de β1 indica el sentido de cambio en la probabilidad de que Y = 1,

antes los cambios de x 1.
β1 = 0 indica independencia, por lo que, la estimación del modelo coincide
con la proporción de valores Y = 1. En términos de ventajas:

e α+βx
= exp(β0 + β1 x ) = e β0 ė β1 x
1 − e α+βx

La ventaja de de Y = 1 aumenta en e β1 por cada unidad de aumento de X .

p(x +1)
1−p(x +1) exp (β0 + β1 (x + 1)) e β0 e β1 x e β1
θ (x + 1, x ) = = = = e β1
p(x ) exp (β0 + β1 (x )) e β0 e β1 x
1−p(x )

Clase 3 MacroPol 28 July de 2022 28 / 59

Interpretación de coeficientes

Ratios de probabilidad en R

Estos se utilizan para facilitar la compresión de los coeficientes estimados. Su

interpretación se realiza en torno a la unidad.
Los coeficientes con signo positivo adquieren mayores superiores a 1,
contrario a los negativos que muestran valores inferiores a 1.
cbind(coeff=coef(coke.logit), odd=exp(coef(coke.logit)))

## coeff odd
## (Intercept) 1.9229722 6.8412616
## pratio -1.9957418 0.1359128
## dispcoke 0.3515994 1.4213390
## disppepsi -0.7309858 0.4814341

El coeficiente logit de -1.9957, tiene un odds de 0.1359 (odds ratio) indica qeu en la medida
en que pratio aumenta en una unidad, manteniendo todas las otras variables constantes, es
86.4% veces menos probable (0.1359 − 1) que se seleccione la coca-cola (y = 1).

Clase 3 MacroPol 28 July de 2022 29 / 59

Interpretación de coeficientes

Ratios de probabilidad en R
logit.odds = exp(coef(coke.logit))
# stargazer(coke.logit, coef=list(logit.odds), type = "text")

Table 2: Ratios de probabilidad

Dependent variable:
coke
pratio 0.136
(0.315)

dispcoke 1.421∗∗∗
(0.159)

disppepsi 0.481∗∗∗
(0.168)

Constant 6.841∗∗∗
(0.326)

Observations 1,140
Clase 3 Log Likelihood MacroPol −709.446 28 July de 2022 30 / 59
Interpretación de coeficientes

Ratios de probabilidad

library(mfx)
library(betareg)

coke.logitor<-logitor(coke~pratio+dispcoke+disppepsi, data=coke)
coke.logitor

## Call:
## logitor(formula = coke ~ pratio + dispcoke + disppepsi, data = coke)
##
## Odds Ratio:
## OddsRatio Std. Err. z P>|z|
## pratio 0.135913 0.042754 -6.3444 2.233e-10 ***
## dispcoke 1.421339 0.225331 2.2178 0.02657 *
## disppepsi 0.481434 0.080799 -4.3555 1.328e-05 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1

Clase 3 MacroPol 28 July de 2022 31 / 59

Interpretación de coeficientes

Ratios de probabilidad

Intervalo de confianza de los odds ratios.

exp(confint(coke.logit))

## 2.5 % 97.5 %
## (Intercept) 3.64567533 13.0911274
## pratio 0.07246983 0.2489933
## dispcoke 1.04258246 1.9419300
## disppepsi 0.34579554 0.6680210

exp(cbind(OR = coef(coke.logit), confint(coke.logit)))

## OR 2.5 % 97.5 %
## (Intercept) 6.8412616 3.64567533 13.0911274
## pratio 0.1359128 0.07246983 0.2489933
## dispcoke 1.4213390 1.04258246 1.9419300
## disppepsi 0.4814341 0.34579554 0.6680210

Clase 3 MacroPol 28 July de 2022 32 / 59

Interpretación de coeficientes

Efectos marginales

Los efectos marginales muestran el cambio en probabilidad esperado tras un

cambio en una unidad de la variable independiente. En el caso de variables
binarias se expresa a partir del cambio 0 a 1 (Williams, 2018):

Xk = Pr(Y = 1|X , Xk = 1)˘ Pr(y = 1|X , Xk = 0)

En el caso de variables continuas, se presenta como un cambio instantáneo:

δE (Y |X = x ) Pr(Y = 1|X , Xk + ∆)˘ Pr(y = 1|X , Xk )

= lim [ ]
δX ∆→0 ∆

Clase 3 MacroPol 28 July de 2022 33 / 59

Interpretación de coeficientes

Efectos marginales

coke.logitMfx<-logitmfx(coke~pratio+dispcoke+disppepsi, data=coke)
coke.logitMfx

## Call:
## logitmfx(formula = coke ~ pratio + dispcoke + disppepsi, data = coke)
##
## Marginal Effects:
## dF/dx Std. Err. z P>|z|
## pratio -0.490596 0.077016 -6.3700 1.890e-10 ***
## dispcoke 0.086654 0.039059 2.2186 0.02652 *
## disppepsi -0.175207 0.038719 -4.5251 6.037e-06 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## dF/dx is for discrete change for the following variables:
##
## [1] "dispcoke" "disppepsi"

Clase 3 MacroPol 28 July de 2022 34 / 59

Interpretación de coeficientes

Efectos marginales

Según la definición del efecto marginal, este será diferente en función de los
valores de la variables independientes.
En el caso de variables categóricas con diferentes valores, el efecto marginal
indica el cambio en probabilidad de cada valor, respecto al indicador de
referencia, por lo que, los efectos marginales serán diferentes en función de
los valores de las variables (Williams, 2018).

Clase 3 MacroPol 28 July de 2022 35 / 59

Interpretación de coeficientes

Efectos marginales

Estiman probabilidades en dos momentos distintos. Dado:

Pr(xi )
log = β0 + β1 xi1 + · · · + βp−1 xi(p−1)
1 − Pr(xi ))

e β0 +β1 xi1 +···+βp−1 xi(p−1)

Pr(xi ) = Pr[Yi = 1 | Xi = xi ] =
1 + e β0 +β1 xi1 +···+βp−1 xi(p−1)

mfx = Pr[Yi = 1 | Xi = 1] − Pr[Yi = 1 | Xi = 0]

Clase 3 MacroPol 28 July de 2022 36 / 59

Interpretación de coeficientes

Efectos marginales
Estimando el efecto marginal manualmente: dispcoke.
El efeecto marginal estima el cambio en probabilidad estimado, dado un
cambio marginal en la variable de interés (δx = 1 − 0).
bx1<-(1.9230-1.9957*mean(pratio)-0.7310*mean(disppepsi) +0.3516*1)
(px1<- exp(bx1)/(1+exp(bx1)))

## [1] 0.4896041

bx0<-(1.9230-1.9957*mean(pratio)-0.7310*mean(disppepsi) +0.3516*0)
(px0<- exp(bx0)/(1+exp(bx0)))

## [1] 0.4029497

px1-px0

## [1] 0.08665439

Clase 3 MacroPol 28 July de 2022 37 / 59

Interpretación de coeficientes

Efectos marginales

En el caso de variables continuas, usamos la variación alrededor de la media

(δx = (x̄ + 1) − x̄ ).
bx1<-1.9230-1.9957*(mean(pratio)+1)-0.7310*mean(disppepsi) +0.3516*mean(dispcoke)
(px1<- exp(bx1)/(1+exp(bx1)))

## [1] 0.09486307

bx0<-1.9230-1.9957*mean(pratio)-0.7310*mean(disppepsi) +0.3516*mean(dispcoke)
(px0<- exp(bx0)/(1+exp(bx0)))

## [1] 0.4353756

px1-px0

## [1] -0.3405125

Clase 3 MacroPol 28 July de 2022 38 / 59

Interpretación de coeficientes

Efectos marginales

EN muchos casos puede más realista comparar efectos marginales usando

valores puntuales de variables que es poco probable que asuman la media
como valor.
bx1<-1.9230-1.9957*(mean(pratio)+1)-0.7310*1 +0.3516*1
(px1<- exp(bx1)/(1+exp(bx1)))

## [1] 0.0757055

bx0<-1.9230-1.9957*mean(pratio)-0.7310*1 +0.3516*1
(px0<- exp(bx0)/(1+exp(bx0)))

## [1] 0.3760191

px1-px0

## [1] -0.3003136

Clase 3 MacroPol 28 July de 2022 39 / 59

Interpretación de coeficientes

Efectos marginales

Entonces, tenemos coeficientes, odds y mfx.

cbind(coeff=coef(coke.logit),
odd=exp(coef(coke.logit)),
mfx=(coke.logitMfx$mfxest[,"dF/dx"]))

## coeff odd mfx

## (Intercept) 1.9229722 6.8412616 -0.49059642
## pratio -1.9957418 0.1359128 0.08665362
## dispcoke 0.3515994 1.4213390 -0.17520661
## disppepsi -0.7309858 0.4814341 -0.49059642

Clase 3 MacroPol 28 July de 2022 40 / 59

Interpretación de coeficientes

Efectos marginales robustos

coke.logitMfx<-logitmfx(coke~pratio+dispcoke+disppepsi, data=coke, robust = T)

coke.logitMfx

## Call:
## logitmfx(formula = coke ~ pratio + dispcoke + disppepsi, data = coke,
## robust = T)
##
## Marginal Effects:
## dF/dx Std. Err. z P>|z|
## pratio -0.490596 0.081925 -5.9883 2.120e-09 ***
## dispcoke 0.086654 0.038319 2.2614 0.02373 *
## disppepsi -0.175207 0.038083 -4.6006 4.212e-06 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## dF/dx is for discrete change for the following variables:
##
## [1] "dispcoke" "disppepsi"

Clase 3 MacroPol 28 July de 2022 41 / 59

Bondad de ajuste

Section 4

Bondad de ajuste

Clase 3 MacroPol 28 July de 2022 42 / 59

Bondad de ajuste

Tabla de clasificación

En este define un predictor binario de yi como uno si la probabilidad predicha

es de al menos .5, y cero en caso contrario (Wooldrige, 2009, p.581). Esta
proporción de aciertos se determina como A+D n .

Ŷi = 0 Ŷi = 0
Yi = 0 p(x ) < c A B
Yi = 1 p(x ) > c C D

Clase 3 MacroPol 28 July de 2022 43 / 59

Bondad de ajuste

Tabla de clasificación

Una alternativa usando la función predict, type = “response”:

ˆ
e f (x)
P̂r(x) =
1 + e fˆ(x)
(
1 p(x) > 0.5
P̂r(x) =
0 p(x) ≤ 0.5

prob_model <- predict(coke.logit, coke, type = "response")

prob_hat <- ifelse(prob_model > 0.5, 1, 0)

mean(prob_hat == coke$coke)

## [1] 0.6614035

Clase 3 MacroPol 28 July de 2022 44 / 59

Bondad de ajuste

Tabla de clasificación
Una primera medida de bondad de ajuste es verificar que porcentaje de los
datos son predichos correctamente. De forma alternativa, podemos acceder
al porcentaje predicho correctamente.
table1<- data.frame(table(true=coke$coke,
predicted=round(fitted(coke.logit))))

table1

## true predicted Freq

## 1 0 0 507
## 2 1 0 263
## 3 0 1 123
## 4 1 1 247

#porcentaje estimado correctamente

(table1[1,3]+table1[4,3])/sum(table1[,3])

## [1] 0.6614035

Clase 3 MacroPol 28 July de 2022 45 / 59

Bondad de ajuste

Tabla de clasificación

Aunque el porcentaje predicho correctamente es útil como una medida de la

bondad de ajuste, puede ser confuso.
Además, suponer Y = 1 cuando y ∗ > 0.5 puede llevarnos a predecir más
casos de los deseados, especialmente en casos improbables, siendo una
alternativa utilizar como umbral, la fracción de éxito de Pr[Y = 1] observada
en la muestra.

Clase 3 MacroPol 28 July de 2022 46 / 59

Bondad de ajuste

Tabla de clasificación
Podemos clasificar el criterio de clasificación en función de la probabilidad
esperada:
(
1 p(x) > c
P̂r(x) =
0 p(x) ≤ c
prediccion <- ifelse(fitted.values(coke.logit) >= 0.7, 1, 0)
table(prediccion)

## prediccion
## 0 1
## 1034 106
table1<- data.frame(table(true=coke$coke,
predicted=prediccion))

table1

## true predicted Freq

## 1 0 0 608
## 2 1 0 426
## 3 0 Clase 3 1 22 MacroPol 28 July de 2022 47 / 59
Bondad de ajuste

Bondad de ajuste: pseudo r-cuadrado

El p-seudo R 2 de McFadden (1974), utiliza la función de verosimilitud del

modelo no restringido y la del modelo restringido (solo con constante), que
es la probabilidad media incondicional.
En caso de las variables no tener poder explicativo, ambas variables son
iguales y la medida de ajuste es igual a cero.

ln β̂
R̂ 2 = 1 −
ln Ȳ

Clase 3 MacroPol 28 July de 2022 48 / 59

Bondad de ajuste

Pseudos R-Cuadrados

Las estimaciones de los pseudos r2 de los modelos binarios, se pueden

obtener a partir de la función pR2, del paquete pscl.
coke.logitConst <- glm(coke~1, data=coke, family=binomial(link="logit"))
(RsqrMcFadden <- 1 - coke.logit$deviance/coke.logitConst$null.deviance)

## [1] 0.09493292

#verificar dato estimado

library(pscl, MASS) #PSCL = Bondad de ajuste: McFadden
pR2(coke.logit)

## fitting null model for pseudo-r2

## llh llhNull G2 McFadden r2ML

## -709.44613816 -783.86028085 148.82828539 0.09493292 0.12238838
## r2CU
## 0.16379397

Clase 3 MacroPol 28 July de 2022 49 / 59

Aplicaciones

Section 5

Aplicaciones

Clase 3 MacroPol 28 July de 2022 50 / 59

Aplicaciones

Perfiles de probabilidad en la media

Los modelos permiten medir la probabilidad de que ocurra el acontecimiento
considerado, a partir del modelo estimado (Y = Pr (Y = 1|x )), lo que
permite crear perfiles de probabilidades.

Pr (Y = 1|x )
Logit i = ln = β′X
1 − Pr (Y = 1|x )

Y ′
= eβ X
1−Y
′
Y = (1 − Y )e β X

′ ′
Y = eβ X
− Ye β X
′ ′
Y + Ye β X
= eβ X
′ ′
(1 + e β X )Y = e β X

′
eβ X
Pr (Y = 1|x ) =
1 + e β′ X
Clase 3 MacroPol 28 July de 2022 51 / 59
Aplicaciones

Perfiles de probabilidad en la media

Estimada la probabilidad para cada individuo, es posible establecer perfiles de

probabilidad a nivel de grupos de la población estudiada.
CASO 0: Estimar la probabilidad a cada individuo y generar tablas de
volatilidad.
CASO 1: Obtención de probabilidades para todas las observaciones en el
promedio de las dependientes (Marginal Effects at the Means (MEMS)
CASO 2: Obtención de probabilidades para todas las observaciones en valores
específicos de las dependientes.

Clase 3 MacroPol 28 July de 2022 52 / 59

Aplicaciones

Perfiles de probabilidad en la media

yhat<-coke.logit$fitted.values
prob<-exp(yhat)/(1+exp(yhat))

library(tidyverse)
coke %>%
dplyr::mutate(proba = prob) %>%
group_by(disppepsi) %>%
summarise(mean(proba))

## # A tibble: 2 x 2
## disppepsi ‘mean(proba)‘
## <int> <dbl>
## 1 0 0.630
## 2 1 0.573

Clase 3 MacroPol 28 July de 2022 53 / 59

Aplicaciones

Perfiles de probabilidad en la media

Adicionalmente, se pueden estimar probabilidades para valores especifícos de

nuestra variable independiente.
allmeans <- data.frame(pratio=mean(pratio),
dispcoke=mean(dispcoke),
disppepsi=mean(disppepsi))

allmeans$predprob <- predict(coke.logit, newdata=allmeans, type="response")

allmeans

## pratio dispcoke disppepsi predprob

## 1 1.027249 0.3789474 0.3640351 0.4353594

Clase 3 MacroPol 28 July de 2022 54 / 59

Aplicaciones

Perfiles de probabilidad en la media

Aunque suele ser más realista suponer valores concretos de las variables.
allmeans <- data.frame(pratio=1,
dispcoke=1,
disppepsi=0)

allmeans$predprob <- predict(coke.logit, newdata=allmeans, type="response")

allmeans

## pratio dispcoke disppepsi predprob

## 1 1 1 0 0.5692593

Clase 3 MacroPol 28 July de 2022 55 / 59

Aplicaciones

Perfiles de probabilidad en la media

Aunque suele ser más realista suponer valores concretos de las variables.
allmeans <- data.frame(pratio=c(0.5,0.5,1,1,2,2),
dispcoke=c(1),
disppepsi=c(0,1))

allmeans$predprob <- predict(coke.logit, newdata=allmeans, type="response")

allmeans

## pratio dispcoke disppepsi predprob

## 1 0.5 1 0 0.78188763
## 2 0.5 1 1 0.63314082
## 3 1.0 1 0 0.56925930
## 4 1.0 1 1 0.38884826
## 5 2.0 1 0 0.15226934
## 6 2.0 1 1 0.07959241

Clase 3 MacroPol 28 July de 2022 56 / 59

Aplicaciones

Perfiles de probabilidad en la media

Aunque suele ser más realista suponer valores concretos de las variables.
means2 <- data.frame(pratio=seq(0,2,length.out = 10),
dispcoke=rep(1,10),
disppepsi=rep(1,10))

means2$predprob <- predict(coke.logit, newdata=means2, type="response")

means2

## pratio dispcoke disppepsi predprob

## 1 0.0000000 1 1 0.82398537
## 2 0.2222222 1 1 0.75027650
## 3 0.4444444 1 1 0.65849381
## 4 0.6666667 1 1 0.55307212
## 5 0.8888889 1 1 0.44265173
## 6 1.1111111 1 1 0.33762296
## 7 1.3333333 1 1 0.24649325
## 8 1.5555556 1 1 0.17351732
## 9 1.7777778 1 1 0.11874175
## 10 2.0000000 1 1 0.07959241

Clase 3 MacroPol 28 July de 2022 57 / 59

Referencias

Section 6

Referencias

Clase 3 MacroPol 28 July de 2022 58 / 59

Referencias

Referencias
Albarran, P. (2011). Modelos de Elección Discreta.
Cañadas, J. (2011). Heterocedasticidad en modelos de regresión ordinal con R. Instituto de
Estudios Sociales Avanzados IESA-CSIC.
Cameron, C.; Trivedi, P. (2005). Microeconometrics: Methods and applications.
Dalpiaz, D. (2022). Applied Statistics with R.
Escabias, M. (2013). Regresión logística. Tratamiento computacional con R. Universidad
de Granada.
Philip L. (2013). texreg: Conversion of Statistical Model Output in R to LaTeX and
HTML Tables. Journal of Statistical Software, 55(8), 1-24.
Torres, O. (2014). Logit, Probit and Multinomial Logit models in R. Princenton University.
Rodríguez, C. y Cáceres, J. (2007). Modelos de elección discreta y especificaciones
ordenadas: una reflexión metodológica. Universidad de La Laguna.
Sharyn, O. (s.f.d.). Logit/Probit. Econometrics II.
Torres, O. (2014). Logit, Probit and Multinomial Logit models in R. Princenton University.
Williams, R. (2018). Marginal Effects for Continuous Variables. University of Notre Dame.
Wooldridge, J. (2009). Introducción a la Econometría: un enfoque moderno. 4ta.
ed. Michigan State University. Cengage Learning

Clase 3 MacroPol 28 July de 2022 59 / 59

También podría gustarte

Modelos Logit y Probit en Econometría
Aún no hay calificaciones
Modelos Logit y Probit en Econometría
25 páginas
Material Stata Avanzado
Aún no hay calificaciones
Material Stata Avanzado
97 páginas
Datos de Panel
Aún no hay calificaciones
Datos de Panel
37 páginas
Curso de STATA 15 para Economistas
Aún no hay calificaciones
Curso de STATA 15 para Economistas
5 páginas
Econometría Aplicada para La Investigación Economica (Final)
50% (2)
Econometría Aplicada para La Investigación Economica (Final)
11 páginas
Syllabus Econometria Aplicada II
Aún no hay calificaciones
Syllabus Econometria Aplicada II
12 páginas
Econometria Con Stata Introduccion y Analisis de D
Aún no hay calificaciones
Econometria Con Stata Introduccion y Analisis de D
47 páginas
Taller de Econometría: Eviews y Stata
Aún no hay calificaciones
Taller de Econometría: Eviews y Stata
6 páginas
Curso de Stata: Análisis de Datos en Chile
Aún no hay calificaciones
Curso de Stata: Análisis de Datos en Chile
83 páginas
Introducción a STATA: Guía Básica
Aún no hay calificaciones
Introducción a STATA: Guía Básica
7 páginas
Modelos Multinomial y Probit en Econometría
Aún no hay calificaciones
Modelos Multinomial y Probit en Econometría
3 páginas
Pronosticos Stata
Aún no hay calificaciones
Pronosticos Stata
77 páginas
Relevancia de la Educación en Salarios
Aún no hay calificaciones
Relevancia de la Educación en Salarios
108 páginas
Compendio de Econometria 2
Aún no hay calificaciones
Compendio de Econometria 2
92 páginas
Macroeconometria PDF
Aún no hay calificaciones
Macroeconometria PDF
248 páginas
Guía de Modelos Cuantitativos UTPL
Aún no hay calificaciones
Guía de Modelos Cuantitativos UTPL
114 páginas
Ejercicio Datos de Panel
Aún no hay calificaciones
Ejercicio Datos de Panel
10 páginas
Modelos ARCH en Econometría Financiera
Aún no hay calificaciones
Modelos ARCH en Econometría Financiera
34 páginas
Introducción a la Econometría I
Aún no hay calificaciones
Introducción a la Econometría I
35 páginas
Modelos de Elección Discreta: Logit y Probit
Aún no hay calificaciones
Modelos de Elección Discreta: Logit y Probit
31 páginas
Clase 1
100% (1)
Clase 1
40 páginas
Algebra Modelo Simple (Macroeconomía)
Aún no hay calificaciones
Algebra Modelo Simple (Macroeconomía)
36 páginas
Introducción a la Econometría y Modelos
Aún no hay calificaciones
Introducción a la Econometría y Modelos
75 páginas
Análisis de Datos Panel en Stata
Aún no hay calificaciones
Análisis de Datos Panel en Stata
1 página
Análisis Microeconométrico en Stata
Aún no hay calificaciones
Análisis Microeconométrico en Stata
131 páginas
Modelo Ricardo
Aún no hay calificaciones
Modelo Ricardo
39 páginas
Análisis del Oligopolio en Microeconomía
Aún no hay calificaciones
Análisis del Oligopolio en Microeconomía
51 páginas
Econometria I. Modelos de Regresión - Marta García PDF
Aún no hay calificaciones
Econometria I. Modelos de Regresión - Marta García PDF
79 páginas
Modelos Económicos en Hojas XLS
Aún no hay calificaciones
Modelos Económicos en Hojas XLS
2 páginas
B Microeconometría Aplicada
Aún no hay calificaciones
B Microeconometría Aplicada
7 páginas
Tema 4. Datos Panel. Modelos Estáticos
100% (1)
Tema 4. Datos Panel. Modelos Estáticos
33 páginas
Fórmulas de Regresión Lineal
100% (2)
Fórmulas de Regresión Lineal
16 páginas
Introducción a Modelos de Regresión y STATA
Aún no hay calificaciones
Introducción a Modelos de Regresión y STATA
14 páginas
Condiciones Blanchard Khan para Regla de Taylor
100% (1)
Condiciones Blanchard Khan para Regla de Taylor
3 páginas
Curso Stata: Econometría y Bases de Datos
Aún no hay calificaciones
Curso Stata: Econometría y Bases de Datos
3 páginas
Stata Economistas 2019 - Puno
0% (1)
Stata Economistas 2019 - Puno
19 páginas
Introduccion A La Econometria Financiera
Aún no hay calificaciones
Introduccion A La Econometria Financiera
106 páginas
Ejercicios Resueltos de Macroeconomía 2
100% (1)
Ejercicios Resueltos de Macroeconomía 2
508 páginas
PUCP Econometría 2 (ECO330) 0722 (2012-2)
100% (1)
PUCP Econometría 2 (ECO330) 0722 (2012-2)
12 páginas
Guía de Ejercicios de Econometría I
Aún no hay calificaciones
Guía de Ejercicios de Econometría I
7 páginas
Evaluación de Impacto en Programas Sociales
Aún no hay calificaciones
Evaluación de Impacto en Programas Sociales
44 páginas
Índice de Lerner: Poder de Mercado
Aún no hay calificaciones
Índice de Lerner: Poder de Mercado
9 páginas
Econometría Financiera: Clase 1. Modelos Lineales de Series Financieras
Aún no hay calificaciones
Econometría Financiera: Clase 1. Modelos Lineales de Series Financieras
82 páginas
Modelos de Crecimiento Económico: Harrod y Domar
Aún no hay calificaciones
Modelos de Crecimiento Económico: Harrod y Domar
384 páginas
Informe Final Libro Econometría I
100% (1)
Informe Final Libro Econometría I
182 páginas
Heterocedasticidad PDF
Aún no hay calificaciones
Heterocedasticidad PDF
33 páginas
Stata Básico GIDDEA
Aún no hay calificaciones
Stata Básico GIDDEA
3 páginas
Detección de Heteroscedasticidad en Regresión
Aún no hay calificaciones
Detección de Heteroscedasticidad en Regresión
12 páginas
Modelo de Regimenes Cambiantes
100% (3)
Modelo de Regimenes Cambiantes
17 páginas
(Alianza Universidad) Roy Harrod - Dinámica Económica (1979, Alianza) - Libgen - Li
Aún no hay calificaciones
(Alianza Universidad) Roy Harrod - Dinámica Económica (1979, Alianza) - Libgen - Li
208 páginas
Clase 12 Econometría 1 - Enviado
Aún no hay calificaciones
Clase 12 Econometría 1 - Enviado
44 páginas
Modelos de Regresión para Variables Binarias
Aún no hay calificaciones
Modelos de Regresión para Variables Binarias
24 páginas
Download
Aún no hay calificaciones
Download
17 páginas
Modelos de Variables Dependientes Binarias
Aún no hay calificaciones
Modelos de Variables Dependientes Binarias
17 páginas
Modelo Probabilidad Lineal
Aún no hay calificaciones
Modelo Probabilidad Lineal
25 páginas
Variable Dependiente Limitada (Econometría)
Aún no hay calificaciones
Variable Dependiente Limitada (Econometría)
26 páginas
Efectos Marginales en Modelos Discretos
Aún no hay calificaciones
Efectos Marginales en Modelos Discretos
51 páginas
Modelos de Variable Dependiente Limitada
Aún no hay calificaciones
Modelos de Variable Dependiente Limitada
48 páginas
Modelos de Respuesta Binaria en Stata
Aún no hay calificaciones
Modelos de Respuesta Binaria en Stata
36 páginas
Econometría Financiera: Clase 2. Modelos de Volatilidad Condicional
Aún no hay calificaciones
Econometría Financiera: Clase 2. Modelos de Volatilidad Condicional
78 páginas
Clase 4. Econometría Financiera en R
Aún no hay calificaciones
Clase 4. Econometría Financiera en R
43 páginas
Sitios para Aprender Gratis Microsoft Power BI
Aún no hay calificaciones
Sitios para Aprender Gratis Microsoft Power BI
7 páginas
Fases y Redacción en Econometría
Aún no hay calificaciones
Fases y Redacción en Econometría
39 páginas
Qué Errores Podemos Encontrarnos en Un Conjunto de Datos
Aún no hay calificaciones
Qué Errores Podemos Encontrarnos en Un Conjunto de Datos
2 páginas
Mercado de Reciclaje de RSDI en Chile
Aún no hay calificaciones
Mercado de Reciclaje de RSDI en Chile
51 páginas
Julio Ibarra Maldonado, Ciudad Traicionera
Aún no hay calificaciones
Julio Ibarra Maldonado, Ciudad Traicionera
67 páginas
Introducción Al Cálculo Estructural
Aún no hay calificaciones
Introducción Al Cálculo Estructural
134 páginas
Historia y actualidad de la minería en Chile
Aún no hay calificaciones
Historia y actualidad de la minería en Chile
338 páginas
Variables Ficticias en Econometría
Aún no hay calificaciones
Variables Ficticias en Econometría
8 páginas
Análisis de Regresión y Residuales
Aún no hay calificaciones
Análisis de Regresión y Residuales
3 páginas
Normas de Unerg
Aún no hay calificaciones
Normas de Unerg
92 páginas
Fundamentos de Estadística en Finanzas
Aún no hay calificaciones
Fundamentos de Estadística en Finanzas
2 páginas
Actividad Unica III Parcial de Estadistica Economica II Del II Pac 2025
Aún no hay calificaciones
Actividad Unica III Parcial de Estadistica Economica II Del II Pac 2025
3 páginas
Pruebas de Hipótesis en La Regresión Lineal Simple
0% (1)
Pruebas de Hipótesis en La Regresión Lineal Simple
5 páginas
Brochure Maestria en Economía
Aún no hay calificaciones
Brochure Maestria en Economía
17 páginas
Satisfacción de Alumnos: Análisis y Resultados
Aún no hay calificaciones
Satisfacción de Alumnos: Análisis y Resultados
5 páginas
Actividad de Puntos Evaluables INTENTO 1 ECONOMETRÍA
Aún no hay calificaciones
Actividad de Puntos Evaluables INTENTO 1 ECONOMETRÍA
6 páginas
Análisis de Correlación y Regresión Lineal
Aún no hay calificaciones
Análisis de Correlación y Regresión Lineal
6 páginas
Análisis de Regresión: Ventas, Publicidad y Precio
Aún no hay calificaciones
Análisis de Regresión: Ventas, Publicidad y Precio
9 páginas
Práctica de Laboratorio: Aceleración Física
Aún no hay calificaciones
Práctica de Laboratorio: Aceleración Física
22 páginas
Propiedades Deseables de Un Estimador: Estimadores
Aún no hay calificaciones
Propiedades Deseables de Un Estimador: Estimadores
2 páginas
Ejercicios de Intervalos de Confianza
Aún no hay calificaciones
Ejercicios de Intervalos de Confianza
6 páginas
Transparencias Econometria 1
Aún no hay calificaciones
Transparencias Econometria 1
33 páginas
Fundamentos de la Econometría
Aún no hay calificaciones
Fundamentos de la Econometría
8 páginas
Ejercicios de Econometria
100% (1)
Ejercicios de Econometria
24 páginas
Intervalos de Confianza en Estadística
Aún no hay calificaciones
Intervalos de Confianza en Estadística
5 páginas
Unidad 6 - Actividad - 2
Aún no hay calificaciones
Unidad 6 - Actividad - 2
9 páginas
Court y Rengifo (2) - 44-52
Aún no hay calificaciones
Court y Rengifo (2) - 44-52
9 páginas
Examen Final - Semana 8 - INV - PRIMER BLOQUE-ECONOMETRIA - (GRUPO1)
100% (1)
Examen Final - Semana 8 - INV - PRIMER BLOQUE-ECONOMETRIA - (GRUPO1)
14 páginas
Técnicas de Proyección en Estudios de Mercado
50% (2)
Técnicas de Proyección en Estudios de Mercado
4 páginas
Teorías Clave de la Administración Moderna
Aún no hay calificaciones
Teorías Clave de la Administración Moderna
4 páginas
Análisis de Modelos ARIMA en Econometría
Aún no hay calificaciones
Análisis de Modelos ARIMA en Econometría
6 páginas
Ejercicios de Econometría para Parcial
Aún no hay calificaciones
Ejercicios de Econometría para Parcial
6 páginas
Modelo Arima
Aún no hay calificaciones
Modelo Arima
8 páginas
Examen Final de Econometría II
Aún no hay calificaciones
Examen Final de Econometría II
2 páginas
Datos de Panel
Aún no hay calificaciones
Datos de Panel
10 páginas
Regresion Lineal Simple
Aún no hay calificaciones
Regresion Lineal Simple
9 páginas
Valuación Masiva: Métodos y Análisis Estadístico
Aún no hay calificaciones
Valuación Masiva: Métodos y Análisis Estadístico
41 páginas