0% encontró este documento útil (0 votos)
91 vistas35 páginas

Tema+4 2

El documento describe diferentes comandos de Stata para ordenar y exportar resultados de regresiones, como estout y outreg2. También explica cómo usar el comando ttest para realizar pruebas de hipótesis sobre los coeficientes estimados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
91 vistas35 páginas

Tema+4 2

El documento describe diferentes comandos de Stata para ordenar y exportar resultados de regresiones, como estout y outreg2. También explica cómo usar el comando ttest para realizar pruebas de hipótesis sobre los coeficientes estimados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Stata: Desde básico hasta avanzando

José Mendoza Sánchez

INFOX

Semana 4 - Parte 2
1 Ordenando y exportando los resultados a distintos formatos
estout y esttab
Exportando el resultado
outreg2

2 Contraste de hipótesis

3 Endogeneidad en los modelos: Variables instrumentales y estimación por mínimos


cuadrados por dos etapas
Endogeneidad
Variables instrumentales
Paso a paso, ivregress y ivreg2

4 Analizando los supuestos de variables instrumentales


Condición de relevancia y condición de exogeneidad

5 Aplicación

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 2 / 35
Ordenando y exportando los resultados a distintos formatos

En la primera parte de la semana exploramos como hacer regresiones


simples y como incluir un diseño muestral en los programas así como el
uso de las opciones de post-estimación y de resultados guardados. En esta
segunda parte vamos a comenzar por explorar algunos comando bastante
utilizados para el ordenamiento y exportación de resultados, tanto de
regresiones como de otro tipo. Particularmente, el paquete de opciones de
estout y outreg2. Ambas necesitan instalarse previamente usando ssc
install estout y ssc install outreg2, respectivamente.
El objetivo es crear tablas usando los resultados de las regresiones,
editarlas y ver en qué formatos se pueden exportar.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 3 / 35
estout
El paquete de comandos de estout permite hacer tablas no solo de regresiones pero
también de estadísticos. Comencemos aprendiendo el comando estout. Si recuerda ya
hemos usado previamente uno de los comandos de este paquete. Al momento de correr
una regresión podemos usar el prefijo estout para ir almacenando los resultados.
También podemos usar estimates store seguido por un nombre luego de una
regresión para almacenar los resultados. Veamos un ejemplo:

En la primera parte guardamos los resultados usando estimates store y en la segunda


parte usamos eststo:. En este caso [Link] hace referencia a las categorías de [Link]
regiones. Veamos el resultado.
José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 4 / 35
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 5 / 35
Cuando se usa estout se junta los coeficientes estimados para ambos modelos y se
agrega. Un problema claro con esta tabla es que no es clara. Se acumulan los resultados
de las dummies por región y de la categoría base para género. Podemos editar esta tabla
para mejorarla.

En este caso estamos agregando una serie de opciones para editar el resultado final de la
tabla:
drop(): Eliminamos las variables que no nos interesa agregar en la tabla final.
Por ejemplo la categoría base de la variable de género y las dummies de región.
renam(): Renombramos las etiquetas de las variables que están en la tabla para
que se entienda mejor
mlabels(): Son como los títulos de cada columna
title(): El título de la tabla
legend: Con esto se agrega la leyenda en la tablas.
cells(): Son los resultados que se buscan presentar, en este caso b hace
referencia a los betas, p al p-value y se al error estándar.
stats(): Son estadísticos adicionales que se agregan al final de la tabla. En este
[Link]
caso el R-cuadrado y el número de observaciones.
José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 6 / 35
Veamos a detalle el código para cells(). En este caso, además de indicar el resultado a
agregar (como el beta o el error estándar), también podemos indicar algunos detalles
adicionales como que se agregen estrellas por la significancia, se cambie la etiqueta (se
usa label() con el nombre final) y que se de formato (se usa fmt() indicando el
formato, en este caso 2 indica dos decimales).

Ojo: en el caso de cells() indicamos entre comillas b, para los coeficientes, y p, para
el p-value. Esto indica que se posicionen verticalmente. Mientras que se, para error
estándar, está fuera de la comilla por lo que se ubica debajo de los coeficientes.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 7 / 35
esttab
El comando esttab es una simplificación de estout. Su uso es muy similar a este pero
no precisa de detallar muchas opciones.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 8 / 35
Este comando permite el mismo nivel de detalle que el previo:

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 9 / 35
Exportando el resultado

Veamos como exportar las tablas que creamos a tres tipos de formato: a formato .csv
(puede ser abierto en Excel), a formato .rtf (puede ser abierto en Word u otro editor
de texto) y en formato .tex (para cargar la base a una docomento de LATEX). Solo hay
que agregar algunas cosas adicionales al código previo. Primero, la ubicación y el
formato de la tabla. Para ello usamos esttab using
"/Users/direccion/tabla_1.csv", o también indicando alguno de los otros formatos.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 10 / 35
El documento .csv se tiene que abrir como una base de datos de texto en
excel para que se pueda ver bien (Abrimos Excel -> Pestaña Datos ->
Desde el texto-> Elegimos el archivo -> Elegimos el delimitador, en este
caso es coma (,)).

El archivo .rtf puede abrirse desde Word y el archivo .tex desde algún
editor de LATEXcomo TexStudio u Overleaf. [Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 11 / 35
outreg2
El comando outreg2 es similar al anterior pero tiene otro conjunto de comandos para
opciones y otra forma de sintaxis. Una gran diferencia es que puede producir tablas en
formato .doc, el formato directo de Word. También puede producir para exportar a
LATEX. Veamos su sintaxis.

En este caso no se ‘almacenan’ los resultado, en cambio se crea una tabla


inmediatamente después de hacer una regresión. En este caso creamos un documento
.doc e indicamos la opción replace para que cada vez que se corra esa linea se cree un
archivo nuevo. En la segunda regresión hacemos algo similar pero en vez de usar la
opción replace usamos la opción append para anexar (append) los resultados a la tabla
creada lineas arriba. En este caso usamos la opción keep() para quedarnos con un sub
conjunto de variables. Veamos el resultado:
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 12 / 35
La tabla, al menos en Word, parece estár más detallada que en el caso del formato .rtf
de estout. Al menos si planea solo usar Word para editar sus tablas puede ser preferible
practicar más usando el comando outreg2.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 13 / 35
Contraste de hipótesis
Luego de revisar como hacer regresiones básica, repasaremos como
implementar pruebas de hipótesis en el programa. Para ello aprenderemos
a usar el comando ttest:

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 14 / 35
ttest
El comando ttest nos permite contrastar estadísticamente el valor de uno de los
coeficientes estimado en las regresiones. Comparemos la edad promedio en la muestra
entre hombres y mujeres:

La primera parte del resultado presenta estadísticos descriptivos para la variable edad
con respecto a hombres y mujeres así como para toda la muestra. La última fila
presenta la diferencia de medias así como su error estándar e intervalo de confianza.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 15 / 35
La segunda parte del resultado presenta la definición de la variable diff, es decir la
diferencia de promedios. Si no hubiera diferencias en el promedio de estas dos variables
la diferencia debería ser estadísticamente indistinta de cero. Para ello, se plantea como
hipótesis nula:
H0 : diff = 0
Y, como hipótesis alternativa se plantean tres opciónes a contrastar de manera
separada:

Ha = diff < 0, es decir que la diferencia sea estadísticamente menor a cero


Ha = diff ! = 0, es decir que la difernecia sea distinta cero (mayor o menor)
Ha = diff > 0, es decir que la diferencia sea mayor a cero

Cada hipótesis alternativa tiene su respectivo p-value asociado. En este caso


concluiríamos que rechazamos la hipótesis nula de que la diferencia sea igual a cero y no
rechazamos que sea indistinta cero y menor a cero (las dos primeras hipótesis
alternativas).

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 16 / 35
También podemos contrastar el valor de una variable con un valor fijo.

En este caso comparamos la edad promedio con 42.5. El contenido del resultado es
similar al anterior. En este caso no podemos rechazar que el promedio de la variable sea
igual a 42.5.
Hasta este puntos hemos usado el comando ttest con los datos sin considerar el diseño
muestral. Ahora veamos como implementar un test de medias (un test de medias es un
test en donde se compara el promedio de una variable entre grupos) usando el diseño de
muestral.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 17 / 35
Si consideramos el diseño muestral primero debemos estimar los promedios usando el
prefijo svy:. Luego tenemos dos opciones, podemos usar el comando text (distinto a
ttest) o usar el comando lincom (que hace el mismo test sobre una combinación lineal
de los coeficientes). Veamos los dos casos.

Al correr los promedios estimados usamos la opción coeflegend para ver la leyenda de
cada coeficiente. Las leyendas de los coeficientes son _b[hombre] y _b[mujer] para
hombre y mujer respectivamente. De esta manera comparamos el promedio para hombre
y mujer en el primer caso usando test. En el segundo caso comparamos la diferencia de
ambos con lincom. Al final usamos los resultados guardados para encontrar el F y
compararlo con el F del test.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 18 / 35
En ambos casos el F es igual a 61.14 y el p-value indica que se rechaza la
H0 de que sean iguales.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 19 / 35
Endogeneidad

Los problemas de endogeneidad son constantes al momento de estimar un


modelo. Una forma fácil de entender la endogeneidad es considerar que
hay una correlación entre una variable explicativa (incluida o no ) y el
término de error. Es decir:

E (|X ) 6= 0 o E (X 0 ) = 0

Definamos que esto puede ocurrir producto de:


Sesgo por omisión de variables
Simultaneidad entre variable dependiente e independiente
Mala especificación del modelo
Sesgo de selección
Veamos un ejemplo clásico de simultaneidad.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 20 / 35
Consideremos una ecuación de oferta y otra de demanda:

Qd = βPd + d

Qs = θPs + s
Si queremos estimar Qd sin considerar que P se determina simultáneamente en las
ecuaciones entonces tendríamos problemas de endogeneidad. Si encontramos los valores
de equilibrio de las variables obtenemos:
s − d
P=
β−θ
βs − θd
Q=
β−θ
A partir de esto, podemos verificar que:
 
s − d E (2d ) σ2
E (Pd d ) = E d =− =−
β−θ β−θ β−θ

Por lo que no se cumpliría que E (Pd d ) = 0, por lo tanto hay endogeneidad.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 21 / 35
Variables instrumentales- IV
Para resolver este problema podemos proponer un o un conjunto de variables
instrumentales. Un instrumento debería no estar correlacionado con el término de error
y solo afectar a la variable independiente mas no a la dependiente. Definamos a un
instrumento como z. Comparemos distintos escenarios:

Exogeneidad Endogeneidad Instrumento z

x y x y z x y

u u u

Estas propiedades pueden expresarme como:

Exogeneidad, Cov (z, u) = 0.


Relevancia, Corr (z, x ) 6= 0. Es decir que z tenga la capacidad de explicar x .

El uso de variables instrumentales se puede dar bajo distintos métodos de estimación, no


solo bajo MCO. En este caos repasaremos como estimar el modelo básico usando dos
métodos: Mínimo Cuadrado en 2 Etapas y el Método Generalizado de Momentos. [Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 22 / 35
Estimando paso a paso, ivregress y ivreg2

Comencemos viendo la estimación por dos etapas. Consideremos a x1 como la variable


endógena, x2 como otra variable explicativa no endógena, a z como la variable
instrumental y a y como la variable dependiente. La primera etapa consiste en estimar:

x1,i = α0 + α1 zi + α2 x2,i + i

A partir de esto se obtiene:


xˆ1,i = αˆ0 + αˆ1 zi + αˆ2 x2,i
Usamos el valor estimado de x1 para regresionar:

yi = β0 + β1 xˆ1,i + β2 xi,2 + ui

Podemos llegar a esta estimación paso a paso, estimando cada etapa, o usando un
comando en particular. Hay dos comandos bastante usados, ivregress y ivreg2.
Comparemos los tres caminos.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 23 / 35
Como ejemplo tomemos los datos del estudio de Romer (1993)1 en donde se busca
estimar la correlación entre la tasa de inflación de un país y su nivel de apertura
comercial (controlado por el nivel de ingreso per cápita en logaritmo). Para ello
planteamo un modelo simple:

inflacioni = β0 + β1 × Aperturai + β2 × log(Ingresopc )i + ui

En este caso planteamos como variable instrumental al logaritmo de la extensión


territorial del país. Veamos:

1
Romer, D. (1993) "Openness and Inflation: Theory and Evidence," The Quarterly
[Link]

Journal of Economics, Oxford University Press, vol. 108(4), pages 869-903.


José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 24 / 35
Si lo hacemos paso a paso, primero debemos estimar la primera etapa del modelo, luego
predecir el valor de la variable endógena y, por último, usar esta nueva variable como
regresor en la ecuación final. En el caso de ivregress debemos indicar que estime el
modelo en dos etapa indicando 2sls:

Entre paréntesis debemos indicar la variable endógena y el o los instrumentos a usar.


Fuera podemos indicar las variables explicativas que no son endógenas. En el caso de
ivreg2 no es necesario indicar expresamente que se estime por dos etapas puesto que es
la opción por default. Este último comando tiene una amplia cantidad de opciones
disponibles para usar así como un resultado acompañado de mayor información.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 25 / 35
Al comparar los tres resultados obtenemos los mismos coeficientes y estadísticos.

En el resultado de ivreg2 podemos ver la información usual sino también mayor


información sobre algunos tests realizados. Regresaremos a estos test posterioremente.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 26 / 35
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 27 / 35
gmm

El método generalizado de momentos estima el modelo de manera distinto


al estimador de dos etapas. En este escenario se busca que los estimadores
cumplan con:
E [g(x , θ)] = 0
Siendo g() la función generalizadora de momentos y θ el vector de
coeficientes a estimar. Este no es un método lineal como en el caso previo.
Veamos las diferencias de estimar el modelo considerando dos etapas y
considerando el Método generalizado de momentos:

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 28 / 35
En este caso vemos que el coeficiente estimado es igual pero los errores
estándar son distintos. Esto se debe a que son dos maneras distintas de
obtener los valores de los coeficientes.
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 29 / 35
Condición de relevancia y de exogeneidad

¿Cómo podemos ver si los instrumentos cumplen con sus condiciones?

Condición de relevancia, Corr (z, x ) 6= 0 o Cov (z, x ) 6= 0.


Podemos construir un estadístico:
Cov (z, x )
π=
Var (z)

Y, luego, testear:
H0 : π = 0
Ha : π 6= 0
Condición de exogeneidad, Cov (z, u) = 0.
No se puede hacer un test sobre este supuesto. En cambio, debemos justificar de
alguna manera que esto cumpla. Bien siguiendo la teoría económica o alguna
fuente de exogeneidad (como un experimento).

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 30 / 35
Condición de relevancia
Para verificar la condición de relevancia podemos verificar el estadístico F de π generado
en la primera etapa de la regresión. Una regla rápida es verificar si el F es mayor a 10.

Para ver los resultados de la priumera etapa usamos la opción , first. Al final de esta
primera parte vemos el test de F test of excluded instruments. El F es mayor [Link]
10
por lo que podemos decir que el instrumento es relevante.
José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 31 / 35
Si estamos ante un modelo sobreidentificado, es decir que hay más
variables instrumentales que variables endógenas, entonces podemos
aplicar otro tipo de test. Veamos el test de Sargan. Para ello consideremos
como instrumento adicional una dummy = 1 cuando el país es petrolero.
Este instrumento sería útil si asumimos que no afecta la inflación del país
pero si la apertura comercial. En este caso la hipótesis nula es que ambos
instrumentos, en conjunto, son válidos. Si rechazamos la H0 entonces
tendríamos cierta evidencia a favor de dudar sobre la validez de los
instrumentos usados, de manera conjunta.

En este caso no podemos rechazar la nula por lo que el conjunto de


instrumentos sería válido.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 32 / 35
Aplicación: Estimemos una ecuación de Mincer básica

Una ecuación de Mincer busca explicar el nivel de ingresos a partir del nivel de
educación así como de otras variables. Consideremos el siguiente modelo:

log(Ingreso)i = β0 + β1 Educacioni + β3 HabilidadesInnatasi + ui

Las habilidades innatas de las personas no son observables por lo que no pueden ser
introducidas al modelo. A pesar de esto sí logran determinar el valor del ingreso. Si no
consideramos a esta variable entonces estaríamos estimando un modelo como el
siguiente:
log(Ingreso)i = β0 + β1 Educacioni + +i (1)
En donde:
β3 HabilidadesInnatasi + ui = i
Si estimamos (1) entonces es esperable que E (Educacion, i ) 6= 0 dado que las
habilidades innatas se correlacionan con el nivel de educación de una personas. A partir
de esto debemos de decidir un instrumento que nos permita estimar la ecuación.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 33 / 35
Para estimar esta ecuación primero necesitamos juntar los módulos de empleo y de
educación de la ENAHO. A partir de esta nueva base creamos una variable para los años
de educación y una del logaritmo del ingreso total. Como instrumento proponemos el
nivel educativo del jefe de hogar. Adicionalmente estimamos 4 modelos. Dos de ellos
MCO directos (uno para toda la muestra y otro para solo los hijos/as de jefes/as de
familiar) y otros dos modelos usando como variable instrumental el nivel educativo del
jefe de hogar.

La calidad del resultado depende, en bastante proporción, de qué tan bien se justifique
la exogeneidad de la variable instrumental.

[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 34 / 35
[Link]

José Mendoza Sánchez (INFOX) Stata: Desde básico hasta avanzando Semana 4 - Parte 2 35 / 35

También podría gustarte