STATA
Contenido
¿Qué es STATA?
¿Cómo ingresar a STATA?
¿Cómo ingresar datos a STATA?
¿Cómo crear programas en STATA?
¿Cómo guardar las salidas?
¿Cómo se configura la memoria?
¿Cómo se escribe la sintaxis en STATA?
¿Con qué tipo de archivos trabaja STATA?
¿Cómo abrir archivos?
Contenido
¿Cómo guardar archivos en STATA?
¿Cómo describir los datos en STATA?
¿Con qué tipo de variables trabaja STATA?
¿Cuál es el formato de variables en STATA?
¿Cómo se maneja la base datos en STATA?
¿Cuáles son los operadores, funciones y formatos?
¿Cómo se manipulan los datos en STATA?
¿Cómo se generan reportes en STATA?
¿Qué es STATA?
• STATA es un rápido, exacto y poderoso programa
estadístico para investigadores de diferentes
disciplinas, desde bioestadísticos hasta
investigadores sociales.
• Más específicamente se usa en el curso de
Econometría.
• Los manuales de STATA reúnen en 14 volúmenes
ejemplos estadísticos, explicaciones teóricas,
métodos, formulas y documentos de referencias.
¿Cómo ingresar a STATA?
¿Cómo ingresar a STATA?
Los cuadros de repaso (Review), de variables, de
comandos (Command) y resultados (cuadro en negro),
permiten al usuario respectivamente:
• Llevar un completo registro de todos los procedimientos
ejecutados durante una sesión de STATA (cuadro de
Review).
• Listar las variables (cuadro de variables)
• Escribir y almacenar las líneas de comandos para ejecutar
un procedimiento estadistico o economñetrico (cuadro
Command).
• Visualizar la sintaxis, mensajes de error y los resultados de
los procedimientos ejecutados por el usuario (cuadro de
fondo oscuro)
¿Cómo ingresar datos a STATA?
Los datos pueden ser visualizados o introducidos en
STATA haciendo clic en el icono de la ventana “Data
editor”. Así:
¿Cómo ingresar datos a STATA?
En esta ventana se ingresan los datos:
¿Cómo crear programas en STATA?
• Así mismo el usuario puede abrir un editor de
texto donde puede crear programas (archivos
“.do” y “.ado” de STATA? Haciendo clic en el icono
de la ventana “New Do-file Editor”. Así:
¿Cómo crear programas en STATA?
En esta ventana se escribe el programa:
¿Cómo se guardan las salidas?
• Finalmente, el usuario puede guardar las salidas
de una sesión de trabajo (las cuales aparecen en el
cuadro en fondo oscuro) en un archivo tipo texto o
“log file” cuya extensión es .smcl. Así:
¿Cómo se guardan las salidas?
• En esta ventana se escribe el nombre del archivo:
¿Cómo se configura la memoria?
• Cuando se trabaja con bases de datos muy grandes, es
posible especificar la cantidad de memoria asignada para
los datos antes de comenzar una sesión de trabajo
escribiendo el siguiente comando en el cuadro
“Command”:
• Set memory 200m, antes era necesario, ahora no.
¿Cómo se escribe la sintaxis en STATA?
La memoria de los comandos de STATA tienen una sintaxis
que se compone de cuatro partes:
1) Comando
2) Lista de variables
3) Restricción o rango para los datos
4) Opciones adicionales para ejecutar el comando
¿Cómo se escribe la sintaxis en STATA?
Por ejemplo, para realizar una regresión lineal:
regre lc lq
¿Cómo obtener los efectos marginales?
• Por ejemplo, para obtener los efectos marginales:
• mfx compute
¿Cómo se escribe la sintaxis en STATA?
• Por ejemplo, para realizar un modelo Probit:
• probit mejora psi
¿Cómo obtener los efectos marginales?
• Por ejemplo, para obtener los efectos marginales en
media:
• mfx
¿Cómo se realizan gráficos?
La ruta para ingresar es: graphics
¿Cómo realizar un gráfico?
Luego se escriben las variables:
10000
5000
Residuals
0
-5000
10 20 30 40
Mileage (mpg)
¿Con qué tipo de archivos trabaja STATA?
Antes de iniciar una sesión de trabajo es importante
tener en cuenta que STATA opera a través de
diferentes tipos de archivos.
¿Cómo abrir archivos en STATA?
¿Cómo guardar archivos en STATA?
¿Cómo describir datos en STATA?
• Una vez que ha sido cargada una base de datos, es
posible examinar su contenido a partir del
comando “describe” o de abreviada “d”
¿Con qué tipos de variables trabaja STATA?
¿Cuál es el formato de variables en STATA?
Cadena
Numérica
¿Cómo se maneja la base de datos en STATA?
• Para combinar conjunto de datos verticalmente se
emplea el comando “append”
• Por ejemplo, podríamos integrar en una sola base de
datos la información sobre hombres y mujeres jefes de
hogar en Puno para el año 2005, la cual se encuentra en
los archivos “hombres.dta” y “mujeres.dta”
respectivamente por medio del comando “append” así:
• Cargamos y hacemos una descripción de la base de datos
con la información de hombres.
• Use hombres, luego describe
¿Cómo se maneja la base de datos en STATA?
• A continuación añadimos la información de las
mujeres y volvemos a pedir una descripción de la
nueva base de datos.
• Append using mujeres
• describe
¿Cómo se maneja la base de datos en
STATA?
• Se deben tener en cuenta dos aspectos. 1) el comando
“append” debe estar acompañado de la palabra “using” la
cual indica que el nombre a continuacion corresponde al
conjunto de datos que serán adicionados verticalmente.
2) Como la base de datos cargada en la memoria ha
cambiado, es conveniente que el usuario salve la nueva
informacíón con otro nombre y verifique la nueva
información así:
• Save PERSONAS
• describe
¿Cómo se maneja la base de datos en
STATA?
• Para combinar conjuntos de datos horizontalemente se emplea el
comando “merge”.
• Para ejecutar este comando se deben tener en cuenta las siguientes
recomendaciones:
• La base de datos cargada en la memoria en el momento de realizar
el pegue será denominada base “master”.
La base de datos de donde serán tomadas las nuevas variables se
denominará base “using”
• Los registros en la base “master” recibirán información adicional
proveniente de la base “using”. Para que la nueva información de la
base “using” corresponda exactamente a los registros contenidos
en la base “master”, es necesario que ambas bases de datos
compartan uno o más variables indentificadoras.
¿Cómo se maneja la base de datos en
STATA?
• Las variables “indetificadoras” permiten señalar, sin
temor a equivocarnos, la ubicación de una observación en
una base de datos.
• Antes de realizar el pegue es necesario que las bases
“master” y “using” estén ordenadas de acuerdo a la(s)
variables identificadoras.
• Una vez que ha realizado el pegado, Stata genera una
nueva variable llamada “_merge” la cual indica de dónde
han sido tomados los datos.
¿Cómo se maneja la base de datos en
STATA?
• Siguiendo con el ejemplo anterior, queremos agregar a la base de datos
“personas” información sobre las características de la fuerza de trabajo. Esta
información se encuentra en la base de datos “trabajo.dta”. Los pasos a seguir
son:
• Cargamos la base “using” la ordenamos y la salvamos. El comando para ordenar
las observaciones es “sort”
Use trabajo
Sort numero
Save trabajo, repklace
• Cargamos la base “master”, la ordenamos y la salvamos.
Use personas
Sort numero
Save personas, replace
¿Cómo se maneja la base de datos en
STATA?
• _merge==1 “ master”
• _merge==2 “using”
• _merge==3 “master” y “using”
¿Cuáles son los operadores, funciones y formatos
en STATA?
• Para crear variables nuevas es necesario que el
usuario se familiarice con los siguientes
operadores matemáticos, lógicos y relacionales:
¿Cuáles son los operadores, funciones y formatos
en STATA?
¿Cuáles son los operadores, funciones y formatos
en STATA?
¿Cuáles son los operadores, funciones y formatos
en STATA?
• Las variables de tiempo; fechas en años,
semestres, trimestres, meses, semanas y días
deben tener un formato especial en análisis de
serie de tiempo y panel de datos. Los formatos de
estas variables en cada caso se describen a
continuación:
¿Cómo se manipulan los datos en STATA?
• Para generar variables nuevas se emplea
principalmente el comando “generate” o en forma
abreviada “g”. Ejm. Generando:
• genr y1=3*x^2
¿Cómo se manipulan los datos en STATA?
• Podemos listar la información en la base por
medio del comando “list”
list
¿Cómo se manipulan los datos en STATA?
• La variable “fecha” tiene un formato numérico que
corresponda al número de meses desde 1960. Así,
para la primera observación (mes2; año 1990) el
número de meses transcurridos desde 1960 son
361.
• Sin embargo a la variable fecha se le puede dar un
formato numérico de fecha correspondiente a
años y meses así.
¿Cómo se manipulan los datos en STATA?
• En el análisis de serie resulta muy útil generar
variables con uno o más rezagos. En estos casos
suele acompañarse al comando “generate” con los
operados _N y _n. El operador _N cuenta el
número totalde observaciones es una variable y el
operador_n numera las observaciones de una
variable.
¿Cómo se manipulan los datos en STATA?
• Para generar una variable indicadora o “dummy” que asigne
“1” o “0” según se cumpla o no cierta condición.
• Por ejemplo
• Gen dummy = (año>=1995)
• List año dummy
• Genera una variable dummy que toma valor “1” si el año es
mayor o igual a 1995 y “0” en los demás casos.
• Un ejemplo más complejo sería
• Gen dummy2=(año==1998|año==2000)
• List año dummy2
• Se debe tener en cuenta cuando se emplea el comando
“generate”
¿Cómo se generan los reportes en STATA?
• Los comandos “tabulate” y “table” ofrecen a los
usuarios de STATA una amplia gama de
posibilidades de descripción y análisis de datos a
través de diferentes tipos de estadisticos y cruces
de variables.
• El comando “tabulate” produce un informe de
frecuencia de ocurrencia de un valor o una
categoria al interior de una variable.
¿Cómo se generan los reportes en STATA?
¿Cómo se generan los reportes en STATA?
• Una importante aplicación del comando “tab” es
que permite generar variables “dummy” para
cada una de las categorias de una variable con la
opción “gen”
• Se puede tabular de forma separada más de una
variable con el comando “tab1”
¿Cómo se generan los reportes en STATA?
• A través del comando “table” es posible generar
tablas de contingencia doble y múltiple, al tiempo
que el usuario puede definir el tipo medición para
las variables de interés.
¿Cómo se generan los reportes en STATA?
• Algunas características del comando “table”:
• Permite expandir la información a través de ponderadores
de frecuencia, de muestra, ponderadores analíticos y de
importancia.
• Permite resumir información para más de una variable.
¿Cómo se generan los reportes en STATA?
• Algunas características del comando “table”:
• Además de las frecuencias relativas, el usuario
puede definir el tipo de medición que desee
realizar para una o más variables y el tipo de
formato para los resultados en la tabla así:
¿Cómo se generan los reportes en STATA?
• Algunos de los más importante tipos de medición
incorporados al comando “table” son:
mean varname media de la variable
sd varname desviación estándar
count varname conteo de observaciones
max varname máximo
min varname mínimo
median varname mediana
¿Cómo se generan los reportes en STATA?
table y, c(mean x)
table y, c(sd, x)
Bibliografía
Málaga Ramiro (2005) “Curso de STATA para Economistas”
Pontificia Universidad Católica del Perú. Lima – Perú.
Marcelo Gordillo Darwin (2005) “Taller Didáctico: Soluciones
para el Análisis Socioeconómico mediante el uso de STATA”
Programa STATA en www.stata.com
STATA Corporation (2003) “Stata base reference manual”:
release 8, vol. 3 College Station: State Press.