Statistical
Analysis
(Stata)
María Teresa González Valencia
Luis Alejandro Villacorta Devoto
Introducción
• Stata: Un programa estadístico orientado al análisis
y manejo de datos. Permite trabajar con series de
tiempo, de corte transversal y de datos de panel.
• Permite al usuario efectuar análisis econométrico.
• Se orienta más al estudio y manejo de series de
corte transversal y panel de datos.
Introducción
• Stata puede utilizarse de dos formas:
1. Desde su interfaz (manejo directo)
2. Desde su entorno de programación.
• La programación de Stata está basada en
comandos.
Ventana principal
Área de
variables
Área de
revisión
Área de resultados
Área de
propiedades
Área de comandos
Ventana principal –
reinicio de áreas
Áreas de la pantalla
• Comandos: Se escriben las líneas de comandos a
ejecutar.
• Resultados: Muestra el resultado del comando
ejecutado
• Variables: Lista de variables contenidas en la base de
datos.
• Propiedades: Las principales características de la base
de datos y de las variables.
• Revisión: Registro completo de comandos ejecutados.
Memoria (versiones
previas a Stata 12)
• Comandos:
• set memory XXm
• set memory XXm, permanently
abreviado: set mem XXm, perm
• Query memory
• El tamaño de memoria asignada deberá ser
suficiente para el tamaño de datos cargados a
Stata.
Estructura de comandos
• Forma general:
• Forma reducida:
• Stata distingue entre mayúsculas y minúsculas. Se
recomienda trabajar siempre con minúsculas.
Tipos de archivo
• *.dta:
Bases de datos para Stata
• *.do:
Archivo de programa que puede ejecutarse en Stata.
• *.smcl
Archivo de registro de comandos y resultados de Stata.
Directorio de trabajo
• Ubicación:
cd
• Cambio de ubicación:
cd “C:\.....”
Guardado de registro
• Mediante uso de log files:
log using clase1
• Para terminar el registro:
log close
• El uso de log files permite el guardado de la
información del área resultados.
Usando bases de datos
• Abrir una base de datos:
use nombre_de_archivo
• Abrir una base de datos del propio Stata:
sysuse nombre_de_archivo
• Ejemplo: sysuse auto
Bases de datos
• Datos de automóviles
Comandos iniciales
• Detalles sobre las variables, etiquetas y valores:
codebook
• Descripción de variables:
describe
• Listado de valores de variables:
list
list nombre_de_variable
Comandos iniciales
• Permitir paso de pantallas de resultados:
set more off
• Guardado de la base de datos:
save nuevo_nombre
Se guardará en el directorio de trabajo, a menos
que se le especifique otro directorio:
save “C:\...nuevo_nombre.dta”
• Guardar sobreescribiendo el nombre de la base de datos:
save, replace
Comandos iniciales
• Retirar la base de datos actual (no se guardarán los
cambios):
clear
• Uso de otra base de datos y retiro de base anterior:
use nombre_base, clear
Comandos estadísticos
• Resumen de estadísticos básicos:
summarize
summarize, detail
• Matriz de correlaciones:
correlate [variable1] [variable2]…
• Tabulación de información:
tabulate variable
Comandos de ayuda
• Ayuda sobre un comando específico:
help nombre_de_comando
• Búsqueda general:
search nombre_del_término
• Abreviaturas: Letras iniciales del comando (ver help del
comando):
summarize, describe
Operadores
• Operadores matemáticos:
+ - * / ^
• Operadores lógicos:
& conjunción
| disyunción
~ ! negación
Operadores
= es igual
~ = != no es igual
>= mayor o igual
<= menor o igual
== es igual a (caso condicional)
Vista de datos
• Inspección de datos:
browse
• Edición de datos:
edit
• Desde interfaz: