STATA
BÁSICO
NUESTRAS MODALIDADES
DO FILE - ESTRUCTURA Y
COMENTARIOS
CREACIÓN DE DO FILE (archivo.do)
• Es una opción que el programa STATA presenta para
que toda la programación de manipulación de bases de
datos se encuentre disponible .
• En la parte superior del STATA se presenta la opción de
creación de Do files, dando click se abrirá una ventana del
software, donde se puede pegar los c0mandos previamente
copiados.
• Esta nueva ventana se debe guardar, FILE, SAVE AS… y se
ha creado el Do file.
PARA CORRER EL DO FILE
• Cuando se quiera correr toda la sesión que se trabajó, se abre el programa. Al momento de
abrir la ventada de Do file se puede buscar el archivo guardado (FILE, OPEN).
• En la parte superior del STATA se presenta la opción para ejecutar el Do file.
• Si el Do file no tiene errores (Se deberá tener un Do file sin errores, los comandos
erróneos son rojos y si se intenta correr un Do file con comandos rojos éste se detendrá
automáticamente) toda la sesión que se trabajó será ejecutada en la interfaz del STATA.
• Se puede colocar comentarios agregando un * al inicio.
INTRODUCCIÓN ANÁLISIS
DESCRIPTIVO
ANALISIS DESCRIPTIVOS
• Al analizar datos, lo primero que conviene hacer con una variable es,
formarse una idea lo más exacta posible acerca de sus características.
• La Estadística Descriptiva ofrece modos de presentar y evaluar las
características principales de los datos a través de tablas, gráficos y
medidas resúmenes.
• El Objetivo de construir gráficos es poder apreciar los datos como un
todo e identificar sus características sobresalientes. El tipo de grafico a
seleccionar depende del tipo de variable que nos interese representar
por esa razón distinguiremos en la presentación de gráficos para
variables categóricas y para cuantitativas.
VARIABLES CATEGORICAS
• Tablas de Frecuencia: Es el modo mas simple de presentar
datos categóricos, una tabla de frecuencias informa sobre los valores
concretos que adopta una variable y sobre el número (y porcentaje) de
veces que se repite cada uno de esos valores. El procedimiento
• Gráficos de Barras: Gráficos en los que a cada categoría se
le asigna una barra con altura equivalente a su frecuencia absoluta o
relativa (porcentual).
• Gráficos de Sectores o Circulares: Gráficos
circulares en los que a cada categoría se le asigna un sector de tamaño
equivalente a su frecuencia absoluta o relativa (porcentual).
Sexo
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Mujer 81 40.5 40.5 40.5
Válido Varón 119 59.5 59.5 100.0
Total 200 100.0 100.0
VARIABLES CUANTITATIVAS
• Estadísticos: Valores que nos ayudan a describir las
características de nuestras variables.
• Gráficos de Histograma: Similares a los gráficos
de barras, pero con las barras juntas, dando así la impresión
de continuidad. Sólo pueden obtenerse con variables
numéricas.
Estadísticos
Edad
N Válido 200
Perdidos 0
Media 29.35
Mediana 29.00
Mínimo 22
Máximo 46
TABLA DE FRECUENCIA PARA
DATOS AGRUPADOS
• Una distribución de frecuencias por intervalos o de datos agrupados es una
organización de los datos en forma tabular en la que una de las columnas
se anota la variable en intervalos de clase y en las otras columnas se
anotan las frecuencias.
• Agrupar los datos en intervalos la información queda reducida y compacta,
lo que permite que sea practica y manejable.
TABLA DE FRECUENCIA
• Las tablas de frecuencia absoluta nos permiten
contabilizar casos que cumplen con
determinadas condiciones, Stata genera este
tipo de tablas mediante diversas formas, una de
ella es mediante el comando tabulate.
TABLAS DE CONTINGENCIA
• Cuando se trabaja con variables categóricas, los datos suelen organizarse
en tablas de doble entrada en las que cada entrada representa un criterio
de clasificación (una variable categórica).
• Como resultado de esta clasificación, las frecuencias (el número o
porcentaje de casos) aparecen organizadas en casillas que contienen
información sobre la relación existente entre ambos criterios. A estas tablas
de frecuencias se les llama tablas de contingencia.
TABLA DE FRECUENCIA CON
CONDICIÓN
También podemos introducir filtros o condicionales a nuestras tablas, esto resulta interesante cuando
deseamos restringir nuestro análisis a solo un grupo especial de la población.
El próximo comando muestra la tabla de frecuencias de las variables sólo para las observaciones que
cumplen la expresión especificada después del if.
• Tabla de frecuencia con condición
tabulate OCUP300 if C366==3| C366==4
TABLA DE FRECUENCIA ABSOLUTA,
RELATIVA Y ACUMULADA
Abrir EPEN BD Ciudades Anual 2023.dta
• Tabla de frecuencia absoluta, relativa y acumulada
tabulate OCUP300
• Tabla cruzada
tabulate OCUP300 C366
TABLA DE ESTADÍSTICOS
DESCRIPTIVOS
Los estadísticos descriptivos constituyen una de las primeras miradas brindad a nuestra base de datos,
utilizando las especificaciones de contenido, se obtiene la tabla, conteniendo la deviación y la media de
una determinada variable según otra variable.
• Tabla de estadísticos descriptivos con una variable categórica
table C207 , contents (n C208 mean C208 sd C208 )
TABLA DE ESTADÍSTICOS
DESCRIPTIVOS
Añadiendo además la opción row (col), la tabla incluirá una fila (columna) adicional con los valores
totales, para cada valor de las opciones que aparecen.
• Tabla de estadísticos descriptivos con una variable categórica
table C207 , contents (n C208 mean C208 sd C208 ) row
table C207 , contents (n C208 mean C208 sd C208 ) col
TABLA DE ESTADÍSTICOS
DESCRIPTIVOS
Podemos también solicitar las estadísticas para diversas variables, pero también podemos obtener
muchos otros estadísticos descriptivos.
• Tabla de estadísticos descriptivos con varias variables
tabstat C208 INGTOT INGTOTP if C207 == 2, s(count min max mean sd cv sk p50 p50 p75 p90)
TABLA DE ESTADÍSTICOS
DESCRIPTIVOS
También se puede combinar summ con el comando tabulate para obtener un resumen de estadístico
descriptivo de algunas variables según condición especifica.
• Tabla de estadísticos descriptivos con summ y tabulate
tabulate Informal_P , summarize( INGTOT )
TABLA DE ESTADÍSTICOS
DESCRIPTIVOS
Recodificar.
• Recodificar la edad
recode C208 (1/13=0 "Niños") (14/64=1 "PET") (else=3 "adultosM"), into(edad3)
TABLAS CON Y SIN FACTOR
(PONDERACIÓN)
Con Factor y sin factor.
• Cruzar edad recodificada con sexo
table edad3 C207
table edad3 C207 [pweight= FAC300_ANUAL]
TABLAS CON Y SIN FACTOR
(PONDERACIÓN)
También podemos adherir las marginales (totales) a las tablas anteriores
• Cruzar edad recodificada con sexo y marginales
table edad3 C207 [pweight= FAC300_ANUAL], row col
TABLAS CON Y SIN FACTOR
(PONDERACIÓN)
• Cruzar edad recodificada con sexo solo columnas
table edad3 C207 [pweight= FAC300_ANUAL], col
table edad3 C207 [pweight= FAC300_ANUAL], row
TABLAS CON BY(PONDERACIÓN)
• Cruzar edad recodificada con sexo según empleo formal e informal
table edad3 C207 [pweight= FAC300_ANUAL ], by( Informal_P )
TABLAS CON BY(PONDERACIÓN)
• Cruzar edad recodificada con sexo según empleo formal e informal por fila y columna
table edad3 C207 [pweight= FAC300_ANUAL ], by( Informal_P ) row col
TABLAS CON BY(PONDERACIÓN)
• Al agregar la opcion scol al final, se obtiene la suma total, equivalente a la población en general.
• Cruzar edad recodificada con sexo según empleo formal e informal por fila y columna y total
table edad3 C207 [pweight= FAC300_ANUAL ], by( Informal_P ) row col scol
Descarga el certificado Digital del curso
Al terminar todo curso en la
Escuela del INEI recibirás
un correo con los datos de
acceso para poder
descargar tu certificado
Digital a nombre del INEI.
https://sistemas.inei.gob.pe/WebCerEnei/