Universidad Popular Autónoma del Estado de Puebla
Academia de Probabilidad y Estadística
Estadística Descriptiva
Profesor: Miguel Ángel García
Instrucciones:
Se le pide contestar los siguientes ejercicios utilizando el programa estadístico Stata. Todas las
respuestas (incluyendo los comandos y tablas utilizadas para llegar a ellas), se deberán subir en la
sección correspondiente de Canvas, en un archivo con formato PDF.
Ejercicio 1:
En la pantalla principal del programa, identifique las principales ventanas y describa su función
(puede hacer uso de impresiones de pantalla para ejemplificar cada caso):
• Comando.-
Área donde escribes los comandos que deseas ejecutar.
• Resultados.-
Sirve para observar los comandos ejecutados.
• Variable.-
Nos sirve para ver todas las variables y conocer que etiquetas se relaciona con que
nombre; y así lograr usar de manera correcta los nombres en los comandos.
• Revisión.-
Va guardando todos los comandos, independientemente de que estén correctos (negros), o
incorrectos (rojo).
Ejercicio 2:
a) ¿Cuál es la importancia de crear un archivo do-file?
- Por que nos sirve para ejecutar comandos y tenerlos guardados en una lista para
poderlos correr en cualquier momento.
b) ¿Cuál es la principal diferencia entre el comando edit y el comando browse?
- Edit: Nos permite editar la información de las variables.
- Browse: Únicamente podremos revisar los datos de las variables.
Ejercicio 3:
Utilizado la base de datos “concentradohogar” (misma base que hemos utilizado en clase),
responda lo siguiente:
a) ¿Qué estadística descriptiva arroja como resultado el comando summarize de la
variable ing_cor?
. summarize ing_cor
Variable Obs Mean Std. Dev. Min Max
ing_cor 90,102 61489.96 78324.84 0 7153770
b) ¿Cuál es el promedio de edad para los hombres y mujeres jefes de hogar?, ¿en
cuál de los dos existe una mayor variación? Es decir, ¿cuál tiene una mayor
desviación estándar?
• El promedio de edad para los hombres es de 50.109, mientras que el de las
mujeres es 53.704.
• Las mujeres tienen una mayor desviación estándar
. tabstat edad_jefe, by(sexo_jefe) stats(mean sd)
Summary for variables: edad_jefe
by categories of: sexo_jefe (Sexo del jefe del hogar)
sexo_jefe mean sd
1 50.10912 15.49309
2 53.70444 16.53513
Total 51.23426 15.91404
c) Del total de jefes de familia, ¿cuál es el porcentaje que cuenta con estudios de
Licenciatura y Posgrado?
. tab educa_jefe
• El porcentaje de jefes de familia que Educaci�n
formal del
cuenta con licenciatura es del 10.86 jefe del
hogar Freq. Percent Cum.
• El porcentaje de jefes de familia que 01 5,495 6.10 6.10
cuenta con Posgrado es del 1.96 02 32 0.04 6.13
03 13,328 14.79 20.93
04 14,928 16.57 37.49
05 2,728 3.03 40.52
06 24,581 27.28 67.80
07 3,032 3.37 71.17
08 11,782 13.08 84.24
09 2,645 2.94 87.18
10 9,788 10.86 98.04
11 1,763 1.96 100.00
Total 90,102 100.00
d) Realice una tabla de la edad del jefe de familia por sexo, indicando la siguiente
estadística descriptiva: media, mediana, desviación estándar, coeficiente de variación,
mínimo y total de observaciones. Describa brevemente sus resultados.
. tabstat edad_jefe, by(sexo_jefe) stats (media mean sd min max N)
Summary for variables: edad_jefe
by categories of: sexo_jefe (Sexo del jefe del hogar)
sexo_jefe p50 mean sd min max N
1 49 50.10912 15.49309 13 109 61905
2 53 53.70444 16.53513 13 104 28197
Total 50 51.23426 15.91404 13 109 90102
El promedio para los hombres es de 50.109 y para mujeres de 53.70. La desviación
estándar es de 15.49 para hombres, mientras que para mujeres es de 16.53. El mínimo
de edad es 13 tanto en hombres como mujeres. Y por ultimo el numero de datos de los
hombres es superior que el de mujeres, ya que en los hombres son 61905, mientras
que para las mujeres son 28197.
e) Haciendo uso del comando describe indique: ¿cuál es la etiqueta de las variables
trans_inst, smg, est_socio?
. describe trans_inst smg est_socio
storage display value
variable name type format label variable label
trans_inst double %12.0g Transferencias de instituciones
smg double %12.0g Salario m�nimo general
est_socio str1 %1s Estrato socioecon�mico
f) Genere tres variables con los nombres p18_35 (18 a 35 años), p36_64 (36 a 64 años),
p65_mas (65 años y más), donde incluya únicamente la edad de esos rangos de los
jefes de familia.
. gen p18_35=edad_jefe if edad_jefe>=18 & edad_jefe<=35
(73,727 missing values generated)
. gen p36_64=edad_jefe if edad_jefe>=36 & edad_jefe<=64
(35,928 missing values generated)
. gen p65_mas=edad_jefe if edad_jefe>=65
(70,603 missing values generated)
g) Utilizando el comando help, investigue las funciones y opciones de los comandos
replace, drop y keep.
Description
replace changes the contents of an existing variable. Because replace alters data, the
command cannot be abbreviated.
Description
drop eliminates variables or observations from the data in memory.
keep works the same as drop, except that you specify the variables or observations to be kept
rather than the variables or observations to be deleted.
Nota: de ser necesario, recurra a la descripción de la base datos ENIGH 2022 que se encuentra en
Canvas, para conocer la construcción y descripción de cada una de las variables requeridas.