PRODUCTO ACADEMICO N°3
UNIVESIDAD CONTINENTAL
PROFESORA:LISBETH CORBACHO CARAZAS
CURSO: ESTADISTICA GENERAL
GRUPO: 7
INTEGRANTES
• BRADY BRAYAN SALDIVAR ESPINOZA
• JAMES BRIJAM SOTA SAAVEDRA
• ELOYSHA MAYPAZ SANTA CRUZ VERA
• JOET ISAI TUCO PUMA
• MELVIN EDWARD TECSE CCASA
• NICOLE VALERIA TUPAYACHI BRICEÑO
_Consideraciones:
Criterio Detalle
Resultado de Al finalizar la asignatura, el estudiante será capaz de analizar información
Aprendizaje utilizando los métodos y técnicas de la estadística descriptiva y probabilidad,
de la para brindar información que sirva para la toma de decisiones.
Asignatura
Instrucciones • Consulta el material de referencia de la Unidad III
para la
resolución de • Resuelve las preguntas que se muestran a continuación apoyados en el
la evaluación
software Excel o SPSS. Luego sube la resolución a través de la plataforma,
solo en archivo PDF.
• Si se detecta algún tipo o indicio de plagio que vaya en contra de la
probidad, el docente responsable de asignatura anulará tu PA 3. y asignará
automáticamente la nota CERO.
• Planifica el tiempo de resolución y de cargado del archivo. Recuerda
garantizar las condiciones de conectividad y de hardware.
• El tiempo previsto para la resolución y carga del producto es: 120 minutos
• Utilice 4 decimales para sus cálculos y respuestas, 2 decimales para los
porcentajes.
CASO: El INE ha registrado datos del ingreso económico y el tipo de
empleo según género, además se les ha consultado sobre su la
edad. Es de vital importancia que colabores con la
organización de los datos para mejorar su sistema de
información.
Considerando el CASO, seleccionar de manera libre las variables a utilizar
según se requiera en cada uno de los enunciados que se encuentran a
continuación.
Enunciados:
• Seleccionar una muestra de 600 datos de manera aleatoria
(los datos están en el archivo Excel adjunto)
• Elabore una tabla de frecuencias de variable
cualitativa con su respectivo gráfico e
interpretación.
Se toma de muestra del 1 al 600 de los datos del excel para el género (Sexo)
SEXO fi hi %hi
M 360 0.6 60%
F 240 0.4 40%
total 600 1 100%
INTERPRETACIÓN: Hay 360 individuos de sexo masculino y 240
individuos de sexo femenino en la muestra. La frecuencia relativa (hi)
demuestra que el 60% de la muestra son hombres (360 de 600) y el 40%
son mujeres (240 de 600). Es decir, el 60% de la muestra son hombres y el
40% son mujeres.
3
Se toma de muestra del 1 al 600 de los datos del excel para el tipo de empresa
EMPRESA fi hi %hi
Autónomo 95 0.15833333 16%
Privada 368 0.61333333 61%
Pública 137 0.22833333 23%
total 600 1 100%
Nro de personas
INTERPRETACIÓN: Hay 95 individuos en empresas autónomas, 368 en empresas
privadas y 137 en empresas públicas en la muestra. La frecuencia relativa (hi) se
observa que e1 5.83% de la muestra trabaja en empresas autónomas (95 de 600), el
61.33% en empresas privadas (368 de 600) y el 22.83% en empresas públicas (137
de 600).
Se toma de muestra del 1 al 600 de los datos del excel para el tipo de clase económica
CLASE
ECONOMICA fi hi %hi
Bajo 27 0.045 5%
Medio 573 0.955 96%
Alto 0 0 0%
Total 600 1 100%
Nro de personas (fi)
INTERPRETACION: Hay 27 individuos en la clase económica baja y 573 en la
clase económica media en la muestra. No hay individuos en la clase económica
alta. Lo que representa el 4.5% de la muestra pertenece a la clase baja (27 de
600) y el 95.5% pertenece a la clase media (573 de personas)
• Nro de personas por sexo
• Elabore una tabla bidimensional de variables
cualitativas con su respectivo gráfico e interpretación.
clase económica
sexo Bajo % Medio % TOTAL %
Masculino 12 2.0% 348 58.0% 360 60.0%
Femenino 15 2.5% 225 37.5% 240 40.0%
Total 27 4.5% 573 95.5% 600 100%
INTERPRETACIÓN: De los 360 individuos masculinos, 12 (2.0%) pertenecen
a la clase baja y 348 (58.0%) a la clase media. Así mismo, 240 individuos con
género femenino, 15 (2.5%) pertenecen a la clase baja y 225 (37.5%) a la clase
media. En conclusión, de los 600 individuos el 27 (4.5%) pertenecen a la clase
baja y 573 (95.5%) pertenecen a la clase media.
Analiza e interprete la relación entre dos variables cuantitativas, grafique y
determine la ecuación de la recta y su coeficiente de correlación.
ingreso mensual
Factor de
coeficiente de 0.69861754
correlacion lineal
Coeficiente de
determinacion 0.4881
R2
INTERPRETACIÓN: La Dirección en el valor positivo indica que existe una relación
positiva entre las dos variables. A medida que una variable aumenta, la otra tiende a
aumentar. Sin embargo, la magnitud con un valor de 0.6986, la relación es
moderadamente fuerte. Este coeficiente sugiere que existe una tendencia significativa
hacia una relación lineal positiva entre las variables, aunque no es perfectamente
fuerte.
• Analiza el coeficiente de variación del salario para el sexo
femenino y otro para el sexo masculino compare e
interprete.
Se toma de muestra del 1 al 600 de los datos del Excel de datos PA3
Coeficiente
Desviacion de variación
Sexo Media Varianza estándar (CV)
(S)
M 4523.48806 435551.648 659.963369 14.5897007
F 4003.069 404086.442 635.677939 15.8797647
INTERPRETACIÓN: La variabilidad del salario para los hombres es del 14.59%
respecto a su media salarial. De igual manera, la variabilidad del salario para las
mujeres es del 15.88% respecto a su media salarial.
. Seleccionar una muestra de 600 datos de manera aleatoria (los datos están en el
archivo Excel adjunto).
• Elabore una tabla de frecuencia de variable cuantitativa (con intervalos) con su
respectivo gráfico e interpretación.
Mi
(marca
ITEMS L I LS L S AUX de clase) fi (ni) hi Ni Hi mi*fi m
1 1252.000 1661.818 1661.817 1456.909 11 0.01833 11 0.01833 16026
2 1661.818 2071.636 2071.635 1866.727 1 0.00167 12 0.02000 1866.72727
3 2071.636 2481.455 2481.454 2276.545 4 0.00667 16 0.02667 9106.18182
4 2481.455 2891.273 2891.272 2686.364 9 0.01500 25 0.04167 24177.2727
5 2891.273 3301.091 3301.090 3096.182 26 0.04333 51 0.08500 80500.7273
6 3301.091 3710.909 3710.908 3506.000 35 0.05833 86 0.14333 122710
7 3710.909 4120.727 4120.726 3915.818 76 0.12667 162 0.27000 297602.182
8 4120.727 4530.545 4530.544 4325.636 170 0.28333 332 0.55333 735358.182
9 4530.545 4940.364 4940.363 4735.455 194 0.32333 526 0.87667 918678.182
10 4940.364 5350.182 5350.181 5145.273 64 0.10667 590 0.98333 329297.455
11 5350.182 5760.000 5759.999 5555.091 10 0.01667 600 1.00000 55550.9091
38566.000 600 1.00000 2590873.82
7
Nro de personas
194
170
76
64
11 1 4 9 26 35 10
1661.818 2071.636 2481.455 2891.273 3301.091 3710.909 4120.727 4530.545 4940.364 5350.182 5760.000
1252.000 1661.818 2071.636 2481.455 2891.273 3301.091 3710.909 4120.727 4530.545 4940.364 5350.182
INTERPRETACIÓN: La mayoría de los ingresos se encuentran en el rango de 4530.545 a
4940.364 unidades monetarias, seguido por el rango de 4120.727 a 4530.545. De igual
manera la distribución de los ingresos muestra una concentración de personas significativa
en los intervalos más altos, con pocas personas en los rangos más bajos y más altos.
• Con los datos de la tabla elaborada del ejercicio a) encuentre las
medidas de tendencia central, medidas de dispersión y medidas de
posición cuartil 1, cuartil 2, cuartil 3 con sus respectivas
interpretaciones.
Los datos requeridos para realizar las medidas de tendencia central, medidas de
dispersión y medidas de posición se encuentran en la tabla de frecuencias del
punto e).
Hallando las medidas de tendencia central corresponde a los valores que se
encuentran en la pared central de un conjunto de datos. Estos nos ayudan a
resumir la información en un solo dato.
• 8
• Medidas de tendencia central
Diferencial
1 24
Diferencial
2 130
Medidas de tendencia central
Para datos
Para datos no agrupados
agrupados
(intervalos)
MEDIA 4318.12303 4315.320433
MEDIANA 4453.403209 4456
MODA 4594.413223 1313
INTERPRETACIÓN: La media es el promedio de los datos. En este caso, la media es
aproximadamente 4318.12. La mediana es el valor que divide al conjunto de datos en dos
partes iguales, es decir, el valor central cuando los datos están ordenados de menor a mayor.
En este caso, la mediana es aproximadamente 4453.40. La moda es el valor que tiene la
mayor frecuencia en el conjunto de datos. Aquí, la moda es aproximadamente 4594.41.
Indica el valor más frecuente, lo cual puede ser útil para describir la ubicación central de los
datos en distribuciones sesgadas.
• Medidas de dispersión
Medidas de dispersión
S2 Varianza 42954.23308 487379.1058
S Desviación estándar 207.2540303 698.1254227
Coeficiente
CV de variacion 0.047996324 0.161778351
INTERPRETACIÓN: Cuanto mayor sea la varianza, mayor es la dispersión de los datos
respecto a la media. En este caso, la varianza es aproximadamente 42954.23. Por otro lado, la
desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de
dispersión en la misma unidad que los datos originales. Una desviación estándar pequeña
indica que los datos están cercanos a la media, mientras que una desviación estándar grande
indica que están más dispersos y en el ejercicio se podría concluir que es grande ya que es
207.25.
• Medidas de posición
Medidas de posición
CUARTIL 1 4056.019139 4095.25
CUARTIL 2 4453.403209 4456
CUARTIL 3 4779.816307 4704.5
INTERPRETACIÓN: El primer cuartil 1 es el valor por debajo del cual se encuentra el 25%
de los datos cuando están ordenados de menor a mayor. En este caso, es aproximadamente
4056.02. Segundo, el cuartil 2, que es igual a la mediana, es el valor que separa el 50% de los
datos en dos partes iguales cuando están ordenados. En este caso, Q2 es aproximadamente
4453.40, que también es la mediana. El tercer cuartil 3 es el valor por debajo del cual se
encuentra el 75% de los datos cuando están ordenados. En este caso, Q3 es aproximadamente
4779.82.
• Con los datos de la tabla elaborada del ejercicio e) encuentre el
coeficiente de variación, la asimetría con sus respectivas
interpretaciones.
Coeficiente de
CV variación 0.047996324
A Asimetría -0.652726406
INTERPRETACIÓN: Coeficiente de Variación: La baja variabilidad relativa (CV) indica
que los ingresos mensuales son bastante consistentes en relación con su promedio. Por
otro lado, la Asimetría es la distribución sesgada a la derecha sugiere que la mayoría de
los ingresos están por encima del promedio, con algunos valores más bajos que influyen
en la distribución general.
•
Realiza dos Box Plots de los salarios, uno para el sexo femenino y
otro para el sexo masculino compare e interprete (ambos Box
Plots en el mismo gráfico.
INTERPRETACIÓN: Salarios Masculinos: Los hombres tienen una mediana
salarial más [Link] dispersión salarial en los extremos superiores es mayor para
los hombres. Por otro lado, los salarios Femeninos: Las mujeres tienen una mayor
dispersión en el rango intercuartil, indicando más variabilidad en los salarios
medios. Así mismo la mediana salarial de las mujeres es menor que la de los
hombres. Este análisis sugiere que, aunque los salarios centrales son más altos
para los hombres, las mujeres experimentan una mayor variabilidad en los
salarios dentro del rango medidas
• Utilizar el Excel o SPSS sin agrupar datos y determinar las
medidas de tendencia central, medidas de dispersión y medidas de
posición cuartil 1, cuartil 2, cuartil 3. Compare resultados con lo
obtenido en item f).
Medidas de tendencia central
Para datos agrupados Para datos
(intervalos) no agrupados
MEDIA 4318.12303 4315.320433
MEDIANA 4453.403209 4456
MODA 4594.413223 1313
Medidas de dispersion
S2 Varianza 42954.23308 487379.1058
S Desviacion estandar 207.2540303 698.1254227
Coeficiente de
CV variacion 0.047996324 0.161778351
Medidas de posicion
CUARTIL 1 4056.019139 4095.25
CUARTIL 2 4453.403209 4456
CUARTIL 3 4779.816307 4704.5
Tendencia Central: Los ingresos promedio y medianos son similares para datos
agrupados y no agrupados, con una moda considerablemente diferente, lo que indica un
sesgo en los datos no agrupados.
Dispersión: Mayor variabilidad en los datos no agrupados sugiere una distribución más
amplia de ingresos en comparación con los datos agrupados.
Posición: Los cuartiles indican una distribución equitativa de ingresos, con una ligera
diferencia entre datos agrupados y no agrupados.
• Elabora un video de 3 minutos sobre los resultados
estadísticos más resaltantes (adjuntar el link al trabajo)
[Link]
11