UNIVERSIDAD
CENTROAMERICANA JOSÉ
SIMEÓN CAÑAS “UCA”
FACULTAD DE INGENIERÍA Y ARQUITECTURA
DEPARTAMENTO DE MATEMÁTICAS
ASIGNATURA: PROBABILIDAD Y ESTADISTICA
SECCIÓN: 01
CATEDRÁTICO:
JOSE HERNANDEZ SALGUERO
ALUMNOS:
EDUARDO ENRIQUE ALVARENGA LOPEZ 00112016
PEDRO RENE GOMEZ FUENTES 00057616
ALEXIS ALEJANDRO HERNANDEZ CORDOVA 00055816
MONICA MICHELLE HERNANDEZ RAMIREZ 00088016
JUNIO 2018.
INTRODUCCIÓN
El presente trabajo consiste en la realización de un análisis estadístico descriptivo de cada una de las
variables de una base de datos proporcionada, la cual trata sobre la información de los empleados de
una compañía, con el fin de probar las hipótesis que se plantean para cada una de ellas. Para esto se
usaron las herramientas que ofrece la estadística descriptiva, específicamente con variables
cuantitativas de carácter discreto y la estadística inferencial a la hora del planteo y comprobación de
hipótesis.
La importancia de estos tipos de análisis queda ejemplificada con el caso a realizar, ya que se desea
evaluar la competencia de los trabajadores de la compañía a la que se le realizó el análisis.
Debido a que el objetivo de la estadística inferencial (también conocida como Estadística Analítica)
es la de concluir sobre una población escogida a partir de la información recogida en las muestras. Es
viable usar este tipo de análisis para la población seleccionada y el tipo de datos obtenidos en donde
la inferencia estadística se divide en dos partes:
La primera, habla sobre la estimación de parámetros que consiste en buscar los valores más
probables de un parámetro en la población. Un ejemplo claro de esto sería la media, también
conocida como Estadístico.
Cabe resaltar que cuando la población es desconocida no se puede entregar un valor puntual,
debido a esto se presenta el intervalo de confianza como medida de interpretación de resultados,
en donde se hallará el valor puntual y a su vez, irá acompañado de la probabilidad de que el
parámetro esté en el nivel de confianza preestablecido o con el complementario llamado
Probabilidad de Error.
La segunda parte conocida como el contraste de hipótesis, consiste en decidir si una afirmación
es cierta o no en la población escogida a investigar, siempre en términos probabilísticos. Dentro
de los contrastes de hipótesis más usados se encuentran la asociación de variables y la
comparación de muestras, siendo esta última la utilizada en el siguiente trabajo.
Enunciado:
Los datos corresponden a empleados de una compañía en sus variables: X1: h: hombre, m: mujer.
X2: años de educación formal. X3: categoría laboral 1: administrativo, 2: seguridad, 3: directivo. X4:
salario anual actual. X5: salario anual inicial. X6: experiencia previa en meses. X7: edad.
X1 X2 X3 X4 X5 X6 X7
h 19 3 60375 27480 96 43.8
h 15 1 32550 14250 43 34.7
h 19 3 135000 79980 199 54.0
h 15 1 31200 14250 54 36.3
h 12 1 36150 14250 83 33.9
h 19 3 110625 45000 120 44.0
h 15 1 42000 15000 68 36.8
h 19 3 92000 39990 175 48.9
h 17 3 81250 30000 18 36.4
m 8 1 31350 11250 52 34.4
h 12 1 29100 13500 113 43.3
h 15 1 31350 15000 49 35.7
h 16 1 36000 15000 46 37.6
m 15 1 19200 9000 23 64.4
m 12 1 23550 11550 52 36.8
h 15 1 35100 16500 90 37.3
h 12 1 23250 14250 46 34.0
h 8 1 29250 14250 50 34.6
h 12 2 30750 13500 307 59.5
m 15 1 22350 12750 165 57.2
m 12 1 30000 16500 228 59.7
h 12 2 30750 14100 240 50.6
h 15 1 34800 16500 93 39.3
h 16 3 60000 23730 59 37.9
h 12 1 35550 15000 48 35.5
h 15 1 45150 15000 40 34.2
h 18 3 73750 26250 56 43.7
h 12 1 25050 13500 444 66.6
h 12 1 27000 15000 120 37.5
h 15 1 26850 13500 5 35.7
h 15 1 33900 15750 78 34.7
m 15 1 26400 13500 3 33.2
h 15 1 28050 14250 36 36.7
h 12 1 30900 15000 102 38.9
Tabla 1. Datos estadísticos proporcionados.
Análisis estadístico de los datos:
Para el cálculo de descriptores estadísticos se utilizó el programa de Excel, seleccionando los datos
proporcionados a utilizar y seleccionando las opciones para el cálculo del análisis estadístico
descriptivo. Los cuales dieron los resultados presentados a continuación:
Salario actual Salario inicial
Media 30650 Media 14144.4444
Error típico 1112.22807 Error típico 315.803291
Mediana 30750 Mediana 14250
Moda 31350 Moda 15000
Desviación estándar 5779.30659 Desviación estándar 1640.96204
Varianza de la muestra 33400384.6 Varianza de la muestra 2692756.41
Curtosis 0.66646595 Curtosis 2.79093336
Coeficiente de asimetría 0.41603253 Coeficiente de asimetría 1.26129281
Rango 25950 Rango 7500
Mínimo 19200 Mínimo 9000
Máximo 45150 Máximo 16500
Suma 827550 Suma 381900
Cuenta 27 Cuenta 27
Nivel de confianza (95.0%) 2286.21754 Nivel de confianza (95.0%) 649.142962
Tabla 2. Datos estadísticos para el salario actual Tabla 3. Datos estadísticos para el salario
inicial.
Edad
Media 41.4481481
Error típico 2.00668662
Mediana 36.8
Moda 34.7
Desviación estándar 10.4270495
Varianza de la muestra 108.723362
Curtosis 0.68850608
Coeficiente de asimetría 1.47751462
Rango 33.4
Mínimo 33.2
Máximo 66.6
Suma 1119.1
Cuenta 27
Nivel de confianza (95.0%) 4.12480342
Tabla 4. Datos estadísticos para la edad.
I. Probar hipótesis para la media (salarios sin considerar cargos directivos): salario
actual µ ≤ 33,000; salario inicial µ = 15,000: edad µ = 42.
Comprobación de hipótesis:
Hipótesis Salario actual Salario inicial edad
Ho μ≤33000 μ=15000 μ=42
Ha μ>33000 μ≠15000 μ≠42
Tabla 5. Hipótesis por demostrar.
α=0.05
A partir de la media aritmética, desviación estándar y el número de datos se pudo obtener
el valor de ZC con la fórmula:
𝑥̅ − 𝜇
𝑍𝑐 = 𝜎
√𝑛
Luego se obtuvo el p-valor con el comando =[Link].N (X; FALSO); donde
X es la celda donde se encuentra el ZC encontrada, ya que se hizo el mismo procedimiento
para las 3 hipótesis probadas.
A partir de P valor, y tomando α como 0.05, se decidió aceptar o rechazar Ho.
Estadísticos:
$42,369.26 $19,245.26 41.99
Tabla 6. Datos estadísticos.
SALARIO ACTUAL
= 42369.26
SE ACEPTA Ha, YA QUE P-VALOR < 0.05
n= 36
s= $26,240.15
v= 35
z= 2.14
p-valor= 0,016083
Tabla 7. Datos estadísticos por evaluar.
SALARIO INICIAL
= 19,245.26
SE ACEPTA Ho, YA QUE P-VALOR > 0.05
n= 36
s= 13,069.25
v= 35
z= 1.95
p-valor= 0.051
Tabla 8. Datos estadísticos por evaluar.
EDAD
= 42
SE ACEPTA Ho, YA QUE P-VALOR > 0.05
n= 36
s= 9.525413104
v= 35
z= 0
p-valor= 1
Tabla 9. Datos estadísticos por evaluar.
II. Pruebas de hipótesis para las diferencias de medias poblacionales de hombres y
mujeres: diferencia de medias para salario inicial y actual.
Hipótesis Salario actual Salario inicial
Ho μ1=μ2 μ1=μ2
Ha μ1≠μ2 μ1≠μ2
Tabla 10. Hipótesis por demostrar.
Para la prueba de hipótesis de dos medias se hizo uso de la fórmula:
(𝑥1 + 𝑥2 ) − 0
𝑡𝑐 =
√𝑆𝑝 ²(1 + 1)
𝑛 𝑛
Dónde:
(𝑛1 − 1)𝑆1 ² + (𝑛2 − 1)𝑆2 ²
𝑆𝑝 ² =
𝑛1 + 𝑛1 − 2
SALARIO ACTUAL
h= 45989.46429
m= 25475
sh= 27530.75466 SE ACEPTA Ha, YA QUE P VALOR<0.05
sm= 4256.245411
sp= 757942452.4
v= 38
tc= 8.6
p valor 5,3x10-10
Tabla 11. Datos estadísticos por evaluar.
SALARIO INICIAL
h= 20706.43
m= 25475.00
sh= 13934.67 SE ACEPTA Ho, YA QUE P VALOR>0.05
sm= 2299.57
sp= 166397521.24
v= 38.00
tc= -1.7
p valor 0.09
Tabla 12. Datos estadísticos por evaluar.
III. Hallar un intervalo de confianza para la proporción de trabajadores que tienen
experiencia previa mayor o igual a 120 meses.
Asumiendo que:
1-α= 0.95
α= 0.05
α/2= 0.025
Buscando en la tabla de distribución normal estándar se sabe que:
Zα/2= 1.96
Teniendo los siguientes datos:
Zα/2= 1.96
n=34
9
𝑝̂ = = 0.2647
34
25
𝑞̂ = = 0.7353
34
Se aplica la siguiente fórmula:
𝑝̂ . 𝑞̂
𝐼𝑝 = 𝑝̂ ± Zα/2√
𝑛
(0.2647)(0.7353)
𝐼𝑝 = 0.2647 ± 1.96√
34
Dando como resultado:
𝐼𝑝 = (0.1164, 0.4130)
IV. Conclusiones:
Debido a que la prueba de hipótesis para el salario actual dio positiva para el supuesto en donde
la hipótesis reflejaba que la media es mayor a treinta y tres mil dólares, se concluye que los datos
proporcionados en donde la media rondaba abajo e incluso igual a los treinta y tres mil dólares,
es un dato erróneo ya que la prueba dicta lo contrario.
Para la segunda prueba se dictó que la media encontrada para el salario inicial de los trabajadores
es igual a quince mil dólares. Esto se pudo comprobar a la hora de realizar la prueba de hipótesis
ya que dicha prueba resultó dando positiva debido a que el p-valor dio un valor ligeramente arriba
del valor aceptado.
En la siguiente prueba se analizó la edad media que poseían los trabajadores contratados y que
ejercían sus competencias en la empresa, dando como resultado una media de 42 años, debido al
número de empleados estos años pueden variar, pero se comprobó que por medio de la prueba
de hipótesis para este caso, se obtuvo un resultado positivo para la hipótesis en donde la media
de los trabajadores es igual a los 42 años que planteaba en un principio.
Para la comprobación de hipótesis de la media del Salario actual entre los trabajadores de género
masculino y femenino se obtuvo un rechazo de la hipótesis inicial en donde decía que las medias
de salario actual eran iguales. Esto se comprobó ya que el p-valor obtenido dio muy por debajo
del valor aceptado para que la hipótesis inicial se aceptara, concluyendo que los salarios actuales
entre el género masculino y femenino son disparejos según su medias obtenidas.
Conforme a la hipótesis inicial en donde se proclamaba que la media de los salarios iniciales son
iguales entre los trabajadores del género masculino y femenino, resultó una prueba positiva ya
que el p-valor obtenido cae dentro del intervalo de aceptación de Ho, concluyendo que la media
del salario inicial para ambos géneros de trabajadores es igual.