1
Taller 3
ESTADISTICA DESCRIPTIVA
Jonh Alexander Rodríguez Zarrate ID:
908781 Diana Mayerly Diaz ID 913679
Docente:
Jorge Luis Bustos Galindo NRC: 1940
Corporación Universitaria Minuto De Dios – UNIMINUTO
Rectoría Tolima – Magdalena Medio
Programa De Contaduría Publica
Ibagué
2024
2
Guía de trabajo 3
1. Si las puntuaciones de 20 trabajadores nuevos de un test de aptitud
son: 31, 39, 40, 43, 45, 50, 52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87,
90, 9 1 y 99. Halle la
varianza y la desviación estándar para datos no agrupados.
La media
𝑥̅ 31 + 39 + 40 + 43 + 45 + 50 + 52 + 58 + 59 + 60 + 70 + 71 + 72 + 78 + 80 + 85 + 1300
= 90 + 91 + 99
20
20
𝒙̅ = 𝟔𝟓
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )
2
�
𝑛−1
(31 − 65)2 + (39 − 65)2 + (40 − 65)2 + (43 − 65)2 + (45 − 65)2 + (50 − 65)2 + (52 − 65)2 + (58 − 65)2
+ (59 − 65)2 +
(60 − 65)2 + (70 − 65)2 + (71 − 65)2 + (72 − 65)2 + (78 − 65)2 + (80 − 65)2 + (85 − 65)2 + (87 − 65)2
𝑆 +
2 (90 − 65)2 + (91 − 65)2 + (99 − 65)2
=
20 − 1
7690
=
19
𝑠2 = 404.7368421
Desviación estándar
𝑠 = √404.7368421𝑚2
𝑠 = 20
3
Las puntuaciones están dispersas, ya que la desviación estándar es
relativamente alta. Esto significa que hay una variabilidad significativa en las
puntuaciones de los trabajadores en el test de aptitud.
2. A partir de los datos del ejercicio anterior, construya una tabla de
frecuencia y con base en ella obtenga la varianza y la desviación
estándar. ¿Hay diferencia entre el valor de la desviación estándar
para datos no agrupados con los datos agrupados? Si hay diferencia
explique el porqué de ésta.
31, 39, 40, 43, 45, 50, 52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87, 90, 91, 99
Número de Interval0os
𝑘 = 1 + 3.322 𝑙𝑜𝑔(20) = 5.3 ≈ 5 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Longitud de Intervalos
𝐶 99 −
= 31 = 13.6 ≈ 14
5
Clase Puntaje 𝑋𝑖 𝑓𝑖 % 𝐹𝑖 % acum.
1 31-44 37.5 4 20 4 20
2 45-58 51.5 4 20 8 40
3 59-72 65.5 5 25 13 65
4 73-86 79.5 3 15 16 80
5 87-100 93.5 4 20 20 100
TOTAL 20 100
La media
4(37.5) + 4(51.5) + 5(65.5) + 3(79.5) + 1296
𝑥̅ 4(93.5)
= 20
20
=
𝒙̅ = 𝟔𝟒. 𝟖
4
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )2
�
𝑛−1
4(37.5 − 64.8)2 + 4(51.5 − 64.8)2 + 5(65.5 − 64.8)2 + 3(79.5 − 64.8)2 +
𝑆2
4(93.5 − 64.8)2
=
20 − 1
7634
=
19
𝑠2 = 401.7894737
Desviación estándar
𝑠 = √401.7894737𝑚2
𝑠 = 20
No hay diferencia entre la desviación estándar de los datos no
agrupados y los datos agrupados porque los intervalos que usamos para
agrupar los datos son pequeños. Esto significa que la información que se
pierde al agrupar los datos es mínima, por lo que los resultados son muy
similares.
3. ¿Cuándo es igual la varianza a la desviación estándar? ¿Puede ser la
varianza menor que la desviación estándar? ¿En qué caso será igual
a 0 la varianza de determinados datos? Explique por qué.
¿Cuándo es igual la varianza a la desviación estándar? La varianza y la
desviación estándar son medidas de dispersión que nos indican cuánto se
alejan los datos de la media. La varianza es el promedio de los cuadrados de
las diferencias entre
5
cada dato y la media, mientras que la desviación estándar es la raíz cuadrada
de la varianza. Por lo tanto, la varianza y la desviación estándar solo serán
iguales cuando todos los datos sean iguales a 0 o 1. Esto se debe a que, en
estos casos, las diferencias entre cada dato y la media (que es 0 o 1,
respectivamente) son 0 o 1, por lo que al elevarlas al cuadrado (para calcular
la varianza) o tomar la raíz cuadrada (para calcular la desviación estándar),
obtenemos el mismo resultado.
¿Puede ser la varianza menor que la desviación estándar? No, la varianza no
puede ser menor que la desviación estándar. Como mencionamos antes, la
desviación estándar es la raíz cuadrada de la varianza. Dado que la raíz
cuadrada de cualquier número positivo es siempre menor que el número
original, la desviación estándar siempre será menor que la varianza.
¿En qué caso será igual a 0 la varianza de determinados datos? La varianza
será igual a 0 cuando todos los valores de los datos sean iguales. Esto se debe
a que la varianza mide cuánto varían los datos con respecto a la media. Si
todos los datos son iguales, entonces no hay variación con respecto a la media,
por lo que la varianza es 0.
4. Halle la varianza y la desviación estándar para los datos del
problema 6, de la guía de trabajo N° 2
Número de Interval0os
𝑘 = 1 + 3.322 𝑙𝑜𝑔(73) = 7.1 ≈ 7 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Longitud de Intervalos
𝐶 10.34 −
= 3.81 = 0.9 ≈ 1
7
6
Clase Puntaje 𝑋𝑖 𝑓𝑖 % 𝐹𝑖 % acum.
1 [3,81-4,81) 4.31 4 5.48 4 5.48
2 [4.81-5.81) 5.31 5 6.85 9 12.33
3 [5.81-6.81) 6.31 17 23.29 26 35.62
4 [6.81-7.81) 7.31 25 34.25 51 69.86
5 [7.81-8.81) 8.31 13 17.81 64 87.67
6 [8.81-9.81) 9.31 6 8.22 70 95.89
7 [9.81-10.81] 10.31 3 4.11 73 100
TOTAL 73 100
La media
4(4.31) + 5(5.31) + 17(6.31) + 25(6.31) + 13(8.31) + 6(9.31) + 528.6
𝑥̅ 3(10.31) 3
= 73 73
𝒙̅ = 𝟕. 𝟐𝟒
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )2
�
𝑛−1
𝑆2
4(4.31 − 7.24)2 + 5(5.31 − 7.24)2 + 17(6.31 − 7.24)2 + 25(7.31 − 7.24)2 + 13(8.31 − 7.24)2 + 6(9.31 − 7.24)2
+ 3(10.31 − 7.24)2
=
73 − 1
136.6577
=
72
𝑠2 = 1.8980236111
Desviación estándar
𝑠 = √401.7894737𝑚2
𝑠 = 1.37 ≈ 1.4
7
5. Dados los 11 datos, X: 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 9. (a) Halle la
varianza y la desviación estándar de X. (b) Aumente en 2 cada
valor de X para obtener valores Y y calcule varianza y la desviación
estándar de Y. (c) Compruebe la relación que existe entre la
varianza y la desviación estándar de estas dos sucesiones de
números.
a) Halle la varianza y la desviación estándar de X
La media
2 + 2 + 3 + 3 + 3 + 4 + 4 + 4 + 5 + 5 + 9 44
𝑥̅ =
= 11 11
𝒙̅ = 𝟒
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )2
�
𝑛−1
(2 − 4)2 + (2 − 4)2 + (3 − 4)2 + (3 − 4)2 + +(3 − 4)2 + (4 − 4)2 + (4 − 4)2 + (4 − 4)2 + (5 − 4)2 +
𝑆2
(5 − 4)2 + (9 − 4)2
=
11 − 1
38
=
10
𝑠2 = 3.8
Desviación estándar
𝑠 = √3.8𝑚2
𝑠 = 1.9
(a) Aumente en 2 cada valor de X para obtener valores Y y calcule
varianza y la desviación estándar de Y.
X: 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 9 = 4, 4, 5, 5, 5, 6, 6, 6,
7, 7, 11
8
La media
4 + 4 + 5 + 5 + 5 + 6 + 6 + 6 + 7 + 7 + 11 66
𝑥̅ =
= 11 11
𝒙̅ = 𝟔
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )2
�
𝑛−1
(4 − 6)2 + (4 − 6)2 + (5 − 6)2 + (5 − 6)2 + (5 − 6)2 + (6 − 6)2 + (6 − 6)2 + (6 − 6)2 + (7 − 6)2 +
𝑆2
(7 − 6)2 + (11 − 6)2
=
11 − 1
38
=
10
𝑠2 = 3.8
Desviación estándar
𝑠 = √3.8𝑚2
𝑠 = 1.9
c) Compruebe la relación que existe entre la varianza y la desviación
estándar de estas dos sucesiones de números.
La varianza y la desviación estándar para la sucesión de números X
como para Y, la varianza es 3.8 y la desviación estándar es 1.9, lo que indica
una dispersión relativamente moderada de los datos.
De igual forma, la desviación estándar es simplemente la raíz cuadrada
de la varianza. Esto significa que la desviación estándar siempre será menor
que la varianza, a menos que la varianza sea 0 o 1. En el caso de que la
varianza sea 0, todos los datos son
9
iguales (no hay dispersión), y tanto la varianza como la desviación estándar serán
0. Si la varianza es 1, entonces la desviación estándar también será 1.
Además, es importante notar que tanto la varianza como la desviación
estándar son medidas de dispersión que no cambian cuando se añade o se
resta una constante a todos los datos. Esto se debe a que estas medidas de
dispersión están calculadas en relación a la media de los datos, y no a sus
valores absolutos.
6. Dos vendedores que mercadean el mismo producto tienen los
siguientes registros durante un periodo:
Vendedor 1 Vendedor 2
Volumen de ventas por 30 000 000 35 000 000
mes
Desviación estándar 2 500 000 3 600 000
¿Cuál de los vendedores parece más constante en el volumen de ventas?
�∗ 100%
�
𝐶. 𝑉
=
�
�
VENDEDOR 1
𝑐𝑣 250000
= 0 ∗ 100% = 8.33%
3000000
0
VENDEDOR 2
𝑐𝑣 360000
= 0 ∗ 100% = 10.28%
3500000
0
El vendedor 1 es más constante en el volumen de ventas, ya que su CV es
menor.
Considerando que, las ventas del vendedor 1 tienden a estar más cerca de su
media (o promedio) que las ventas del vendedor 2. Esto sugiere que el
vendedor 1 tiene un rendimiento de ventas más predecible y constante de un
mes a otro, lo cual puede ser beneficioso para la planificación y la gestión de
inventarios.
10
7. Halle el coeficiente de variación para los siguientes datos: 2, 4, 5, 6, 6, 9,
10,
13.
La media
2 + 4 + 5 + 6 + 6 + 9 + 10 + 13 55
𝑥̅ =
= 8 8
𝒙̅ = 𝟔. 𝟖𝟕
Variación
𝑠2 𝛴𝑛=1(𝑥1−𝑥̅
= � )2
�
𝑛−1
𝑆2
(2 − 6.87)2 + (4 − 6.87)2 + (5 − 6.87)2 + (6 − 6.87)2 + (6 − 6.87)2 + (9 − 6.87)2 + (10 − 6.87)2 +
(13 − 6.87)2
=
8−1
88.87
=
7
𝑠2 = 12.697
Desviación estándar
𝑠 = √12.697𝑚2
𝑠 = 3.56
Coeficiente de variación
�∗ 100%
�
𝐶. 𝑉
=
�
�
𝐶. 𝑉 3.5
= 6 ∗ 100% = 51.8%
6.8
7
11
8. Una persona tiene una estatura de 175 cm; la estatura promedio
de la población es170 cm con una desviación estándar de 5 cm.
Esta misma persona pesa 70 Kg: el peso promedio de la población
es de 68 Kg con una desviación estándar de 5 Kg. ¿En qué caso
esta persona ocupa un puesto relativamente mayor?
𝑥𝑖 −
𝑍𝑖 =
̅ 𝑥
𝑠
ESTATURA
𝑍𝑖 175 − 170
= =1
5
PESO
𝑍𝑖 70 − 68
= = 0.4
5
¿En qué caso esta persona ocupa un puesto relativamente mayor? La
persona tiene un puntaje Z de 1 para la estatura y 0.4 para el peso, esto
significa que su estatura está 1 desviación estándar por encima de la media
de la población, y su peso está 0.4 desviaciones estándar por encima de la
media de la población. Por lo tanto, esta persona ocupa un puesto
relativamente mayor en términos de estatura en comparación con el peso,
debido a que su estatura está más desviada de la media de la población (en
términos positivos) que su peso.