Medidas Estadísticas 2022-1
Medidas Estadísticas 2022-1
X i X i
X i 1 i 1
n N
X
i 1
i
X
n
Ejemplo: Se tiene los siguientes pesos de 10 alumnos se pide calcular e
interpretar el peso promedio. 70, 71, 62, 70, 60, 70, 71, 70, 62, 64
Solución:
70+ 71+ 62+ 70+ 60+70+ 71+ 70+62+64
X= =67 kilos
10
INTERPRETACIÓN: El peso promedio de los alumnos es de 67 kilos.
Statistics
PESOS
N Valid 10
Missing 0
Media 67.0000
PESOS
esta fórmula se escribirá una sola vez, ya que para las siguientes
4.1.2 PROPIEDADES
1. La suma total de los n valores cuya media es X es igual a n X
Para n datos no tabulados y tabulados respectivamente, se tiene:
n k
∑ Xi= n X , ∑ fiXi=n X
i =1 i =1
2. La media de una constante es igual a la constante.
3. La media de una variable más o menos una constante es igual a
la media de la variable más o menos la constante.
4. La media de una constante por la variable es igual a la constante
multiplicada por la media de la variable.
5. La media de una constante k multiplicada por la variable más o
menos otra constante C, es igual a la constante k multiplicada por
la media de la variable más o menos la constante C
6. La media de la suma o diferencia de dos o más variables es igual
a la suma o diferencia de las medias de dichas variables.
4.1.3 CARACTERÍSTICAS
1. Es la más usada y conocida en el análisis estadístico.
2. Para calcular la media intervienen todos los datos.
3. Para un conjunto de datos existe una sola media.
4. Es sensible a los valores extremos, es decir a los valores
demasiados altos o demasiados bajos.
5. No se puede calcular cuando presentan intervalos abiertos en los
extremos.
4.1.4 VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMETICA.
VENTAJAS:
1. La media aritmética es la más fácil de entender y la más usada.
2. Es muy sensible a los cambios en los datos de la distribución.
3. Se define en forma rígida por una ecuación matemática muy fácil
de entender y algunas veces, se puede obtener cuando no es
posible calcular otros tipos de medidas de tendencia central.
DESVENTAJAS:
1. Es sensible a los valores extremos, es decir a los valores
demasiados altos o demasiados bajos.
2. Cuando la distribución tiene forma de U, es decir, este
corresponde a los valores menos comunes en la serie y por tanto,
puede dar una idea irreal de la distribución.
4.2 LA MEDIANA
SOLUCIÓN: n = 7 estudiantes.
Para calcular la edad mediana se ordena de menor a mayor.
19, 20, 21, 22, 23, 25, 25. Me = 22 Años.
Me ( x )=LI +
( fi )
n/ 2−F i−1
Ci
siguiente fórmula:
Donde:
LI : Límite inferior del intervalo de trabajo.
Fi-1 : Frecuencia acumulada anterior al intervalo de trabajo.
fi : Frecuencia absoluta del intervalo de trabajo.
Ci amplitud del intervalo de trabajo.
fi Fi
EDADES
20 24 5 5
24 28 8 F2 =13
28 32 f3 =10 23 i=3
32 36 7 30
36 40 6 36
TOTAL 36
4.2.2 PROPIEDADES
1. La mediana, sólo depende del número de datos ordenados y no del
valor de los datos. Por lo tanto, no es sesgada por algún valor
grande o pequeño.
2. La mediana puede ser calculada para distribuciones de frecuencia
con intervalos de diferente amplitud, siempre que se pueda
determinar el límite inferior del intervalo de la mediana.
3. La mediana puede ser calculada para variables con valores en
escala ordinal.
VENTAS(S/) fi
Xi
380 4
420 2
500 7
630 4
780 3
TOTAL 20
Solución:
Observamos que la mayor frecuencia es 7, por lo tanto:
Mo(x) = 500 soles.
INTERPRETACIÓN: Las ventas más frecuentes de los vendedores
informales es de 500 soles.
Mo( x )=LI +
[ d1
d1 + d 2 ] Ci
Donde:
d1 = fi / Ci – fi –1 / C i –1
d2 = fi / Ci – fi +1 / C i + 1
Ejemplo: Calcular e interpretar la moda de las edades de los
empleados en la siguiente tabla:
fi Fi
EDADES
20 24 5 5
24 28 8 13
28 32 10 23
32 36 7 30
36 40 6 36
TOTAL 36
Solución:
Y calcular:
d1= 10 – 8 = 2
d2= 10 – 7 = 3
2° Aplicar la fórmula:
Mo( x )=28+
[ ]
2
2+3
4=29 .6 años
4.3.2 CARACTERÍSTICAS
1. No se encuentra afectada por valores extremos.
2. Puede usarse cuando los datos presentan clases abiertas en los
extremos.
3. No es significativa a menos que la distribución contenga un gran
número datos y exista significativa repetición de algunos de ellos.
4. En muchos de los casos puede que no exista moda.
5. Cuando la serie de datos tiene dos o más modas, se hace difícil su
interpretación y comparación.
DESVENTAJAS:
1. La moda es muy inestable en el muestreo.
2. No se recomienda usar la moda cuando la variable cuantitativa
continua tiene intervalos de amplitudes diferentes.
As=0
x Me Mo
Mo Me x
x Me Mo
X −Mo=3( X− Me)
5. Los tres (media, mediana y moda) pueden calcularse para distribuciones
de frecuencias de intervalos de diferente amplitud, siempre y cuando se
pueda determinar sus marcas de clase o sus límites inferiores de los
intervalos, según sea el caso.
FORMAS DE CÁLCULO
1. PARA DATOS NO TABULADOS
EJEMPLO: calcular la media geométrica de los siguientes valores: 9, 27,
81
3
SOLUCIÓN: X G =√ 9 x 27 x 81=27
INTERPRETACIÓN: La media geométrica es 27
2. PARA DATOS TABULADOS
PARA VARIABLE CUANTITATIVA DISCRETA Y CONTINUA
También conocida como media geométrica ponderada y se define
como la raíz enésima del producto del valor de la variable elevada a
sus respectivas ponderaciones o frecuencias.
√
n f f
X G = X 11∗X 22 ¿ . .. .∗X nn
f
También
[ ]
n
∑ log Xifi
i=1
X G =anti log
n
Ejemplo: calcular la media geométrica de los datos de la siguiente
tabla:
PESOS Xi fi
5 20 12.5 8
20 35 27.5 6
35 50 42.5 12
50 65 57.5 10
TOTAL 36
SOLUCION:
1
XG= [ 8log 12. 5+6 log 27 .5+.. ..+10 log57 . 5 ] =
36
X G =anti log[54 . 54862187
36 ]
=32. 752 kg.
SOLUCIÓN: a)
PRODUCCION DE
% DE CEMENTO
AÑO CRECIMIENTO (miles de T.M) TASAS
1 80
2 20% 80+0.2(80)=96 96/80=1.2
3 30% 96+0.3(96)=124.8 124.8/96=1.3
4 -15% 124.8 - 0.15(124.8)=106.08 106.08/124.8=0.85
3
X G =√ 1 . 2 x 1. 3 x 0 . 85=1 . 0986
El porcentaje promedio de crecimiento es de:
1.0986 – 1= 0.0986 x 100= 9.86%
SOLUCIÓN:
2
X H= =74 . 67 Km /hora
1 1
+
70 80
n
X h= n
∑ Xfi
i=1 i
SOLUCIÓN:
36
X h= =27 . 39 Kg .
8 6 12 10
+ + +
12. 5 27 . 5 42. 5 57 . 5
SOLUCIÓN:
400+500+600+300
X h= =$ 14 .75 dólares .
400 500 600 300
+ + +
10 12. 5 20 25
INTERPRETACIÓN: El costo promedio del galón de aceite es de $ 14.75
dólares.
Ejemplo:
Sean las variables: X1 = notas obtenidas por los alumnos de ingeniería de
sistemas en el curso de estadística I:
12, 15, 10, 13, 16, 14, 11, 10, 12, 14 , promedio 12.7 y desviación estándar =
2.06
Las dos distribuciones presentan los mismos promedios, sin embargo se puede
observar que la distribución de la variable X1 es mucho menos variable que la
variable X2, ¿cuánto más o menos variable?; lo responderemos con las
mediciones de variación, entre las cuales estudiaremos al: rango, la varianza,
la desviación estándar y el coeficiente de variación.
Las medidas de dispersión se necesitan para dos propósitos básicos:
a) Para verificar la confiabilidad de los promedios.
b) Para que sirva como base para el control de la variación misma.
También podemos decir que los términos concentración y dispersión pueden
ser utilizados indistintamente, pues se da la relación:
Alta dispersión Baja concentración.
Baja dispersión Alta concentración.
Las medidas de dispersión que se utilizan con mayor frecuencia son:
Rango o recorrido de la variable.
Rango intercuartil.
Varianza.
Desviación estándar o desviación típica.
Coeficiente de variación.
R = 16 – 10 = 6
Siendo que el rango sólo mide la propagación total de una serie de datos,
su cálculo es muy simple y su utilidad tiene muy poco alcance, puesto que
no nos dice mucho acerca de cómo se distribuyen realmente los datos.
2. RANGO INTERCUARTIL.
Es la diferencia entre el cuartil 3 (Q3) y el primer cuartil (Q1) y se denota
asi:
RI = Q3 – Q1
3. VARIANZA.
La varianza de define como la media aritmética de los cuadrados de las
desviaciones de los datos respecto a su media aritmética.
La varianza es una medida de dispersión con unidades de medición al
cuadrado, por ejemplo, soles2, dólares2, km2., años2, etc.
Es una medida de dispersión que cuantifica el grado de dispersión o de
variación de los valores de una variable cuantitativa con respecto a su
media aritmética.
Si los valores tienden a concentrarse alrededor de su media, la varianza
será pequeña. Si los valores tienden a distribuirse lejos de la media, la
varianza será grande.
A. FORMAS DE CÁLCULO
A.1. PARA DATOS NO AGRUPADOS
Cuando la muestra es pequeña (n 30) se utiliza la siguiente fórmula,
conocida como la varianza de Cochran:
(∑ )
n n 2
∑ ( x i− x )² n
Xi
s 2 =i=1 ∑ X 2i −n
i=1
n−1
s 2 =i=1
n−1
Cuando la muestra es grande (n 30) se utiliza la siguiente fórmula:
método rápido
n n
∑ ( x i− x ) ² ∑ X 2i
2 i=1 2
2 i=1 s = −X
s = N
N
Ejemplo:
Calcular e interpretar la varianza de las notas de los alumnos de ingeniería
en sistemas: X =12, 15, 10, 13, 16, 14, 11, 10, 12, 14
Solución:
10
10
∑ Xi=127
∑ X 2i =1651 i=1
i=1
Reemplazando en la fórmula:
método rápido
( 127 )2
1651−
10
s2= =4 . 23
10−1
Interpretación: la variación de las notas de los alumnos es de 4.23 puntos 2
Si la muestra n 30
m m
∑ ( X i −X ) 2
fi ∑ X 2i fi−n X 2
i=1 i =1
s2= =
n−1 n−1
VENTAS(S/) Xi fi X²f
380 4 577600
420 2 352800
500 7 1750000
630 4 1587600
780 3 1825200
TOTAL 20 6093200
2
2 6093200−20 (536 )
s= =s/18 277 . 90
20−1
Si la muestra n 30
m m
∑ ( X i −X ) 2
fi ∑ X 2i fi−n X 2
i=1 i =1
s 2= =
n−1 n−1
fi Xi X²f
EDADES
20 24 5 22 2420
24 28 8 26 5408
28 32 10 30 9000
32 36 7 34 8092
36 40 6 38 8664
TOTAL 36 33584
Solución: las columnas de las marcas de clase (Xi) y X²f deben ser
calculadas para la solución del problema, además su promedio es 30.11
años
33584
s2= −(30 .11 )²=26 . 27 años ²
36
PROPIEDADES DE LA VARIANZA
V(X) 0
La varianza siempre es positiva.
V(K) = 0
La varianza de una constante es cero.
V(X K) = V(X)
La varianza de una variable más o menos una constante es igual
a la varianza de la variable.
V(KX) = K² V(X)
La varianza de una constante multiplicada por una variable es
igual al cuadrado de la constante por la varianza de la variable.
V(KX C) = K² V(X)
La varianza de una constante K por la variable más o menos otra
constante C es igual al cuadrado de la constante K por la varianza
de la variable.
√
n
∑ ( x i−x )²
(∑ )
n 2
i=1
s= Xi
n−1 n
i=1
∑ X 2i − n
i=1
s=
n−1
Cuando la muestra es grande (n 30) se utiliza la siguiente fórmula:
método rápido
√ √
n n
∑ ( x i −x ) ² ∑ X 2i
i =1 2
i =1 s= −X
s= N
N
Ejemplo:
Calcular e interpretar la desviación estándar de las notas de los alumnos
de ingeniería en sistemas: X =12, 15, 10, 13, 16, 14, 11, 10, 12, 14
Solución:
10
10
∑ Xi=127
∑ X 2i =1651 i=1
i=1
Reemplazando en la fórmula:
método rápido
√
( 127 )2
1651−
10
s= =√ 4 . 23=2 . 06 puntos
10−1
√ √
m m
Si la muestra n 30 ∑ ( X i −X )2 fi ∑ X 2i fi
i=1 i =1
s= = − X2
n n
Si la muestra n 30
√ √
m m
∑ ( X i −X )2
fi ∑ X 2i fi−n X 2
i=1 i =1
s= =
n−1 n−1
VENTAS(S/) Xi fi X²f
380 4 577600
420 2 352800
500 7 1750000
630 4 1587600
780 3 1825200
TOTAL 20 6093200
s=
√
6093200−20(536 )2
20−1
= √18 277 . 90=s /135 . 20 soles
√ √
Si la muestra n 30 m m
∑ ( X i −X ) 2
fi ∑ X 2i fi
i=1 i =1
s= = − X2
n n
Si la muestra n 30
√ √
m m
∑ ( X i −X )2
fi ∑ X 2i fi−n X 2
i=1 i=1
s= =
n−1 n−1
Ejemplo: Calcular e interpretar la desviación estándar de las edades
de los empleados en la siguiente tabla:
fi Xi X²f
EDADES
20 24 5 22 2420
24 28 8 26 5408
28 32 10 30 9000
32 36 7 34 8092
36 40 6 38 8664
TOTAL 36 33584
Solución: las columnas de las marcas de clase (Xi) y X²f deben ser
calculadas para la solución del problema., además su promedio es
30.11 años
s=
√ 33584
36
−(30 . 11)²=√26 . 21=5 . 12 años
5. COEFICIENTE DE VARIACIÓN.
Es una medida de dispersión relativa que no tiene unidades y se expresa
en porcentaje, se utiliza para comparar la variación de dos distribuciones
siempre que las variables se expresen en las mismas unidades de
medida y sean aproximadamente del mismo tamaño promedio. Sin
embargo, a veces es necesario comparar dos conjuntos de datos
expresados en unidades diferentes. En estos casos las medidas de
dispersión absoluta no son comparables y deben utilizarse medidas de
dispersión relativa.
Se calcula con la siguiente fórmula: S
C . V .= x100
X
X =media
Si C.V. 15% , los datos son homogéneos, es decir tienen una
baja variabilidad.
Si C.V. 15% , los datos son heterogéneos, es decir tienen una
alta variabilidad.
Ejemplo: Calcular e interpretar el coeficiente de variación de las notas de
los alumnos de ingeniería en sistemas: X =12, 15, 10, 13, 16, 14, 11, 10,
12, 14
Solución: como los resultados ya fueron calculados anteriormente, se
conoce que la media es 12.7 y la desviación estándar es 2.06, entonces
reemplazamos en la fórmula:
2.06
C .V .= x 100=16 .2% ¿ 15%¿
12 .7
Interpretación: las notas de los alumnos de ingeniería de sistemas son
heterogéneos, es decir presentan un alto grado de variabilidad.
GRUPO DE EJERCICIOS Nº 1
1. Dado el tablero incompleto de frecuencias de las notas de 50 alumnos.
Completar el tablero, con un ancho de clase constante e igual a 2
a) Señale i) a + b + c ii) m + n + p
b) Calcular e interpretar la media aritmética.
c) Calcular e interpretar la mediana.
d) Calcular e interpretar la moda.
e) Calcular la desviación estándar, la varianza y el coeficiente de
variación.
f) Dibujar su gráfica respectiva.
a) Señale a + b – c
b) Calcular e interpretar la media aritmética.
c) Calcular e interpretar la mediana.
d) Calcular e interpretar la moda.
e) Calcular la desviación estándar, la varianza y el coeficiente de
variación.
f) Dibujar su gráfico respectivo.
GRUPO DE EJERCICIOS Nº 2
Marca de Clase
N° de Viviendas 3 2 7 7 11 11 9
Prueba
1 2 3 4 5 6 7
57 55 54 52 62 55 59
Puntaje obtenido por A
80 40 62 72 46 80 40
Puntaje obtenido por B
a) Halle e interprete la media, mediana y moda de los dos candidatos.
b) Estadísticamente ¿Cuál de los candidatos debe ser contratado?
Fundamente su respuesta.
0 6 1 2 3 1 4 3 6 4
A
B 3 4 1 4 2 3 1 5 4 3
GRUPO DE EJERCICIOS Nº 3
9. Se sabe que ninguna de las sucursales de una empresa comercial tiene más
de 10 empleados ó menos de 8. La mayoría tiene 9 empleados, pero el 30%
tiene 10 empleados y dos de cada 10 sucursales tiene 8 empleados. ¿Cuál
es el promedio de empleados por sucursal?
12. Una persona maneja su automóvil durante 300 Km. Los primeros 110 Km.
viaja a razón de 70 K/h los siguientes 110 Km. A 100 k/h ¿A qué velocidad
debe viajar el resto, para tener en total una velocidad promedio de 90 k/h.?
15. Las ciudades X,Y,Z, son equidistantes entre sí. Un motorista viaje de A a B
a 40 k/h, de B a C a 50 k/h, de C a A a 55 k/h. Determinar el promedio de
velocidad para el viaje completo.
Y5 = 60 f 3 = f 4 = 30 MEDIA = 45
21. Una tienda comercial vendió 95 ternos para caballeros al precio normal de
$ 300 dólares. Para la venta de primavera los ternos se rebajaron a $ 200 y
se vendieron 126. En las ventas de liquidación el precio se redujo a $ 100
y se vendieron los 79 ternos restantes.
a. ¿Cuál es el precio medio ponderado de un terno?
b). La tienda pagó $ 150 por cada uno de los ternos. Comente acerca de la
ganancia de la tienda en estos ternos, si un vendedor recibe una comisión
de $ 15, por cada terno vendido.
24. Una muestra de camiones que utilizan petróleo reveló las siguientes millas
recorridas por galón de combustible consumido:
26. Un grupo de 20 obreros tienen una edad media de 50 años; otro grupo
de 20 trabajadores tienen una edad media de 30 años; la desviación
estándar de los 40 obreros considerados conjuntamente es igual a 5.
Calcular el coeficiente de variación del conjunto de los 40 obreros.
27. Una muestra de 70 datos da para una cierta variable una media de 120 y
una desviación típica de 6, otra semejante, pero de 30 observaciones,
da para la misma variable una media de 125 y una desviación típica de
5. Si se reúnen las dos muestras formando una sola muestra de 100
datos ¿Cuál es su media y su desviación típica?
37. Un grupo de trabajadores hace 140 papeleras para piso con una
productividad de 14 papeleras diarias; una vez terminado este contrato se
dedican a producir otras 140 papeleras a razón de 10 por día. Se desea
determinar la productividad diaria en la elaboración de las 280 papeleras.
38. Un fabricante dispone de $ 100 000 anuales, para la compra de materia
prima. Durante años invierte la misma cantidad de dinero. Si el precio
promedio por kilo ha subido en tres años sucesivos de $ 120 a $ 180 y a $
360. ¿Cuál es el precio promedio que ha pagado el fabricante en los tres
años?
39. Dados los números: 8, 12, 16, 20, encontrar la media, la media geométrica,
la media armónica.
40. Una persona va a tres tiendas del barrio a comprar azúcar; los precios son
los siguientes:
TIENDA PRECIOS
A $ 225
B $ 283
C $ 257
Se pide:
a).Calcular la mediana, moda y media aritmética para cada una de las
submuestras, separadamente.
b). Calcular la media de las dos submuestras.
45. Tres almacenes tienen un total de 80 vendedores. Los dos primeros ganan
$ 22,500 y $ 27,000 respectivamente y tienen, además, el mismo
número de vendedores. Se quiere saber cuál es el salario promedio de
los vendedores del tercer almacén, sabiendo que el salario promedio de
los vendedores de los 3 almacenes es de $ 24,600 y además, tiene 10
vendedores menos que el primer almacén. El salario es semanal.
Rpta. n1 = 30 n2 = 30 n3 = 20 $ 24,150
INTERVALOS FRECUENCIA
10 15 3
15 20 7
20 25 15
25 30 25
30 35 10
TOTAL 60
Se pide calcular:
a). La media aritmética
b). La moda
c). La mediana
d). La media geométrica
e). La media armónica.
50. Un grupo de obreros tiene los siguientes salarios mensuales (miles de $):
23 31 25 24 28 20 23 28 25 20.
Los obreros tienen un reajuste general de35%, pero el empresario ofrece
un aumento del 15%, más una bonificación mensual de $ 2,000. ¿ Cuál
cree usted que deber ser la decisión más ventajosa para el obrero?
Rpta. Pedido de 35% X = $ 31,146.
51. Un grupo de 200 estudiantes, cuya estatura media es de 160.96 cms. Se
divide en 2 grupos, uno con una estatura, media de 163.4 cm Y otro con
una de 157.3 cm ¿Cuántos estudiantes hay en cada grupo?.
Rpta. n1 = 80 n2 = 120
52. En una clase hay 35 estudiantes varones con una edad media de 17.5 años
y 15 estudiantes mujeres las que, en promedio son 12% más jóvenes.
¿Cuál es la edad media de la clase?
Rpta. 16.87 años
57. Una muestra de 70 datos originales da una media de 120 y una desviación
típica de 6, otra muestra de 30 datos originales da una media de 125 y una
desviación típica de 5. Se reúnen las 2 muestras formando una sola
muestra de 100 datos.
¿Cómo podrá calcularse el coeficiente de variación de esta muestra de 100
datos?
58. Los salarios de una empresa son, en promedio S/. 50.00 con posterioridad
se incorporan a la empresa un grupo de obreros igual al 25% de lo que
estaban anteriormente. El nuevo grupo ingresa a la empresa con un
salario medio igual al 60% de los antiguos. Dos meses más tarde la
empresa concede un aumento de salarios de S/.30.00. Determinar:
a).El promedio de salario del total de obreros.
b).Si el aumento hubiera sido del 20% de los salarios ¿Cuál habría sido la
media de los salarios así ajustados?.
59. En una empresa donde los salarios tienen una media de S/. 50.00 y una
desviación estándar de S/. 10.00 el Sindicato solicita que cada salario Xi
se transforme en Yi mediante la siguiente relación Yi = 2.5 Xi + 10.
El Directorio acoge parcialmente la petición rebajando los salarios
propuestos por el sindicato en un 10%, lo que es aceptado. Se pide
calcular la media aritmética y la varianza dela nueva distribución de
salarios.
66. Una compañía tiene 100 trabajadores; para los nombrados el haber básico
máximo es de 150 nuevos soles mensuales y el mínimo es S/. 60.00
mensuales.
Hay un 5% de eventuales que trabajan ad-honore o perciben
compensaciones inferiores a S/. 60.00; 15 trabajadores nombrados
perciben haberes inferiores a S/100; el 85% de los trabajadores tienen
haberes inferiores a S/. 130.
Con esta información calcular e interpretar:
Cuántos trabajadores ganan más de S/. 120 mensuales?
La media, la mediana y moda.
67. Suponga que con un nuevo sol se compren 3 kg. de maíz, o 2 kg. de
azúcar, o 4 kg. de harina. ¿Cuántos kilos se pueden adquirir en promedio
con un nuevo sol y cuál es el precio promedio de los 3 artículos.
68. Una persona maneja los primeros 50 km. A 60 Km/h y los siguientes 50 km
a 50 km/h. ¿Cuál es la velocidad media?
Vm = 54.54 k/h.
72. El Sr. X fue a la ciudad B desde la ciudad A en avión a 250 millas por hora
y regresó en tren a 40 millas por hora. La distancia entre A y B es 1000
millas. ¿Cuál es la velocidad media?. Verifíquelo para comprobar si su
respuesta es lógica.
Rpta. 68.97.