MEDIDAS DE
DISPERSIÓN
RANGO, VARIANZA,
DESVIACIÓN ESTÁNDAR,
COEFICIENTE DE VARIACIÓN
MEDIDAS DE DISPERSIÓN
REFLEXIÓN DESDE LA EXPERIENCIA
¿Donde me conviene trabajar?
Supongamos que los sueldos mensuales de los enfermeros en dos clínicas son las
siguientes:
¿En cuál de las dos clínicas existe mayor diferencia de los sueldos con
respecto al promedio?
LOGRO DE LA SESIÓN
Al finalizar la sesión, el estudiante analiza,
resuelve ejercicios de medidas de
dispersión usando las fórmulas e
interpreta sus resultados.
MEDIDAS DE DISPERSIÓN
Una medida de variabilidad es un número
que nos indica el grado de dispersión en un
conjunto de datos. Si el valor es pequeño
(respecto de la unidad de medida)
entonces hay una gran uniformidad entre
los datos (homogénea).
Por el contrario, un gran valor nos indica
poca uniformidad (heterogénea). Cuando
es cero quiere decir que todos los datos
son iguales.
¿Para qué sirven las medidas de dispersión?
Las medidas de dispersión nos sirven para determinar si
nuestros datos se alejan mucho del valor central. Con
ello, nos dan información si este valor central es
adecuado para representar la población de estudio.
Esto es muy útil para comparar distribuciones y
comprender los riesgos en la toma de decisiones.
A mayor dispersión, menos representativo es el valor
central.
LAS MEDIDAS DE DISPERSIÓN
Recorrido o Coeficiente de
Rango Variación
Desviación
Varianza
Estándar
RECORRIDO O RANGO
Es la distancia que existe entre el valor máximo y el valor mínimo
Rango = Vmax - Vmin
Ejemplo:
Los siguientes datos corresponden a las notas del curso de Estadística de la
UCSUR del grupo 2H
10 12 15 08 15 18 17 16 11 12 07 18 17 16 15 10 11 13 14 15 16 10
10 18 12 07 12 14 16 16 14 13 15 17 10 15 12 15 17 16 12 14 18 17
10 16 13 11
R= 18 – 07 = 11
VARIANZA
Mide la mayor o menor dispersión de la variable respecto a su media aritmética.
Cuanto mayor sea la varianza mayor dispersión existirá, por lo tanto, menor
representatividad tendrá la media aritmética.
CARACTERÍSTICAS:
1. Es la suma de los cuadrados de las diferencias de cada valor respecto a su media
entre el número de observaciones.
1. Mide la distancia existente entre los valores de la serie y la media.
3. La varianza siempre será mayor a cero. Mientras más se aproxima a cero, más
concentrados están los valores de las serie alrededor de la media. Por el contrario,
mientras la varianza sea mayor más dispersos están los datos.
4. Este estadístico es poco significativo ya que mide el cuadrado de la unidad de la
variables. Ejemplo: Si la variable es en cm. La varianza será en cm2.
FÓRMULAS:
Varianza poblacional 2
σ(Xi − μ)2 Xi edad
σ =
N
32 ;33; 33; 38; 27;
PARA DATOS NO AGRUPADOS:
29; 35; 32; 30; 35
Varianza muestral
σ xi − µ 2 × fi
Varianza poblacional 2
σ =
N EDAD
PARA DATOS AGRUPADOS:
ഥ 2 × fi
σ xi − X
S2 =
Varianza muestral n−1
EJEMPLO 1:
En una muestra aleatoria de las edades de 10 pacientes con infección
renal, se obtuvo los siguientes datos:
42,28,28,61,31,23,50,34,32,37
Calcule la varianza de las edades de los pacientes.
42,28,28,61,31,23,50,34,32,37
Calculamos la media:
(42+28+28+61+31+23+50+34+32+37)
xത =
10
xത= 36.6
Aplicamos la fórmula:
(42−36.6) 2+(28−36.6)2+(28−36.6)2+ ⋯ . +(37−36.6)2
2 𝒔𝟐 =
σ (𝑥𝑖 − 𝑥)
ҧ 9
𝑠2 =
𝑛−1
1196.4
𝒔𝟐 =
9
S2 = 132.9
La varianza de la edades de los pacientes es 132.9 𝑎ñ𝑜𝑠 2 .
EJEMPLO 2:
Un pediatra registra en una tabla el número meses que los niños tardan en dar sus
primeros pasos luego de haber nacido.
Calcule la varianza.
Calculamos la media:
σ 𝑥𝑖 𝑓𝑖 9𝑥1+10𝑥4+11𝑥9+⋯.+15𝑥1 610
xത =
𝑛
=
50
= 50
xത= 12.2
Aplicamos la fórmula:
σ (𝑥 − 𝑥)ҧ 2. 𝑓
2 𝑖 𝑖
𝑠 =
𝑛−1
2 2 2 2
2
(9 − 12.2) . 1 + (10 − 12.2) . 4 + (11 − 12.2) . 9 + ⋯ . +(15 − 12.2) .1
𝑠 =
49
84
𝑠2 = 𝑠 2 = 1.7
49
La varianza de los meses que tardan los niños en dar sus primeros pasos es
1.7 𝑚𝑒𝑠𝑒𝑠 2 .
EJEMPLO 3:
Las calorías que se pierde en una hora de gimnasio de 80 personas se muestran a
continuación en la siguiente tabla. Calcule la varianza de las calorías perdidas.
Calorías Marca de clase (xi) fi
90-130 110 15
130-170 150 22
170-210 190 24
210-250 230 15
250-290 270 4
Total 80
Calculamos la media:
σ 𝑥𝑖 𝑓𝑖 110𝑥15+150𝑥22+190𝑥24+⋯.+270𝑥4 14040
xത =
𝑛
=
80
= 80
xത= 175.5
Aplicamos la fórmula:
σ (𝑥 − 𝑥)
ҧ 2. 𝑓
𝑖 𝑖
𝑠2 =
𝑛−1
(110 − 175.5)2 . 15 + (150 − 175.5)2 . 22 + (190 − 175.5)2 . 24 + ⋯ . +(270 − 175.5)2 . 4
𝑠2 =
79
𝑠 2 =2075.7
La varianza de las calorías perdidas es 2075.7 𝑐𝑎𝑙 2 .
DESVIACIÓN ESTÁNDAR
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos
están los datos con respecto a la media. Es útil como medida de variación en un determinado
conjunto de datos. Se calcula sacando la raíz cuadrada a la varianza.
PARA DATOS NO AGRUPADOS: PARA DATOS AGRUPADOS:
Desviación estándar poblacional Desviación estándar poblacional
σ(𝑋𝑖 −𝜇)2 σ(𝑥𝑖 −𝜇)2 ∗𝑓𝑖
𝜎= 𝜎2 = 𝑁 𝜎= 𝜎2 = 𝑁
Desviación estándar muestral Desviación estándar muestral
ത 2
σ(𝑋𝑖 −𝑋) ത 2 ∗𝑓𝑖
σ(𝑥𝑖 −𝑋)
𝑆= 𝑆2 = 𝑛−1
𝑆= 𝑆2 = 𝑛−1
Regla Empírica
Regla empírica para una distribución de frecuencias simétrica de campana:
• Cerca de 68.2% de las observaciones estará dentro de ± 1σ de la media(μ);
• Cerca de 95.4% de las observaciones estará dentro de ± 2σ de la media(μ);
• Casi todas (alrededor de 99.6%) las observaciones estarán dentro de ± 3σ de la media(μ).
s2 = 195.2𝑎ñ𝑜𝑠 2 s= 195.2𝑎ñ𝑜𝑠 2 =13.97años
𝑠 2 = 1.7𝑚𝑒𝑠𝑒𝑠 2 s= 1.7𝑚𝑒𝑠𝑒𝑠 2 =1.30meses
𝑠 2 =2075.7𝑐𝑎𝑙 2 𝑠 = 2075.7𝑐𝑎𝑙 2 = 45.56𝑐𝑎𝑙
COEFICIENTE DE VARIACIÓN
El coeficiente de variación es una medida relativa de la variabilidad; mide la
desviación estándar en relación con la media.
𝑺
𝐂𝐕 = ഥ *100%
𝑿
El coeficiente de variación es la razón entre las desviación típica y
la media.
También se le conoce como variabilidad relativa.
Permite comparar dos o más conjuntos de datos
Características:
1. Es frecuente que se presente en porcentajes. Ejemplo: si la media es 80 y la
desviación es 20, entonces: CV= 20/80 = 0,25 = 25% (variabilidad relativa).
2. Permite comparar la variabilidad de diferentes variables. Ejemplo: si el peso
tiene CV= 40 % y la altura tiene CV= 20 %, los individuos presentan más
dispersión en peso que en altura.
3. No debe usarse cuando la variable presenta valores negativos o cuando el 0
sea arbitrario. Ejemplo: la temperatura.
El coeficiente de variación es independiente a cualquier escala de medición.
Se debe considerar que no es un verdadero porcentaje porque puede ser superior a 100. A mayor
CV, menos representatividad tiene la media aritmética.
EJEMPLO 1:
Se tomó en un grupo de jóvenes el peso y la altura de todos los estudiantes, y
se obtuvieron los siguientes resultados: el peso promedio de los jóvenes fue
de 80kg con una desviación típica de 10kg, mientras que la altura promedio
fue de 172 cm con una desviación típica de 5cm. Conociendo estos
resultados, definir cual de las dos variables varío más.
PESO ALTURA
SOLUCIÓN:
Primero se calculará el coeficiente de variación del peso de los jóvenes
CV = S / x = 10 / 80 = 0.125
CV = 0.125 * 100%
CV = 12.5%
Ahora se calculará el coeficiente de variación de la altura
CV = S / x = 5 / 172 = 0.029
CV = 0.029 * 100%
CV = 2.9%
EJEMPLO 2:
Los siguientes resultados corresponden a dos muestras formadas por varones:
MUESTRA 1 MUESTRA 2
Edad 25 años 11 años
Peso medio 145 libras 80 libras
Desviación estándar 10 libras 10 libras
¿Cuál de los datos tiene mayor variabilidad?
¿El peso de los individuos de 25 o de 11 años?
Si realizamos la comparación entre las desviaciones estándar de los individuos de
ambas edades, podemos concluir que ambos tienen igual variabilidad (información
errónea). Si calculamos los coeficientes de variación tenemos:
Individuos de 25 años:
CV = (10/145 ) x 100 = 6.9%
Individuos de 11 años:
CV = (10/80) x 100 = 12.5%
El peso de los individuos de 11 años tienen mayor variabilidad que los pesos de los
individuos de 25 años
APLIQUEMOS LO APRENDIDO
1.- Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas a continuación
presentan los salarios percibidos hasta fines de mayo de este año de una muestra de trabajadores
(expresado en miles de soles):
Dpto. producción Dpto. ventas
Nº Nº
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
2.5 – 3 24 12 – 14 15
3 – 3.5 12 14 – 16 3
a) Hallar la desviación típica correspondiente a cada departamento.
b) Cuál de los departamentos presenta mayor dispersión relativa y cuanto
vale.
La siguiente información corresponde a las edades de una muestra de pacientes que sufren de
insuficiencia renal:
2.- Halle la desviación estándar en datos no agrupados
15 16 18 18 19 21 21 22
23 25 27 29 30 31 31 35
44 46 48 48 50 52 52 53
3.- Halle la desviación estándar en datos agrupados
Edades fi
30 – 34 6
34 – 38 2
38 – 42 8
42 – 46 3
46 – 50 10
INTEGREMOS LO APRENDIDO
ACTIVIDAD ASINCRÓNICA