MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN
Miden qué tanto se dispersan las observaciones alrededor de su media.
MEDIDAS DE DISPERSIÓN
En algunos casos existen conjuntos de datos que tienen la misma media y la
misma mediana, pero esto no refleja qué tan dispersos están los elementos de
cada conjunto.
Ejemplo:
Conjunto 1. 80, 90, 100, 110, 120
Conjunto 2. 0, 50, 100, 150, 200
Conjunto 1 80 90 100 110 120
Media 100
5
Conjunto 2 0 50 100 150 200
Media 100
5
Observa que para ambos conjuntos la Mediana es igual a 100. También
nota que los datos del conjunto 2 están más dispersos con respecto a su
media que los datos del conjunto 1.
MEDIDAS DE DISPERSIÓN
Existen diversas medidas estadísticas de dispersión, pero muchos autores
coinciden en que las principales son:
Rango
Varianza
Desviación estándar
Coeficiente de variación
RANGO
Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el
valor más elevado (Límite superior) y el valor más bajo (Límite inferior).
FÓRMULA
Rango X MAX X MIN
Ejemplo 1.
Ante la pregunta sobre número de hijos por familia, una muestra de 12 hogares,
marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
Calcula el rango de la variable
Solución.
Rango 5 0 5
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en La Paz y Santa Cruz en
un año.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
La Paz 86 135 178 170 231 290 231 305 244 122 66 71
Santa Cruz 40 77 83 89 147 168 184 252 209 101 32 13
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:
La Paz Rango 305mm 66mm 239mm
Santa Cruz Rango 252mm 13mm 239mm
En este caso se puede
observar que el rango es el
mismo para ambos casos
aunque las cantidades sean
diferentes.
Cantidad de lluvia en La Paz y Santa Cruz
2020
Cantidad de lluvia (mm)
350
300
250
200
150
100
50
0
Mes
VARIANZA (Datos no agrupados)
Mide la distancia existente entre los valores de la serie y la media. Se calcula
como sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. La
sumatoria obtenida se divide por el tamaño de la muestra.
n
FÓRMULA i
( x x ) 2
Muestral s 2 i 1
n 1
Poblacional i x
( x ) 2
2 i 1
N
La varianza siempre será mayor que cero. Mientras más se aproxima a cero,
más concentrados están los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, más dispersos están.
Ejemplo 1.
Calcula la varianza para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Primero es necesario obtener la media. En este caso x 2.16
Ahora aplicamos la fórmula correspondiente
2 (2 2.16)2 (1 2.16) 2 (2 2.16) 2 (4 2.16) 2 (1 2.16) 2 (3 2.16) 2 (2 2.16) 2 (3 2.16) 2 (2 2.16) 2 (0 2.16) 2 (5 2.16) 2 (1 2.16) 2
s
12 1
21.6672
s2 1.9697
11
Ejemplo 2.
A continuación se muestran dos conjuntos de datos obtenidos a partir de un
experimento químico que realizaron dos estudiantes distintos. Calcular la
varianza.
Volumen de ácido medido (cm^3)
Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
Solución.
Primero es necesario obtener la media de cada conjunto de datos. En este caso
Estudiante A 8 12 7 9 3 10 12 11 12 14
x 9.8
10
Estudiante B 7 6 7 15 12 11 9 9 13 11
x 10
10
Ahora aplicamos la fórmula correspondiente
Solución (Continuación).
Estudiante A
2 (8 9.8)2 (12 9.8)2 (7 9.8)2 (9 9.8) 2 (3 9.8) 2 (10 9.8)2 (12 9.8)2 (11 9.8)2 (12 9.8)2 (14 9.8)2
s
10 1
Estudiante B
2 (7 10)2 (6 10)2 (7 10)2 (15 10)2 (12 10)2 (11 10)2 (9 10)2 (9 10)2 (13 10)2 (11 10)2
s
10 1
𝟐 𝟕𝟔
𝑺 = =𝟖 , 𝟒𝟒
𝟗
DESVIACIÓN ESTÁNDAR (Datos no agrupados)
También llamada desviación típica, es una medida de dispersión usada en
estadística que nos dice cuánto tienden a alejarse los valores puntuales del
promedio en una distribución.
Específicamente, la desviación estándar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por una S o con la letra
sigma,σ, según se calcule en una muestra o en la población.
Una desviación estándar grande indica que los puntos están lejos de la media, y
una desviación pequeña indica que los datos están agrupados cerca de la
media.
n
FÓRMULA i
( x x ) 2
s i 1
Muestral n 1
N
Poblacional
(x i x )2
i 1
N
Ejemplo 1.
Si retomamos el ejemplo 1 que corresponde a la varianza:
Calcula la desviación estándar para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Una vez que hemos calculado la media y la varianza, sólo resta calcular la raíz cuadrada de
la varianza.
x 2.16
21.6672
s2 1.9697
11
S 1.9697 1.4034
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para calcular la varianza,
tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir de un experimento
químico que realizaron dos estudiantes distintos. Calcular la varianza.
Volumen de ácido medido (cm^3)
Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular la desviación
estándar a partir de la obtención de la raíz cuadrada de la varianza.
Estudiante A
S 10.17 3.18
Estudiante B 𝟐 𝟕𝟔
𝑺 = =𝟖 , 𝟒𝟒 S 8.44 2.90
𝟗
COEFICIENTE DE VARIACIÓN
Es una medida de dispersión que se utiliza para poder comparar las
desviaciones estándar de poblaciones con diferentes medias y se calcula como
cociente entre la desviación típica y la media.
FÓRMULA
S
CV 100%
Muestral x
Poblacional
CV 100%
Ejemplo 1.
En dos cursos los promedios que sacaron sus alumnos fueron 6.1 y 4.3 y las
desviaciones estándar respectivas fueron 0.6 y 0.45 respectivamente. ¿En qué
curso hay mayor dispersión?
Solución
Para responder esto, debemos obtener el coeficiente de variación aplicando la
fórmula S
CV 100%
x
0 .6
CVA (100%) 9.8%
6.1
0.45
CVB (100%) 10.4%
4.3
Claramente, el curso A tiene una dispersión menor que el B, pese a presentar
una mayor desviación estándar.
VARIANZA Y DESVIACIÓN ESTÁNDAR (Datos agrupados)
Cuando los datos están agrupados en tablas de frecuencias, el significado de
las medidas de dispersión es el mismo, sin embargo la manera de calcularlas es
diferente.
Enseguida se muestra la fórmula para la varianza, pero recuerda que la
desviación estándar es igual a la raíz cuadrada de la primera.
FÓRMULA 2
k
k k
xi f i
f (x x)
i i
2
f i xi2 i 1
Muestral 2 n
s i 1
i 1
n 1 n 1
k k
2
Poblacional
fi ( xi ) fi xi2
2 i 1 i 1 2
N N
Ejemplo 1.
Se han registrado durante 20 días, el número de viajeros que hacen
reservaciones a una agencia de viajes pero que no las hacen efectivas:
Número de viajeros Frecuencia
i (xi ) (fi)
1 12 3
2 13 3
3 14 6
4 15 3
5 16 5
Total 70 20
Calcula las medidas de dispersión de la variable en estudio. Interpreta
Solución.
Tal como lo indica la fórmula, primero es necesario multiplicar la
variable (xi ) por la frecuencia (fi) y añadirlo como una columna a la
tabla. 2
k
k
xi f i
... i 1
...
s 2 i 1
...
Número de viajeros Frecuencia
i xi fi
(xi ) (fi)
1 12 3 36
2 13 3 39
3 14 6 84
4 15 3 45
5 16 5 80
Total 70 20 284
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (x i )2.
...x ... 2
i
s 2 i 1
...
Frecuenc
Número de viajeros
i ia xi fi x i2
(xi )
(fi)
1 12 3 36 144
2 13 3 39 169
3 14 6 84 196
4 15 3 45 225
5 16 5 80 256
Total 70 20 284 990
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es
decir, (fixi2).
k
...
f i xi2
...
s 2 i 1
...
Número de fixi2
Frecuencia
i viajeros xi fi x i2
(fi)
(xi )
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la
fórmula 2
k
k
xi f i
f i xi2 i 1
n
s 2 i 1
n 1
Número de fixi2
Frecuencia
i viajeros xi fi x i2
(fi)
(xi )
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
Solución (Continuación).
Número de fixi2
Frecuencia
i viajeros xi fi x i2
(fi)
(xi )
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
284 2
4070
s2 20 1.9579
19
s 1.9579 1.3992
Ejemplo 2.
De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC RELATIVA
FREC. RELATIVA %
x f ACUMULADA ACUMULADA %
1.2 1 1 0.1 0.1
1.4 2 3 0.2 0.3
1.6 3 6 0.3 0.6
1.8 8 14 0.8 1.4
2.0 14 28 1.4 2.8
2.2 18 46 1.8 4.6
2.4 19 65 1.9 6.5
2.6 22 87 2.2 8.7
2.8 25 112 2.5 11.2
3.0 26 138 2.6 13.8
3.2 27 165 2.7 16.5
3.4 31 196 3.1 19.6
3.6 35 231 3.5 23.1
3.8 38 269 3.8 26.9
4.0 45 314 4.5 31.4
4.2 46 360 4.6 36.0
4.4 48 408 4.8 40.8
4.6 52 460 5.2 46.0
4.8 58 518 5.8 51.8
5.0 60 578 6.0 57.8
5.2 56 634 5.6 63.4
5.4 54 688 5.4 68.8
5.6 51 739 5.1 73.9
5.8 50 789 5.0 78.9
6.0 46 835 4.6 83.5
6.2 44 879 4.4 87.9
6.4 40 919 4.0 91.9
6.6 32 951 3.2 95.1
6.8 31 982 3.1 98.2
7.0 18 1000 1.8 100
TOTAL 1000 4717 23970.12
Solución.
El primer paso es calcular xi fi:
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC RELATIVA
x f ACUMULADA
FREC. RELATIVA %
ACUMULADA % xi fi
1.2 1 1 0.1 0.1 1.2
1.4 2 3 0.2 0.3 2.8
1.6 3 6 0.3 0.6 4.8
1.8 8 14 0.8 1.4 14.4
2.0 14 28 1.4 2.8 28
2.2 18 46 1.8 4.6 39.6
2.4 19 65 1.9 6.5 45.6
2.6 22 87 2.2 8.7 57.2
2.8 25 112 2.5 11.2 70
3.0 26 138 2.6 13.8 78
3.2 27 165 2.7 16.5 86.4
3.4 31 196 3.1 19.6 105.4
3.6 35 231 3.5 23.1 126
3.8 38 269 3.8 26.9 144.4
4.0 45 314 4.5 31.4 180
4.2 46 360 4.6 36.0 193.2
4.4 48 408 4.8 40.8 211.2
4.6 52 460 5.2 46.0 239.2
4.8 58 518 5.8 51.8 278.4
5.0 60 578 6.0 57.8 300
5.2 56 634 5.6 63.4 291.2
5.4 54 688 5.4 68.8 291.6
5.6 51 739 5.1 73.9 285.6
5.8 50 789 5.0 78.9 290
6.0 46 835 4.6 83.5 276
6.2 44 879 4.4 87.9 272.8
6.4 40 919 4.0 91.9 256
6.6 32 951 3.2 95.1 211.2
6.8 31 982 3.1 98.2 210.8
7.0 18 1000 1.8 100 126
TOTAL 1000 4717 23970.12
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (x i )2.
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC RELATIVA
x f ACUMULADA
FREC. RELATIVA %
ACUMULADA % xi fi xi2
1.2 1 1 0.1 0.1 1.2 1.44
1.4 2 3 0.2 0.3 2.8 1.96
1.6 3 6 0.3 0.6 4.8 2.56
1.8 8 14 0.8 1.4 14.4 3.24
2.0 14 28 1.4 2.8 28 4
2.2 18 46 1.8 4.6 39.6 4.84
2.4 19 65 1.9 6.5 45.6 5.76
2.6 22 87 2.2 8.7 57.2 6.76
2.8 25 112 2.5 11.2 70 7.84
3.0 26 138 2.6 13.8 78 9
3.2 27 165 2.7 16.5 86.4 10.24
3.4 31 196 3.1 19.6 105.4 11.56
3.6 35 231 3.5 23.1 126 12.96
3.8 38 269 3.8 26.9 144.4 14.44
4.0 45 314 4.5 31.4 180 16
4.2 46 360 4.6 36.0 193.2 17.64
4.4 48 408 4.8 40.8 211.2 19.36
4.6 52 460 5.2 46.0 239.2 21.16
4.8 58 518 5.8 51.8 278.4 23.04
5.0 60 578 6.0 57.8 300 25
5.2 56 634 5.6 63.4 291.2 27.04
5.4 54 688 5.4 68.8 291.6 29.16
5.6 51 739 5.1 73.9 285.6 31.36
5.8 50 789 5.0 78.9 290 33.64
6.0 46 835 4.6 83.5 276 36
6.2 44 879 4.4 87.9 272.8 38.44
6.4 40 919 4.0 91.9 256 40.96
6.6 32 951 3.2 95.1 211.2 43.56
6.8 31 982 3.1 98.2 210.8 46.24
7.0 18 1000 1.8 100 126 49
TOTAL 1000 4717 23970.12
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (f ixi2).
NOTA FREC. ABSOLUTA FREC. ABSOLUTA FREC. RELATIVA FREC RELATIVA
x f ACUMULADA % ACUMULADA % xi fi xi2 fixi2
1.2 1 1 0.1 0.1 1.2 1.44 1.44
1.4 2 3 0.2 0.3 2.8 1.96 3.92
1.6 3 6 0.3 0.6 4.8 2.56 7.68
1.8 8 14 0.8 1.4 14.4 3.24 25.92
2.0 14 28 1.4 2.8 28 4 56
2.2 18 46 1.8 4.6 39.6 4.84 87.12
2.4 19 65 1.9 6.5 45.6 5.76 109.44
2.6 22 87 2.2 8.7 57.2 6.76 148.72
2.8 25 112 2.5 11.2 70 7.84 196
3.0 26 138 2.6 13.8 78 9 234
3.2 27 165 2.7 16.5 86.4 10.24 276.48
3.4 31 196 3.1 19.6 105.4 11.56 358.36
3.6 35 231 3.5 23.1 126 12.96 453.6
3.8 38 269 3.8 26.9 144.4 14.44 548.72
4.0 45 314 4.5 31.4 180 16 720
4.2 46 360 4.6 36.0 193.2 17.64 811.44
4.4 48 408 4.8 40.8 211.2 19.36 929.28
4.6 52 460 5.2 46.0 239.2 21.16 1100.32
4.8 58 518 5.8 51.8 278.4 23.04 1336.32
5.0 60 578 6.0 57.8 300 25 1500
5.2 56 634 5.6 63.4 291.2 27.04 1514.24
5.4 54 688 5.4 68.8 291.6 29.16 1574.64
5.6 51 739 5.1 73.9 285.6 31.36 1599.36
5.8 50 789 5.0 78.9 290 33.64 1682
6.0 46 835 4.6 83.5 276 36 1656
6.2 44 879 4.4 87.9 272.8 38.44 1691.36
6.4 40 919 4.0 91.9 256 40.96 1638.4
6.6 32 951 3.2 95.1 211.2 43.56 1393.92
6.8 31 982 3.1 98.2 210.8 46.24 1433.44
7.0 18 1000 1.8 100 126 49 882
TOTAL 1000 4717 23970.12 4717 23970.12
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
2
k
k
xi f i
f i xi2 i 1
2 n
s i 1
n 1
4717 2
23970.12
2
s 1000 1.7217 Varianza
1000 1
s 1.7217 1.3121 Desviación estándar
Fuentes de información
• [Link]
• [Link]
[Link]
• [Link]
• [Link]
• [Link]
[Link]
.
• [Link]/~ms/f7it/[Link]
GRACIAS…..!!!