Medidas de Dispersión en Estadística
Medidas de Dispersión en Estadística
Generalidades
En el capítulo anterior estudiamos las medidas de tendencia central: media aritmética,
mediana y moda; asimismo, analizamos la media geométrica y la media armónica,
que describen el comportamiento de los datos en una distribución de frecuencias.
Conviene aclarar que estas medidas no proporcionan información sobre la forma en
que están distribuidos o dispersos los valores con relación a la tendencia central y
poco informan sobre un dato específico con relación a los otros en la distribución de Conceptos clave
frecuencias.
Rango
En este capítulo estudiaremos el rango, la desviación cuartil, la desviación media, Cuartil
la varianza y la desviación estándar. Todos estos recursos nos ayudarán a medir la Decil
dispersión. Rango intercuartil
Problema 1 Rango semintercuartil o
desviación cuartil
En una escuela se aplicó un examen extraordinario para los 40 alumnos Desviación media
que reprobaron matemáticas y física. Los estudiantes fueron calificados Varianza
sobre 30 puntos y obtuvieron las calificaciones que se expresan en el
siguiente cuadro de frecuencias agrupadas. Juan obtuvo 16 puntos en
los dos exámenes que presentó, calcula qué resultado debe esperar en su
calificación.
Clases Frecuencias
(calificaciones) Matemáticas Física
0.5 - 3.5 2 3
3.5 - 6.5 4 3
6.5 - 9.5 9 0
9.5 - 12.5 10 1
12.5 - 15.5 8 2
15.5 - 18.5 4 2
18.5 - 21.5 0 7
21.5 - 24.5 2 9
24.5 - 27.5 1 12
27.5 - 30.5 0 1
40 40
Solución:
Juan obtuvo 16 puntos en ambos exámenes. En matemáticas su calificación
será bastante alta porque sólo hay 3 calificaciones mejores, pero el
resultado de su examen de física no es bueno porque hay 29 mejores.
Rango
En toda distribución hay valores extremos, uno menor y otro mayor; la diferencia
entre estos valores se llama rango y en él están distribuidos todos los demás valores,
por eso también se le llama recorrido.
El rango es una medida de dispersión y es la más fácil de obtener; sin embargo, su
uso es limitado porque es muy influenciable por la presencia de valores extremos
de poca frecuencia. Se piensa que cuanto mayor es el rango, mayor es la dispersión de
los datos, lo cual conduce a apreciaciones falsas.
Problema 2
Frecuencias
X
A B
55 0 1
54 1 0
53 0 2
52 0 0
51 2 0
50 3 3
49 9 7
48 17 19
47 3 2
46 3 4
45 1 1
39 39
Rango = 55 - 45 = 10
Cálculo de las medias aritméticas
Para A:
n n
¤ f i X¤i fi X
55i
0 5554 10 5352
0 1 5453 0 0 5251
0 2 5150
2 3 503
i1 i1
49(9)49(48
9)(1748
) (17
47)(3)47(46
3)(3)46(45
3)(1)45(1)
n n
¤ f i X¤i fi X
55i 1 0 5453
1 5554 0 2 5352
2 0 5251
0 0 5150
0 3 503
i1 i1
497 4948
7 194819
47 2 4746
2 4 4645
4 1 451
Cuartiles y deciles
Para conocer los intervalos dentro de los cuales quedan representados proporcional-
mente los términos de una distribución, se divide la distribución de frecuencias en
cuatro partes iguales, cada una contiene igual número de observaciones (25% del
total).
Los puntos de separación de los valores de X se llaman cuartiles. El primer cuartil
corresponde al 25% y se designa con Q1. El segundo se designa con Q2, que representa
el valor de 50% y coincide con la mediana. El tercer cuartil es Q3 y representa 75%
de las observaciones que están por debajo de él.
Si en lugar de dividir en cuatro partes iguales se hace en diez, se tienen nueve puntos
de división, correspondiendo a cada punto un decil, de donde, el primer decil es el
valor por debajo del cual está el 10% de las observaciones, para el segundo decil
el 20%, y así sucesivamente.
Cálculo de los cuartiles
Problema 3
1
4
¥ 1 ´ 15
PROBABILIDAD CAP [Link] 198 15 ¦ µ 3.7 7/19/07 [Link] AM
20 : 5 :: 1 : x
20 x 5 20 : 5 :: 1 : x
5 20 x 5
x
20 5
x
20 Capítulo 10 Medidas de dispersión 199
1
4 1
Como al número 1 le corresponde , para los 15 que faltan tenemos:
4
¥ 1 ´ 15
15 ¦ µ 3.7
§ 4¶ 4 20 : 5 :: 1¥ :1x´ 15
15 ¦ µ 3.7
§ 4¶ 4
Entonces, 146.5 + 3.7 =20 x 5 Es el valor del tercer cuartil.
150.2
Q Q1
QD 3 5
Rango intercuartil 2 x
20 Q Q1
QD 3
Es el resultado de la diferencia entre el tercer cuartil Q23 y el primero Q1. Se expresa así:
1 =Q=Q −Q
Rango intercuartil 3 1
4
Si después de haber aplicado la media aritmética se quiere evitar la influencia de los
valores extremos, se analiza únicamente la situación intermedia de la distribución de
¥ 1 ´ 15
frecuencias aplicando el rango intercuartil.
15 ¦ µ 3.7
§ 4¶ 4
El rango semintercuartil o desviación cuartil es la mitad del rango intercuartil; se
representa con QD
Q Q1
QD 3
2
El rango semicuartil (desviación cuartil) mide la dispersión con mayor precisión que
el rango; sin embargo, presenta las limitaciones siguientes:
a) No toma en consideración todos los valores de la distribución de frecuencias
y puede suceder que los valores menores a Q1 o superiores a Q3 estén muy
compactos o muy dispersos, y el valor de Q sería el mismo.
b) No es posible, conociendo únicamente Q, hacer la ubicación precisa de una
observación dentro de la distribución
20 : 5 :: 1 : x de frecuencias.
c ) Igual que la mediana, no tiene
20propiedades
x5 que permitan su uso en las relaciones
matemáticas que utiliza la estadística.
5
Problema 4 x
20
Calcula el rango intercuartil y la desviación cuartil de la distribución del
cuadro anterior, en que se1 manejaron las estaturas de 104 alumnos y se
calcularon Q1 = 139.3 y 4Q3 = 150.2, que significa: 18 alumnos miden
menos de 139.3 cm y 52 miden menos de 150.2 cm.
Solución: ¥ 1 ´ 15
15 ¦ µ 3.7
Rango intercuartil =§Q4 =
¶ Q34− Q1
Q = 150.2 -139.3 = 10.9
Q 3 Q1
Desviación cuartil = Q D
2
10.9
QD = = 5.45
2
Desviación media y varianza
Son medidas de dispersión que tienen relación con la media aritmética porque las
tres tienen propiedades algebraicas que les permiten su uso en relaciones matemá-
ticas, que son la base estructural de los análisis estadísticos. Por sus propiedades
algebraicas, son las medidas de dispersión de mayor uso e importancia.
Desviación media
Una de las propiedades de la media aritmética establece
n que en toda distribución la
¤ i
suma de las desviaciones de cada valor de la variable X
respecto a la media es cero;
esto es, que la suma de las desviaciones (X - X )de las variables mayores que la
i1
N
media es igual y de signo opuesto a la suma de las desviaciones de las variables
menores que la media.
n
Por lo tanto,
n
para obtener las desviaciones¤medias
Xi se usan los valores absolutos de
¤ X i que se expresa |X - X |.EsteN valor corresponde al valor positivo de
las desviaciones, i1
Problema 6
Clases
Marca f fX |X - X | f |X - X |
(intervalos)
121.5 - 126.5 124 2 248 20.62 41.24
126.5 - 131.5 129 3 387 15.62 46.86
131.5 - 136.5 134 8 1 072 10.62 84.96
136.5 - 141.5 139 23 3 197 5.62 129.26
141.5 - 146.5 144 27 3 888 0.62 16.74
146.5 - 151.5 149 20 2 980 4.38 87.60
151.5 - 156.5 154 16 2 464 9.38 150.08
156.5 - 161.5 159 3 477 14.38 43.14
161.5 - 166.5 164 2 328 19.38 38.76
Totales 104 15 041 638.64
Los datos numéricos para llenar el cuadro y calcular la desviación media
(DM ) se obtuvieron así:
a) Las clases también se suelen citar como intervalos.
b) La marca o marca de clase es el punto medio entre los extremos de
un intervalo, en el ejemplo son:
121.5 126.5 248.0
121.5 126.5 248.0 124
2 2 124
2 2
126.5 131.5 258.0
126.5 131.5 258.0 129
2 2 129
2 2
Y así se calculan las demás.
¤ f X 15 041
X ¤ f X 15 041 144.62
X N 104 144.62
N 104
f ) Hechos¤los
f | cálculos
X X | necesarios para obtener los valores del cuadro,
DM
tenemos:
N ¤ f |X X|
Desviación media DM
N
638.64
DM
104 638.64
DM
DM = 6.14 (se tomaron 2 cifras
104 decimales)
Varianza
Es la media aritmética de los cuadrados de desviaciones respecto a la media aritmética.
Se representa s2.
Al calcular la desviación media fue necesario ignorar los signos negativos y tomar
los valores absolutos de las desviaciones respecto a la media aritmética.
Si elevamos al cuadrado las desviaciones, todas las desviaciones dan positivas,
sumando los cuadrados de las desviaciones y dividiendo entre N, obtenemos la
varianza.
La varianza sirve de base para calcular la desviación estándar o desviación típica,
que es la más importante de todas las medidas de dispersión.
22
¤¤ XX XX
ss2 2
NN
2
¤ X X 2
Para
s 2 datos
¤ X agrupados: X
N
22
s2 ¤ f X X
N ¤ f X X
2
¤ X X 2 2 ss2 2
s 2 ¤ fX X X X 2
NN
Ahora
sNota:
2
s 22 ¤ f NX X
NN usamos paréntesis y no ¤ barras
2
¤xx 2
para denotar el valor absoluto.
N s 22
s
2
Si en¤lasf relaciones X 2 anteriores sustituimos NN X - X con x, se tiene:
2X
ss
2
2
¤
¤ xf X X
s 22 ¤Nx Npara datos no agrupados ¤ fx 2 2
2
s N ¤ fx
N ss2 2
NN
¤¤xfx 2
2
ss 2 ¤ x 2 para datos agrupados
2 2
s 22 ¤ N fx
s NN
22
¤ X X ¤¤XX 2 22¤¤XXXX ¤¤XX 2¤¤XX 2 22XX¤¤XX XX¤¤XX
2
N ¤ X X 2 2
N
s¤ X X el
2
Desarrollamos
N
¤X 2
2 ¤ X X ¤ XX2 22 ¤2 X¤¤
binomio:
¤¤ X 2
2X
NN
X2 X ¤ X ¤¤XXX¤ X
¤¤XX NNXX
NN
¤X 2 ¤X
2
¤ ¤XX 2 X 2 2 ¤ X¤ X 2 ¤ X X N¤XX 2 ¤ X 2 22X ¤ X X ¤ X
¤ X ¤ XX ¤ X 2 ¤ X¤2 X 2 2X ¤ X ¤XX¤ X
¤¤ X X 2 X2 N ¤ X¤ X 2 ¤ X
2
N N X 22 ¤X ¤X
N N ¤¤XX 22 ¤¤XX
Sustituimos el valor de la media aritmética donde NN se cita XN:N
¤¤ XX 2
¤¤X X
¤¤XX2 2 22 ¤ X 2¤ X¤ X ¤¤XXN X
¤X
22
¤ X 2 22 NN ¤ X¤ X NN NX¤ X 2 2 ¤¤XX
2
¤X
NN NN ¤X
NN
¤X 2 2 2
¤X
¤¤XX 2 ¤¤XX 2 ¤ X ¤ X
22
¤ X2 2 N
¤X
2 N ¤X N
NN N
¤ XX
2
¤X
2
¤X2
2
¤X X N
2
¤ 2
¤ X XN 2
2
¤ XN X ¤ X X
Ahora sustituimos
N en s =
2
N2 2
N
Por lo ¤ X
tanto: ¥ ¤ X ´ 2
s 2 ¤ X 2 ¦¥ ¤ X µ´
s 2 ¤N 2 §¦¥ ¤N ¶µ´ 2 ¤ X 2
¥ ¤X ´
2
NX X
§ N ¶s 2
s2 ¦ µ ¦ µ
N § N ¶ N § N ¶
¤X2
s2 ¤ X 2 X 2
s 2 ¤N 2 X 2 para datos ¤ noXagrupados
2
NX s 2
X2
s
2
X 2
N N
¤ f X 22
s ¤f X
2
X 2 para datos agrupados
s
2 M 2 X2
¤M f X ¤f X2
s
2
X 2 s 2
X2
M M
¤ X 9 11 1 8 14 5 6 7 11 9 81
X ¤ X 9 11 1 8 14 5 6 7 11 9 81
X N 10
¤10X5 69 711 11
10
1 89 14
¤NX 9 11 1 8 14 81 5 6 7 11 9 81
10
X X
N N
10 10
10 10
¤|X X|
DM
PROBABILIDAD CAP [Link] 203 7/19/07 [Link] AM
2
¤ X N X
2
¤ X X
N
N 2
¤X 2 ¥ ¤X ´
s 2 ¥ ¦ ´ µ
2 2
¤XN ¤ XN ¶ 2
s 2 §
2
204 Probabilidad y estadística ¤ ¦
X N¥ ¤ µ X´
s2 N § ¦ ¶ µ
N2 § N ¶
Problema 7¤ X
s 2
2
X2
¤ X N
s 2 Calcula X2 2
¤laXdesviación media DM y la varianza de la serie de números 9,
2 N
11,s 1, 8, 14, 5, 6,X7,2 11, 9.
¤ fNX 2 n
s
2
X2
Solución:
¤
s 2 Calculamos
f XM
2
X2
2 ¤ Xi
¤ f X
la media2 aritmética X i1
s 2 M X N
¤ X M 9 11 1 8 14 5 6 7 11 9 81
X n
¤ X N 9 11 1 8 14 510 6 7 11 9 81 10
X ¤¤XXi 9 11 1 810 14 5 6 7 11 10 9 81
XX=N8.1i1
¤N|NX X | 10 10
DM Para obtener DM tomamos el valor absoluto
¤ | X NX |
DM ¤|X X|
DM N
| 9 8.1N| | 11 8.1 | | 1 8.1 | | 8 8.1 | | 14 8.1 | | 5 8.1 |
| 9 8.1 | | 11 8.1 | | 1 8.1 | | 8 810 .1 | | 14 8.1 | | 5 8.1 |
| 9 8 .1 | | 11 8 .1 | | 1 8 .1 |
| 6 8.1 | | 7 8.1 | | 11 8.1 | 10 | 9 8.81.1| | | 14 8.1 | | 5 8.1 |
| 8
| 6 8.1 | | 7 8.1 | | 11 8.1 | | 9 8.110 |
9 38.1.1 | 2.|19 18.1.1 | 2.9 0.9 27
0|.96 28..91 | 7|.71 80..11 | 5|.11
0.9 2.9 7.1 0.1 5.9 310 .1 2.1 1.1 2.9 0.9 27 10
0.9 2.9 7.1 0.1 105.9 3.1 2.1 1.1 2.9 0.10 9 27
DM = 2 10 10
2
2
¤ XX X
2 ¤ X
2s
s
NN
9 98.18.21 11118.18.21 1 18.18.21 8 88.18.21 14148.18.21 5 58.18.21
2 2 2 2 2 2
1010
6 68 18 1 7 78.18.1 11118.18.1 9 98.18.21
2 2 2 2
2 2 2
1010
2.9 2.9
2
2
0.9 0.29
2
0.818.41
0.81 8.4150.50
41.410.01
0.0134.34
81.819.61 4.411.21
9.614.41 1.218.41
8.410.81
0.81
1010
.90.90
118118
10
10
s2 = 11.89
Problema 8
Solución:
Clases |X - X | f |X - X | (X - X )2 f (X - X )2
Marca f fx
(intervalos)
121.5 - 126.5 124 2 248 20.62 41.24 425.18 850.36
126.5 - 131.5 129 3 387 15.62 46.86 243.98 731.94
131.5 - 136.5 134 8 1072 10.62 84.96 112.78 902.24
136.5 - 141.5 139 23 3 197 5.62 129.26 31.58 726.34
141.5 - 146.5 144 27 3 888 0.62 16.74 0.38 10.26
146.5 - 151.5 149 20 2 980 4.38 87.60 19.18 383.60
151.5 - 156.5 154 16 2 464 9.38 150.08 87.98 1 407.68
156.5 - 161.5 159 3 477 14.38 43.14 206.78 620.34
161.5 - 166.5 164 2 328 19.38 38.76 375.58 751.16
Totales 104 15 041 638.64 6 383.92
2
¤ f X2 X 6 383.92
¤
s 2
f X X
6 383.92
s
2
N 104
N 104
s2 = 61.38 (se tomaron dos cifras decimales)
Ejercicios de repaso
10
8
8
6
6
4 5
4
2 2
0
11 12 13 14 15
Sol. 13 (no se tomó la cifra decimal)
Clase Frecuencias
151.5 - 156.5 3
156.5 - 161.5 8
161.5 - 166.5 12
166.5 - 171.5 10
171.5 - 176.5 6
5. Con los datos obtenidos para calcular la desviación media de la misma frecuencia agrupada, citada en
el problema anterior, determina el valor de la varianza.
Clase Frecuencias
151.5 - 156.5 3
156.5 - 161.5 8
161.5 - 166.5 12
166.5 - 171.5 10
171.5 - 176.5 6