De la información al conocimiento
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA
DATOS SIMPLES
Datos no agrupados.
Cuando los datos se presentan en una tabla de distribución de e frecuencias para datos no
agrupados, es preciso modificar el procedimiento para el cálculo de las medidas de tendencia
central.
Para guiarnos en este desarrollo, realizaremos un ejemplo guiado, planteando el siguiente caso:
En la cooperativa del plantel 06 se venden diariamente muchos productos, el encargado de ella se
ha propuesto investigar cual es la cantidad de dinero que se gasta un estudiante en sus alimentos
en el plantel, para ello realizo una encuesta que los estudiantes de probabilidad y estadística 1 le
han ayudado a presentar como una tabla de distribución de frecuencias para datos no agrupados.
𝒙𝒊 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
35 6 6 0.17 0.17 17%
40 9 15 0.26 0.43 26%
45 7 22 0.20 0.63 22%
50 8 30 0.23 0.86 23%
60 5 35 0.14 1.00 14%
∑ 35 1 100%
El encargado de la cooperativa desea emplear esta información para diseñar un menú acorde a las
necesidades de la población. Sin embargo, no sabe interpretar la información que se obtuvo.
Emplea las medidas de tendencia central para ofrecerle información que le permita realizar un menú
adecuado.
125
Media:
Si se tiene un conjunto de datos, con valores numéricos denotados como Xi y estos se presentan a
su vez con distintos valores de frecuencia fi, entonces la fórmula para calcular la media aritmética
seria
∑𝑛1 𝑥𝑖 𝑓𝑖
𝑥̅ =
𝑛
Es decir, se tiene que realizar la suma de todos los productos que se obtiene a multiplicar cada valor
por su respectiva media. Para hacerlo podemos emplear una columna adicional a nuestra tabla de
distribución de frecuencias.
𝒙𝒊 𝒇𝒊 𝒙𝒊 ∗ 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
35 6 210 6 0.17 0.17 17%
40 9 360 15 0.26 0.43 26%
45 7 315 22 0.20 0.63 22%
50 8 400 30 0.23 0.86 23%
60 5 300 35 0.14 1.00 14%
∑ 35 1585 1 100%
Al sumar todos los elementos de la columna tendríamos el valor correspondiente a la parte superior
de la fórmula, la parte inferior corresponde al tamaño de la muestra, el cual lo podemos obtener
sumando todas las frecuencias absolutas, de tal manera que podríamos sustituir ambos elementos
en la formula y obtendríamos:
∑𝑛1 𝑥𝑖 𝑓𝑖 1585
𝑥̅ = → 𝑥̅ = = 45.28
𝑛 35
De esta manera se obtiene la media aritmética para una tabla de frecuencias con datos no
agrupados.
Mediana:
Calcular la mediana se base en el ordenamiento de los datos del conjunto, cuando se presentan
estos en una tabla de frecuencias para datos no agrupados, se entiende que las clases tienen un
ordenamiento ascendente (de menor a mayor).
Para entender esta parte es necesario comprender la frecuencia absoluta como un conjunto de
posiciones, cada frecuencia absoluta tiene sus propias posiciones, por ejemplo:
126
𝒙𝒊 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
𝒇𝒂 = 6 i = {1, 2, 3, 4, 5, 6}
35 6 6 0.17 0.17 17% 𝒇𝒂 = 15 i = {7, 8, 9, 10, 11, 12, 13, 14, 15}
40 9 15 0.26 0.43 26% 𝒇𝒂 = 22 i = {15, 16, 17, 18, 19, 20, 21, 22}
𝒇𝒂 = 30 i = {23, 24, 25, 26, 27, 28, 29, 30}
45 7 22 0.20 0.63 22% 𝒇𝒂 = 35 i = {31, 32, 33, 34, 35}
50 8 30 0.23 0.86 23%
60 5 35 0.14 1.00 14%
∑ 35 1 100%
Para encontrar la mediana es necesario determinar el procedimiento a seguir, para ello es necesario
corroborar si el valor del tamaño del conjunto de datos es par o impar.
Cuando n es impar la posición se obtiene de la siguiente manera.
𝑛
𝑝= + 0.5
2
Cuando n es par se obtendrán dos posiciones de las siguientes maneras.
𝑛 𝑛
𝑝1 = 𝑝2 = +1
2 2
Estas posiciones se emplearán para encontrar la mediana mas no son el valor de ella, para encontrar
el valor de esta es necesario usar la columna de frecuencia absoluta (fa) donde están contenidas, y
emplear el valor Xi que le corresponde.
Por ejemplo:
𝒙𝒊 𝒇𝒊 𝒇𝒂
6 4 4
7 6 10 Si p = 13 𝒙𝟏𝟑 = 9
8 2 12 Si p = 3 𝒙𝟑 = 6
9 3 15
10 5 20
∑ 20
127
Cuando n es impar la Mediana se obtiene de la siguiente manera.
𝑥̂ = 𝑥𝑝
Por ejemplo:
𝒙𝒊 𝒇𝒊 𝒇𝒂
6 4 4 25
𝑝= + 0.5 = 13
7 6 10 2
8 2 12 𝑥̂ = 𝑥13 = 9
9 3 15 La mediana es 9
10 5 20
Cuando n es par La mediana se obtiene de la siguiente manera .
∑ 𝒙𝒊 25
𝑥𝑝 + 𝑥𝑝2
𝑥̂ = 1
2
Por ejemplo:
𝒙𝒊 𝒇𝒊 𝒇𝒂 𝟐𝟎 𝟐𝟎
𝒑𝟏 = = 𝟏𝟎 𝒑𝟐 = + 𝟏 = 𝟏𝟏
6 4 4 𝟐 𝟐
7 6 10 𝒙𝟏𝟎 + 𝒙𝟏𝟏
̂=
𝒙
8 2 12 𝟐
𝟕 + 𝟖 𝟏𝟓
9 3 15 ̂=
𝒙 = = 𝟕. 𝟓
𝟐 𝟐
10 5 20
20 La mediana es 7.5
∑ 𝒙𝒊
Para el problema que estamos desarrollando usaríamos:
𝒏 𝟑𝟓
𝒑= + 𝟎. 𝟓 → 𝒑 = + 𝟎. 𝟓 → 𝒑 = 𝟏𝟕. 𝟓 + 𝟎. 𝟓
𝟐 𝟐
𝐩 = 𝟏𝟖
La mediana se calcula con la posición:
𝐱̂ = 𝐱𝐩
𝐱̂ = 𝐱𝟏𝟖
𝐱̂ = 𝟒𝟓
128
Moda:
La moda está dada por el dato que más se repite, al encontrarse los datos en una tabla de
frecuencias para datos no agrupados, es fácil identificar la moda como el valor de la clase con mayor
frecuencia absoluta.
𝒙𝒊 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
35 6 6 0.17 0.17 17%
40 9 15 0.26 0.43 26%
45 7 22 0.20 0.63 22%
50 8 30 0.23 0.86 23%
60 5 35 0.14 1.00 14%
∑ 𝒙𝒊 35 1 100%
Primero buscamos en la columna de las frecuencias absolutas 𝒇𝒊 y ubicamos el valor más alto, en
este ejemplo sería el 9, posteriormente seleccionamos el valor de la clase 𝒙𝒊 y ese es el valor de la
moda.
𝑥̃ = 40
Sesgo:
El sesgo es una unidad que representa la asimetría del polígono de frecuencias de una distribución,
esto es la gráfica de una tabla de frecuencias para datos no agrupados, para calcularlo hay varias
maneras, la que usaremos seria la dada por la siguiente formula.
𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑜𝑑𝑎
𝑆𝑒𝑠𝑔𝑜 =
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
𝑥̅ − 𝑥̃
𝑆𝑒𝑠𝑔𝑜 =
𝑠
Existen 3 interpretaciones para el sesgo dependiendo de su signo y valor.
• Si el sesgo es positivo, se tiene una asimetría hacia la derecha.
• Si el sesgo es negativo, se tiene una asimetría hacia la izquierda.
• Si el sesgo es 0, entonces no hay asimetría.
129
Ilustración tomada de: http://1.bp.blogspot.com/_mA-
bypZU_yA/ScfGYolZY3I/AAAAAAAAAA4/g4__2B4EJ4c/s1600/image028.gif
Para el ejemplo que estamos desarrollando, nos hace falta obtener la desviación estándar la cual
aprenderemos más adelante en la lectura, para calcular el sesgo usaremos solo su valor el cual es
7.83. Ahora sustituimos los datos en la fórmula:
45.28 − 40
𝑆𝑒𝑠𝑔𝑜 =
7.83
5.28
𝑆𝑒𝑠𝑔𝑜 =
7.83
𝑆𝑒𝑠𝑔𝑜 = 0.67
Por lo cual podemos deducir que la distribución tiene una asimetría a la derecha.
Rango
El rango de un conjunto de números es la diferencia entre el número mayor y el número menor del
conjunto.
𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
Para obtener los datos menor y mayor nos referimos a la tabla de distribución de frecuencias para
datos no agrupados de nuestro ejemplo contextualizado.
130
𝒙𝒊 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
35 6 6 0.17 0.17 17%
40 9 15 0.26 0.43 26%
45 7 22 0.20 0.63 22%
50 8 30 0.23 0.86 23%
60 5 35 0.14 1.00 14%
∑ 𝒙𝒊 35 1 100%
El dato menor es la clase que posea el menor valor y el dato mayor es el valor de la clase con mayor
valor. Para nuestro ejemplo la sustitución en la formula seria:
𝑅𝑎𝑛𝑔𝑜 = 60 − 35
𝑹𝒂𝒏𝒈𝒐 = 𝟐𝟓
Desviación media
La desviación media es el promedio de las desviaciones (separaciones) de cada elemento de la
distribución con respecto a la media aritmética de la distribución. Su fórmula para tablas de
frecuencias de datos no agrupados seria:
∑𝒏𝟏(| 𝒙𝒊 − 𝒙
̅|) 𝒇𝒊
𝑫𝒎 =
𝒏
Para calcularla nos enfocaremos en las columnas xi y fi, y agregaremos dos columnas auxiliares,
|𝑥𝑖 - 𝑥̅ | La cual se obtiene al aplicar el valor absoluto al resultado de la resta de cada clase
menos el valor de la media.
𝑓𝑖 |𝑥𝑖 - 𝑥̅ | La cual se obtiene al multiplicar la frecuencia absoluta fi por la columna |𝑥𝑖 - 𝑥̅ |
131
En nuestro ejemplo contextualizado la tabla quedaría:
𝒙𝒊 𝒇𝒊 ̅|
|𝒙𝒊 - 𝒙 ̅|
𝒇𝒊 |𝒙𝒊 - 𝒙 𝑓𝑎 𝑓𝑟 𝑓𝑟𝑎 𝑓𝑟%
35 6 10.28 61.68 6 0.17 0.17 17%
40 9 5.28 47.52 15 0.26 0.43 26%
45 7 0.28 1.96 22 0.20 0.63 22%
50 8 4.72 37.76 30 0.23 0.86 23%
60 5 14.72 73.6 35 0.14 1.00 14%
∑ 35 222.52 1 100%
Ahora realizamos la suma de todos los elementos de la columna 𝑓𝑖 |𝑥𝑖 - 𝑥̅ | y sustituimos los datos en
la fórmula:
𝟐𝟐𝟐. 𝟓𝟐
𝑫𝒎 =
𝟑𝟓
𝑫𝒎 = 𝟔. 𝟑𝟓
Varianza
La varianza determina que tanto se alejan los datos de la media, considerando el signo de sus
desviaciones, para calcularla en tablas de frecuencias para datos no agrupados se emplea la
siguiente formula:
∑𝑛1 𝒇𝒊 ( 𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛
Para poder emplear la formula usaremos las columnas xi y fi, además de tres columnas auxiliares:
𝑥𝑖 - 𝑥̅ Es el resultado de restar al valor de la clase xi el valor de la media 𝑥̅ .
(𝒙𝒊 - 𝑥̅ )𝟐 Es el resultado de elevar al cuadrado la columna 𝑥𝑖 - 𝑥̅
𝑓𝑖 (𝑥𝑖 - 𝑥̅ )2 Es el resultado de multiplicar la frecuencia absoluta fi, por la columna (𝒙𝒊 - 𝑥̅ )𝟐
132
𝒙𝒊 𝒇𝒊 ̅
𝒙𝒊 - 𝒙 ̅)𝟐
(𝒙𝒊 - 𝒙 ̅)𝟐
𝒇𝒊 (𝒙𝒊 - 𝒙 𝑓𝑎 𝑓𝑟 𝑓𝑟𝑎 𝑓𝑟%
35 6 -10.28 105.6784 634.0704 6 0.17 0.17 17%
40 9 -5.28 27.8784 250.9056 15 0.26 0.43 26%
45 7 -0.28 0.0784 0.5488 22 0.20 0.63 22%
50 8 4.72 22.2784 178.2272 30 0.23 0.86 23%
60 5 14.72 216.6784 1083.392 35 0.14 1.00 14%
∑ 35 2147.14 1 100%
Después realizamos la suma de todos los elementos de la columna 𝑓𝑖 (𝑥𝑖 - 𝑥̅ )2, con esos datos
sustituyo los valores en la fórmula:
2147.14
𝑠2 =
35
𝑠 2 = 61.34
Desviación estándar
La desviación estándar se obtiene de la varianza, su fórmula es:
∑𝑛
1 𝒇𝒊 ( 𝑥𝑖 − 𝑥̅ )
2
𝑠=√ 𝑛
o 𝑠 = √𝑠 2
Al conocer la varianza solo la sustituimos en la segunda fórmula:
𝑠 = √61.34
𝑠 = 7.83
133
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA
DATOS AGRUPADOS
Datos agrupados.
Cuando los datos se presentan en una tabla de distribución de e frecuencias para datos agrupados,
es preciso modificar el procedimiento para el cálculo de las medidas de tendencia central y de
dispersión.
Para guiarnos en este desarrollo, realizaremos un ejemplo guiado, planteando el siguiente caso:
En el plantel 06 del COBATAB la academia de orientación educativa realizo un estudio sobre los
hábitos académicos de los estudiantes, el estudio se enfocó en las horas que estos dedican al estudio
en una semana normal, los resultados se presentan en la siguiente tabla de frecuencias para datos
agrupados.
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒇𝒂 𝒇𝒓 𝒇𝒓𝒂 𝒇𝒓%
0 4 2 24 24 0.24 0.24 24%
4 8 6 31 55 0.31 0.55 31%
8 12 10 13 68 0.13 0.68 13%
12 16 14 21 89 0.21 0.89 21%
16 20 18 11 100 0.11 1 11%
100
Para realizar los cálculos solo emplearemos las primeras cinco columnas.
Media
El cálculo de la media sigue el mismo procedimiento que realizamos para las tablas de frecuencias
para datos no agrupados, sin embargo, se cambia la clase (xi) por la marca de clase (mc) para realizar
los cálculos, por ese motivo la fórmula de la media para tablas de frecuencias para datos agrupados
quedaría de la siguiente manera:
∑𝑛𝑖=1 𝑓𝑖 𝑚𝑐
𝑥̅ =
𝑛
Para poder emplearla, debemos agregar una columna donde multipliquemos la marca de clase(mc)
de cada una de las filas por su correspondiente frecuencia absoluta (fi)
134
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒇𝒊 𝑴𝒄 𝒇𝒂
0 4 2 24 48 24
4 8 6 31 186 55
8 12 10 13 130 68
12 16 14 21 294 89
16 20 18 11 198 100
100 856
Al sumar todos los elementos de la columna tendríamos el valor correspondiente a la parte superior
de la fórmula, la parte inferior corresponde al tamaño de la muestra, el cual lo podemos obtener
sumando todas las frecuencias absolutas, de tal manera que podríamos sustituir ambos elementos
en la formula y obtendríamos:
856
𝑥̅ = → 𝑥̅ = 8.56
100
De esta manera se obtiene la media aritmética para una tabla de frecuencias con datos agrupados.
Mediana
La mediana se basa en las posiciones, por lo cual retomaremos lo aprendido en la lectura anterior
sobre las posiciones contenidas en las frecuencias absolutas.
Para calcular la mediana en una tabla de frecuencias es necesario determinar el intervalo mediano,
para ello debemos usar alguna de las siguientes formulas:
𝑛 𝑛
𝑝= 𝑠𝑖 𝑒𝑠 𝑝𝑎𝑟 𝑝= + 0.5 𝑠𝑖 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
2 2
Una vez que se obtiene la posición se ubica el valor de la frecuencia acumulada donde está
contenido, ese intervalo será el intervalo mediano.
En nuestro ejemplo, primero calculamos la posición p. al ser 𝑛 = 100 es un numero par por lo que
se usaría la siguiente formula:
100
𝑝= 𝑝 = 50
2
Ahora ubicamos el valor de la frecuencia absoluta donde este contenido y determinamos el intervalo
mediano.
135
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒇𝒂
0 4 2 24 24
4 8 6 31 55
8 12 10 13 68
12 16 14 21 89
16 20 18 11 100
100
Conociendo el intervalo mediano obtendremos varios datos a partir de él y podemos emplear la
siguiente fórmula para encontrar la mediana.
𝑛
2 − 𝑓𝑎 𝑎𝑛𝑡
𝑥̂ = 𝐿𝑖𝑚𝑒𝑑 + ( ) 𝐴𝑐
𝑓𝑖 𝑚𝑒𝑑
Donde:
• 𝐿𝑖𝑚𝑒𝑑 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜
• 𝑛 = numero de elementos de la muestra
• 𝑓𝑎 𝑎𝑛𝑡 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜
• 𝑓𝑖 𝑚𝑒𝑑 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑒𝑑𝑖𝑎𝑛𝑜
• Ac = amplitud de clase ( Ls – Li)
Si sustituimos los datos en la formula obtenemos;
100
− 24
𝑥̂ = 4 + ( 2 )4
55
50 − 24
𝑥̂ = 4 + ( )4
55
26
𝑥̂ = 4 + ( )4
55
𝑥̂ = 4 + (0,47 )4
𝑥̂ = 4 + 1.88
𝑥̂ = 5.88
De esta manera se calcula la mediana para tablas de frecuencias para datos agrupados.
136
Moda
La moda está dada por el dato que más se repite, al encontrarse los datos en una tabla de
frecuencias para datos agrupados, es necesario determinar el intervalo modal primero, esto es muy
fácil ya que es aquel o aquellos que posean el valor más alto de frecuencia absoluta (fi).
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒇𝒂
0 4 2 24 24
4 8 6 31 55
8 12 10 13 68
12 16 14 21 89
16 20 18 11 100
100
Una vez identificamos el intervalo moda, tenemos que considerar las frecuencias absolutas anterior
y posterior al intervalo modal. Y encontrar la diferencia respecto a la frecuencia absoluta del
intervalo modal para después emplear la fórmula de la moda que se presenta:
𝑑𝑎
𝑥̃ = 𝐿𝑖𝑚𝑜𝑑 + (𝑑 ) 𝐴𝑐
𝑎 +𝑑𝑝
Donde:
• 𝐿𝑖𝑚𝑜𝑑 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙
• 𝑑𝑎 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 = 𝑓𝑚𝑜𝑑 − 𝑓𝑚𝑜𝑑 −1
• 𝑑𝑝 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 = 𝑓𝑚𝑜𝑑 − 𝑓𝑚𝑜𝑑+1
• Ac = amplitud de clase (Ls – Li)
Primero calculamos las diferencias:
𝑑𝑎 = 31 − 24 = 7
𝑑𝑝 = 31 − 13 = 18
Sustituimos los datos en la fórmula:
7
𝑥̃ = 4 + ( )4
7 + 18
7
𝑥̃ = 4 + (25 ) 4
𝑥̃ = 4 + (0.28 )4
𝑥̃ = 4 + 1.12
𝑥̃ = 5.12
137
Sesgo:
La definición para el sesgo es la misma para datos agrupados o no agrupados, por lo que esta vez se
omitirá y sólo se retoma su fórmula:
𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑜𝑑𝑎
𝑆𝑒𝑠𝑔𝑜 =
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
𝑥̅ − 𝑥̃
𝑆𝑒𝑠𝑔𝑜 =
𝑠
Recuerda:
• Si el sesgo es positivo, se tiene una asimetría hacia la derecha.
• Si el sesgo es negativo, se tiene una asimetría hacia la izquierda.
• Si el sesgo es 0, entonces no hay asimetría.
Ilustración tomada de: http://1.bp.blogspot.com/_mA-
bypZU_yA/ScfGYolZY3I/AAAAAAAAAA4/g4__2B4EJ4c/s1600/image028.gif
Para el ejemplo que estamos desarrollando, nos hace falta obtener la desviación estándar la cual
aprenderemos a calcular más adelante en la lectura, para calcular el sesgo usaremos solo su valor
el cual es 5.35. Ahora sustituimos los datos en la fórmula:
8.56 − 5.12
𝑆𝑒𝑠𝑔𝑜 =
5.35
3.44
𝑆𝑒𝑠𝑔𝑜 =
5.35
𝑆𝑒𝑠𝑔𝑜 = 0.64
Por lo cual podemos deducir que la distribución tiene una asimetría a la derecha.
138
Rango
El rango de un conjunto de números es la diferencia entre el número mayor y el número menor del
conjunto.
𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟
Para obtener los datos menor y mayor nos referimos a la tabla de distribución de frecuencias para
datos agrupados; el dato mayor será el valor del límite superior (Ls) del último intervalo, mientras
que el dato menor será el límite inferior (Li) del primer intervalo.
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒇𝒂
0 4 2 24 24
4 8 6 31 55
8 12 10 13 68
12 16 14 21 89
16 20 18 11 100
100
Para nuestro ejemplo la sustitución en la formula seria:
𝑅𝑎𝑛𝑔𝑜 = 20 − 0
𝑹𝒂𝒏𝒈𝒐 = 𝟐𝟎
Desviación media
La desviación media es el promedio de las desviaciones (separaciones) de cada elemento de la
distribución con respecto a la media aritmética de la distribución. Su fórmula para tablas de
frecuencias de datos agrupados seria:
∑𝒏𝟏(| 𝒎𝒄 − 𝒙
̅|) 𝒇𝒊
𝑫𝒎 =
𝒏
Para calcularla agregaremos dos columnas auxiliares a nuestra tabla de frecuencias:
|𝑚𝑐 − 𝑥̅ | La cual se obtiene al aplicar el valor absoluto al resultado de la resta de cada marca
de clase menos el valor de la media para cada uno de los intervalos.
𝑓𝑖 |𝑚𝑐 - 𝑥̅ | La cual se obtiene al multiplicar la frecuencia absoluta fi por la columna |𝑚𝑐 − 𝑥̅ |
139
En nuestro ejemplo contextualizado la tabla quedaría:
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 |𝒎𝒄 − 𝒙̅| ̅|
𝒇𝒊 |𝒎𝒄 - 𝒙 𝒇𝒂
0 4 2 24 6.56 157.44 24
4 8 6 31 2.56 79.36 55
8 12 10 13 1.44 18.72 68
12 16 14 21 5.44 114.24 89
16 20 18 11 9.44 103.84 100
100 473.6
Ahora realizamos la suma de todos los elementos de la columna 𝑓𝑖 |𝑚𝑐 - 𝑥̅ | y sustituimos los datos
en la fórmula:
𝟒𝟕𝟑. 𝟔
𝑫𝒎 =
𝟏𝟎𝟎
𝑫𝒎 = 𝟒. 𝟕𝟑
Varianza
La varianza determina que tanto se alejan los datos de la media, considerando el signo de sus
desviaciones, para calcularla en tablas de frecuencias para datos no agrupados se emplea la
siguiente formula:
2
∑𝑛1 𝒇𝒊 ( 𝑚𝑐 − 𝑥̅ )2
𝑠 =
𝑛
Para poder emplear la formula usaremos las columnas xi y fi, además de tres columnas auxiliares:
mc - 𝑥̅ Es el resultado de restar al valor de la clase xi el valor de la media 𝑥̅ .
(mc - 𝑥̅ )𝟐 Es el resultado de elevar al cuadrado la columna 𝑥𝑖 - 𝑥̅
𝑓𝑖 (mc - 𝑥̅ )2 Es el resultado de multiplicar la frecuencia absoluta fi, por la columna (𝒙𝒊 - 𝑥̅ )𝟐
𝑳𝒊 𝑳𝒔 Mc 𝒇𝒊 𝒎𝒄 − 𝒙 ̅ (𝑴𝒄 − 𝒙̅)𝟐 𝒇𝒊 (𝑴𝒄 − 𝒙̅)𝟐 𝒇𝒂
0 4 2 24 -6.56 43.0336 1032.8064 24
4 8 6 31 -2.56 6.5536 203.1616 55
8 12 10 13 1.44 2.0736 26.9568 68
12 16 14 21 5.44 29.5936 621.4656 89
16 20 18 11 9.44 89.1136 980.2496 100
100 2864.64
140
Después realizamos la suma de todos los elementos de la columna 𝑓𝑖 (𝑚𝑐 - 𝑥̅ )2 , con esos datos
sustituyo los valores en la fórmula:
2864.64 𝑠 2 = 28.64
𝑠2 =
100
Desviación estándar
• La desviación estándar se obtiene de la varianza, su fórmula es:
∑𝑛
1 𝒇𝒊 ( 𝑚𝑐 − 𝑥̅ )
2
𝑠=√ o 𝑠 = √𝑠 2
𝑛
• Al conocer la varianza solo la sustituimos en la segunda fórmula:
𝑠 = √28.64
𝑠 = 5.35
141