“Medidas de Dispersión”
Aprendizajes Esperados
• Calcula medidas de dispersión, utilizando
funciones de Excel.
• Interpreta medidas de dispersión.
• Calcula medidas de dispersión con
herramientas de análisis de datos en Excel.
Medidas de dispersión
Las medidas de dispersión cuantifican la variabilidad (el grado de
separación) que presenta un conjunto de datos. Ya que dos conjuntos de
datos pueden tener las mismas medidas de tendencia central pero diferir
en términos de variación. Entre las medidas de dispersión, tenemos:
- Rango.
- Varianza.
- Desviación estándar o típica.
- Coeficiente de variación.
Medidas de dispersión
Rango
La dispersión puede medirse en términos de la diferencia entre los dos valores
extremos del conjunto de datos. De esta forma, el rango (amplitud) se define
como la diferencia entre el máximo y el mínimo valor de la distribución.
Rango = x máx – xmín
Observación: Esta medida de dispersión tiene como inconveniente ser poco
representativa, cuando existen valores extremos atípicos . Por esta razón puede ser
más conveniente usar el rango intercuartil, que se define como la diferencia entre el
tercer y el primer cuartil.
Rango Intercuartil = Q 3 – Q1 = P75 – P25
(cuartil 3 menos cuartil 1, o bien percentil 75 menos percentil 25)
El rango intercuartil corresponde a la amplitud o longitud del intervalo donde se
concentra el 50% central de los datos. Indica que tan concentrado o dispersos están los
datos centrales, de este modo, podemos utilizarlo como una medida de dispersión.
Medidas de dispersión
Varianza
La varianza se define como el promedio de las desviaciones (distancias) cuadráticas
de las observaciones respecto del promedio. Mide el grado de dispersión de los
valores de la variable respecto a la media aritmética.
Observación: Esta medida de dispersión tiene como inconveniente que las unidades
de la variable están al cuadrado.
Nota: Las siguientes fórmulas se utilizan para calcular la varianza, pero nosotros
utilizaremos la planilla de cálculo Excel para obtener este valor.
x x
2
X 2 X
2
Varianza poblacional:
i
2
n
x x
2
i
Varianza muestral: S2
n 1
Medidas de dispersión
Desviación estándar
La desviación estándar se define como la raíz cuadrada de la varianza. Como la
varianza tiene las unidades de medidas elevadas al cuadrado, estas unidades no son
intuitivamente claras y fáciles de interpretar. Por lo que la desviación estándar es un
estadígrafo de dispersión que no presenta problema con las unidades de medidas,
es decir, las unidades quedan igual que los datos de origen.
Nota: Las siguientes fórmulas se utilizan para calcular la desviación estándar, pero
nosotros utilizaremos la planilla de cálculo Excel para obtener este valor.
x x
2
X 2 X
2
Desviación estándar poblacional: 2 i
n
x 2
i x
Desviación estándar muestral: S S2
n 1
Medidas de dispersión
Propiedad importante de la desviación estándar
El uso de la desviación estándar nos permite determinar, con un buen grado de
precisión, la ubicación de los valores de una distribución de frecuencias en relación
a la media. Por lo cual si la distribución de los datos se acerca al modelo normal,
aproximadamente el 68% de los datos están dentro de ±1 desviación estándar a
partir de la media de la distribución. Aproximadamente el 96% de los valores caen
dentro de ±2 desviaciones estándar a partir de la media y aproximadamente el
100% caen dentro de ±3 desviaciones estándar a partir de la media .
Observación: Todas las medidas de dispersión vistas
anteriormente tiene como inconveniente que no sirven para
comparar la variabilidad entre variables con unidades de medidas
distintas.
Por ejemplo si deseamos comparar la variabilidad del peso
medido en kilógramos y la estatura medida en centímetros de un
conjunto de personas.
Medidas de dispersión
Coeficiente de variación
El coeficiente de variación se define como la razón entre la desviación estándar y la
media aritmética, el cual se puede expresar en porcentaje al ser multiplicado por
100.
Observación: Esta medida de dispersión tiene como ventaja que no depende de las
unidades de medidas de la variable, lo cual permite comparar la variabilidad de datos
de variables con distintas unidades.
Nota: La planilla de cálculo Excel no tiene una fórmula directa para calcular el
coeficiente de variación, por lo que se debe aplicar la siguiente fórmula.
S → Desviación estándar
Coeficiente de variación: CV
X X → Media aritmética
Medidas de dispersión
Coeficiente de Variación
0
1
Datos menos dispersos Datos más dispersos
(más homogéneos) (más heterogéneos)
Homogéneo: Uniforme, semejante, similar, idéntico.
Heterogéneo: Diverso, variado, mezclado, distinto.
Observación: En la mayoría de las distribuciones de datos el coeficiente de variación
toma valores desde 0% al 100%.
Ejemplo 1: Medidas de dispersión con Excel
Los siguientes datos representan las edades en años de dos grupos diferentes de
personas, en las cuales se calculó el promedio. Determine el grupo de personas que
presenta un comportamiento más homogéneo en sus edades.
Grupo 1 Grupo 2
19 – 20 – 20 – 19 – 22 28 – 32 – 30 – 4 – 6
Media: 20 Media: 20
Ejemplo 1: Medidas de dispersión con Excel
Respuesta:
Edades Grupo 1 Edades grupo 2
35 35
30 30
25 25
20 20
Edad
Edad
15 15
10 10
5 5
0 0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Persona Persona
Como se puede observar en la gráfica de cada grupo de personas, las medidas
de tendencia central (en este caso la media) no reflejan la variabilidad o
dispersión del grupo de datos.
Es por esto que debemos utilizar otro indicador para medir la variabilidad de
los datos. Este indicador puede ser el coeficiente de variación.
Ejemplo 1: Medidas de dispersión con Excel
Respuesta:
El coeficiente de variación de la edad del primer y segundo grupo, son
respectivamente 6,1% y 68,9%, por lo que el primer grupo presenta un
comportamiento más homogéneo con respecto a la edad, ya que su
coeficiente de variación es menor.
Ejemplo 2: Medidas de dispersión con Excel
Se tienen los registros del sueldo en miles de pesos y los años de antigüedad de 30
operarios de una fábrica. Determine con respecto a qué variable los operarios
presentan menor variabilidad. Justifique su respuesta.
Sueldos en m$ Años de antigüedad
396 351 427 12 5 6
296 360 338 11 5 3
385 400 317 9 7 4
348 367 346 6 5 6
405 361 392 8 7 8
367 411 492 7 8 1
496 359 292 5 10 7
372 455 400 9 12 10
483 433 362 8 8 3
309 435 378 5 8 5
Cuadro resumen
Indicadores Estadísticos (Estadígrafos)
Posición Dispersión
Tendencia Central Tendencia No Central
• Rango
• Varianza
• Media aritmética • Percentiles • Desviación estándar
• Moda • Coeficiente de variación
• Mediana