Las medidas de dispersión son estadísticos que indican cuánto se alejan los datos de la
tendencia central. Las principales medidas de dispersión son:
Varianza
La varianza es una medida de dispersión que cuantifica qué tan alejados están los datos de su
media. Se calcula como el promedio de las desviaciones cuadráticas respecto a la media.Para
datos no agrupados, la fórmula de la varianza muestral es:s² = Σ(x - x̄ )² / (n-1)Donde:
s² = varianza muestral
x = cada valor individual
x̄ = media muestral
n = tamaño de la muestraEl proceso de cálculo es:
1. Calcular la media de los datos
2. Restar la media a cada valor
3. Elevar al cuadrado estas diferencias
4. Sumar todos los cuadrados
5. Dividir entre n-1
Para datos agrupados en intervalos, la fórmula es:s² = Σ f(x - x̄)² / (n-1)Donde:
f = frecuencia de cada intervalo
x = marca de clase de cada intervaloEl proceso es similar, pero usando las marcas de clase y
frecuencias de los intervalos.La varianza tiene algunas propiedades importantes:
Siempre es positiva o cero
Se expresa en unidades cuadradas
Es sensible a valores extremos
Juega un papel fundamental en la inferencia estadística
La raíz cuadrada de la varianza es la desviación estándar, que se expresa en las mismas
unidades que los datos originales.
Se calcula como la media de las desviaciones al cuadrado respecto a la media.
Fórmula para datos no agrupados:s² = Σ(x - x̄ )² / (n-1)Donde:
s² = varianza muestral
x = cada valor
x̄ = media muestral
n = tamaño de la muestra
Desviación típica o estándar
La desviación típica o estándar es una de las medidas de dispersión más importantes y
utilizadas en estadística. Algunas características clave de la desviación estándar son:
Se define como la raíz cuadrada positiva de la varianza. Esto significa que está
expresada en las mismas unidades que los datos originales, a diferencia de la varianza
que está en unidades al cuadrado.
Su fórmula para una muestra es:
s = √(Σ(x - x̄ )² / (n-1))Donde s es la desviación estándar muestral, x son los valores individuales,
x̄ es la media muestral y n es el tamaño de la muestra.
Proporciona una medida de la dispersión "promedio" de los datos alrededor de la
media.
Tiene propiedades matemáticas útiles que la hacen preferible a otras medidas de
dispersión en muchos análisis estadísticos.
Es menos sensible a valores extremos que el rango, pero más sensible que la
desviación media.
Aproximadamente el 68% de los valores en una distribución normal caen dentro de
una desviación estándar de la media.
Se utiliza ampliamente en inferencia estadística, por ejemplo para calcular intervalos
de confianza y en pruebas de hipótesis.
Permite comparar la dispersión de conjuntos de datos que tienen diferentes unidades
de medida, al expresarla como coeficiente de variación (CV = s / x̄).
Es una medida robusta de variabilidad que considera todos los valores del conjunto de
datos.
Tiene las mismas unidades que los datos originales.Fórmula:s = √s²Donde:
s = desviación estándar muestral
s² = varianza muestral
Amplitud o rango
El rango o amplitud es una medida de dispersión que proporciona información sobre la
extensión total de un conjunto de datos. Sus características principales son:
Definición: Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de
datos.
Fórmula:
Rango = Valor máximo - Valor mínimo
Propiedades:
Es fácil de calcular e interpretar
Utiliza sólo dos valores del conjunto de datos (el máximo y el mínimo)
Es muy sensible a valores extremos o atípicos
No proporciona información sobre la dispersión de los valores intermedios
Tipos:
1. Rango simple: Es la definición básica mencionada arriba
2. Rango intercuartílico: Es la diferencia entre el tercer y primer cuartil,
eliminando la influencia de valores extremos
Usos:
Proporciona una idea rápida de la dispersión total de los datos
Útil para comparar la variabilidad entre diferentes conjuntos de datos
Se utiliza en el control de calidad para evaluar la consistencia de procesos
Limitaciones:
No considera la distribución de los valores intermedios
Puede dar una imagen distorsionada si hay valores atípicos
No es adecuado para comparar conjuntos de datos de diferentes tamaños
El rango es una medida simple pero limitada de la variabilidad.
Generalmente se utiliza junto con otras medidas de dispersión más robustas como la
desviación estándar o el rango intercuartílico para obtener una imagen más completa de la
distribución de los datos.Fórmula:Rango = xmax - xminDonde:
xmax = valor máximo
xmin = valor mínimo
Coeficiente de variación
El coeficiente de variación (CV) es una medida de dispersión relativa que expresa la desviación
estándar como porcentaje de la media. Sus características principales son:
Fórmula: CV = (s / x̄ ) * 100
Donde:
s = desviación estándar
x̄ = media
Es una medida adimensional, lo que permite comparar la variabilidad de diferentes
conjuntos de datos, incluso si tienen diferentes unidades de medida o diferentes
magnitudes.
Se expresa como porcentaje, lo que facilita su interpretación.
Un CV bajo indica que los datos tienen poca variabilidad en relación con su media,
mientras que un CV alto indica mayor dispersión relativa.
Es especialmente útil para comparar la variabilidad entre conjuntos de datos con
medias muy diferentes.
No se ve afectado por cambios de escala en los datos, a diferencia de la desviación
estándar.
Tiene limitaciones cuando la media es cercana a cero o cuando hay valores negativos
en los datos.
Se utiliza comúnmente en campos como finanzas, biología y control de calidad para
evaluar la consistencia o variabilidad relativa de diferentes mediciones o procesos.
No tiene un rango fijo de valores "aceptables", ya que su interpretación depende del
contexto y área de estudio específicos.
El coeficiente de variación proporciona una medida estandarizada de dispersión que permite
comparaciones significativas entre diferentes conjuntos de datos, siendo especialmente
valioso cuando se necesita evaluar la variabilidad relativa.
Expresa la desviación estándar como porcentaje de la media. Permite comparar la variabilidad
de diferentes conjuntos de datos.Fórmula:CV = (s / x̄) * 100Donde:
CV = coeficiente de variación
s = desviación estándar
x̄ = mediaEstas medidas de dispersión proporcionan información complementaria sobre la
variabilidad de los datos, siendo la varianza y la desviación estándar las más utilizadas en
inferencia estadística.