Medidas de dispersión
Docente: Mg. Juan Iván Añazco Valdivia
Curso: Matemática
• Definición: Una medida de dispersión es un número que
mide el grado de separación de los datos con respecto a un
valor central, generalmente es la media aritmética.
• Las principales medidas de dispersión son:
• El rango
• El rango intercuartil
• El rango interdecil
• Desviación media absoluta
• Desviación mediana absoluta
• La varianza
• La desviación estándar
• El coeficiente de variación
Rango
Definición: El rango o recorrido, denotado por es el
número que resulta de la diferencia entre su valor máximo
y su valor mínimo de una serie de datos observados de la
variable X.
Definición: El rango intercuartil, denotado por es el
número que resulta de la diferencia entre su cuartil tercero
y su cuartil primero de los datos.
• Definición: El rango interdecil, denotado por es el
número que resulta de la diferencia entre el percentil 90
y percentil decimo.
Desviación Media Absoluta
Datos no agrupados
Sean los datos de una muestra de tamaño , de la
variable entonces
Datos agrupados de una variable discreta
Sean , los valores de una variable discreta X, con
sus respectivas frecuencias entonces
Datos agrupados por intervalos
Sean los marcas de clase de la distribución de frecuencias por
intervalos de una variable con respectivas entonces
Ventajas:
• La desviación media absoluta es una mejor medida de
dispersión que el rango, porque toma en cuenta todas
las observaciones en consideración.
• Indica que tan lejos, en promedio, se encuentra cada
observación de la media.
• Es menos sensible a mayores valores extremos de los
datos.
Desventajas:
• Es muy operativa.
Ejemplo: Suponga que se tiene las siguientes
observaciones:
a) 2,2,4,4
b) 1,1,4,6
c) 2,1,10,10
d) 2,1,10,10,10
Hallar la desviación media absoluta en cada
caso.
Desviación Mediana Absoluta
Datos no agrupados
Sean los datos de una muestra de tamaño , de la
variable entonces
Datos agrupados de una variable discreta
Sean , los valores de una variable discreta X, con
sus respectivas frecuencias entonces
Datos agrupados por intervalos
Sean los marcas de clase de la distribución de frecuencias para
con respectivas entonces
Ejemplos: Los pesos de 9 niños en kilogramos
respectivamente son: 10, 12, 12, 13, 15, 15, 13,
18, 20. Determinar la desviación media y
mediana absoluta de los pesos.
Medidas de dispersión
Varianza
Definición: Se define la varianza como la media
aritmética de los cuadrados de las diferencias de
los datos con respecto a su media aritmética.
Para datos no agrupados
Poblacional:
Muestral:
Donde son valores de la variable cuantitativa X, cuya media
muestral es .
Para datos agrupados de variable discreta
Poblacional:
Muestral:
Donde son valores de la variable X, con sus respectivas
frecuencias cuya media muestral es .
Para datos agrupados por intervalos
Poblacional:
Muestral:
son las marcas de clase de distribución de frecuencias de la
variable X, con sus respectivas frecuencias cuya media muestral
es .
Nota: Si la cantidad de datos de una muestra es mayor
de 60, se puede aplicar la varianza poblacional.
Forma reducida de la varianza muestral:
, datos no agrupados
, datos agrupados para una variable discreta
, datos agrupados por intervalos
Propiedades de la varianza
• Si todos los valores observados son iguales a (donde es una
constante) entonces .
• Si a cada valor de las observaciones se le suma (o resta) una
constante, la varianza del nuevo conjunto transformado será
la misma que la varianza de las observaciones iniciales, es
decir
• Si a cada valor de las observaciones se le multiplica por una
constante diferente de cero, la varianza del nuevo conjunto
transformado es la varianza del conjunto original multiplicado
por la constante elevado al cuadrado. Es decir
Desviación estándar: Se define como la raíz
cuadrada positiva de la varianza.
Desviación estándar poblacional:
Desviación estándar muestral:
• Esta medida es mas recomendable que la varianza,
pues muestra la dispersión de los datos en las mismas
unidades de la variable.
• Sus propiedades son similares a la varianza.
• La varianza y la desviación estándar son las medidas
mas usadas.
Coeficiente de variación:
Se define como el cociente entre la desviación estándar y la media.
Permite comparar dos o más conjuntos de datos.
Coeficiente de variación poblacional:
Coeficiente de variación muestral:
El coeficiente de variación se utiliza para comparar la
variabilidad de dos o mas series de datos que tengan
medias iguales o diferentes o que tengan unidades de
medida iguales o diferentes (una serie en metros y otra en
kilogramos).
A menor valor de CV decimos que la serie de datos tiene menos
variabilidad.
Si entonces, se llaman datos homogéneos.
Si entonces, se llaman datos con variabilidad
aceptable.
Si entonces, se llaman datos heterogéneos.
Desigualdad de Chebyshev
Cualquiera sea la forma de la distribución de
frecuencias (simétrica o asimétrica), el intervalo
contiene por lo menos el
en % de los datos.
El porcentaje de datos que se halla fuera del intervalo
es menor que el
.
Ejercicio
Los puntajes obtenidos en una prueba de
conocimientos tiene una media igual a 8. Si el
coeficiente de variación de los puntajes es igual a
0.25.
a. Determine el porcentaje de evaluados cuyos
puntajes estén comprendidos en el intervalo
[4, 12].
USO DE LA MEDIDAS DE DISPERSIÓN
Recordar que la varianza es expresada en
unidades cuadráticas de los datos. La desviación
estándar viene expresada en las mismas unidades
que los datos. El CV se expresa en números
abstractos (se suprimen sus unidades).
1. Si dos o más series de datos tienen medias iguales
o casi iguales es mas dispersa la serie que tenga
mayor medida de dispersión: Rango o RI o o o CV.
Si hay marcada asimetría es preferible comparar
con el RI.
2. Si dos o mas series de datos, no tiene medias
iguales (o casi iguales), o no tienen las mismas
unidades de medición, entonces, es mas dispersa
las serie de mayor CV.
NOTA:
Cuando se necesiten comparar valores
observados que pertenecen a diferentes
distribuciones de dos o mas muestras, que difieren
en su o difieren en el tipo de unidades de
medición, entonces se usa el valor estandar que
se define
Ejemplo: Los siguientes datos muestran los calificativos
de 20 personas sometidos a una prueba de aptitud. Los
estudiantes fueron divididos en dos grupos, al grupo 1 se
califico de 0 a 100 y al grupo 2 de 0 a 20.
a) Calcule la media y la desviación estándar en cada
grupo, ¿Cuál de los grupos es más homogéneo?
b) Se puede aceptar que el estudiante con 73 puntos del
grupo 1 tiene mayor aptitud que el estudiantes con 13
puntos del grupo 2
Ejercicio
Un estudiante de la carrera de ingeniería de Software revisó durante
11 días el ranking de una revista científica que publica artículos sobre
la industria de Software a través de internet. A continuación se
presenta el listado que elaboró de acuerdo al número de visitas por día
a la página web www.scopus2018.com.
Nº de visitas por 4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
día a la página
web scopus
Además, la cantidad de visitas a la página web www.sciencie2018.com
se presenta a continuación:
Nº de visitas por 3200 4300 4700 4400 4200 4200 4200 4100 4100 4300 4300
día a la página
web sciencie
Calcule el valor de la desviación estándar de ambas páginas web.