OTRAS MEDIDAS DESCRIPTIVAS
Objetivos:
1. Calcular e interpretar la amplitud, la desviación
media, la varianza y la desviación estándar de
datos no agrupados.
2. Calcular e interpretar la amplitud de variación, la
varianza y la desviación estándar de datos
agrupados.
3. Explicar las características, usos, ventajas y
desventajas de cada medida.
1
(CONTINUACIÓN)
4. Entender el teorema de Chebyshev y la regla
normal o empírica, con relación a un conjunto de
observaciones.
5. Calcular e interpretar los cuartiles y la amplitud
cuartílica o intercuartílica.
6. Elaborar e interpretar los diagramas de caja.
7. Calcular y entender el coeficiente de asimetría y
el coeficiente de variación.
2
AMPLITUD DE VARIACIÓN
La amplitud de variación es la diferencia entre el
valor más grande y el valor más pequeño.
Sólo dos valores son utilizados en su cálculo.
Está influido por un valor extremo.
Es fácil calcularlo y entenderlo.
3
DESVIACIÓN MEDIA
La desviación media (MD) es el promedio aritmético de
los valores absolutos de las desviaciones con respecto a la
media aritmética.
Todos los valores son utilizados en el cálculo.
No está influido excesivamente por valores muy grandes o
valores muy pequeños.
Los valores absolutos son difíciles de manipular.
4
DESVIACIÓN MEDIA
La fórmula para la desviación media es:
X −X
MD =
n
5
EJEMPLO 1
Los pesos de una muestra de canastas
conteniendo libros para una librería (en libras)
son:
103, 97, 101, 106, 103
Encuentre la amplitud y la desviación media.
Amplitud = 106 – 97 = 9
6
EJEMPLO 1 (CONTINUACIÓN)
El primer paso es encontrar la media:
X 510
X= = = 102
n 5
La desviación media es:
X −X 103 − 102 + ... + 103 − 102
MD = =
n 5
1+ 5 +1+ 4 + 5
= = 2.4
5
7
VARIANZA DE LA POBLACIÓN
La varianza de la población es la media aritmética
de las desviaciones al cuadrado de la media
poblacional.
Todos los valores son utilizados en el cálculo.
No está influido por valores extremos.
Las unidades están desproporcionadas, son los
cuadrados de la unidad original.
8
VARIANZA
La fórmula para la varianza poblacional es:
( X − ) 2
=2
N
La fórmula para la varianza muestral es:
( X − X ) 2
s =
2
n −1
9
EJEMPLO 2
Las edades de la familia González son:
2, 18, 34, 42
¿Cuál es la varianza poblacional?
X 96
= = = 24
n 4
( X − ) 2 (2 − 24)2 + ... + (42 − 24)2
=
2
=
N 4
944
= = 236
4
10
LA DESVIACIÓN ESTÁNDAR POBLACIONAL
La desviación estándar poblacional ( la raíz cuadrada
) es
de la varianza poblacional.
Para el Ejemplo 2, la desviación estándar es 15.36, calculada
así:
= = 236 = 15.36
2
11
EJEMPLO 3
Los ingresos ganados por hora en una muestra de cinco
estudiantes son:
$7, $5, $11, $8, $6.
Encuentre la varianza.
X 37
X= = = 7.40
n 5
s =
2 (
X−X )2
=
(7 − 7.4 )2 + ... + (6 − 7.4 )2
n −1 5 −1
21.2
= = 5.30
5 −1
12
DESVIACIÓN ESTÁNDAR MUESTRAL
La desviación estándar muestral es la raíz cuadrada de la
varianza muestral.
En el Ejemplo 3, la desviación estándar muestral es 2.30
s = s 2 = 5.29 = 2.30
13
VARIANZA MUESTRAL PARA DATOS
AGRUPADOS
La fórmula para la varianza muestral para datos agrupados es:
(fX ) 2
fX −
2
s2 = n
n −1
donde f es la frecuencia de clase y X es la marca de clase.
14
INTERPRETACIÓN Y USOS DE LA
DESVIACIÓN ESTÁNDAR
Teorema de Chebyshev: Para un conjunto cualquiera
de observaciones, la proporción mínima de los
valores que se encuentran dentro de k desviaciones
estándar desde la media es por lo menos.
1
1− 2
k
donde k2 es una constante mayor que 1.
15
INTERPRETACIÓN Y USOS DE LA
DESVIACIÓN ESTÁNDAR
Regla empírica: En una distribución de frecuencias simétrica,
con forma de campana:
Aproximadamente 68% de las observaciones estarán entre
más una y menos una s desde la media;
Aproximadamente 95% de las observaciones se encontrarán
entre más dos y menos dos s desde la media;
Prácticamente todas las observaciones se hallarán entre más
tres y menos tres s a partir del valor medio.
16
µ-3s µ-2s µ-1s µ µ +1s µ+2s µ+3s
17
DISPERSIÓN RELATIVA
El coeficiente de variación es la razón (cociente)
de la desviación estándar y la media aritmética,
expresada como un porcentaje.
Los datos de la desviación estándar ofrecen un
indicador de la dispersión de cada una de las
variables, pero no se puede comparar entre países
por la escala diferente de cada uno. El coeficiente
de variación tiene la propiedad de medir la
dispersión sin referencia a la unidad de medida.
s
CV = (100%)
X 18
MEDIDAS DE FORMA: ASIMETRÍA Y CURTOSIS
COEFICIENTE DE ASIMETRÍA
La asimetría es la medida de la carencia de simetría
en una distribución.
El coeficiente de asimetría puede variar desde
-3 hasta 3.
Un valor cero indica una distribución simétrica.
Es calculado como sigue:
CA = 3(Media – Mediana)/s
19
SESGO Y CURTOSIS
El sesgo mide la simetría de una distribución de
frecuencias de los datos.
La curtosis mide el grado de espesor en
relación con las colas y el pico de la función de
distribución de los datos.
20
Distribución mesocúrtica: curtosis igual a 3
Distribución leptocúrtica: curtosis superior a 3
Distribución platocúrtica: curtosis inferior a 3
Las distribuciones simétricas tienen sesgo igual
a cero y si además son mesocúrticas entonces
tienen las características de una distribución
normal
21
MEDIDAS DE POSICIÓN
RANGO INTERCUARTÍLICO
El rango intercuartílico es la distancia entre el
tercer cuartil Q3 y el primer cuartil Q1.
Esta distancia incluirá la mitad de las
observaciones.
Rango intercuartílico = Q3 – Q1
22
EJEMPLO 5
Para un conjunto de observaciones el tercer
cuartil es 24 y el primer cuartil es 10.
¿Cuál es la desviación intercuartílica?
El rango intercuartílico es 24 – 10 = 14. 50% de
las observaciones ocurrirán entre 10 y 24.
23
DIAGRAMA DE CAJA Y BIGOTES
Una gráfica de caja y bigotes es una gráfica
basada en cuartiles, que ayudan a retratar un
conjunto de datos.
Cinco tipos de datos son necesarios para
construir una gráfica de caja y bigotes: el valor
mínimo, el primer cuartil, la mediana, el tercer
cuartil, y el valor máximo.
24
EJEMPLO 6
Basado en una muestra de 20 pedidos
entregados, Pizza Hot registró la siguiente
información. El tiempo mínimo de entrega fue
13 minutos, y el máximo, 30 minutos. El primer
cuartil fue 15 minutos, la mediana 18 minutos, y
el tercer cuartil 22 minutos. Elabore un
diagrama de caja y bigotes para los tiempos de
entrega.
25
EJEMPLO 6 (CONTINUACIÓN)
Q1 Q2 Q3
mín máx
12 14 16 18 20 22 24 26 28 30
26