UNIDAD III:
MEDIDAS DE DISPERSIÓN.
Medidas de dispersión: absolutas y relativas.
Propiedades de la varianza.
Otras medidas de dispersión: momentos.
Ing. Jhonny CRUZ
DOCENTE ISTJBA
¿Por qué estudiar la dispersión?
Una medida de ubicación, como la media o la mediana, sólo describe el centro de los datos.
Una medida de dispersión pequeña indica que los datos se acumulan con proximidad alrededor
de la media aritmética. Por consiguiente, la media se considera representativa de los datos. Por
el contrario, una medida grande de dispersión indica que la media no es confiable resulta
valiosa, pero no dice nada sobre la dispersión de los datos.
Una segunda razón para estudiar la dispersión en un conjunto de datos consiste en comparar la
propagación en dos o más distribuciones.
MEDIDAS DE DISPERSIÓN
Son medias que se emplean para determinar el grado de variabilidad o de
dispersión de los datos con respecto a un promedio.
Por lo general se les considera como promedio de las desviaciones respecto a
algún valor central o medidas de tendencia central (posición)
En otras palabras, es el grado en que los datos numéricos tienden a separarse
(esparcirse) alrededor de un valor promedio.
Consideraremos diversas medidas de dispersión. El rango se sustenta en los
valores máximo y mínimo del conjunto de datos, es decir, sólo se consideran dos
valores. La desviación media, la varianza y la desviación estándar se basan en
desviaciones de la media aritmética.
DOCENTE: Ing. Jhonny CRUZ
Desviación media
Un problema que presenta el rango estriba en que parte de dos valores, el más alto y el más
bajo, es decir, no los toma en cuenta a todos. La desviación media sí lo hace; mide la cantidad
media respecto de la cual los valores de una población o muestra varían. Expresado en forma de
definición:
DESVIACIÓN MEDIA Media aritmética de los valores absolutos de las desviaciones con
respecto a la media aritmética.
En el caso de una muestra, la desviación media,
designada DM, se calcula mediante la fórmula:
DESVIACIÓN MEDIA
En donde:
X es el valor de cada observación.
𝑋ത 𝑒𝑠 la media aritmética de los valores.
n es el número de observaciones en la muestra.
I indica el valor absoluto.
¿Por qué ignorar los signos de las desviaciones de la media? De no hacerlo, las
desviaciones positivas y negativas se compensarían con exactitud unas a otras
y la desviación media siempre sería cero. Dicha medida (cero) resultaría un
estadístico sin utilidad
La siguiente tabla muestra el número de capuchinos que se vendieron en el local de Starbucks
de los aeropuertos de Orange County y de Ontario, California, entre las 4 y las 5 de la tarde, de
una muestra de 5 días el mes pasado.
Determine la media, la mediana, el rango y la desviación media de cada local. Compare las
similitudes y diferencias.
TIPOS DE MEDIDAS DE DISPERSIÓN
Se consideran de dos tipos:
ABSOLUTAS: Generalmente se utiliza la media aritmética o promedio. Entre
ellas están: Rango, varianza y desviación típica o estándar
RELATIVAS: Se obtienen por cocientes o razones (divisiones) entre magnitudes
de la misma dimensión, lo que permite comparaciones entre distribuciones
heterogéneas.
Está:
Coeficiente de variación (Pearson)
DOCENTE: Ing. Jhonny CRUZ
M. Dispersión ABSOLUTAS
DOCENTE: Ing. Jhonny CRUZ
M. Dispersión ABSOLUTAS
Datos cuantitativos
DOCENTE: Ing. Jhonny CRUZ
Rango o recorrido
R= Xmax −Xmin
• Cuanto mayor sea el recorrido, mayor será el campo de variación de la variable, por lo que no
toma en cuenta las frecuencias
• Su uso es bastante limitado y sólo se utiliza en aquellas ocasiones, en donde nos interesa tener
una idea rápida de la variación en un grupo de datos.
• Es la más sencilla y proporciona menos información.
• Sólo se toma en cuenta dos valores de la variable en toda la distribución
- El rango se emplea mucho en aplicaciones de control de procesos estadísticos (CPE), debido a
que resulta fácil de calcular y entender.
DOCENTE: Ing. Jhonny CRUZ
Varianza
Es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética, es
decir, da un aproximado sobre la cuantificación del grado de variabilidad en una distribución
cualquiera
DOCENTE: Ing. Jhonny CRUZ
Desviación típica o estándar S
Es la raíz cuadrada de la varianza, o dicho de otro modo, es la raíz cuadrada de las desviaciones
respecto a la media.
Es la medida de dispersión más conocida y utilizada.
DOCENTE: Ing. Jhonny CRUZ
Otras fórmulas para calcular la Varianza
DOCENTE: Ing. Jhonny CRUZ
Medidas de Dispersión REALTIVAS
Coeficiente de Variación (CV)
Se obtiene dividiendo la desviación típica por su media aritmética, expresándose el
resultado en términos porcentuales
DOCENTE: Ing. Jhonny CRUZ
Coeficiente de Variación (CV)
Este coeficiente de variación se emplea:
-1. Cuando se desea comparar dos o más distribuciones, con el fin de determinar
cuál de ellas tiene mayor o menor variabilidad
-2. Cuando las distribuciones están dadas en unidades de medidas diferentes
Coeficiente de Variación (CV)
Cuanto menor sea el CV, menor será la dispersión relativa y, por lo tanto, mayor
será la representatividad de la media aritmética
CV < 30%, los datos serán homogéneos
DOCENTE: Ing. Jhonny CRUZ
Ejemplos
DATOS NO AGRUPADOS
Los datos corresponden a la edad de un grupo de empleados de la dirección de Movilidad tránsito y
tránsito del GAD Municipal de Riobamba, dependencia Administración.
Realizar:
1. Calcular la media aritmética
2. Calcular la mediana
3. Calcular la moda
4. Calcular la desviación típica o estándar
5. Calcular el coeficiente de variación
6. Representar un diagrama de barras verticales en Excel
Datos:
N=20
R = Xmax-Xmin
R =31-27
R =4
DATOS AGRUPADOS
Los datos corresponden al peso en kilogramos de un grupo de funcionarios de la fiscalía de la ciudad de
Quito, los mismos que se encuentran en una edad promedio de 48 años. .
55 82 62 60 58 70 55 64 65 59 60 78 65 80 60 60
58 70 70 75 72 57 65 75 72 78 60 65 70 75 70 70
70 70 55 78 80 75 65 58 80 78 78 58 70 75 75 58
Realizar:
1. Tabulación de datos en una distribución de frecuencias con datos agrupados de variable continúa.
2. Calcular la media aritmética
3. Calcular la mediana
4. Calcular la moda
5. Calcular la desviación típica o estándar
6. Calcular el coeficiente de variación
7. Representar un diagrama circular en Excel
Li Ls [ Li - Ls ) fi Xm Xm*fi Fi fr Fr (𝑋
Xm- ത 2 (𝑋 − 𝑋)
ത (𝑋𝑚 − 𝑋)
− 𝑋) ത 2 *fi
𝑚 media 𝑚
55,00 58,86 [55,00-58,86] 9 56,93 512,36 9 0,1875 0,1875 -10,69 114,22 1028,00
58,86 62,71 [58,86-62,71] 7 60,79 425,5 16 0,1458 0,3333 -6,83 46,65 326,58
62,71 66,57 [62,71-66,57] 6 64,64 387,86 22 0,125 0,458 -2,97 8,84 53,04
66,57 70,43 [66,57-70,43] 9 68,50 616,5 31 0,1875 0,64583 0,88 0,78 7,03
70,43 74,29 [70,43-74,29] 2 72,36 144,71 33 0,0417 0,6875 4,74 22,48 44,96
74,29 78,14 [74,43-78,14] 11 76,21 838,36 44 0,2292 0,91666 8,60 73,93 813,22
78,14 82,00 [78,14-82,00] 4 80,07 320,29 48 0,0833 1 12,46 155,14 620,54
48 3245,6 1 2893,37
SIGNIFICADO FORMULA SIMBOLO RESULTADO
Posición n/2 pos 24
Media aritmética 67.62
Mediana Me= 67.43
Moda Mo= 76.46
Varianza = 60.28
Desviación estándar = 7.76
Coeficiente Variación CV= 11.48%
Fi-1 31
fi 11
Límite Inferior Li 66.57
Límite superior Ls 7043
Diferencia entre la frecuencia
modal y la frecuencia absoluta d1 9
anterior
Diferencia entre la frecuencia
modal y la frecuencia absoluta d2 7
siguiente
Los datos son homogéneos por que el coeficiente de variación es menor a 30 %
Histograma y Polígono de Frecuencia
12
10
0
[55,00-58,86] [58,86-62,71] [62,71-66,57] [66,57-70,43] [70,43-74,29] [74,43-78,14] [78,14-82,00]
Diagrama Circular
Análisis y la
interpretación
de los datos
obtenidos.- 8%
19%
Dentro del grupo de funcionarios que laboran 23%
en la fiscalía en la ciudad de Quito, es claro que [55,00-58,86]
existe un incremento paulatino en el peso de las 15% [58,86-62,71]
personas de 48 años, por un lado tenemos el
12% de personas que se encuentran dentro del [62,71-66,57]
peso mínimo que se considera una persona 4% [66,57-70,43]
debe poseer, por otro lado tenemos el 12% [70,43-74,29]
porcentaje más elevado 17% de personas que 19%
tienen su peso de manera excedida, además [74,43-78,14]
podemos mencionar que la media en la que se [78,14-82,00]
manejan la mayoría de sus trabajadores oscila
entre el rango de 67.43 de peso, por
consiguiente dentro de los dos extremos y
considerando la edad de los trabajadores se
debe ampliar programas de prevención y
promoción en pro de conocer cuál sería el peso
acorde a las características físicas de cada
persona.
Docente: Jhonny Iván Cruz Moreta
Correo electrónico:: jhonnyivan05@[Link] / [Link]@[Link]
Celular: 0987580995