INSTITUTO IRAPUATO
PROBABILIDAD Y ESTADISTICA
4° RELACIONES INDUSTRIALES
Medidas de variabilidad.
Recorrido. El recorrido, amplitud o intervalo total (r), es la diferencia entre el valor
mayor y el valor menor de las observaciones, es decir, para calcular el recorrido se
toma el valor mayor y se le resta el valor menor.
Por ejemplo, si se tienen 10 observaciones: 6; 4; 2; 7; 8; 2; 5; 6; 10; 9, el valor
mayor es 10 y el valor menor es 2, por lo tanto, el recorrido es 8.
Recorrido: r = 10 - 2 = 8
Cuartiles. Son aquéllos que dividen el área del histograma en cuartos y se definen
como sigue:
El primer cuartil es mayor que el 25 % de los datos y menor que el 75 % de
éstos.
El segundo cuartil es la mediana de los datos.
El tercer cuartil es menor que el 25 % de los datos y mayor que el 75 % de
los mismos.
f
Md
1º M
2º 3º
El porcentil (p). Es aquel valor que es mayor que el p % de los datos y menor que
el (100 - p) % de los datos.
En resumen, el recorrido se expresa por un solo número, los cuartiles y los
porcentiles dan mayor información pero se necesitan varios números para dar una
descripción adecuada.
1
Desviación.
Es el valor de cada dato menos la media.
Desviación = x -
Para obtener una buena medida de la variación, como una posibilidad, se podría
considerar el promedio de las desviaciones, pero la sumatoria
( x ) 0 ; Es decir siempre suma cero.
N
i
i 1
Y esto se debe a que, en valor, la misma cantidad de desviaciones son positivas y
negativas, por lo que su suma es cero.
Para evitar la dificultad causada por los signos es preferible usar la suma de los
cuadrados de las desviaciones.
Varianza1 de la Población
( x )
N
2
2
i
i1
La desviación estándar de la población es:
(x )
N
2
1
2
i 1
(Para la desviación estándar de la población se utiliza la letra griega sigma minúscula “”)
N
La desviación estándar de la muestra es:
2
(x x ) i
2
s i 1
(Para la desviación estándar de la muestra se utiliza la letra “s” minúscula)
n 1
La varianza de la muestra.
1
Algunos autores llaman VARIANCIA al término que aquí se denomina Varianza.
2
n
( x x )2
S
2 i 1
n 1
La varianza y la desviación estándar es una forma de ver que tan dispersos están
los datos.
Fórmula abreviada para la suma de cuadrados de las desviaciones
N N ( xi ) 2
( xi ) 2 xi
2
i 1 i 1 N
Nota: Esta fórmula se utiliza durante todo el curso en diversos temas.
a b
En la distribución mostrada en la curva “a” la desviación estándar es pequeña; y
en la mostrada en la curva “b” la desviación estándar es mucho mayor que en “a”.
SIGNIFICADO PRÁCTICO DE LA DESVIACIÓN ESTÁNDAR
Teorema de Tchebysheff.
Dados un número k mayor o igual que 1 y un conjunto de observaciones y 1, y2,
y3,.....yn, al menos (1 - 1/k2) de las observaciones caen dentro de k desviaciones
estándar de la media.
f
1 - 1/k2
k k
3
Valores para el Teorema de Tchebysheff
k 1 - 1/k2 “al menos”
1 0
2 3/4 = 0,750
3 8/9 = 0,888
4 15/16 = 0,938
5 24/25 = 0,960
6 35/36 = 0,972
20 399/400 = 0,998
2000 (20002-1) / 20002 = 0,999
En la mayoría de los casos el número de observaciones que caen en el intervalo
excede lo indicado en la tabla, por eso el teorema dice "al menos".
Regla práctica
Para una distribución acampanada (conocida como distribución normal) se aplica
la siguiente regla empírica.
( 1) Contiene aproximadamente el 68% de las observaciones
( 2) Contiene aproximadamente el 95% de las observaciones
( 3) Contiene casi todas las observaciones
Cálculo aproximado de la desviación estándar.
Para tener una idea aproximada del valor de la desviación estándar puede
calcularse el recorrido “r” y dividirse entre 4, es decir:
r
Valor aproximado de la desviación estándar
4
En las siguientes páginas se muestra un ejemplo del cálculo de los principales
conceptos antes vistos:
Ejemplo: Estadística Descriptiva
Considerando los 30 datos del ejemplo anterior (véase página 2), obtener la
Media, Mediana, Moda, Varianza Muestral, Varianza Poblacional, Desviación
Estándar si fuera muestra y Desviación Estándar si fuera población.
Tabla de datos Tabla de datos (continuación)
Datos Datos
Edades Edades
Número de acomodados Número de acomodados
(Datos (Datos
datos en orden datos en orden
iniciales) iniciales)
ascendente ascendente
1 20 3 16 19 21
2 28 5 17 28 21
4
3 42 6 18 105 26
4 86 7 19 7 28
5 3 8 20 10 28
6 38 10 21 8 32
7 19 11 22 32 35
8 14 12 23 20 38
9 5 13 24 11 40
10 26 14 25 57 42
11 21 17 26 45 45
12 13 19 27 12 57
13 40 19 28 6 72
14 72 20 29 21 86
15 35 20 30 17 105
Suma de datos x 860
Media de la población = 860/30 = 28,667
Se tienen 30 datos, y acomodándolos
en orden ascendente los datos centrales son
Mediana:
20 y 21, por lo que la mediana será:
Mediana = (20+21)/2 = 20,5
Tabla de apoyo para cálculos Tabla de apoyo para
cálculos (continuación)
x x- (x-)2 x x- (x-)2
3 -25,667 658,794889 21 -7,667 58,782889
5 -23,667 560,126889 21 -7,667 58,782889
6 -22,667 513,792889 26 -2,667 7,112889
7 -21,667 469,458889 28 -0,667 0,444889
8 -20,667 427,124889 28 -0,667 0,444889
10 -18,667 348,456889 32 3,333 11,108889
11 -17,667 312,122889 35 6,333 40,106889
12 -16,667 277,788889 38 9,333 87,104889
13 -15,667 245,454889 40 11,333 128,436889
14 -14,667 215,120889 42 13,333 177,768889
17 -11,667 136,118889 45 16,333 266,766889
19 -9,667 93,450889 57 28,333 802,758889
19 -9,667 93,450889 72 43,333 1877,748889
20 -8,667 75,116889 86 57,333 3287,072889
20 -8,667 75,116889 105 76,333 5826,726889
Suma (x-)2= 17132,66667
Si fuera muestra:
Varianza Muestral s2 = (x- x ) /n-1
2
= 17132,66667/29 = 590,782
( x x )2
Desviación estándar s= = √590,782 = 24,306
n 1
5
Si fuera población:
Varianza Poblacional 2 = (x-)2/n = 17132,66667/30 = 571,089
( x )2
Desviación Estándar = = √571,089 = 23,897
n
Desviación Estándar
recorrido / 4 (105-3) / 4= 102 /4 25,5
aproximada
Uso de la Calculadora o Computadora:
Los mismos resultados se puedan obtener introduciendo los datos a una
calculadora o computadora, utilizando la función estadística.
Datos obtenidos con calculadora o computadora para el ejemplo anterior:
Suma de datos (x) = 860
Media ( ó x ) = 28,667
Mediana = 20,5
Moda = 19; 20; 21; 28 (multimodal)
Varianza Muestral (s2) = 590,782
Varianza como Población ( )2
= 571,089
Desviación Estándar Muestral (s) = 24,306
Desviación Estándar como Población () = 23,897
Si se desea verificar si cumple con la regla práctica o el teorema de Tchebysheff
se puede calcular y esto es:
= 28,667 ± 23,897 es decir: El intervalo es de 4,77 a 52,654 y este intervalo
abarca 25 de los 30 datos del ejemplo (del 5 al 45) es decir 25/30 = 0.833 o sea el
83,3%.
= 28,667 ± (2)23,897 = 28,667 ± 47,794; el intervalo es -19,197 a 76.461 y
abarca 28 de los 30 datos (desde el 3 hasta el 73), esto es 28/30 = 0,933 o sea
93,3% e los datos están cubiertos al considerar la media más menos dos
desviaciones estándar.
= 28,667 ± (3)23,897 = 28,667 ± 71.691, en este caso el intervalo es de -
43,024 a 100,358, y abarca 29 de los 30 datos, es decir, casi todos, o sea
29/30 = 0,967 o lo que es lo mismo 96,7%.
Como puede verse, no se cumple con la regla práctica, sobre todo el primer valor,
ya que la regla practica dice que para debe abarcar el 68% de los datos, los
otros dos valores 93.3% y 96.6% se aproximan a lo que establece la regla práctica
(la regla dice para el 95% y para casi el 100%), pero podemos
concluir que la distribución de valores no es totalmente simétrica y no está bajo
una curva totalmente acampanada, pero que es aproximada.
6
Respecto al Teorema de Tchebysheff, puede verse que en los tres casos se
cumple perfectamente, ya que los valores que establece (véanse estos valores en
la tabla de la página 10), el teorema dice “al menos” y si se obtienen valores
mayores entonces se cumple, por ejemplo, para ± 2, el teorema dice “al
menos” abarca 75% de los datos, y el resultado que se obtiene es de 93.3%, es
decir sí cumple.
Nota: Como complemento, se recomienda practicar el uso de la calculadora o
programa de computadora en Casa, y verificar los resultados anteriores.