INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
1.2 DATOS NO AGRUPADOS
1.2.1 Medidas de tendencia central y de posición.
A menudo es necesario representar un conjunto de datos en términos de un solo
número el cual, en su forma, es descriptivo de todo el conjunto. La elección definitiva
del número depende de la característica determinada que queremos describir. En un
estudio, por ejemplo podríamos estar interesados en los valores extremos (menor y
mayor) de los datos; en otro, en el valor que sólo es superado por el 10% de los
valores; y en otro más, en el total de los valores.
Estás medidas se emplean para indicar un valor que tiende a ser el más
representativo de un conjunto de números. Las tres medidas de mayor importancia
son: la MEDIA, la MEDIANA y la MODA.
Otra palabra que se emplea en lugar de medidas de tendencia central es la de
PROMEDIOS, es decir, son valores que tienden a situarse en el centro de un
conjunto.
Media
De las tres medidas está es la más importante. La media se determina al sumar los
valores de un conjunto y dividir el resultado de esta suma entre el número de valores
del mismo.
En notación se dice que la media de un conjunto de n números x1,x2,……,xn se
representa por x y se define como:
n
x + x + ... + xn ∑x i
x= 1 2 = i =1
n n
Esta medida de tendencia central posee varias propiedades.
1. La medida siempre se puede calcular para un conjunto de números.
2. La medida es única, es decir, existe una y sólo una medida para un conjunto
dado de números.
3. Si sumamos una constante a cada valor del conjunto, la medida aumentará
por la misma cantidad. Si en lugar de sumar, se multiplica o divide sucede lo
mismo, es decir, la medida resultara multiplicada o dividida por dicha
constante.
1
INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
4. Si cambia algún valor del conjunto de números, entonces también la medida
cambia.
5. La suma de desviaciones de los números de un conjunto a partir de la medida
cero, esto es:
n
∑ ( x − x) = 0
i =1
i
El valor de la media se localiza cerca de la mitad de la base del histograma.
Mediana
La característica de mayor importancia es que divide un conjunto ordenado en dos
grupos iguales, es decir, la mediana de un conjunto de datos ordenados en orden de
magnitud, es el valor medio o la media de los valores medios.
Una regla para obtener la mediana es:
1. Clasificación u ordenamiento de los datos.
2. Contar para conocer si existe un número par o impar de datos.
3. Si se tiene un número impar de valores, la mediana es el valor intermedio.
Para un número par de valores, la mediana es la media de los valores
intermedios.
Resumiendo se tiene que la mediana de un conjunto de valores es mayor que la
mitad de los valores y menor que la otra mitad de los mismos.
n +1
Md = sólo para obtener la posición.
2
Moda
La moda es el valor que mayor número de veces se presenta en un conjunto de
números. Existen algunos casos en los cuales no existe la moda y otros en los
cuales existe más de una moda. Una distribución que cuenta con una moda se le
conoce como unimodal.
Ejemplo:
Quince empleados de una fábrica textil producen según sus capacidades y
experiencias los siguientes artículos
2
INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
No. de unidades por cada trabajador:
60 52 58 50 62 60 54 62 60 58
53 61 56 60 54
Sin agrupar los datos determinar.
a) La Media
b) La Mediana
c) La Moda
Demostración.
15
∑x 60 + 52 + ... + 60 + 54
a) x= i =1
= = 57.33
15 15
Media = 57.33
b) La mediana requiere ordenar los datos
50 52 53 54 54 56 58 58 60 60 60 60 61 62 62
Mediana = 58
c) El valor que se presenta mayor número de veces es el 60
Dato Numero
50 1
52 1
53 1
54 2
56 1
58 2
60 4
61 1
62 2
Total= 15
Moda = 60
3
INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
1.2.2 MEDIDAS DE DISPERSIÓN
Este tipo de medidas también reciben el nombre de Medidas de variación. Las
medias de dispersión o variación se emplean para saber si los valores están
relativamente cercanos uno del otro o si se encuentran dispersos. En otras palabras,
se quiere determinar una cantidad que describa la medida en la cual un conjunto de
datos se aleja de su media.
Todas las medidas de variación, exceptuando la de Amplitud o Rango de
variación, toman a la media como punto de referencia.
Rango o amplitud de variación
Se puede determinar de dos formas.
1. Es la diferencia entre el mayor valor y el menor de todos ellos.
2. Identificando los valores mayor y menor.
El rango es una medida limitada puesto que considera a los valores extremos de un
conjunto y no proporciona mayor información respecto a los demás valores del
mismo.
Las siguientes medidas utilizan la media como punto de referencia. Todas estas
incluyen la obtención de la desviación o diferencia entre cada valor y la media
( xi − x) .
Desviación media o promedio de desviación
Se emplea para medir el promedio de los alejamientos de los datos observados en la
muestra respecto a la media de estos datos. Para un conjunto de valores se obtiene
al restar la media de cada valor del grupo, eliminando el signo negativo (esto se logra
por medio del valor absoluto) divida entre el número total de observaciones. Para
lograr lo anterior emplearemos la fórmula:
∑x i −x
DM = MD = i =1
N
Donde:
N= Número total de datos
X= Dato observado
X= Media
4
INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
El valor absoluto significa que se deben considerar los alejamientos de los datos,
tanto a la izquierda como a la derecha de la media para incrementar la desviación
promedio.
Variancia
La variancia de una muestra se determina en forma similar que la desviación media
pero con las siguientes dos diferencias.
a) Las desviaciones se elevan al cuadrado antes de ser sumadas.
b) Se obtiene el promedio, utilizando N-1 en lugar de N. Esto nos permite obtener
un resultado mejor de la variancia.
La variancia se puede determinar por medio de:
∑ (x i − x) 2
S2 = i =1
N −1
Para facilitar los cálculos consideremos la siguiente regla.
1. Calcular la media.
2. Restar la media de cada valor del conjunto.
3. Elevar al cuadrado cada una de estas desviaciones.
4. Sumar los cuadrados de las desviaciones.
5. Dividir entre N-1 en el caso de datos muéstrales.
Desviación Estándar
La desviación estándar es la raíz cuadrada positiva de la varianza. Para obtener la
desviación estándar se debe calcular la varianza y hallar su raíz cuadrada positiva.
Entonces la desviación estándar queda representada por la letra mayúscula S.
La desviación estándar es una de las medidas más importantes dentro de la
estadística. Las unidades de esta medida son las mismas que las de la media.
∑(x i − x) 2
S= i =1
N −1
5
INSTITUTO TECNOLÓGICO TUXTLA GUTIÉRREZ - EDUCACIÓN A DISTANCIA
Ejemplo:
En un taller mecánico se tomaron 7 observaciones sobre una sección de 400 tornos,
para determinar el número de tornos funcionando en un instante dado. Los
resultados fueron 368, 353, 376, 361, 366, 351, 359. ¿Cuál es el Rango, desviación
media, Varianza y Desviación Estándar?
Demostración.
N x x x−x x−x (x−x) 2
1 368 362 6 6 36
2 353 362 -9 9 81
3 376 362 14 14 196
4 361 362 -1 1 1
5 366 362 4 4 16
6 351 362 -11 11 121
7 359 362 -3 3 9
Total 2534 0 48 460
2534
Media = x = = 362
7
Rango = 376 – 351 = 25
48
Desviación Media = D.M = = 6.86
7
460
Varianza = S 2 = = 30.66
15
Desviación Estándar = S = 30.66 = 5.5376
NOTA: N es el número de datos total de toda la población y n es el número de datos
de la muestra de una población. La utilización en las fórmulas depende de la
naturaleza de los datos.