Medidas Descriptivas en Estadística
Medidas Descriptivas en Estadística
Contenido:
Medidas de tendencia central: Media aritmética simple y ponderada: concepto, propiedades,
ventajas e inconvenientes, cálculo; Mediana: concepto, propiedades y aplicaciones para va-
riable discreta y continua. Determinación gráfica y analítica. Cuartiles y percentiles. Moda o
modo: concepto y aplicaciones para variable discreta y continua. Cálculo gráfico y analítico.
Medidas de dispersión: Rango o recorrido: concepto, ventajas e inconvenientes. Recorrido
intercuartílico, cálculo e interpretación. Variancia y desviación estándar: concepto, aplica-
ciones para datos agrupados y no agrupados, cálculo. Coeficiente de variación: concepto,
cálculo y aplicaciones.
Medidas de asimetría y kurtosis: Interpretación gráfica de la asimetría y la kurtosis. Coefi-
ciente de asimetría: concepto, cálculo y aplicaciones. Coeficiente de kurtosis: concepto,
cálculo y aplicaciones.
1
Berenson, M.L.- Levine, D.M. Estadística para Administración y Economía. Conceptos y Aplicaciones.
22
Probabilidad y Estadística - Medidas descriptivas
MEDIDAS
DESCRIPTIVAS
Media aritmética
Media geométrica
De tendencia Media armónica
central Moda o modo
Mediana
De posición
Cuartiles
De tendencia Deciles
no central Percentiles
Recorrido o rango
Recorrido intercuartílico
Desviación media
De dispersión Desviación mediana
Varianza
Desviación estándar
Coeficiente de variación
Medidas de Coeficiente
asimetría de asimetría
De forma
Medidas de
apuntamiento Coeficiente
o curtosis de curtosis
Diagrama 4
23
Probabilidad y Estadística - Medidas descriptivas
xi
i n
La media muestral está dada por: , en la que n es el tamaño de la muestra.
x es un estadístico.
xi
La media poblacional está dada por: , en la que N es el tamaño de la población.
N
es un parámetro.
Ejemplo 1:
El largo de 8 hojas expresadas en mm de una cierta especie vegetal arroja los siguientes valores:
71; 65; 64; 64; 66; 65; 69; 70
Calcule el promedio aritmético de las longitudes.
Recordemos que siempre debemos definir la variable de estudio, clasificarla e indicar la es-
cala de medición.
X: Largo de hojas expresadas en mm.
La variable es cuantitativa continua y la escala de medición es de razón.
Los 10 datos constituyen una serie simple
Solución
Reemplazando por los datos del problema tenemos:
71 65 64 64 66 65 69 70
x 66.75mm
8
2
Berenson, M.L.- Levine, D.M. Estadística para Administración y Economía. Conceptos y Aplicaciones.
24
Probabilidad y Estadística - Medidas descriptivas
Propiedades de la media:
1.- n .x xi
Demostración:
(x1 - x ) + (x2 - x ) + ........ + (xn - x ) = x1 + x2 + ….. + x n – n x = xi – n x = 0
3.- La suma de las desviaciones al cuadrado de los datos con respecto a la media, es un mínimo.
xi - x ) 2 = mínimo
Por esta propiedad, la media generalmente se la utiliza para las medidas de dispersión.
Ventajas: Cálculo sencillo, fácil interpretación, intervienen todos los valores de la variable.
Inconvenientes: Es afectada por la existencia de valores extremos.
La mediana (Me)
“La mediana de un conjunto de observaciones es un valor de la variable que divide a este
conjunto (ordenado de menor a mayor) en dos subconjuntos que contienen la misma cantidad de
datos”.3
“La mediana de un conjunto de datos es el valor del elemento del centro (o la media de los
valores de los dos elementos del centro) cuando los datos están acomodados u ordenados, es decir,
dispuestos en orden de magnitud creciente o decreciente”.4
La mediana de un conjunto de n valores es el valor que no es superado ni supera a más de la
mitad de las n observaciones.
25
Probabilidad y Estadística - Medidas descriptivas
Como la serie tiene un número par de datos la mediana está dado por el promedio de los dos valores
65 66
centrales n4 y n5 . En nuestro problema Me = 65.5mm
2
Observación: Si el número de datos de la serie es impar, entonces la mediana está dada por el valor
central.
La mediana no es influida por los valores de las colas de una distribución. Es una medida muy
conveniente de localización central para distribuciones asimétricas.
Propiedad: La suma de las desviaciones absolutas de las observaciones con relación a la mediana es
menor que la suma de las desviaciones absolutas con relación a cualquier otro punto de la distribu-
ción.
xi – Me = mínimo
La moda (Mo)
La moda es aquel valor de la variable que ocurre con más frecuencia. Es el valor más “pro-
bable” de una serie.
En el gráfico 1 (pág. 7), se observa que: El área de mayor preferencia es la de Economía.
Distribución simétrica
x = Me = Mo
26
Probabilidad y Estadística - Medidas descriptivas
Gráfico 9: Distribuciones de frecuencias que muestran la posición teórica de la media, la mediana y la moda
Gráfico 10: Tres curvas con la misma media pero con variabilidad distinta
27
Probabilidad y Estadística - Medidas descriptivas
La medida de dispersión más sencilla es el rango que ya fue definido en la pág. 17.
El recorrido intercuartílico
Esta medida considera la extensión del 50% central de los datos y por lo tanto no sufre la in-
fluencia de los valores extremos. Se define como la diferencia entre el tercer cuartil y primer cuartil.
El recorrido intercuartílico RI = Q3 – Q1
El procedimiento para el cálculo de los cuartiles es similar al seguido para el cálculo de la mediana.
Otra medida de dispersión ampliamente conocida es la varianza, que también considera las
desviaciones con respecto a la media.
Problema 5
El registro de los pesos (expresados en Kg.) de 5 niños al nacer es el siguiente:
2.800 3.600 3.700 2.500 3.900
Calcule e interprete medidas de dispersión.
Solución:
La variable de estudio es X: Peso de 5 niños al nacer. Es una variable cuantitativa continua.
En este problema tenemos también una serie simple o datos no agrupados.
Cálculo de la varianza
m
2
(x i x)2
La varianza está dada por: S i 1
n
Dado que la variable queda elevada al cuadrado, entonces se emplea como medida de dispersión la
raíz cuadrada de la varianza, la que se conoce con el nombre de desviación estándar.
La desviación estándar está dada por: S (estadístico)
Verifique que la S2 es 0.375 Kg2 y la S es 0.612 Kg.
2
(x )2
La varianza en la población está dada por: i1 y la desviación estándar
N
Observación:
Puede encontrar estas medidas en forma directa utilizando una calculadora científica con comandos
que realicen cálculos estadísticos. Para ello debe cargar los datos y luego presionar las teclas de la
28
Probabilidad y Estadística - Medidas descriptivas
media, de la varianza de la desviación estándar según el cálculo que desea realizar ( lea el manual
de uso de la calculadora).
Gráfico 11: Localización de las observaciones alrededor de la media de una distribución de frecuencia normal
El intervalo: a) incluirá aproximadamente el 68% de las mediciones
b) incluirá aproximadamente el 95% de las mediciones
c) incluirá aproximadamente el 99% de las mediciones
29
Probabilidad y Estadística - Medidas descriptivas
Cantidad de Cantidad
insectos vivos de parcelas x i fi
xi fi
5 3 15
6 9 54
7 10 70
8 12 96
9 8 72
10 5 50
11 3 33
Totales 50 390
30
Probabilidad y Estadística - Medidas descriptivas
m
xf
x i 1 i i = 390 / 50 = 7,8 8 insectos vivos por parcela.
n
El resultado matemático obtenido , no es un posible valor de la variable, por lo que tomamos
el entero próximo: x = 8 insectos vivos por parcela.
Interpretación: En promedio se observan 8 insectos vivos por parcela.
Cálculo de la moda
-En la columna de frecuencias absolutas, la mayor frecuencia observada es 12 parcelas, y a 12 parce-
las le corresponde 8 insectos en la columna de los valores de la variable.
Entonces la Mo = 8 insectos vivos por parcela.
Interpretación: 8 insectos vivos es el número que se observa en la mayor cantidad de parcelas.
fi
Gráficamente: 12
Cantidad de parcelas
10
0
5 6 7 8 9 10 11 xi
Cantidad de insectos vivos
Mo
Cálculo de la Mediana
Tabla VIII: Cantidad de insectos vivos por parcela
Método gráfico
Fi
50
40
Cantidad de parcelas
30
n/2= 25 20
10
0
5 6 7 8 9 10 11 xi
Cantidad de insectos vivos
Me
-Como se trata de una variable discreta se construye el gráfico de escalones “menor que” de las fre-
cuencias absolutas acumuladas Fi (o de las relativas acumuladas ).
-A una altura n/2 = 25 (o 0.5 si el gráfico de escalones corresponde a frecuencias relativas acumula-
das), sobre el eje vertical de las frecuencias acumuladas se traza una paralela al eje de abscisas hasta
cortar el gráfico de escalones.
32
Probabilidad y Estadística - Medidas descriptivas
-Por el punto de intersección, se baja una vertical que corta al eje de las abscisas en un punto que
corresponde a 8 insectos. Este punto es la mediana.
Observación: Siempre que en un conjunto de datos, esté presente un valor extremo o atípico, es
conveniente utilizar la mediana como medida de tendencia central, en lugar de la media aritmética.
Las medidas que permiten responder las preguntas del punto d) son los cuartiles.
Para Q1
-Se calculan las frecuencias absolutas acumuladas “menor que”.
-Se calcula n / 4 = 50 / 4 = 12.5
-En la columna de frecuencias acumuladas se busca la primera que supera a 12.5. Esa frecuencia es
22 y a 22 le corresponde el valor de x3 = 7, por lo que 7 es el primer cuartil de este conjunto de da-
tos.
Q1 = 7 insectos vivos por parcela
Interpretación: El 25% de las parcelas posee 7 insectos vivos o menos y el 75% restante tiene 7 in-
sectos vivos o más.
Para Q2
El segundo cuartil coincide con la mediana, es decir Q2 = Me = 8 insectos vivos por parcela. La
33
Probabilidad y Estadística - Medidas descriptivas
Para Q3
-Se calculan las frecuencias absolutas acumuladas “menor que”.
-Se calcula 3n / 4 = 150 / 4 =37.5
-En la columna de frecuencias acumuladas se busca la primera que supera a 37.5. Esa frecuencia es
42 y a 42 le corresponde el valor de x5 = 9, por lo que 9 es el tercer cuartil de este conjunto de datos.
Q3 = 9 insectos vivos por parcela.
Interpretación: El 75% de las parcelas posee 9 insectos vivos o menos y el 25% restante tiene 9 in-
sectos vivos o más.
Determinación gráfica de los cuartiles
El método gráfico para la determinación de los cuartiles es similar al visto para la mediana.
Fi
50
40
3n/4=37.5
Cantidad de parcelas
30
n/2= 25
20
n/4 = 12,5
10
0
5 6 7 8 9 10 11 xi
Q3 Cantidad de insectos vivos
Q1 Me = Q2
Cálculo de la varianza
2
(x i
n 1
34
Probabilidad y Estadística - Medidas descriptivas
Cantidad Cantidad
de insectos de parcelas xi x
xi fi
5 3 5 - 7.8 = -2.8 7.84 7.84 x 3 = 23.52
6 9 6 - 7.8= -1.8 3.24 3.24 x 9 = 29.16
7 10 7 - 7.8= -0.8 0.64 0.64 x 10 = 6.4
8 12 8 - 7.8= 0.2 0.04 0.48
9 8 9 - 7.8= 1.2 1.44 11.52
10 5 10 - 7.8= 2.2 4.84 24.2
11 3 11 - 7.8= 3.2 10.24 30.72
Totales 50 126
126
S2 2.57 insectos2
49
𝑋̅ − 𝑀𝑜
𝐴𝑠 =
𝑆
Con -1 < As < 1
En nuestro problema :
𝑋̅ − 𝑀𝑜 7.8 − 8
𝐴𝑠 = = = −0.12 𝑚𝑚
𝑆 1.61
tiende a cero. Por lo que la distribución es casi simétrica como ya lo habíamos anticipado. Presenta
una leve asimetría negativa.
𝑛 50
10 = 10 =5
100 100
Interpretación: El 10% de las parcelas posee 6 insectos vivos o menos y el 90% restante tiene 6 in-
sectos vivos o más.
Cálculo de P90
n 50
90 90 45
100 100
37
Probabilidad y Estadística - Medidas descriptivas
38
Probabilidad y Estadística - Medidas descriptivas
Problema 7
En un experimento industrial donde se desea estudiar la capacidad de una máquina para producir
piezas dentro de especificaciones, se han medido 100 tornillos (registrándose su longitud en mm.), los
resultados se presentan en la siguiente tabla de frecuencias:
Longitud de Cantidad
los tornillos de
(Medidos en mm.) tornillos
6-7 11
7-8 9
8-9 14
9-10 11
10-11 22
11-12 14
12-13 7
13-14 5
14-15 4
15-16 3
x'i fi
i 1
, en la que m es la cantidad intervalos y x’i es la marca de clase de los inter-
valos.
39
Probabilidad y Estadística - Medidas descriptivas
Para su cálculo se organizan los datos en una tabla de frecuencias absolutas, en la que se agrega una
columna con las marcas de clases y otra con los productos de cada marca de clase por la correspon-
diente frecuencia absoluta.
Marca de Frecuencia
ntervalos
clase fi x’i fi
de clase
x’i
6-7 6.5 11 71.5
7-8 7.5 9 67.5
8-9 8.5 14 119.0
9-10 9.5 11 104.5
10-11 10.5 22 231.0
11-12 11.5 14 161.0
12-13 12.5 7 87.5
13-14 13.5 5 67.5
14-15 14.5 4 58.0
15-16 15.5 3 46.5
Total 100 1014.0
1014.4
𝑋̅ = = 10.14 𝑚𝑚
100
40
Probabilidad y Estadística - Medidas descriptivas
1.-Método gráfico
41
Probabilidad y Estadística - Medidas descriptivas
fi
Intervalo
25 modal
Intervalo
Intervalo posmodal
20 premodal
Cantidad de tornillos
15
10
0
6 7 8 9 10 11 12 13 14 15 16
Long. de los tornillos en mm.
Mo
Mo Li ai
Intervalos Frecuencia
de clase absoluta
fi
6-7 11
7-8 9
8-9 14
9-10 11 Frecuencia absoluta premodal
10-11 22
Intervalo Frecuencia absoluta modal
11-12 14
modal
12-13 7 Frecuencia absoluta posmodal
13-14 5
14-15 4
15-16 3
Total 100
42
Probabilidad y Estadística - Medidas descriptivas
Observación:
Se puede trabajar con las frecuencias relativas, en lugar de las frecuencias absolutas.
- La mayor frecuencia absoluta es 22. Esta frecuencia es la que corresponde al intervalo 10-
11. Entonces 10-11 es el intervalo modal.
- Li es el límite inferior del intervalo modal. En nuestro caso Li = 10.
- d1 es la diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia absoluta
del intervalo premodal.
d1 = 22 –11 = 11
- d2 es la diferencia entre la frecuencia absoluta del intervalo modal y la frecuencia absoluta
del intervalo posmodal.
d2 = 22 –14 = 8
- ai es la amplitud del intervalo modal. ai = 1
Reemplazando estos valores en la fórmula tenemos:
11 .1 10 11
Mo 10 10.58 mm.
11 8 19
Interpretación: La longitud de tornillos que se presenta con mayor frecuencia en el proceso de fabri-
cación es de 10.58 mm.
43
Probabilidad y Estadística - Medidas descriptivas
Tabla XIV.-Tabla de frecuencias de una variable continua para una muestra de tamaño n.
- Se consideran las frecuencias acumuladas “menor que” Fi (se puede considerar las frecuencias
relativas acumuladas)
- Se calcula n/2 y se ubica la menor frecuencia acumulada Fj que supere a este valor n/2.
- A Fj le corresponde el intervalo medial Lj-1- Lj y la frecuencia absoluta fj .
- Lj-1 es el límite inferior del intervalo medial y Lj el límite superior del intervalo.
- Con ai se designa la amplitud de los intervalos, entonces aj , es la amplitud del intervalo medial.
44
Probabilidad y Estadística - Medidas descriptivas
50 45 5
Tenemos que: Me 10 .1 10 10.23mm.
22 22
45
Probabilidad y Estadística - Medidas descriptivas
Interpretación
- El 50% de los tornillos producidos por una máquina tienen una longitud de 10.23 mm. o menos.
- El 50% de los tornillos producidos por una máquina tienen una longitud de 10.23 mm. o más.
2.-Método gráfico
Para el cálculo gráfico de la mediana se procede de la siguiente manera.
-Como se trata de una variable continua se construye la ojiva “menor que” de las frecuencias
absolutas acumuladas Fi (o de las relativas acumuladas Ri).
-A una altura n/2 = 50 (o 0.5 si la ojiva corresponde a las frecuencias relativas acumuladas),
sobre el eje vertical de las frecuencias acumuladas se traza una paralela al eje de abscisas hasta cor-
tar la ojiva.
-Por el punto anterior, se baja una vertical que corta al eje de las abscisas en un punto que
corresponde aproximadamente a 10.23 mm. Este punto es la mediana.
Fi
100
Cantidad de tornillos
90
80
70
60
n/2 = 50
40
30
20
10
0
6 7 8 9 10 11 12 13 14 15 16
Me = 10.23 Long. de los tornillos en mm.
Gráfico 16: Ojiva de las frecuencias absolutas acumuladas de las longitudes de los tornillos producidos por una
máquina.
46
Probabilidad y Estadística - Medidas descriptivas
Cálculo de la varianza
El cálculo de la varianza para datos agrupados en intervalos de clase, está dado por:
(x'
S 2 i 1
en la que x’i es la marca de clase de los intervalos.
n -1
Dispondremos los datos en una tabla, con el objeto de facilitar el cálculo. Recordemos que
x 10.144mm
Tabla XVI.- Longitud de tornillos producidos por una máquina
47
Probabilidad y Estadística - Medidas descriptivas
El recorrido intercuartílico
RI = Q3 Q1
Cálculo de los cuartiles
48
Probabilidad y Estadística - Medidas descriptivas
- En la columna Fi, se ubica la primera frecuencia que supera a n / 4, en nuestro caso que supera a
25. Esa frecuencia es F3 = 34.
- A 34 le corresponde el intervalo 8-9; 8 es el límite inferior del intervalo y fj = f3 = 14 la frecuen-
cia absoluta del intervalo
- En nuestro problema todos los intervalos son iguales, entonces a3 = a = 1, es la amplitud del
intervalo.
- La F(j-i) es = F2 = 20
25 − 20 5
Q1 = 8 + ∗1=8+ = 8.36 𝑚𝑚
14 14
Se calcula 3n / 4 = 300 / 4 = 75
- En la columna Fi, se ubica la primera frecuencia que supera a 3n / 4, en nuestro caso que su-
pera a 75. Esa frecuencia es F6 = 81
- A 81 le corresponde el intervalo 11-12; 11 es el límite inferior del intervalo y fj = f6 = 14 la
frecuencia absoluta del intervalo.
- En nuestro problema todos los intervalos son iguales, entonces a6 = a = 1, es la amplitud del
intervalo.
- La F(j-i) es = F5 = 67
Reemplazando los valores obtenidos en la fórmula dada, tenemos que:
75 67 8
Q3 11 .1 11 11.57mm.
14 14
49
Probabilidad y Estadística - Medidas descriptivas
Asimetría
x < Me < Mo
Como la media es menor que la mediana y la moda está a la derecha, podemos decir que la
distribución de los datos tiene asimetría negativa o que es sesgada hacia la izquierda.
Veamos el cálculo del coeficiente:
𝑋̅ − 𝑀𝑜 10.144 𝑚𝑚 − 10.58 𝑚𝑚
𝐴𝑠 = = = −0.19 𝑚𝑚
𝑆 2.3291 𝑚𝑚
Curtosis
Para el cálculo necesitamos conocer los percentiles 10 y 90.
En forma análoga al procedimiento seguido para el cálculo de cuartiles, hallaremos los percentiles.
10−0 90−88
𝑃10 = 6 + 11
∗ 1 = 6.91 𝑚𝑚 𝑃90 = 13 + 5
∗ 1 = 13.4 𝑚𝑚
50
Probabilidad y Estadística - Medidas descriptivas
“El coeficiente de variación se utiliza para comparar la homogeneidad de dos series de datos
aun cuando estén expresadas en distintas unidades de medida”.5
Problema 8
El siguiente lote de 20 datos corresponde a lecturas de humedad (en porcientos) reducidos al entero
más próximo:
Lote de datos
29 44 12 53 21
34 39 25 48 23
17 24 27 32 34
15 42 21 28 37
5
ESTADÍSTICA aplicada a la investigación. [Link] C.
51
Probabilidad y Estadística - Medidas descriptivas
Solución
Serie simple: es un conjunto de pocos datos (generalmente n < 30 ).
Dado un lote de pocos datos cuantitativos (serie simple), además de los métodos explorato-
rios vistos (tablas de frecuencias), existe otra técnica sencilla de gran utilidad llamada “Diagrama de
Tallo y Hojas”desarrollada por Tukey.
Para realizar el diagrama en primer lugar se ordenan los datos:
Lote de datos ordenados
12 15 17 21 21
23 24 25 27 28
29 32 34 34 37
39 42 44 48 53
Luego se construye el diagrama colocando en una columna todos los números del lote de da-
tos eliminando la última cifra (unidades) ordenados de menor a mayor. Esta columna constituye el
tallo. A la derecha de cada número del tallo, se agrega la última cifra (unidad) de cada dato, ordena-
dos también de menor a mayor, estas cifras constituyen las hojas.
Diagrama de Tallo y Hoja para el estudio de humedad
Tallo Hojas
1 2 5 7
2 1 1 3 4 5 7 8 9
3 2 4 4 7 9
4 2 4 8
5 3