0% encontró este documento útil (0 votos)
124 vistas27 páginas

Medidas Descriptivas: Índice

Este documento presenta un índice de medidas descriptivas y de tendencia central. Incluye secciones sobre la mediana, la media aritmética, la moda y sus relaciones. También cubre medidas de posición relativa como cuartiles, deciles y percentiles. Explica cómo calcular estas medidas para datos agrupados y no agrupados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
124 vistas27 páginas

Medidas Descriptivas: Índice

Este documento presenta un índice de medidas descriptivas y de tendencia central. Incluye secciones sobre la mediana, la media aritmética, la moda y sus relaciones. También cubre medidas de posición relativa como cuartiles, deciles y percentiles. Explica cómo calcular estas medidas para datos agrupados y no agrupados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Probabilidad y Estadística ÍNDICE

Medidas Descriptivas
Jhon F. Bernedo Gonzales • Ronny I. Gonzales Medina • 2020

Última revisión: 29 de septiembre de 2020

Índice

1. Introducción 2

2. Medidas descriptivas: medidas de tendencia central 2


2.1. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Média aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Propiedades de x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4. Relación entre media, mediana y moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3. Medidas de posición relativa 12


3.1. Cuartiles, Qj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2. Deciles, Dj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3. Percentiles, Pj . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4. Medidas resumen: datos agrupados por intervalos 17


4.1. Média aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

5. Medidas de Posición Relativa: datos agrupados por intervalos 22


5.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5.2. Deciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.3. Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

1 Introducción
Uno de los objetivos en estadística es condensar ó resumir los datos por medio de números que son
denominados medidas descriptivas que indican algunas características de la población ó muestra. Se
debe de tener en cuenta lo siguiente:
a) Una medida descriptiva calculada de una muestra es llamada de estadística
b) Una medida descriptiva calculada de una población es llamado de parametro.
En este sentido, por medio de las estadísticas obtenidas de la muestra puede descubrir e identificar
algunas características que las observaciones tienen en común y así con esta información a partir de la
muestra hacer inferencias de la población.
En general, los datos brutos tienen muchas variables, sin embargo será considerado un análisis univa-
riado de los datos, i.e., serán calculados estadísticas considerando sólo una variable y de naturaleza
cuantitativas.

2 Medidas descriptivas: medidas de tendencia central


2.1 Mediana
La mediana (Me) es el valor central de un conjunto de datos, la mediana divide el conjunto en dos grupos
iguales. Así, el 50 % de los valores son menores o iguales a la mediana y 50 % de los valores son mayores
a la mediana. Para calcular la mediana se ordenan los datos en orden ascendente (o descendente)
Así, dado un conjunto de datos de tamaño n

x1 , x2 , . . . , xn

y si este conjunto de datos es ordenado en forma ascendente entonces de adopta la siguiente notación

x(1) , x(2) , . . . , x(n)

en que x(1) es el valor mínimo de los datos y x(n) es el valor máximo. Nótese que x(1) ocupa la 1o posición
de los datos ordenados, x(2) ocupa la 2o posición, y así sucesivamente. Una vez ordenado los datos, el
valor de la mediana depende del número de observaciones n.
Si n es impar la mediana es dada por
Me = x( n+1 )
2

Si n es par entonces a mediana es dada por


1
 
Me = x( n ) + x( n +1)
2 2 2

Notación: La mediana también denotada por

x = Me
e

2
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Ejemplo 2.1.
Considerando los siguientes números 2, 5, 3, 6, 1 e 7. Calcular la mediana. Nótese que el número de
observaciones es par n = 6.
Para el cálculo de la mediana, los datos tienen que estar ordenados, por ejemplo, en forma ascendente ,
así

posición 1o 2o 3o 4o 5o 6o
x(i) 1 2 3 5 6 7

Debido a que n = 6 entonces


1 1h
  i
Me = x( 6 ) + x( 6 +1) = x(3) + x(3+1)
2 2 2 2
1h i
= x(3) + x(4)
2
1
= [3 + 5] = 4
2
Ejemplo 2.2.
Suponiendo que el conjunto de valores es dado por {2, 3, 5, 10, 1}, entonces se observa que para este
conjunto de valores se tienen que n = 5 y así el cálculo de la mediana es diferente al caso anterior.
Primeramente los valores son ordenados

posición 1o 2o 3o 4o 5o
x(i) 1 2 3 5 10

Luego, la mediana es dada por

Me = x( 5+1 ) = x( 6 ) = x(3) = 3
2 2

3
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

2.2 Média aritmética


A media aritmética es una de las medidas de posición (estadística) mas utilizada para resumir un
conjunto de datos. La media aritmética es dada por
n
P
xi
i=1
x= ,
n
en que n representa el tamaño de muestra considerada.
Interpretación: Una interpretación física de la media aritmética es que x representa el centro de
gravedad de la distribución.

Ejemplo 2.3.
El artículo (“Oxygen Consumption During Fire Suppression: Error of Heart Rate Estimation”, Ergonomics,
1991: 1469-1474) reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una muestra
de diez bomberos que realizaron un simulacro de supresión de incendio.

29.5 49.3 30.6 28.2 28 26.3 33.9 29.4 23.5 31.6

La media aritmética para este conjunto de datos es


n
P
xi
i=1 29.5 + 49.3 + 30.6 + . . . + 31.6 310.3
x= = = = 31.03
n 10 10
El consumo promedio de la muestra de los bomberos es x = 31.03 ml/kg/min

Ejemplo 2.4.
Se investiga la cantidad de sodio en 20 marcas de cereales para desayuno, los niveles registrados (en mg)
son

0 50 70 100 130 140 140 150 160 180


180 180 190 200 200 210 210 220 290 340

Calcule y compare los valores de la media y mediana muestrales.

4
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Ejemplo 2.5.
La propagación de grietas provocadas por fatiga en varias partes de un avión ha sido el tema de extensos
estudios en años recientes. Los datos adjuntos se componen de vidas de propagación (horas de vuelo/104
) para alcanzar un tamaño de agrietamiento dado en orificios para sujetadores utilizados en aviones
militares (“Statistical Crack Propagation in Fastener Holes ander Spectrum Loading”, J. Aircraft, 1983:
1028-1032)

0.736 0.863 0.865 0.913 0.915 0.937 0.983 1.007


1.011 1.064 1.109 1.132 1.14 1.153 1.253 1.394

Calcule y compare los valores de la media y mediana muestrales.

5
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Ejemplo 2.6.
El artículo (“The Pedaling Technique of Elite Endurance Cyclists”, Inst. J. of Sport Biomechanics, 1991:
29-53) reportó los datos adjuntos sobre potencia de una sola pierna sometida a una alta carga de trabajo.

244 191 160 187 180 176 174


205 211 183 211 180 194 200

Calcule e interprete la media y la mediana muestral

Suponga que la primera observación hubiera sido 204 en lugar de 244. ¿Cómo cambiarían la media
y la mediana?

6
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Propiedades de x
a) Suma Total Si x es la media aritmetica de n datos, entonces la suma total de los n valores es dado
por
n
X Xn
xi = x × n, fi xi = x × n
i=1 i=1

b) Transformación Lineal Sea x que representa una variable estadística (discreta o continua y sea xi
un valor de la muestra de tamaño. Si se considera una transformación lineal de x, esto es,

yi = axi + b i = 1, . . . , n

en que a y b son constantes. Entonces la media de los valores transformados y1 , y2 , . . . , yn es dada


por
y = ax + b.
Casos Particulares

si a = 1, se tiene y = x + b luego y = x + b.
si b = 0 se tiene y = ax luego y = ax.

c) Si x es la media aritmetica de n datos, entonces las desviaciones de c/u de los datos en relación x
es igual a 0,
Xn X k
(xi − x) = 0 fi (xi − x) = 0.
i=1 i=1
Nótese que una desviación de xi en relación a x es dada por xi − x.

d) Media global Si se tiene un conjunto de datos de tamaño n agrupado en 3 grupos (cluster) en


que cada grupo tiene un tamaño respectivo de n1 , n2 y n3 y para cada grupo se tiene su media
aritmética x1 , x2 y x3 respectivamente. Entonces la media global de los n datos es dada por :

n1 x1 + n2 x2 + n3 x3 n1 x1 + n2 x2 + n3 x3
x= = ,
n1 + n2 + n3 n
en que n = n1 + n2 + n3 .

e) La media aritmética es afectada por valores extremos. Esto lleva a que esta estadística indique
conclusiones distorcionadas.

La media aritmética, la mediana y moda son conocidos como promedios.

n1 n2 n3
xbar1 xbar2 xbar3

7
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Ejemplo 2.7.
Una muestra de temperaturas para iniciar una cierta reacción química dio un promedio muestral (o C)
de 87.3 ¿Cuál es el promedio muestral medido en o F?
Sugerencia: F = 95 C + 32

Solución

9
F= C + 32 se usa la transformacióm lineal
5
9
F = C + 32
5
9
F = · 87.3 + 32
5
F = 189.14

8
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

Ejemplo 2.8.
El sueldo promedio actual de 200 empleados de una empresa es S/. 800.00. Si para el siguiente mes hay
dos alternativas de aumento:

a) S/. 90.00 soles a c/u de los empleados

b) 5 % de su sueldo más 45 soles a c/u

Cual es la alternativa es más conveniente para la empresa si está sólo dispone de 177000 soles para pagar
sueldos?

Solución
Para este ejemplo se utiliza la propiedad de suma total y transformación lineal.

a) Primera alternativa: S/. 90.00 soles a c/u de los empleados

yi = xi + 90
y = x + 90
y = 800 + 90 = 890
n
X
yi = 200 × 890 = 178000
i=1

b) Segunda alternativa: 5 % de su sueldo más 45 soles a c/u

yi = xi + 0.05xi + 45
yi = 1.05xi + 45
y = 1.05x + 45
y = 1.05 × 800 + 45 = 885
n
X
yi = 200 × 885 = 177000
i=1

9
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

2.3 Moda
La moda es el valor (o valores) que tiene mayor frecuencia (que mas se repite).
Un conjunto de datos (univariado) puede tener mas de una moda. Si un conjunto de datos tiene 2 modas
entonces se dice que ese conjunto de datos es bimodal.
En general, si un conjunto de datos tiene mas de 2 modas se dice que los datos son multimodales.
Sin embargo, caso un conjunto de datos no tenga un valor modal se dice que ese conjunto de datos no
tiene moda.
Notación: La moda es denotad denotada por

Mo ≡ moda

Ejemplo 2.9.
El número de cafeterías Starbucks en 18 ciudades a no más de 20 millas de la Universidad de California,
en Riverside, se muestra en la tabla siguiente ([Link]).

16 7 2 6 4
1 7 1 1 1
3 2 11 1
5 1 4 12

A fin de encontrar la moda es necesario saber la xi fi xi fi


frecuencia de cada uno de los valores observados.
1 6 6 1
Así, ordenado los datos en una tabla de frecuencias
2 2 7 2
absolutas se tiene
3 1 11 1
4 2 12 1
5 1 16 1

El valor que tiene mayor frecuencia es 1 con una frecuencia absoluta de 6, luego la moda es 1.

10
Probabilidad y Estadística 2. Medidas descriptivas: medidas de tendencia central

2.4 Relación entre media, mediana y moda

1. La distribución es asimétrica a la izquierda si Asimétrica a la izquierda

x < Me < Mo

0.2 0.4 0.6 0.8 1.0

Asimétrica a la derecha

2. La distribución es asimétrica a la derecha si

Mo < Me < x
0.0 0.2 0.4 0.6 0.8

Simétrica

3. La distribución de los datos es simétrica si

x = Me = Mo

11
Probabilidad y Estadística 3. Medidas de posición relativa

3 Medidas de posición relativa


min T2 max
T1
Las principales medidas de posición relativa son:

1. cuartiles

2. deciles y 0 200
100
3. percentiles o centiles.

Estas medias son también denominadas cuantiles


25% 25% 25% 25%

3.1 Cuartiles, Qj
Los datos pueden ser divididos en 4 partes iguales. Para dividirlos en 4 partes iguales se considera los
cuartiles. Existen 3 cuartiles así

Cuartil Interpretación Posición


n
1o cuartil Q1 25 % de los datos son menores o iguales a Q1 4

2n
2o cuartil Q2 50 % de los datos son menores o iguales a Q2 4

3n
3o cuartil Q3 75 % de los datos son menores o iguales a Q3 4

La Figura 3.1 presenta de forma gráfica forma geométrica la proporción de los datos para los cuarti-
les.Nótese que en el valor máximo de la muestra se obtiene el 100 %.

Figura 3.1: Cuartiles de una distribución de frecuencias

12
Probabilidad y Estadística 3. Medidas de posición relativa

nota: los paquetes


A fin de obtener los cuartiles se debe de considerar el siguiente procedimiento estadísticos usan
diferentes algoritmos
1. Se debe de ordenar los datos. De preferencia de menor a mayor. para el calculo de los
cuartiles
2. Se calcula la posición del cuartil
j×n
, j = 1, 2, 3
4
3. Se obtiene la posición en los datos para obtener el cuartil

a) Si (j × n)/4 es un número entero entonces se tiene la posición (i) = (j × n)/4 entonces el j-ésimo
cuartil se calcula
x(i) + x(i+1)
Qj =
2 4 < 4.56 < 5
b) Si (j × n)/4 es un número decimal entonces se cumple (i − 1) < (j × n)/4 < (i) entonces el
j-ésimo cuartil se igual a
Qj = x(i)

Ejemplo 3.1.
Considerando los siguientes números 2, 5, 3, 6, 2 e 7. Calcular Calcular Q1 , Q2 y Q3 . Nótese que el
número de observaciones es n = 6.
Para el cálculo de los cuartiles los datos tienen que estar ordenados así

posición (i) 1o 2o 3o 4o 5o 6o
x(i) 2 2 3 5 6 7

a) Para Q1 se tiene que

Como j = 1 luego
1×n 1×6
= = 1.5
4 4
Luego se ubica
1×n
(i − 1) < < (i)
4
1 < 1.5 < 2

Luego (i) = 2, así Q1 = x(2) = 2

b) Para Q2 se tiene que

Como j = 2 luego (6 × 2)/4 = 3, es número entero


Luego se ubica (i) = 3, luego se toma el promedio
x(3) + x(3+1) x(3) + x(4) 3+5
Q2 = = = =4
2 2 2

13
Probabilidad y Estadística 3. Medidas de posición relativa

3.2 Deciles, Dj
Los deciles dividen el conjunto de datos en 10 partes iguales

Decil Interpretación Posición


1o decil D1 10 % de los datos son menores o iguales a D1 n
10

2o decil D2 20 % de los datos son menores o iguales a D2 2n


10

3o decil D3 30 % de los datos son menores o iguales a D3 3n


10

4o decil D4 40 % de los datos son menores o iguales a D4 4n


10

5o decil D5 50 % de los datos son menores o iguales a D5 5n


10

6o decil D6 60 % de los datos son menores o iguales a D6 6n


10

7o decil D7 70 % de los datos son menores o iguales a D7 7n


10

8o decil D8 80 % de los datos son menores o iguales a D8 8n


10

9o decil D9 90 % de los datos son menores o iguales a D9 9n


10

A fin de obtener los deciles se debe de considerar el siguiente procedimiento

1. Se debe de ordenar los datos. De preferencia de menor a mayor.

2. Se calcula la posición del decil


j×n
, j = 1, 2, 3, . . . , 9
10
3. Se obtiene la posición en los datos para obtener el decil

a) Si (j × n)/10 es un número entero entonces se tiene la posición (i) = (j × n)/10 entonces el


j-ésimo decil se calcula
x(i) + x(i+1)
Dj =
2
b) Si (j × n)/10 es un número decimal entonces se cumple (i − 1) < (j × n)/10 < (i) entonces el
j-ésimo decil es igual a
Dj = x(i)

14
Probabilidad y Estadística 3. Medidas de posición relativa

Ejemplo 3.2.
Considerando los siguientes números 2, 5, 3, 6, 2 e 7. Calcular Calcular D1 , D6 y D5 . Nótese que el número
de observaciones es n = 6.
Para el cálculo de los deciles los datos tienen que estar ordenados así

posición (i) 1o 2o 3o 4o 5o 6o
x(i) 2 2 3 5 6 7

a) Para D1 se tiene que

Como j = 1 luego (6 × 1)/10 = 0.6


Luego se ubica
(1 − 1) < 0.6 < 1
Luego (i) = 1, así D1 = x(1) = 2

b) Para D6 se tiene que

Como j = 6 luego (6 × 6)/10 = 3.6


Luego se ubica
(4 − 1) < 3.6 < 4
Luego (i) = 4, así D6 = x(4) = 5

c) Para D5 se tiene que

Como j = 5 luego (6 × 5)/10 = 3


Luego se ubica (i) = 3 (exacto), se tiene que tomar promedios
x(3) + x(3+1) x(3) + x(4) 3+5
D5 = = = =4
2 2 2

15
Probabilidad y Estadística 3. Medidas de posición relativa

3.3 Percentiles, Pj
Los percentiles dividen el conjunto de datos en 100 partes iguales. A fin de obtener los cuartiles se debe
de considerar el siguiente procedimiento

1. Se debe de ordenar los datos. De preferencia de menor a mayor.

2. Se calcula la posición del decil


j×n
, j = 1, 2, 3, . . . , 99
100
3. Se obtiene la posición en los datos para obtener el decil

a) Si (j × n)/100 es un número entero entonces se tiene la posición (i) = (j × n)/100 entonces el


j-ésimo percentil se calcula
x(i) + x(i+1)
Pj =
2
b) Si (j × n)/100 es un número decimal entonces se cumple que (i − 1) < (j × n)/100 < (i) entonces
el j-ésimo percentil es igual a
Pj = x(i)

Ejemplo 3.3.
Considerando los siguientes números 2, 5, 3, 6, 2 e 7. Calcular P19 , D48 y D83 .

16
Probabilidad y Estadística 4. Medidas resumen: datos agrupados por intervalos

4 Medidas resumen: datos agrupados por intervalos


Para calcular las medidas de tendencia central y de posición relativa cuando los datos son organizados
por intervalos, será considerado la siguiente tabla de distribución de frecuencias

Ii mi fi Fi hi
[21; 31[ 26 189 189 0.034
[31; 41[ 36 1032 1221 0.186
[41; 51[ 46 2053 3274 0.37
[51; 61[ 56 1617 4891 0.291
[61; 71[ 66 564 5455 0.102
[71; 81] 76 95 5550 0.017
total 5550 1.000

Los datos están relacionado con las edades de los regidores de varias alcaldías en algún país. Nótese que
el número de intervalos es k = 6, la amplitud es Ai = 10 y el número de regidores considerados para la
construcción de la tabla es 5550.

17
Probabilidad y Estadística 4. Medidas resumen: datos agrupados por intervalos

4.1 Média aritmética


El cálculo de la media aritmética (x) cuando los datos están agrupados en k intervalos se utiliza las
marcas de clase (mi ) de cada intervalo.
La media aritmética para datos agrupados por intervalos es dado por
k
P
fi × mi
i=1
x= ,
n
en que fi es a frecuencia absoluta de cada clase y k es el número de intervalos.
Observación: Nótese que también se puede reescribir en términos de la frecuencia relativa (hi ), así
k
X
x= hi × mi .
i=1

Ejemplo 4.1.
Con la tabla de distribución de frecuencias de las edades de los regidores se calculará la media aritmética
de los regidores.

Ii mi fi fi × mi
[21; 31[ 26 189 4914
[31; 41[ 36 1032 37152
[41; 51[ 46 2053 94438
[51; 61[ 56 1617 90552
[61; 71[ 66 564 37224
[71; 81] 76 95 7220
total 5550 271500

Luego la media aritmética es dada por


k
P
fi × mi
i=1 271500
x= = = 48.92 años
n 5550
La edad media de los regidores es x = 48.92 años

18
Probabilidad y Estadística 4. Medidas resumen: datos agrupados por intervalos

4.2 Mediana
La mediana (Me) es definida como el valor tal que 50 % de las observaciones son menores y 50 % son
mayores que la mediana. La mediana para datos agrupados por clases o intervalos es dada por
!
0.5 × n − Fi−1
Me = Li + Ai ,
fi
en que

Li : limite inferior de la clase mediana, esto es, el intervalo en que la frecuencia absoluta acumulada
Fi es mayor o igual que el 50 % (0.5n) de los valores.

fi : frecuencia absoluta de la clase mediana

Fi−1 : frecuencia absoluta acumulada de la clase anterior a la clase mediana

Ai : amplitud de la clase mediana

Ejemplo 4.2.
Considerando la tabla de frecuencias para las edades de los regidores, será calculado la mediana (Me)
Ii mi fi Fi Se calcula la mitad de los datos 0.5 × n = 0.5(5550) =
[21; 31[ 26 189 189 2775.
[31; 41[ 36 1032 1221 Se busca en la tabla de distribución de frecuencias en la
[41; 51[ 46 2053 3274 columna de las frecuencias acumuladas Fi el valor que
[51; 61[ 56 1617 4891 sea mayor o igual a 2775. La frecuencia acumulada que es
[61; 71[ 66 564 5455 mayor que 0.5× n = 2775 es la frecuencia acumulada F3 =
[71; 81] 76 95 5550 3274 que corresponde a la tercera clase, I3 . La tercera
total 5550 clase [41; 51[ es denominada clase mediana.
Seguidamente, el limite inferior, amplitud y frecuencia absoluta de la clase mediana son L3 = 41,
A3 = 10 y f3 = 2053, respectivamente.
La frecuencia acumulada de la clase anterior a la clase mediana es F2 = 1221, así la mediana es dada por
!
0.5 × n − F2
Me = L3 + A3
f3
2775 − 1221
 
= 41 + 10 ≈ 48.57 años
2053
El 50 % de las edades de los regidores están entre 21 y 48.57 años (aproximadamente).

19
Probabilidad y Estadística 4. Medidas resumen: datos agrupados por intervalos

4.3 Moda
La moda (Mo) es el valor (o valores) que tiene la mayor frecuencia absoluta fi entre los valores en la
muestra.
La moda cuando los datos están agrupados es dada por
" #
fi − fi−1
Mo = Li + A,
(fi − fi−1 ) + (fi − fi+1 ) i
en que

Li limite inferior de la clase modal, esto es, la clase de mayor frecuencia absoluta

fi frecuencia absoluta de la clase modal

fi−1 frecuencia absoluta de la clase anterior a la clase modal

fi+1 frecuencia absoluta de la clase posterior a la clase modal

Ai amplitud de la clase modal

Observación: La clase modal es el intervalo que tiene mayor frecuencia absoluta, fi .


Se puede usar la siguiente notación:

41 = fi − fi−1
42 = fi − fi+1 ,

y de esta forma se puede reescribir la expresión par el cálculo de la moda


" #
41
Mo = Li + A
41 + 42 i

20
Probabilidad y Estadística 4. Medidas resumen: datos agrupados por intervalos

Ejemplo 4.3.
Cálculo de la moda para los datos de las edades de los regidores.
Ii mi fi Fi
[21; 31[ 26 189 189
[31; 41[ 36 1032 1221
La clase modal es [41; 51[, porque ese intervalo tiene la
[41; 51[ 46 2053 3274
mayor frecuencia absoluta, f3 = 2053.
[51; 61[ 56 1617 4891
Nótese que el límite inferior de la clase modal es L3 = 41.
[61; 71[ 66 564 5455
[71; 81] 76 95 5550
total 5550

la frecuencia absoluta de la clase anterior a la clase modal es fi−1 = f3−1 = f2 = 1032

la frecuencia absoluta de la clase posterior a la clase modal es fi+1 = f3+1 = f4 = 1617

la amplitud de la clase modal es A3 = 10

Luego la moda es dada por


" #
f3 − f2
Mo = L3 + A
(f3 − f2 ) + (f3 − f4 ) 3
" #
2053 − 1032
= 41 + 10
(2053 − 1032) + (2053 − 1617)
" #
1021
= 41 + 10
(1021) + (436)
1021
 
= 41 + 10
1457
≈ 48 años

21
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

5 Medidas de Posición Relativa: datos agrupados por intervalos


5.1 Cuartiles
Existen 3 cuartiles que dividen el conjunto de datos en cuatro partes iguales.

Cuartil Interpretación Posición


n
1o cuartil Q1 25 % de los datos son menores o iguales a Q1 4

2n
2o cuartil Q2 50 % de los datos son menores o iguales a Q2 4

3n
3o cuartil Q3 75 % de los datos son menores o iguales a Q3 4

Observación: Nótese que el segundo cuartil Q2 es igual a la mediana, Q2 = Me.


Un cuartil Qj de una distribución de frecuencias por intervalos es dado por
 j×n 
 − Fi−1 
Qj = Li +  4  A ,
 i j = 1, 2, 3 (5.1)
fi

en que

Li limite inferior de la clase que contiene al j-ésimo cuartil, i.e., , el intervalo que su frecuencia
j×n
acumulada Fi es mayor o igual a 4 .

fi frecuencia absoluta del intervalo que contiene al j-ésimo cuartil

Fi−1 frecuencia acumulada de la clase anterior al intervalo que contiene al j-ésimo cuartil

Ai amplitud de la clase que contiene al j-ésimo cuartil

22
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

Ejemplo 5.1.
Será calculado el cuartil Q3 (j = 3) de la distribución de frecuencias de la edad de los regidores.

Ii mi fi Fi Se calcula
3 × n 3(5550)
= = 4162.5
[21; 31[ 26 189 189 4 4
[31; 41[ 36 1032 1221
[41; 51[ 46 2053 3274 Se busca en la tabla de distribución de frecuencias en la
[51; 61[ 56 1617 4891 columna de las frecuencias acumuladas Fi el valor que
[61; 71[ 66 564 5455 sea mayor o igual a 4162.5. Así, la frecuencia acumulada
[71; 81] 76 95 5550 que es mayor que 4162.5 es la frecuencia acumulada
F4 = 4891 que corresponde al cuarto intervalo (o clase),
total 5550 [51; 61[ (I4 ).
Luego, el limite inferior, amplitud e frecuencia absoluta de la cuarta clase es L4 = 51, A4 = 10 y
f4 = 1617, respectivamente. La frecuencia acumulada de la clase anterior a la 4o clase es F3 = 3274. Así,
Q3 es dado por
 3×n 
 4 − F3 
Q3 = L4 +   A
f4  4
4162.5 − 3274
 
= 51 + 10 ≈ 56.49
1617
Interpretación: Se puede afirmar que el 75 % de las edades de los regidores son menores que 56.49 años
(aproximadamente).

23
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

5.2 Deciles
Un decil Dj de una distribución de frecuencias por intervalos es dado por
 j×n 
 − Fi−1 
Dj = Li +  10  A ,
 i j = 1, 2, 3, 4, 5, 6, 7, 8, 9
fi

en que

Li limite inferior de la clase que contiene al j-ésimo decil, esto es, el intervalo que contienen la
jn
frecuencia acumulada Fi es mayor o igual a 10 .

fi frecuencia absoluta del intervalo que contiene al j-ésimo decil

Fi−1 frecuencia acumulada de la clase anterior a la clase que contiene al j-ésimo decil

Ai amplitud de la clase que contiene al j-ésimo decil

24
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

Ejemplo 5.2.
Será calculado o segundo decil, D2 (j = 2) de la distribución de frecuencias de las edades de los regidores.
Ii mi fi Fi Se calcula
2 × n 2(5550)
= = 1110
[21; 31[ 26 189 189 10 10
[31; 41[ 36 1032 1221
[41; 51[ 46 2053 3274 Se busca en la tabla de distribución de frecuencias en la
[51; 61[ 56 1617 4891 columna de las frecuencias acumuladas Fi el valor que sea
[61; 71[ 66 564 5455 mayor o igual a 1110. Así, la frecuencia acumulada que
[71; 81] 76 95 5550 es mayor que 1110 es la frecuencia acumulada F2 = 1221
que corresponde al segundo intervalo (o clase), [31; 41[
total 5550 (I2 ).

Luego, el limite inferior, amplitud y frecuencia absoluta de la segunda clase son L2 = 31, A2 = 10 y
f2 = 1032, respectivamente.
La frecuencia acumulada de la clase anterior a la segunda clase es F1 = 189, así el decil D2 es dado por
 2×n 
 10 − F1 
D2 = L2 +   A
f2  2
1110 − 189
 
= 31 + 10 ≈ 39.92
1032
Interpretación: Se puede afirmar que el 20 % de las edades de los regidores son menores que 39.92 años
(aproximadamente).

25
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

5.3 Percentiles
Los percentiles dividen a la distribución de los datos en 100 partes iguales.
Un percentil Pj de una distribución de frecuencias por intervalos es dado por
 j×n 
 − Fi−1 
Pj = Li +  100  Ai , j = 1, 2, . . . , 99

fi 

en que

Li limite inferior da clase que contiene al j-ésimo percentil, esto es, el intervalo que contienen la
j×n
frecuencia acumulada Fi es mayor o igual à 100 .

fi frecuencia absoluta del intervalo que contiene al j-ésimo percentil

Fi−1 frecuencia acumulada de la clase anterior a la clase que contiene al j-ésimo percentil

Ai amplitud del intervalo (clase) que contiene al j-ésimo percentil

Ejemplo 5.3.
Será calculado o segundo decil, P35 (j = 35) de la distribución de frecuencias de las edades de los
regidores.
Se calcula
Ii mi fi Fi
35 × n 35(5550)
[21; 31[ 26 189 189 = = 1942.5
100 100
[31; 41[ 36 1032 1221
[41; 51[ 46 2053 3274 Se busca en la tabla de distribución de frecuencias en la
[51; 61[ 56 1617 4891 columna de las frecuencias acumuladas Fi el valor que
[61; 71[ 66 564 5455 sea mayor o igual a 1942.5. Así, la frecuencia acumulada
[71; 81] 76 95 5550 que es mayor que 1942.5 es la frecuencia acumulada
total 5550 F2 = 3274 que corresponde al tercer intervalo (o clase),
[41; 51[ (I3 ).
Luego, el limite inferior, amplitud y frecuencia absoluta de la tercera clase son L3 = 41, A3 = 10 y
f3 = 2053, respectivamente.
La frecuencia acumulada de la clase anterior a la segunda clase es F2 = 1221, así el percentil P35 es dado
por
 35×n 
 100 − F2 
P35 = L3 +   A3
f3 
1942.5 − 1221
 
= 41 + 10 ≈ 44.51
2053
Interpretación: Se puede afirmar que el 35 % de las edades de los regidores son menores que 44.51 años.

26
Probabilidad y Estadística 5. Medidas de Posición Relativa: datos agrupados por intervalos

Ejercicio: Encontrar:

la media, mediana, moda

los cuartiles, Q1 , Q3 , los deciles D2 , D7 y los percentiles P23 , P78

Ii mi fi Fi hi Hi %hi
[ 26; 34 [ 30 1 1 0.022 0.022 2.2
[ 34; 42 [ 38 2 3 0.044 0.066 4.4
[ 42; 50 [ 46 4 7 0.098 0.155 8.9
[ 50; 58 ] 54 10 17 0.222 0.377 22.2
[ 58; 66 ] 62 16 33 0.356 0.733 35.6
[ 66; 74 ] 70 8 41 0.178 0.911 17.8
[ 74; 82 ] 78 4 45 0.089 1.000 8.9
total 45 1.00 100

27

También podría gustarte