Medidas Estadísticas Descriptivas en Ingeniería
Medidas Estadísticas Descriptivas en Ingeniería
FACULTAD DE INGENIERÍA
ESCUELA PROFESIONAL DE
INGENIERÍA CIVIL
Estadística
Docente: Fiorella Vanessa Li Vega
E-mail: flivega@[Link]
Curso: Estadística
MEDIDAS ESTADÍSTICAS DESCRIPTIVAS
Semana
2
Por lo tanto, la descripción del perfil del estudiantes de Ingeniería de la UNACH 2021, se pudo realizar
utilizando medidas de resumen, como:
• El promedio
• La mediana
• Los cuartiles
• Coeficiente de variación
• Coeficiente de asimetría
3
PROPÓSITO DE LA SESIÓN DE APRENDIZAJE
4
Contenido
• Cálculo e interpretación de la media para datos no agrupados y agrupados.
• Cálculo e interpretación de la mediana para datos no agrupados y
agrupados.
• Cálculo e interpretación de la moda para datos no agrupados y agrupados.
5
Medidas de Resumen
MEDIDAS DE
RESUMEN
MEDIDAS DE
MEDIDAS DE MEDIDAS DE MEDIDAS DE
CONCENTRAC
POSICIÓN DISPERSIÓN FORMA
IÓN
DESVIACION
ESTANDAR COEFICIENTE
MEDIDAS DE MEDIDAS DE
DE COEFICIENTE
TENDENCIA TENDENCIA VARIANZA
ASIMETRÍA DE CURTOSIS
CENTRAL NO CENTRAL COEFICIENTE DE
VARIACION DE PEARSON
MEDIA CUARTILES
MEDIANA DECILES
MODA PERCENTILES
MEDIA PONDERADA
MEDIA TOTAL
7
Medidas de Tendencia Central
üMedia
üMediana
üModa
8
La media Para datos no Agrupados
La media aritmética.
åx i
Media muestral x= i =1
9
La media para datos agrupados
• Cuando los n datos observados ha sido agrupados y organizados en una tabla de frecuencia, el cálculo de la
media aritmética se realiza de la siguiente manera:
∑$!"# 𝑥! 𝑓!
𝑥̄ =
𝑛
Donde:
𝑘 = 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎
𝑥𝑖 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑋 𝑒𝑛 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑖 𝑑𝑒 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑖
10
Ventajas
• En el cálculo intervienen todos los valores de la variable
• Es fácil de calcular
• Es el centro de gravedad de la distribución.
Desventajas
• Sensibilidad a valores extremos (muy altos o muy bajos).
• No es recomendable emplearla en distribuciones de datos muy
asimétricas.
11
Ejemplo:
• El gerente de un centro comercial de venta de partes de computadora desea conocer el
promedio que ganó cada agente en la semana anterior, para tal fin seleccionó una
muestra de 25 agentes, a quienes se les preguntó por el monto (x). Los datos
recolectados en soles son:
300 420 300 170 230 130 260 170 300 260 260 170 300
420 70 80 260 440 80 300 420 230 130 230 300
∑$%
!"# 𝑥! 300 + 420 + 300 + … … … … … + 230 + 300
%
𝑋= = = 249.20
25 25
• Interpretación: “La Comisión promedio ganada por cada agente de venta, la semana
pasada, fue 249.20 soles, aproximadamente.”
12
Ejemplo
• Se evaluó a un total de 56 empresas constructoras con una antigüedad no mayor de 5 años respecto a su
experiencia en el sector de construcción de edificios. La tabla de frecuencias para años de experiencia se
presenta a continuación:
Tabla 1
Distribución de empresas según años de
experiencia
∑%"#$ 𝑥" 𝑓" 0 ∗ 4 + 1 ∗ 16 + 2 ∗ 12 + 3 ∗ 10 + 4 ∗ 8 + 5 ∗ 6 132
Años de Cantidad de 𝑋% = = = = 2.36
experiencia(𝒙𝒊 ) Empresas (𝒇𝒊 ) 56 56 56
0 4
1 16
2 12 Interpretación:
3 10 En promedio, la experiencia de las empresas en construcción de edificios
4 8 es de 2.36 años.
5 6
Total 56
Elaboración propia.
13
Ejemplo
• Un total de 40 alumnos de negocios fueron seleccionados que integren un equipo de básquetbol. Para esto
el técnico del equipo tomó medidas de sus estaturas, apuntó los datos aproximando en centímetros y los
agrupo por intervalos en una tabla de frecuencia, como se muestra a continuación:
Tabla 2 6295.0
Distribución de alumnos según su estatura 𝑥̄ = = 157.38
Cantidad de 40
Marca de clases
Estatura (cm) alumnos 𝒙𝒊 ∗ 𝒇𝒊
(𝒙𝒊 )
(𝒇𝒊 )
[145 – 150> 147.5 3 442.5
[150 – 155> 152.5 10 1525.0 Interpretación:
La estatura promedio por alumno seleccionado para el equipo de
[155 – 160> 157.5 16 2520.0
básquetbol es 157.35 centímetros, aproximadamente.
[160 – 165> 162.5 7 1137.5
[165 – 170> 167.5 4 670.0
Total ---- 40 6295.0
Registro de alumnos
14
Media ponderada
• Un artículo para el hogar se vende en tres establecimientos de una ciudad. Según la ubicación del establecimiento, el
precio de venta (en soles) varía para el consumidor. A continuación se presenta el precio de venta y la cantidad de
artículos vendidos:
Tabla 3
Precio y cantidad de venta por establecimiento 55 700
𝑥̄ = = 13.93
Establecimiento Precio por un Cantidad 4000
artículo vendida
𝒙𝒊 *𝒑𝒊
𝒙𝒊 𝒑𝒊
Interpretación:
1 12.50 1500 18 750
El precio promedio de venta por artículo es 13.93 soles, en lo
2 14.00 1200 16 800 tres establecimiento de dicha ciudad.
3 15.50 1300 20 150
Total --- 4000 55 700
15
Mediana
• Es el valor de la observación que está justo en la mitad de los datos observados.
• La mediana no está afectada por los valores extremos y, por tanto es una medida de tendencia central
más resistente que la media aritmética y se denota como Me.
16
Ventajas
• No es sensible a los valores extremos.
• Es fácil de interpretar.
• Es recomendable para distribuciones muy asimétricas.
• Es la medida de tendencia central más potente.
Desventajas
• Se deben ordenar los datos para el cálculo.
• Los valores extremos pueden ser importantes.
• Se emplea solo en variables cuantitativas.
17
Mediana para datos no agrupados
1. Ordenar los datos de menor a mayor.
2. Determinar el valor central del conjunto de datos ordenados.
𝑛+1
- Si n es impar, la mediana es el valor de X que ocupa la posición
2
𝑛 𝑛+1
- Si n es par, la mediana es el promedio de los valores de X que ocupan la posición 𝑦
2 2
𝑥 &'(
𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
)
𝑀. =
𝑥 * 𝑥 *+# 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
$ + $
2
18
Mediana para datos agrupados
*
• Si $ no coincide con algún valor de las frecuencias acumuladas, este estará posicionado entre 2
frecuencias:
𝑛
𝐹!,# < < 𝐹!
2
Entonces, la mediana es el valor de X que corresponde a las frecuencia acumulada 𝐹! , es decir:
𝑀- = 𝑥!
*
• Si coincide con algún valor de las frecuencias acumuladas, este estará posicionado entre 2
$
frecuencias:
𝑛
𝐹!,# = < 𝐹!
2
Tabla 4
Distribución de suscriptores según número de
revistas leídas
* %..
Número de Se calcula = = 250
Números $ $
suscriptores 𝑭𝒊
leídos 𝒙𝒊
𝒇𝒊
0 15 15 → 𝐹/ < 250 < 𝐹%
1 10 25
2 40 65
3 85 150
𝑥 " 4 350 500 𝑀! = → 𝑀! = 4
Total 500 --- Interpretación: El 50% de los suscriptores de la revista, leen menos de 4
números.
20
Mediana para datos agrupados con intervalos
*
1. Calcular e identificar la clase mediana que contiene a la mediana (intervalo cuya
$
*
frecuencia absoluta acumulada supera por primera vez a .
$
2. Calcular la mediana mediante la siguiente fórmula:
𝑛
− 𝐹!,#
𝑀- = 𝐿! + 𝐴 2
𝑓!
Donde:
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝐿! = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐹!,# = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑓! = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝐴 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
21
Ejemplo:
Se realizó un estudio en el distrito de Chiclayo con la finalidad de conocer en que los trabajadores del
distrito solicitaron su jubilación. Los datos han sido clasificados en grupo quinquenales y se muestra en la
siguiente tabla:
Tabla 4
Distribución de trabajadores según año de
jubilación
# %"&
Se calcula = = 225 → 𝐹' < 225 < 𝐹$
Edad 𝒇𝒊 𝑭𝒊 $ $
[63 – 68> 71 71
[68 – 73> 162 233
[73 – 78> 91 324 !
)*#$%
" $$"),'
[78 – 83> 79 403 𝑀! = 𝐿( + 𝐴 +#
→ 𝑀! = 68 + 5 '-$
[83 – 88> 47 450
𝑀! = 72.75
Total 450 ---
22
Moda o Valor modal
• Es el valor de las observación que aparece con más frecuencia , es decir, el valor que mas repite en un
conjunto de datos. La moda puede calcularse para variables cuantitativas y cualitativas, es útil para identificar
categorías más frecuentes ya sea en escala nominal u ordinal. Se denota como Mo
• La moda también tiene la ventaja de no verse afectada por valores muy altos o muy pequeños, sin embargo
tiene algunas desventajas que hacen que utilice con menos frecuencia que la media que la media y la
mediana. Estad desventajas son:
ü Para muchos conjuntos de datos no existe la moda o ningún número que se repita más de una vez.
ü Para algunos conjuntos de datos puede existir más de una moda, lo cual dificulta la interpretación:
- Datos con una moda, se llama distribución unimodal.
- Datos con dos modas, se llama distribución bimodal.
- Datos con tres o más modas, se llama distribución multimodal.
23
Ventajas
• Es útil cuando hay agrupaciones con diferentes valores
• Fácil de reconocer
Desventajas
• Puede no existir en algunos datos
• Puede existir más de una moda
• Puede estar demasiado lejos del centro de gravedad de los datos
• En distribuciones muy asimétricas suele ser un dato muy poco representativo.
24
Moda para datos no agrupados
A continuación , presenta los tiempos de espera (en minutos) de 11 clientes para ser atendidos en la
ventanilla de un banco:
𝑴𝒐 = 𝟏𝟓
Interpretación:
El tiempo de espera más frecuente de un cliente para ser atendido en la ventanilla es de 15 minutos
25
Moda para dato agrupados
1. Identificar la clase modal (intervalo cuya frecuencia absoluta simple es la más grande)
2. Calcular la moda mediante la siguiente fórmula:
𝑑1
𝑀𝑜 = 𝐿𝑖 + 𝐴
𝑑1 + 𝑑2
Donde:
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝑑1 = 𝑓𝑀𝑜 − 𝑓𝑀𝑜−1
𝑑2 = 𝑓𝑀𝑜 − 𝑓𝑀𝑜+1
𝑓𝑀𝑜 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑓𝑀𝑜−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑟𝑒𝑚𝑜𝑑𝑎𝑙 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝑓𝑀𝑜−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑜𝑠𝑚𝑜𝑑𝑎𝑙 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
𝐴 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
26
Ejemplo:
Se realizó un estudio en el distrito de Chiclayo con la finalidad de conocer en que los trabajadores del distrito solicitaron su
jubilación. Los datos han sido clasificados en grupo quinquenales y se muestra en la siguiente tabla:
Tabla 4
Distribución de suscriptores según número de
𝑑' = 𝑓4) − 𝑓4)$% = 162 − 71 = 91
revistas leídas 𝑑$ = 𝑓4) − 𝑓4)*% = 162 − 91 = 71
Edad 𝒇𝒊 𝑭𝒊
[63 – 68> 71 71 𝑑'
𝑀3 = 𝐿( + 𝐴
[68 – 73> 162 233 𝑑' + 𝑑$
91
[73 – 78> 91 324 𝑀3 = 68 + 5
[78 – 83> 79 403
91 + 71
𝑀3 = 70.81
[83 – 88> 47 450
Total 450 ---
27
Medidas de Tendencia No Central
üCuartiles
üDeciles
üPercentiles
8
Medidas Tendencia No Central
Una medida de posición no central es un valor, 𝑷𝒌 de la variable que ocupa una posición en la serie ordenada
de los datos, de modo tal que una determinada proporción (porcentaje) de los datos son menores o iguales a
dicho valor y la proporción (porcentaje), restante son mayores o iguales que dicha medida de posición no
central, 𝑷𝒌
Supongamos que X1, X2, X3, …, Xn son n valores de una variable cuantitativa X, ordenando estos datos de
acuerdo a su magnitud, de menor a mayor, se tendrá una serie de datos ordenados:
X(1), X(2), X(3) ,... , X(n)
En donde X(1) es el menor de todo el conjunto de valores de la variable y X(n) es el mayor valor de los datos,
gráficamente,
X(1) ___________________________________Pk___________________X(n)
5
Cuartiles (𝑸𝒌 )
Definición. Son tres valores de la variable:
Primer cuartil: Q1 , Segundo cuartil: Q2 , Tercer cuartil: Q3
que dividen a los datos ordenados en cuatro partes iguales.
Nótese que el Q2 = Me
6
Cálculo de los cuartiles con Excel
7
Cuartiles para datos no agrupados
1. Ordenar los datos de menor a mayor.
𝑛+1
2. Para calcular el primer cuartil 𝑄1 se realizan los siguientes cálculos W=
4
𝑦 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎 𝑑𝑒 𝑊
𝑧 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑜 𝑓𝑟𝑎𝑐𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎 𝑑𝑒 𝑊
𝑄1 = 𝑥(𝑦) + 𝑧 𝑥(𝑦+1) − 𝑥(𝑦)
𝑛+1
3. Para calcular el tercer cuartil 𝑄3 se realizan los siguientes cálculos W=3
4
𝑦 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎 𝑑𝑒 𝑊
𝑧 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑜 𝑓𝑟𝑎𝑐𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎 𝑑𝑒 𝑊
𝑄3 = 𝑥(𝑦) + 𝑧 𝑥(𝑦+1) − 𝑥(𝑦)
8
Cuartiles para datos no agrupados
Ejemplo
• Ahora se muestran los tiempos de espera (en minutos) de 13 clientes para ser atendidos en la
ventanilla de un banco:
15 10 20 13 8 15 9 12 18 11 14 17 11
11 + 1
W=3 = 10,5
4
𝑦 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎 𝑑𝑒 𝑊 = 10
𝑧 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑜 𝑓𝑟𝑎𝑐𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎 𝑑𝑒 𝑊=0,5
𝑄3 = 𝑥(𝑦) + 𝑧 𝑥(𝑦+1) − 𝑥(𝑦)
𝑄3 = 𝑥(10) + 0,5 𝑥(11) − 𝑥(10)
𝑄3 = 10 + 0,5 17 − 15
𝑸𝟑 = 𝟏𝟔
Interpretación
𝑸𝟏 = 𝟏𝟎, 𝟓
→ 𝑬𝒍 𝟐𝟓% 𝒅𝒆 𝒍𝒐𝒔 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔, 𝒆𝒔𝒑𝒆𝒓𝒂𝒏 𝒂𝒑𝒓𝒐𝒙𝒊𝒎𝒂𝒅𝒂𝒎𝒆𝒏𝒕𝒆 𝟏𝟎, 𝟓 𝒎𝒊𝒏𝒖𝒕𝒐𝒔 𝒑𝒂𝒓𝒂 𝒔𝒆𝒓 𝒂𝒕𝒆𝒏𝒅𝒊𝒅𝒐𝒔
𝒆𝒏 𝒍𝒂 𝒗𝒆𝒏𝒕𝒏𝒊𝒍𝒍𝒂 𝒅𝒆𝒍 𝒃𝒂𝒏𝒄𝒐.
𝑸𝟑 = 𝟏𝟔
→ 𝑬𝒍 𝟕𝟓% 𝒅𝒆 𝒍𝒐𝒔 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔, 𝒆𝒔𝒑𝒆𝒓𝒂𝒏 𝒂𝒑𝒓𝒐𝒙𝒊𝒎𝒂𝒅𝒂𝒎𝒆𝒏𝒕𝒆 𝟏𝟔 𝒎𝒊𝒏𝒖𝒕𝒐𝒔 𝒑𝒂𝒓𝒂 𝒔𝒆𝒓 𝒂𝒕𝒆𝒏𝒅𝒊𝒅𝒐𝒔
𝒆𝒏 𝒍𝒂 𝒗𝒆𝒏𝒕𝒏𝒊𝒍𝒍𝒂 𝒅𝒆𝒍 𝒃𝒂𝒏𝒄𝒐.
10
Cuartiles para datos agrupados
𝒌𝒏
1. Calcular e identificar la clase cuartil 𝑘, donde 𝑘 = 1,2,3. La clase cuartil 𝒌 es el intervalo cuya
𝟒
𝒌𝒏
frecuencia absoluta acumulada es la primera que supera a
𝟒
2. Calcular los cuartiles mediante la siguiente fórmula:
𝒌𝒏
−𝑭𝒊−𝟏
𝑸 𝒌 = 𝑳𝒊 + 𝑨 𝟒
𝒇𝒊
…….. 𝒌 = 𝟏, 𝟐, 𝟑
Donde:
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑘
𝐹𝑖−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑘
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
𝐴 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
11
Ejemplo
Se realizó un estudio en el distrito de Chiclayo con la finalidad de conocer en que los trabajadores del distrito
solicitaron su jubilación. Los datos han sido clasificados en grupo quinquenales y se muestra en la siguiente
tabla:
Tabla 4
Distribución de suscriptores según número de revistas leídas =# '∗%"&
Se calcula %
= %
= 112,5 → 𝐹$ < 112,5 < 𝐹%
Edad 𝒇𝒊 𝑭𝒊
[63 – 68> 71 71
12
DECILES
Nótese que el Q2 = Me = D5
Los cuartiles como los cuartiles son casos particulares de los percentiles.
13
PERCENTILES
Definición. Son 99 valores de la variable, que dividen a los datos ordenados en 100
partes iguales
Primer percentil: P1 , Segundo percentil: P2 , … , noveno decil: P99
14
Percentiles (Pk)
Llamados también Cuantiles.
Son 99 valores que dividen al conjunto de datos ordenados en 100 partes iguales.
Cada parte representa al 1% del total. Se denotan con:
𝑃A = 𝑝𝑟𝑖𝑚𝑒𝑟 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝑃B = 𝑠𝑒𝑔𝑢𝑛𝑑𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝑃BC = 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 25 = 𝑄A
𝑃DC = 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 75 = 𝑄E
𝑃FF = 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 99
15
Percentiles para datos no agrupados
1. Ordenar los datos de menor a mayor.
efL
W=𝑘 LUU
𝑦 = 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎 𝑑𝑒 𝑊
16
EJEMPLO
• Ahora se muestran los tiempos de espera (en minutos) de 11 clientes para ser atendidos en la ventanilla de un
banco:
15 10 20 13 8 15 9 12 18 11 14
17
Percentiles para datos agrupados
GH
1. Calcular e identificar la clase cuartil 𝑘, donde 𝑘 = 1,2,3, … .99. La clase cuartil 𝑘 es el intervalo
AII
GH
cuya frecuencia absoluta acumulada es la primera que supera a
AII
2. Calcular los cuartiles mediante la siguiente fórmula:
𝒌𝒏
j𝑭𝒊-𝟏
𝑷𝒌 = 𝑳 𝒊 + 𝑨 𝟏𝟎𝟎
…….. 𝒌 = 𝟏, 𝟐, 𝟑,…99
𝒇𝒊
Donde:
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝐿J = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘
𝐹JKA = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘
𝑓J = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑠𝑖𝑚𝑝𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝐴 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
18
Ejemplo
Se realizó un estudio en el distrito de Chiclayo con la finalidad de conocer en que los trabajadores
del distrito solicitaron su jubilación. Los datos han sido clasificados en grupo quinquenales y se
muestra en la siguiente tabla:
Tabla 4
𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑟 ∶ 𝑃%& 𝑦 𝑃/"
Distribución de suscriptores según número de revistas leídas =# %&B%"&
Se calcula'&& = '&&
= 180 → 𝐹' < 180 < 𝐹$
Edad 𝒇𝒊 𝑭𝒊
[63 – 68> 71 71
[68 – 73> 162 233
+!
)*#$% '/&),'
[73 – 78> 91 324 𝑃%& = 𝐿( + 𝐴 %--
→ 𝑃%& = 68 + 5
+# '-$
[78 – 83> 79 403 𝑃%& = 71,36
[83 – 88> 47 450
Total 450 --- Interpretación: 𝑃%& = 𝟕𝟏, 𝟑𝟔 El 40% de los trabajadores se
jubila con una edad inferior a 71.36 años.
19
Ejercicio
En los últimos años, la demanda por alquileres de departamentos en Lambayeque ha crecido considerablemente.
Por esta razón, el director de una inmobiliaria realizó un estudio con el fin de obtener información sobre los costos
de alquileres (en soles) en la ciudad. Los resultados se presentan en la siguiente tabla:
Costo de alquiler fi
[1050 – 1150> 12
[1150 – 1250> 15
[1250 – 1350> 25
[1350 – 1450> 14
[1450 – 1550> 9
Total 75
20
Medidas de Dispersión
üRango
üDesviación estándar
üVarianza
üCoeficiente de variación
8
Observa las imágenes:
5
¿A qué se refiere la Dispersión de un conjunto de datos o de su
distribución?
• La dispersión de los datos correspondientes a una variable cuantitativa hace referencia a qué
tanto se encuentran separados entre si.
• La dispersión o variabilidad de los datos o de su distribución es la característica más
importante.
• Ejemplo para captar la idea de dispersión o variabilidad de datos estadísticos. Tenemos las
calificaciones de dos grupos de estudiantes del curso de Estadística y Probabilidades
ü Grupo A: 15, 18, 14, 14, 16, 16, 17, 14, 15, 14, 16, 17, 14, 15.
ü Grupo B: 02, 16, 18, 15, 13, 11, 18, 12, 17, 18, 16, 16, 14, 11.
Las calificaciones de los estudiantes del grupo A presentan menor dispersión o variabilidad con
relación a las calificaciones de los estudiantes del grupo B, pues no hay mucha separación entre
sus valores.
Menor dispersión Datos más homogéneos
8
Rango o Amplitud (R)
Llamado también Recorrido, se obtiene como la diferencia entre el valor máximo y el valor
mínimo:
𝑹 = 𝒙𝒎á𝒙 − 𝒙𝒎í𝒏
Propiedades:
Es fácil de calcular y se expresa en las mismas unidades que la variable, aunque presenta las
sgtes desventajas:
9
Ejemplo 1
El gerente de un centro comercial de venta de partes de computadora desea conocer el promedio que
ganó cada agente en la semana anterior, para tal fin seleccionó una muestra de 25 agentes, a quienes se
les preguntó por el monto (x). Los datos recolectados en soles son:
10
Rango Intercuartil (𝑅" )
Es la diferencia entre el tercer cuartil 𝑄E y el primer cuartil 𝑄A . En otras palabras , el rango
intercuartil es la amplitud o rango del 50% central de los datos. Se calcula:
𝑹 𝑸 = 𝑸𝟑 - 𝑸𝟏
La varianza es también una medida de dispersión de un conjunto de datos, al igual que la desviación estándar mide el
grado de dispersión de los datos con respecto a la media aritmética, a diferencia de la desviación estándar, la varianza se
expresa en unidades cuadradas. La varianza es el cuadrado de la desviación estándar.
13
Cálculo de la Desviación estándar usando la función de EXCEL
DATOS MUESTRALES
DATOS DE POBLACIONALES
14
Ejemplo 3
• El gerente de un centro comercial de venta de partes de computadora desea conocer el
promedio que ganó cada agente en la semana anterior, para tal fin seleccionó una muestra
de 25 agentes, a quienes se les preguntó por el monto (x). Los datos recolectados en soles
son:
15
Ejemplo 4
16
Ejemplo 5
17
Coeficiente de Variación (CV)
18
Ejemplo 6
Total 30
19
Medidas de Forma y concentración
5
EL COEFICIENTE DE ASIMETRÍA,𝑨𝒔 .
Es una medida estadística o coeficiente que permite determinar si un conjunto de datos o su distribución es
simétrica o asimétrica.
Existen varios coeficientes para evaluar a simetría de una distribución, siendo el más importante el que se
calcula con la siguiente fórmula:
El valor del CA puede ser negativo, positivo o cero.
3(𝑥̅ − 𝑚𝑒)
𝐴s =
𝑠
Cálculo del Coeficiente de Asimetría con la función de EXCEL
6
Interpretación del CA
7
Medida de concentración
8
EL COEFICIENTE DE CURTOSIS, K.
Es una medida estadística o coeficiente que permite determinar el grado de
concentración o apuntamiento de un conjunto de datos o su distribución.
Existen varios coeficientes para evaluar a simetría de una distribución, siendo el más
importante el que se calcula con la siguiente fórmula:
𝑄S − 𝑄T
𝐾=
2(𝑃UV − 𝑃TV )
9
Interpretación del CC
ü Si 𝑲 = 𝟎, entonces la distribución es Mesocúrtica.
ü En la práctica casi nunca se obtiene un CC que sea igual a cero, por lo que valores cercanos a cero, sean positivos o
negativos nos permitirán concluir que la distribución es Mesocúrtica
ü Si 𝑲 > 𝟎, entonces la distribución es leptocúrtica, (elevada concentración).
ü Si K< 0, entonces la distribución es platicúrtica, (baja concentración)
Ejemplo. Analizar el grado de concentración o apuntamiento de la distribución de la variable Edad de los estudiantes de
Ingeniería.
K = -1,02, este valor negativo indica que la distribución de las edades es platicúrtica.
10
Diagrama Caja
Existe Una gran variedad de gráficas estadísticas para extraer información acerca de las propiedades
de un conjunto de datos.
Una gráfica útil para reflejar propiedades de los datos es la gráfica de caja (“box plots”) que se basa
en la mediana (o en la media), los cuartiles y valores extremos. La caja representa el rango
intercuartil que encierra el 50% de los valores y tiene la mediana (Me) dibujada dentro. El rango
intercuartil tiene como extremos el percentil 75, (cuartil superior) y el percentil 25, (cuartil inferior).
Además de la caja se incluye la extensión de los datos mediante segmentos que se extienden de la
caja hacia el valor máximo (U) y hacia el valor mínimo (L) de los datos. Este recuadro se dibuja con el
eje de la variable en forma horizontal o vertical como se indica en la figura que sigue.
11
De un gráfico de cajas, se obtiene información de los datos acerca de:
La centralización (Observando la ubicación de la mediana)
La dispersión o variabilidad (mediante el rango intercuartil: RI = P75 - P25 )
La asimetría (comparando: Me - P25 con P75 - Me)
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
12
Ejemplo 1
13
Ejemplo 2
14