Medidas de posición
no central:
percentiles, deciles y
cuartiles
Semana N°04
RESULTADO DE APRENDIZAJE DE LA SESIÓN
Al finalizar la sesión, el estudiante interpreta
medidas de posición no central en datos
agrupados y no agrupados usando las
fórmulas correctas.
ma correcta
REFLEXIÓN DESDE LA EXPERIENCIA
Si la talla de una niña es inferior al
percentil 30 para su edad, significa que el
70% de las niñas de la misma edad miden
más, a la niña también se le denomina
“pequeña para su edad”.
[Link]
REFLEXIÓN DESDE LA EXPERIENCIA
El colesterol se distribuye simétricamente en la población. Supongamos
que se consideran patológicos los valores extremos.
El 90% de los individuos son normales. ¿Entre qué valores se encuentran
los individuos normales?
20
15 Percentiles 5 y 95
frecuencia
10
5
0
180 200 220 240 260
Colesterol en 100 personas
[Link]
REFLEXIÓN DESDE LA EXPERIENCIA
Responde en el padlet las
siguientes preguntas
• ¿Qué es un percentil?
• ¿Cómo se calcula un percentil?
MEDIDAS DE TENDENCIA NO CENTRAL
Las medidas de tendencia central son en realidad, un caso particular de un
tipo de medidas más amplias, llamadas “de posición “
Estas medidas de posición, tienen la propiedad de ubicarse entre los
dos extremos de variación de los datos, pero ya no necesariamente
hacia el centro del intervalo como las de tendencia central.
Entre otros indicadores, se suelen utilizar una serie de valores
que dividen la muestra en tramos iguales: Cuartiles; Deciles y
Percentiles.
Se utilizan principalmente para indicar la posición relativa
de un dato dentro del conjunto de datos previamente
ordenados.
MEDIDAS DE TENDENCIA NO CENTRAL
SECCIÓN DE REFERENCIA
DATOS NO 117 161 116 138
AGRUPADOS 353 123 376 194
Para obtener Sin Intervalos
sus valores
depende
como se
presentan los DATOS
datos. AGRUPADOS
Con Intervalos
TÍTULO QK
CUARTILES:
Son valores de la variable que dividen a la distribución de datos
en cuatro partes iguales, en donde cada parte incluye el 25% de
los datos y se denotan por 𝑄𝑖 , i=1,2,3.
Vmin. Vmax.
25%
DECILES: DK
Son valores de la variable que dividen a la distribución de datos en
diez partes iguales, en donde cada parte incluye el 10% de los
datos.
V. min._10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ V. máx.
D1 D2 D3 D4 D5 D6 D7 D8 D9
Q2
Me
Primer decil : D1 , el 10% de los datos esta por debajo del D1
Segundo decil: D2 , el 20% de los datos esta por debajo del D2
Tercer Decil : D3 , el 30% de los datos esta por debajo del D3
…….
Quinto Decil : D5 , el 50% de los datos esta por debajo del D5
…….
Noveno Decil : D9 , el 90% de los datos esta por debajo del D9
PERCENTILES: PK
Son valores de la variable que dividen a la distribución de datos en cien
partes iguales, en donde cada parte incluye el 1% de los datos.
V. mín._ 1%_._ 1%_. …._ ._ …… _._ 1%_._ …… ._ … ._1%_ V. máx.
P1 P2 …. P25 …..... P50 P51 …..... P75 ...... P99
Q1 Q2 Q3
Me
En resumen
Algunas de las medidas de posición no central coinciden, de acuerdo al
cuadro siguiente:
PERCENTIL DECIL CUARTIL
Observación P10 D1
Los valores del P20 D2
percentil 50 (P50), P25 Q1
decil 5 (D5) y cuartil 2 P30 D3
(Q2) son iguales; y, a P40 D4
su vez, son iguales al P50 D5 Q2
valor de la mediana P60 D6
(Me). P70 D7
P75 Q3
P80 D8
P90 D9
TÍTULO
Cálculo de los percentiles para datos no agrupados
1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn
𝒌∗(𝒏+𝟏)
2.- Obtener la posición correspondiente del percentil. , 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗𝟗
𝟏𝟎𝟎
3.- Calculo de los percentiles
𝑘(𝑛+1)
E: parte entera de 100
𝒌 ∗ (𝒏 + 𝟏) 𝐏𝐤 = XE + d*(X(E+1) – XE)
𝐏𝐤 = ? 𝟏𝟎𝟎
𝐤: 𝟏, 𝟐, 𝟑, …, 99
𝑘(𝑛+1)
d: parte decimal de 100
Cálculo de los percentiles para datos no agrupados
TÍTULO
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a una muestra
de 10 personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los percentiles: 𝑃10 , 𝑃69
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20
𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 1
P10 = X1 + 0.1*(X(1+1) – X1)
𝟏𝟎∗(𝟏𝟎+𝟏) P10 = X1 + 0.1*(X(2) – X1)
𝐏𝟏𝟎 = ? 𝟏𝟎𝟎
= 1.1 𝐏𝟏𝟎 = 7 + 0.1*(7 – 7) = 7 minutos
D = 0.1
En la muestra el 10% de las personas le hizo efecto el calmante en un tiempo máximo de 7
minutos.
Cálculo de los percentiles para datos no agrupados
TÍTULO
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a una muestra
de 10 personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los percentiles:𝑃10 𝑃69
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20 𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 7
P69 = X7 + 0.59*(X(7+1) – X7)
𝟔𝟗∗(𝟏𝟎+𝟏) P69 = X7 + 0.59*(X(8) – X7)
𝐏𝟔𝟗 = ? 𝟏𝟎𝟎
= 7.59
𝐏𝟔𝟗 = 15 + 0.59*(16 – 15) = 15.59 minutos
D = 0.59
En la muestra el 69% de las personas le hizo efecto el calmante en un tiempo máximo de 15.59
minutos
Cálculo de los percentiles para datos no agrupados
TÍTULO
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 7
personas.
Xi : 14,15,16,18,7,8,15
Calcule el cuartil: 𝑄1
X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18
𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 2
𝟐𝟓∗(𝟕+𝟏) 𝐏𝟐𝟓 = X2 + 0*(X(2+1) – X2) = X2
𝐐𝟏 = 𝐏𝟐𝟓 ? 𝟏𝟎𝟎
= 2.0
𝐏𝟐𝟓 = X2 = 8 minutos
D=0
En la muestra 25% de las personas le hizo efecto el calmante en un tiempo máximo de 8
minutos
Cálculo de los percentiles para datos no agrupados
TÍTULO
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a una muestra
de 7 personas.
Xi : 14,15,16,18,7,8,15
Calcule los cuartiles: 𝑄2
X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18
E= 4 𝐏𝐤 = XE + d*(X(E+1) – XE)
𝟓𝟎∗(𝟕+𝟏) 𝐏𝟓𝟎 = X4 + 0*(X(4+1) – X4) = X4
𝐐𝟐 = 𝐏𝟓𝟎? = 4.0
𝟏𝟎𝟎
D=0 𝐏𝟓𝟎 = X4 = 15 minutos
En la muestra 50% de las personas le hizo efecto el calmante en un tiempo máximo de 15
minutos.
TÍTULO
Cálculo de los percentiles para datos agrupados sin intervalos
Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖
𝐤∗𝐧
Paso 2: Calcular la posición del Pk :
𝟏𝟎𝟎
𝐤∗𝐧
Paso 3: .- El percentil 𝑃𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 >
𝟏𝟎𝟎
𝐤 𝐤∗𝐧
.- El percentil 𝑃𝑘 = Xi +(X(i+1) – Xi)* ; cuya 𝑭𝒊 =
𝟏𝟎𝟎 𝟏𝟎𝟎
n: número de datos.
Cálculo de los percentiles para datos agrupados sin intervalos
TÍTULO
Los datos de la tabla muestran información sobre la variable X que representa el número
de años de consumo de estupefacientes en una muestra de pacientes del Hospital
Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística:
Años de
consumo de 𝐏𝟏𝟗 = ?
fi Fi
estupefacientes:
Xi Paso 1: Calcular las frecuencias absolutas acumulada.
𝟏𝟗∗𝟓𝟎
1 4 4 Paso 2: Calcular la posición del 𝐏𝟏𝟗 : = 9.5
𝟏𝟎𝟎
2 4 8 𝑭𝟑 > 9.5
P19 3 8 16
4 7 23
𝐏𝟔𝟗 = ?
5 5 28
Paso 1: Calcular las frecuencias absolutas acumulada.
P69 6 10 38 𝟔𝟗∗𝟓𝟎
7 7 45 Paso 2: Calcular la posición del 𝑃69 : = 34.5
𝟏𝟎𝟎
8 5 50 𝑭𝟔 > 34.5
Total 50
PERCENTIL VALOR INTERPRETACIÓN
P19 3 años En la muestra el 19% de los pacientes del Hospital Nacional del Centro
consumieron estupefaciente en un tiempo máximo de 3 años.
P69 6 años En la muestra el 69% de los pacientes del Hospital Nacional del Centro
consumieron estupefaciente en un tiempo máximo de 6 años.
Cálculo de los percentiles para datos agrupados con intervalos
Los percentiles se calculan utilizando la siguiente fórmula:
𝑘∗𝑛
− 𝐹(𝑖−1)
𝑃𝑘 = 𝐿𝑖 + 𝐶 ∗ 100 K = 1,2,3, … ,99
𝑓𝑖
Donde:
PK : Percentil k ésimo
.i : Intervalo de clase que contiene el PK
𝒌∗𝒏
: Posición del PK
𝟏𝟎𝟎
Li : Limite real inferior de la clase que contiene el PK .
C : Amplitud de la clase que contiene PK .
𝑭(𝒊−𝟏): Frecuencia absoluta acumulada anterior a la clase que contiene el PK .
𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el PK
EJEMPLO:
La siguiente tabla representa la distribución de la edades de una muestra
de 50 trabajadores.
[Link]
Calcule el P68
𝑓𝑖
𝑭𝒊 ≥34
kn
𝟏𝟎𝟎
𝑷𝑲 c años
𝑓𝑖
Interprete: En la muestra el 68% de los trabajadores tienen una edad máxima de 39.3
años.
TÍTULO
EJEMPLO:
La siguiente tabla corresponde a la distribución de los sueldos semanales de los
trabajadores de la aseguradora Rímac Seguros.
[Link]
a) ¿Cuál es el sueldo máximo del 25% de los trabajadores que tienen los menores
sueldos?
b) Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores sueldos?
b) Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores sueldos?
P75
TÍTULO
𝟕𝟓𝒏 𝟕𝟓(𝟔𝟎𝟎)
= = 𝟒𝟓𝟎
𝟏𝟎𝟎 𝟏𝟎𝟎
Clase de 𝑷𝟕𝟓
𝑓𝑖 𝑭𝒊 ≥ 𝟒𝟓𝟎
485.9 soles
Interprete: El 25% de los trabajadores de la aseguradora Rímac Seguros que tienen los
mayores sueldos tienen un sueldo semanal mínimo de 485.9 soles.
b) Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores sueldos?
P75
𝟕𝟓𝒏 𝟕𝟓(𝟔𝟎𝟎)
= = 𝟒𝟓𝟎
𝟏𝟎𝟎 𝟏𝟎𝟎
Clase de 𝑷𝟕𝟓
𝑓𝑖
𝑭𝒊 ≥ 𝟒𝟓𝟎
485.9 soles
Interprete: El 25% de los trabajadores de la aseguradora Rímac Seguros que tienen
los mayores sueldos tienen un sueldo semanal mínimo de 485.9 soles.
TÍTULO
b) Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores sueldos?
P75
𝟕𝟓𝒏 𝟕𝟓(𝟔𝟎𝟎)
= = 𝟒𝟓𝟎
𝟏𝟎𝟎 𝟏𝟎𝟎
Clase de 𝑷𝟕𝟓
𝑓𝑖 𝑭𝒊 ≥ 𝟒𝟓𝟎
485.9 soles
Interprete: El 25% de los trabajadores de la aseguradora Rímac Seguros que
tienen los mayores sueldos tienen un sueldo semanal mínimo de 485.9 soles.
TÍTULODE CAJAS (BOX PLOT)
DIAGRAMA
Es un grafico representativo que permite visualizar tanto la dispersión como la forma
(simetría de los datos) de una variable y detectar valores atípicos (outliers). Asimismo,
es especialmente útil para comparar diferentes distribuciones de manera simultanea.
[Link] [Link]
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUÉ INDICA EL BOX PLOT?
Mientras más larga la caja y
los bigotes, más dispersa es
la distribución de datos.
La distancia entre las cinco
medidas descritas en el
boxplot (sin incluir la media
aritmética) puede variar.
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUE INDICA EL BOX PLOT?
Al igual que el histograma
y el gráfico de Tallos y CASO 1.- La línea que representa
Hojas permite tener una la mediana indica la simetría. Si
idea visual de la
está relativamente en el centro de
distribución de los datos
(simetría y variabilidad) la caja la distribución es simétrica.
CASO 2.- Si por el contrario se
acerca al tercer cuartil, la
distribución pudiera ser sesgada a
la izquierda (asimétrica negativa).
CASO 3.- Si por el contrario se
acerca al primer, la distribución
pudiera ser sesgada a la derecha
(asimétrica positiva).
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUÉ INDICA EL BOX PLOT?
La mediana puede
inclusive coincidir con los
cuartiles o con los límites
de los bigotes. Esto
sucede cuando se
concentran muchos datos
en un mismo punto.
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUE INDICA EL BOX PLOT?
Identifica con claridad y de
forma individual,
observaciones que se alejan
de manera poco usual del
resto de los datos. A estas
observaciones se les
conoce como valores
atípicos. outliers (valores
extremos).
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT
de las edades de 100 trabajadores
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT Tabla I. Distribución de
de las edades de 100 trabajadores frecuencias de la edad en
100 pacientes.
Nº de
Edad Fi
pacientes
18 1 1
19 3 4
20 4 8
21 7 15
22 5 20
Q1 = 23 8 28
24 10 38
25 8 46
Q2 = 26 9 55
27 6 61
28 6 67
29 4 71
30 3 74
Q3 = 31 4 78
32 5 83
33 3 86
34 2 88
35 3 91
36 1 92
37 2 94
Min. = 18 Máx. = 42 38
39
3
1
97
98
Q1 = 23; Mediana = Q2 = 26; Q3 = 31 41 1 99
100
42 1
TÍTULO
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT Máx.
de las edades de 100 trabajadores
Los valores para obtener el diagrama:
Min. = 18 Máx. = 42 Mediana = 26
Q1 = 23 ; Q3 = 31 ; RIC = Q3 - Q1 = 31 – 23 = 8
Q3
Calculando los extremos de los bigotes:
Extremo inferior = (Q1 – 1,5RIC) = 23 - 1,5(8) = 11 RIC
Q2 = Me
Extremo superior=(Q3 + 1,5RIC)= 31 + 1,5(8) = 43
Q1
Como los valores máximo y mínimo se encuentran
entre estos extremos, los bigotes se graficarán Mín.
hasta 18 y 42, no existiendo ningún valor atípico
(outlier)
APLIQUEMOS LO APRENDIDO
1)La siguiente tabla muestra el tiempo (en minutos) que demora
60 médicos de consulta externa en un centro hospitalario de
Trujillo (La Libertad).
Tiempo (minutos) 8- 13 14- 17 18- 21 22– 25
Numero de médicos 10 30 12 8
¿Qué medida de resumen se utilizará para determinar
que un medico se ubique en el 25% de los mas rápidos?
a. Calcular la media.
b. Calcular la mediana.
c. Determinar el cuartil 3.
d. Determinar el cuartil 1.
e. Faltan datos.
APLIQUEMOS LO APRENDIDO
TÍTULO
2)Con respecto al Gráfico de Cajas responda las siguientes preguntas:
¿Qué grupo tiene mayor mediana?.......................
¿Qué grupo presenta mayor dispersión?.............
¿Qué grupo es más simétrico?..............................
¿Qué grupo presenta valores discordantes?.........
APLIQUEMOS LO APRENDIDO
3)Una asociación recaba información sobre sueldos anuales iniciales de los recién
egresados de universidades de acuerdo con su especialidad. El salario anual inicial de los
administradores de empresas es S/. 39580. A continuación se presentan muestras de los
sueldos anuales iniciales de especialistas en marketing y en contabilidad(los datos están
en miles):
Egresados de marketing: 34.2; 45.0; 39.5; 28.4; 37.7; 35.8; 30.6; 35.2; 34.2; 42.4
Egresados de contabilidad: 33.5; 57.1; 49.7; 40.2; 44.2; 45.2; 47.8; 38.0; 53.9; 41.1;
41.7; 40.8; 55.5; 43.5; 49.1; 49.9
Realice una descripción comparativa usando las medidas de posición de tendencia no
central y el diagrama de box plot.
APLIQUEMOS LO APRENDIDO
4)Sobre las equivalencias que se presentan a continuación, indique cuales son
VERDADERAS y cuáles son FALSAS. Marque con un aspa la opción correcta.
APLIQUEMOS LO APRENDIDO
5)Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota
global de cada uno de los estudiantes que van a acudir a los exámenes de selectividad.
Las distribuciones de frecuencias son las siguientes:
[Link]
Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota global de
cada uno de los estudiantes que van a acudir a los exámenes de selectividad. Las distribuciones
de frecuencias son las siguientes: a) Calcule la nota máxima del 30% de los alumnos menos
aplicados
b) Calcule la nota mínima global del 10% de los alumnos más aplicados.
c) Calcule la nota máxima global del 20% de los alumnos menos aplicados
INTEGREMOS LO APRENDIDO
¿Qué es un decil?
¿Qué es un percentil?
¿Qué es un rango intercuartílico?
INTEGREMOS LO APRENDIDO
• ¿Qué es lo que más te ha gustado de la sesión
desarrollada?
• ¿Qué es lo que aún puedes mejorar para calcular
percentiles?
• ¿Cómo puedes aplicar lo aprendido en la sesión a tu
vida profesional?
[Link]
Actividad Asincrónica (virtual)
Resolver el cuestionario
virtual de la semana 5
SECCIÓN DE REFERENCIA
Referencias Bibliográficas
SECCIÓN DE REFERENCIA
MUCHAS GRACIAS