Medidas de Posición
Clase #11
Docente: Msc. Adela A. Pérez Carreño
Jefe de práctica: Lic. John E. Huanca Miranda
Medidas de posición
Medidas de Medidas de
Tendencia Tendencia no
Central Central
Las medidas de tendencia no central son aquellas que
tienden a ocupar posiciones no centrales en el conjunto de
datos ordenado. Entre estas tenemos:
* Cuartiles
* Deciles
* Percentiles
Cuartiles (Qk)
Los cuartiles son tres valores (Qk; k = 1, 2, 3) que dividen al conjunto de datos
en cuatro partes iguales. Estos son: El cuartil 1 (Q1) , El cuartil 2 (Q2) , El cuartil
3 (Q3)
Q2
Cuartiles (Qk)
El cuartil 1 (Q1) divide al conjunto de datos en dos partes, el 25%
de los datos son menores (menores o iguales) que el cuartil 1 y el
75% de los datos son mayores (mayores o iguales) que el cuartil 1.
El cuartil 2 (Q2) divide al conjunto de datos en dos partes, el 50%
de los datos son menores (menores o iguales) que el cuartil 2 y el
50% de los datos son mayores (mayores o iguales) que el cuartil 2.
El cuartil 3 (Q3) divide al conjunto de datos en dos partes, el 75%
de los datos son menores (menores o iguales) que el cuartil 3 y el
25% de los datos son mayores (mayores o iguales) que el cuartil 3.
Deciles (Dk)
Los deciles son nueve valores (Dk; k = 1, 2, …, 9) que
dividen al conjunto de datos en diez partes iguales.
Ejemplo:
el decil 5 (D5) divide al conjunto de datos en dos partes, el
50% de los datos son menores o iguales que el decil 5 y el
50% de los datos son mayores o iguales que el decil 5.
Percentiles (Pk)
Los percentiles son noventa y nueve valores (Pk; k = 1, 2,…, 99) que
dividen al conjunto de datos en cien partes iguales.
Por ejemplo, el percentil 50 (P50) divide al conjunto de datos en dos
partes, el 50% de los datos son menores o iguales que el percentil 50 y
el 50% de los datos son mayores o iguales que el percentil 50.
Gráficamente:
NOTA: Algunas de las Medidas de Posición coinciden, de
acuerdo al cuadro siguiente:
PERCENTIL DECIL CUARTIL
P10 D1
P20 D2
P25 Q1
P30 D3
P40 D4
P50 D5 Q2
P60 D6
P70 D7
P75 Q3
P80 D8
P90 D9
OBSERVACIÓN:
Los valores del percentil 50 (P50), decil 5 (D5) y cuartil 2 (Q2) son iguales;
y, a su vez, son iguales al valor de la mediana (Me).
Cálculo de percentiles para datos no agrupados
1. Ordenar los datos en forma ascendente.
2. Hallar la posición del percentil buscado con : j = k (n + 1)
100
3. Calcular el percentil de la siguiente forma:
𝑃𝑘 = 𝑋𝑗 + 𝐷𝑒𝑐 𝑋𝑗+1 − 𝑋𝑗
donde:
𝑋𝑗 : Dato del j – ésimo orden
𝑋𝑗+1 : Dato del j+1 – ésimo orden
Dec: Parte decimal de j
Ejemplo 1
Hallar el percentiles 20 .
• A= 3, 5, 2, 7, 6, 4, 9.
Entonces K = 20 y n = 7
1. Ordenar los datos en forma ascendente.
A= 2, 3,4,5, 6, 7, 9
2. Hallar la posición del percentil buscado con :
Ejemplo 2.
El siguiente diagrama de tallo y hojas presenta los gastos de exportación (en
miles de cientos de nuevos soles) de medicinas.
Tallo y hojas del Gasto de exportación
Unidad de hoja = 1
a) A las empresas con gastos de exportación que se encuentran en el tercio superior se
les aplica un impuesto, calcule el gasto mínimo para que a una empresa se le aplique
el impuesto.
b) Cuando el valor del gasto de exportación es por lo menos el segundo decil y a lo más el
octavo decil se considera que el gasto está bajo control, calcule los límites para que el
gasto reciba esta denominación.
Cálculo de percentiles para datos no agrupados
j= 20(7+1)/100 = 1.6
3. Calcular el percentil de la siguiente forma:
Datos
Xj = 3
Xj+1= 4
Dec= 0.6
P20 = 3 +0.6(4-3)
P20 = 3.6 A= 3, 5, 2, 7, 6, 4, 9.
Solución: Tercio inferior Tercio superior
a) Se calcula el P67: P33 P67
k ( n + 1) 67(41)
Se halla la ubicación del percentil 67: j= = = 27.47
100 100
Tallo Hojas Datos: n = 40, k = 67, Dec = 0.47
1 0 4
3 1 02 𝑋𝑗 = 30, 𝑋𝑗+1 = 31
8 1 57889
16 2 01123344 𝑃𝑘 = 𝑋𝑗 + 𝐷𝑒𝑐 𝑋𝑗+1 − 𝑋𝑗
(10) 2 5567788899
14 3 01111334
𝑃67 = 30 + 0.47(31 − 30)
6 3 5679
𝑃67 = 30.47
2 4 1
1 4 6
Tallo Hojas
b) Se calcula el P20 y P80: 1 0 4
Se halla la ubicación del percentil 20: 3 1 02
8 1 57889
k ( n + 1) 20(41) 16 2 01123344
j= = = 8.2 (10) 2 5567788899
100 100 14 3 01111334
6 3 5679
Datos: n = 40, k = 20, Dec = 0.2 2 4 1
𝑋𝑗 = 19, 𝑋𝑗+1 = 20 1 4 6
P20 = 19 + 0.2(20 − 19) P80 = 33 + 0.8(33 − 33)
P20 = 19.2 P80 = 33
Se halla la ubicación del percentil 80:
80(41)
j= = 32.8 Para que el gasto se encuentre
100 bajo control, estos se deben
encontrar entre 19.2 y 33 mil
Datos: n = 40, k = 80, Dec = 0.8
cientos de nuevos soles.
𝑋𝑗 = 33, 𝑋𝑗+1 = 33
Cálculo de percentiles para datos agrupados
Cuando los datos se encuentran agrupados en una tabla de
frecuencias por intervalos, la fórmula para el cálculo de
percentiles es la siguiente:
donde:
Linf = Límite inferior del intervalo donde se encuentra el percentil.
c = Amplitud del intervalo.
Fi-1 = Frecuencia absoluta acumulada del intervalo anterior donde se
encuentra el percentil.
fi = Frecuencia absoluta (simple) del intervalo donde se encuentra el percentil.
𝒌𝒏
= Posición que ocupa el percentil en el conjunto de datos.
𝟏𝟎𝟎
Cuantiles para datos agrupados
Si tenemos n datos agrupados en clases
y queremos determinar el valor de los
cuartiles (Qi); deciles (Di) y centiles (Pi):
donde:
k : Cuantil buscado
Li : Límite inferior de la clase cuantil.
fi : Frecuencia absoluta de la clase cuantil.
Fi : Frecuencia acumulada de la clase que
precede a la clase del cuantil.
A : Amplitud de clase.
n : Número de datos.
Kn/4, kn/10 y kn/100 = Posición que ocupa el
percentil en el conjunto de datos.
Ejemplo 3
El jefe del área de recursos humanos de una
empresa decide mandar a capacitar y evaluar
a sus empleados con la finalidad de ascender
a aquellos que obtengan las más altas
calificaciones; quienes asciendan ocuparán
puestos de supervisores. Los resultados
obtenidos después de la aplicación del
examen se muestran a continuación:
a) El jefe espera que por lo menos el 55% de los empleados obtenga una
calificación por encima del promedio, ¿se cumplió con el objetivo? Justifique.
b) El jefe considera que los empleados cuyas calificaciones se encuentren en el
70% central pertenezcan al “segundo grupo” y sigan con sus labores
normales; mientras que, aquellos cuyas calificaciones son mayores a la de
este grupo pertenecerán al “primer grupo” y pasarán a ser supervisores;
finalmente, aquellos que obtuvieron calificaciones menores que el segundo
grupo recibirán una nueva capacitación y formarán parte del “tercer grupo”.
Calcule los límites para cada uno de los grupos.
Solución
Sea la variable: X = Calificación de los empleados.
Marcas de N° de
Calificaciones clases empleados xifi
xi fi
[0, 4> 2 2 4
[4, 8> 6 4 24
[8, 12> 10 12 120
[12, 16> 14 22 308
[16, 20] 18 10 180
Total 50 636
a) Calculo del promedio:
k
X f
i i
636
X= i =1
= = 12.72
n 50
Se calcula el P45:
Calificaciones fi Fi
El 55% de los empleados
[0 4> 2 2
[4 8> 4 6
[8 12> 12 18
P45 [12 16> 22 40
[16 20] 10 50
Total 50
Datos:
𝒌𝒏 𝟓𝟎(𝟒𝟓)
= = 𝟐𝟐. 𝟓 < 𝑭𝒊 = 𝑭𝟒 = 𝟒𝟎, 𝑳𝒊𝒏𝒇 = 𝟏𝟐, 𝒄 = 𝟒, 𝒇𝒊 = 𝟐𝟐, 𝑭𝒊−𝟏 = 𝟏𝟖
𝟏𝟎𝟎 𝟏𝟎𝟎
nk
100 − Fi −1
22.5 − 18
P45 = Linf + c = 12 + 4 = 12.818
fi 22
Según los resultados, por lo menos el 55% de los empleados obtuvo una
calificación mayor del promedio (P45 = 12.818 > 𝑥ҧ = 12.72). Por lo tanto, se
cumplió con el objetivo.
b) Se calcula el P15 y P85: Calificaciones fi Fi
[0 – 4 > 2 2
3° grupo 70% central (2° grupo) 1° grupo
[4 – 8 > 4 6
[8 – 12> 12 18
[12 – 16 > 22 40
[16 – 20 ] 10 50
P15 P85
Total 50
Datos: Datos:
𝑘𝑛 50(15) 𝑘𝑛 50(85)
= = 7.5 < 𝐹𝑖 = 𝐹3 = 18, = = 42.5 < 𝐹𝑖 = 𝐹5 = 50,
100 100 100 100
𝐿𝑖𝑛𝑓 = 8, 𝑐 = 4, 𝑓𝑖 = 12, 𝐹𝑖−1 =6 𝐿𝑖𝑛𝑓 = 16, 𝑐 = 4, 𝑓𝑖 = 10, 𝐹𝑖−1 =40
7.5 − 6 42.5 − 40
P15 = 8 + 4 = 8.5 P85 = 16 + 4 = 17
12 10
1° grupo: Menos de 8.5: Reciben nueva capacitación.
2° grupo: De 8.5 a 17: Siguen con labores normales.
3° grupo: Más de 17: Pasan a ser supervisores.
Diagrama de cajas
❖Es una representación gráfica que se construye en base a la mediana y
los cuartiles Q1 y Q3.
❖Se traza un rectángulo con los extremos correspondientes al primer y
tercer cuartil.
❖Dentro de la caja se traza una línea horizontal en el lugar de la mediana.
❖Se ubican los límites mediante el rango intercuartil: RI = Q3 – Q1
• Límite inferior : LI = Q1 – 1.5 RI
• Límite superior: LS = Q3 + 1.5 RI
❖Se trazan líneas verticales desde los extremos de la caja hasta el valor
máximo y mínimo dentro de los límites (bigotes de la caja).
❖Se marcan con asterisco (*) las localizaciones de los valores atípicos
(outliers).
Diagrama de cajas y
bigotes
Las líneas antes y después de las cajas se llaman
bigotes, se traza desde los extremos de la caja hasta
el mínimo y máximo dentro de los límites inferior y
superior.
Se marcan con un asterisco los valores fuera de los
límites (valores atípicos).
Ejemplo aplicativo
Una academia, ha evaluado el rendimiento de
15 de sus estudiantes en tres sedes. Con los
puntajes alcanzados por los empleados se
obtiene la siguiente gráfica. Responda:
¿En cuál de las tres sedes se obtuvo puntajes
más homogéneos?, justifique.
En la sede 2, comparando los rangos y
observando el tamaño de las cajas.
Para la sede 2, ¿Qué tipo de asimetría tiene en
el 50% central de las puntuaciones?
Tiene asimetría positiva
¿Cómo se llaman los valores que están representados por los asteriscos?
Valores atípicos o outliers.
Para la sede 2, ¿por qué el bigote es más largo en el 25% inferior en comparación con el 25%
superior?
Porque existe mayor variabilidad.
¿Es posible que el puntaje promedio de los empleados de la sede 3 sea 70 puntos? Justifique.
No, porque presenta asimetría positiva y en este caso el promedio es mayor que la mediana que
es aproximadamente 75 puntos.
Ejemplo 4
El diagrama de caja muestra:
La puntuación mediana es de
12,95.
El rango intercuartílico esta entre
Q1 = 10,575 a Q3 = 17,24.
No hay valores atípicos.
El rango de los datos están entre
el valor Mínimo = 7,03 y
Máximo=22,5.
El hecho de que el área mas
grande de la caja estén por
encima de la Mediana indica que
los datos tienen un sesgo
ligeramente positivo. Esto es, la
cola derecha de la distribución es
más larga que la cola izquierda.
RANGO INTERCUARTIL
Se define la medida de dispersión al
Rango intercuartil como la diferencia
entre el tercer cuartil y el primer
cuartil en una serie de datos, es
decir, es el rango del 50% de los Rango intercuartil = RIC = Q3 – Q1
datos centrales:
bigote
EJEMPLO 04:
N° Curso Faltas de Alumnos 21 Diseños experimentales 2 31
1 Matemática 1 42 22 Contabilidad 186
23 Teoría de decisiones 0
2 Dibujo técnico 1 44
24 Introducción a la ingeniería 180
3 Dibujo técnico 2 159 25 Estudios de mercados 50
4 Estadística 402
26 Muestreo 116
5 Contabilidad 97
27 Gestión de la calidad 58
6 Economía 40 28 Tesis 2 720
7 Métodos Estadísticos 288 Metodología de la
8 Proceso estocásticos 73 29 investigación 341
9 Estructuras 29 30 Ciencia de los datos 23
10 Estructura de datos 10 Minería y explotación de la
31 información 81
11 Física 2 140
32 Electivo 1 660
12 Resistencia de materiales 30 33 Electivo 2 188
13 Electricidad 86
34 Demografía 274
14 Termodinamica 142
35 Probabilidades 65
15 Biología 247
16 Química 11 36 Inferencia estadística 424
17 Geoestadística 6 37 Practicas pre profesionales 24
18 Probabilidades 20 38 Matemática 2 179
19 Leguaje 524 39 Métodos numéricos 152
20 Tesis 568 40 Matemática 4 30
EJEMPLO 5:
Los siguientes son tiempos de hospitalización en días de una muestra de 10 pacientes. 5, 7, 6, 4,
5, 7, 8, 5, 3, 5
Calcular e interpretar la desviación cuartil.
Solución:
Ordenando los datos: Tiempo de hospitalización 3 4 5 5 5 5 6 7 7 8
Ubicación del valor x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Q1 =P25 : j= 25(10+1)/100=2.75 Q3=P75: j= 75(10+1)/100 =8.25
P25 = x2 + 0.75(x3-x2) P75 = x8 + 0.25(x9-x8)
Q1 =P25= 4+0.75(5-4)=4.75 Q3=P75= 7 + 0.25(7-7)= 7
Luego : Q = (7-4.75)/2 =1.125 días.
Como la Me=5 días, los resultados se expresarían como: ( 5 ± 1.125) días, lo que implicaría que entre 3.875
y 6.125 días habría permanecido hospitalizado aproximadamente el 50% de los pacientes centrales
28
MEDIDAS DE ASIMETÍA
Se dice que una distribución de medidas es simétrica cuando valores de la variable
equidistantes, a uno y otro lado, del valor central tienen la misma frecuencia. García
J. (2011)
Tipos de Asimetría
X̅ > Me > Mo
X̅ = Me = Mo X̅ < Me < Mo
- Figura (a). Distribución con asimetría hacia la derecha,
positiva.
- Figura (b). Distribución Simetría.
- Figura (c). Distribución con asimetría hacia la izquierda,
negativa.
Moda Media Media
Mediana Media Moda
Moda
Mediana
Mediana
Coeficiente de Asimetría de FISHER
Para datos sin agrupar se Para datos agrupados en tablas de
emplea la siguiente frecuencias se emplea la siguiente
fórmula: fórmula:
𝒏 𝑛
ഥ
𝒙𝒊 − 𝒙 𝟑 𝑓𝑖 (𝑥𝑖 − 𝑥ҧ )3
𝑨𝒔 = 𝐴𝑠 =
𝒏 ∗ 𝑺𝟑 𝑛 ∗ 𝑆3
𝒊=𝟏 𝑖=1
Donde: Interpretación:
𝑨𝒔 = Representa el coeficiente de asimetría. • Si 𝑨𝒔 > 0: asimétrica positiva
xi = cada uno de los valores, • Si 𝑨𝒔 = 0: simétrica
X̅ = la media aritmética de la muestra, • Si 𝑨𝒔 < 0: asimétrica negativa
fi =la frecuencia de cada valor
n =el numero total de valores y
s =la deviación estándar
Curtosis
Se entiende por curtosis (K), al grado de deformación vertical de
una distribución normal o aproximadamente normal. La
distribución se mide en comparación con la curva normal o
mesocúrtica.
Fórmula de la Curtosis (K)
K: Coeficiente de curtosis
Q1: Cuartil 1
Q3: Cuartil 3
P10: Percentil 10
P90: Percentil 90
Interpretación
La curva de distribución es Leptocúrtica. Los datos se concentran
Si K > 0,263
más en la parte central que en las colas.
Si K = 0,263 La curva de distribución es Mesocúrtica o Normal
La curva de distribución es Platicúrtica. Los datos están más
Si K < 0,263
dispersos.
Solución
Usando Excel
De forma Manual
Promedio 168.50
Mediana 91.5
Desv.Estand
1. ar 187.947
Suma(xi-promedio)^3 383262528
n*s^3 265560733.6
2.
As 1.44
3. Suma(xi-promedio)^4 2.07841E+11
n*s^4 49911254121
K 4.16
4. Calculando el coeficiente de A. FISHER, utilizando;
5. Calculando el coeficiente K de FISHER, utilizando;
6. Representación Gráfica; 7. Interpretación;
• Si As > 0: la distribución es asimétrica Positiva.
Por lo tanto;
Las faltas de los estudiantes a los cursos presenta una asimetría
positiva, es decir existe variabilidad por encima de la mediana.
Las faltas de los estudiantes presentan una forma leptocúrtica,
es decir los datos están concentrados en la media
¡Gracias!