PORCENTILES
CONCEPTO DE PORCENTIL
Un percentil es una de las llamadas medidas de posición no central (cuartiles, deciles,
quintiles, percentiles, etc) que se puede describir como una forma de comparación de
resultados, por ello es un concepto ampliamente utilizado en campos como
la estadística o el análisis de datos. El percentil es un número de 0 a 100 que está muy
relacionado con el porcentaje pero que no es el porcentaje en sí. Para un conjunto de
datos, el percentil para un valor dado indica el porcentaje de datos que son igual o
menores que dicho valor; en otras palabras, nos dice dónde se posiciona una muestra
respecto al total.
El concepto es más sencillo de entender con unos ejemplos:
Ejemplo 1: Tenemos un conjunto de datos consistente en la nota de cada uno de
los alumnos de una clase. Si un alumno tiene un 9,5 y está en el P85 (percentil
85), significa que el 85% de los alumnos tiene un 9,5 o menos.
Ejemplo 2: Tenemos unas muestra con los sueldos de 10.000 trabajadores. ¿Cuál
sería el percentil 60? El P60 sería aquel sueldo por debajo del cuál estaría el 60%
de los trabajadores, es decir, si ordenamos los trabajadores desde el que cobra
menos hasta el cobra más, el P60 sería el sueldo del trabajador número 6.000
(60% de 10.000).
Ejemplo 3: Si medimos el tiempo que tarda cada uno de los atletas de una
competición en recorrer una cierta distancia. ¿Cuánto tiempo tardan en recorrer
esta distancia el 45% de los corredores? La respuesta es el percentil 45. La idea
es simple, encontrar un porcentaje a partir del cuál los valores son iguales o están
por debajo.
CÁLCULO DE PERCENTILES
Para calcular los percentiles de un conjunto de datos, primero se han de ordenar los
datos en orden ascendente. Una vez ordenados, un determinado percentil puede
encontrarse restando 0,5 a la posición del dato en la secuencia, dividiendo por el número
total de datos y multiplicando luego por 100.
Fórmula general para calcular percentiles
Siendo P el percentil, Xn la posición en la secuencia de la muestra X y N el número total
de datos.
Ejemplo: Tenemos 47 datos, el valor mínimo que encontramos entre todos los datos es
51 y el máximo es 99. Ordenamos los datos desde el que tiene valor 51 hasta el que
tiene valor 99. Si queremos saber el percentil al que pertenece el valor 63, miramos el
dato cuyo valor es 63, supongamos que su posición en la secuencia es 12. Para calcular
su percentil, restamos 12 menos 0,5, el resultado (11,5) lo dividimos entre 47 (el total de
datos); nos da 0,2446; multiplicamos por 100 y obtenemos 24,46: Este resultado indica
que el valor 63 se encuentra en el percentil 24,46, o lo que es lo mismo, que el 24,46%
de los datos tiene un valor de 63 o menos, o que el P24,46 es 63.
Este tipo de cálculos tiene numerosas aplicaciones en cualquier cálculo estadístico como
datos de empleo o el análisis de muestras. Por ejemplo, imagina que se está midiendo la
concentración de un determinado contaminante en el aire cuya concentración máxima
segura es de 3 ppm. Para ello se toman muchas muestras de aire y se va midiendo la
concentración de este contaminante. Imagina que los resultados concluyen que el 35%
de las muestras presentan una concentración de contaminante de 3 ppm o menos. Es
decir, el percentil 35 tiene concentraciones seguras y el percentil 65 tiene una
concentración superior a la segura. Este dato podría ser suficiente para recomendar a las
autoridades competentes que tomen medidas para su reducción.
LOS DECILES
Por su parte los Deciles constituyen otro tipo de Medidas de Posición, conformados por
ciertos valores que dividen la sucesión de datos que han sido ordenadas en diez
partes, que son equitativas porcentualmente hablando. Ellos se denotan de la siguiente
forma: D1, D2, D3….D9, aun cuando se leen “primer decil”, “cuarto decil”, etc. De
acuerdo a las fuentes estadísticas son utilizados sobre todo para calcular el
aprovechamiento académico.
Cómo calcular Deciles
Al igual que con los Cuartiles, los Deciles pueden ser calculados en base a si los datos se
encuentran no agrupados, o por el contrario sí lo están. De esta forma, se tendrían dos
formas de calcularlos:
Cálculo de Deciles de Datos no Agrupados
Si se tiene una serie de números o datos, correspondientes a distintos valores X1, X2…
Xn, se deberán usar las siguientes fórmulas, según si el valor es un número par o impar.
A continuación cada una de las ecuaciones a emplear de acuerdo al caso:
Si n (número que corresponde al número de datos) y es par se deberá emplear la
siguiente fórmula:
Si por el contrario n es impar, entonces se deberá aplicar la fórmula que se expresa a
continuación:
Es importante señalar que en todos los casos A corresponderá al Decil que se desea
calcular.
Cálculo de Datos Agrupados
Si por el contrario se trata de Datos Agrupados, la fórmula para calcular los
Deciles corresponderá a la siguiente:
En donde cada una de las variables corresponden a los siguientes valores:
Lk: límite real inferior a la clase correspondiente al decil k
n: será el número de datos
Fk: es equivalente a la frecuencia acumulada correspondiente a la clase que antecede a
la que corresponde al decil k
fk: por su parte esta variable corresponde a la frecuencia de la clase del decil k
c: longitud del intervalo correspondiente a la clase del decil k
PERCENTILES (CENTILES)
Se denomina Centil k o Percentil k la puntuación que deja por bajo
el k por ciento de las puntuaciones de una distribución. Los Centiles
son un caso particular de Cuantiles. Un Cuantil se define como una
puntuación que deja por bajo una proporción conocida (k) de
puntuaciones.
Ejemplo: Sea la siguiente distribución
La puntuación que deja por debajo el 25% de los datos es
(aproximadamente) igual a 10.
Cálculo
Si se desea un resultado más preciso se puede utilizar la siguiente
expresión: (datos agrupados en frecuencias):
Ejemplo
Obtención de P60 (datos ya ordenados):
Explicación:
1) En primer lugar hay que obtener la posición del Centil, para lo cual
hay que conocer la frecuencia acumulada por bajo del Centil, que en
el ejemplo es igual a 9.
2) Buscamos el valor que deja por bajo la frecuencia acumulada: Es
el 5 (límite inferior exacto 4.5)
3) Sustituir los símbolos de la fórmula y calcular.
PRINCIPALES CARACTERÍSTICAS
Las distancias entre Centiles, expresadas en términos de las
puntuaciones directas, NO son constantes, pero las áreas entre
Centiles sí lo son.
En distribuciones simétricas, las distancias entre Centiles son
menores en la parte central de la distribución que en los extremos.