Curso: Estadística Industrial
Semestre: Agosto – Diciembre de 2020
Introducción
La desviación estándar es la medida de dispersión más generalmente
utilizada, pero existen otras formas de describir la variación (dispersión)
de un conjunto de datos.
Un método consiste en determinar la ubicación de los valores que dividen
un conjunto de observaciones en partes iguales. Estas medidas incluyen
los cuartiles, deciles y percentiles.
Los cuartiles son los tres valores de la variable que dividen a un
conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3
determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos.
Utilizando cuartiles puede evaluar rápidamente la dispersión y la
tendencia central de un conjunto de datos, que son los pasos iniciales
importantes para comprender sus datos.
Dada un conjunto de datos ordenados en forma creciente, su
interpretación sería:
Primer cuartil Q1 : la mediana de la primera mitad de valores
Segundo cuartil Q2 : la propia mediana de la serie
Tercer cuartil Q3 : la mediana de la segunda mitad de valores.
Ejemplo de cálculo de cuartiles:
Ordenamos los datos de menor a mayor
Número impar de datos 2,5,3,6,7,4,9
Número par de datos 2,5,3,4,6,7,1,9
El Decil (Dn) es una medida estadística que se utiliza para indicar el valor por
debajo del cual se encuentra un determinado porcentaje de observaciones.
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales donde D5 coincide con la mediana.
Los deciles dan los valores correspondientes al 10%, 20%.....y al 90% de los datos.
Cada decil representa un 10% hasta llegar a 100% siendo 100% el total de las
muestras analizadas:
Decil 1 (D1): valor que es superior al del 10% de las muestras más bajas
Decil 2 (D2): valor que es superior al del 20% de las muestras más bajas
Decil 3 (D3): valor que es superior al del 30% de las muestras más bajas
Por ejemplo, supongamos que el decil 3 (D3) del peso de un varón de 15 años es 53
kg. Esto significa que hay un 30% de varones de 15 años que pesan menos de 53 kg y
un 70% que pesan más.
Deciles
Cálculo de los Deciles:
1. Agrupamos las muestras de menor a mayor valor
2. Calculamos la posición que ocupa el percentil buscado aplicando la siguiente fórmula:
x = (N · i) / 10 Siendo N el número total de muestras analizadas y la letra "i" el decil buscado
3. Si el resultado anterior (X) no tiene decimales, el decil se obtiene seleccionando el valor de la muestra
que ocupa la posición X.
[Link] el resultado (x) tiene decimales, el decil se obtiene haciendo la media de las muestras en posición X y
X+1:
Ejemplo 1: Calcular el decil 6 (D6) de las siguientes muestras de notas en matemáticas de un aula (notas
de 0 a 20):16,10,12,8,15,18,20,9,11,1,13,17,9,10,14
Ordenamos de menor a mayor:1,8,9,9,10,10,11,12,13,14,15,16,17,18,20
N = número de muestras = 15 muestras
x = (N · i) / 10 = (15 · 6) / 10 = 9 (posición)
Como x = 9 es un número sin decimales, entonces el decil 6 es el valor de la muestra que ocupa la posición 9
D6 (decil 6) = 13
Deciles
Ejemplo 2: En un examen muy difícil de universidad, se obliga al
profesor a aprobar al menos al 10%. Calcular la nota a partir de la cual
está obligado a aprobar siendo las notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7,
2,1,4,0,3,9,2,0,0,4,8,1,0,9,4
Necesitamos calcular el decil 9 (D9) ya que nos interesa calcular el
valor a partir del cual solo hay un 10% con mejores notas
Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7,
8, 9,9
N = número de muestras = 21 muestras
Dk = (K · N) / 10 = (9·21) / 10 = 18.9
Como x = 18.9 es un número con decimales, entonces el decil 9 es la
media de los valores que ocupan la posición 18 y 19
D9 (decil 9) = (7 + 8) / 2 = 7.5
Percentiles
Son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores
correspondientes al 1%,al 2%...y al 99% de los datos. P50 coincide con la mediana.
Ejercicio 3: Un experimento medido en grados centígrados arroja los siguientes resultados, hallarlos
percentiles 18 y 70: 28,31,28,30,28,27,30,32,35,26,25,29,26,28,25,31,31,32,27,30,31,31,25,28
1. Se ordenan los datos de menor a mayor:
25,25,25,26,26,27,27,28,28,28,28,28,29,30,30,30,31,31,31,31,31, 32,32,35
2. Se aplica la siguiente fórmula para calcular la posición respectiva: K. N/100 (K= percentil, N= totalde
datos)
Percentil 18: 18x24/100= 4.32
Como la posición 4.32 no coincide con un dato exacto de la distribución se calcula el valor encontrado
entre los dos números donde corresponde dicha posición, en este caso 4.32 se halla entre las posiciones
4 y 5, es decir entre 26 y 26 por lo tanto calculando una interpolación entre ambos valores el percentil 18
es igual a 26
Percentil 70: 70x24/100 = 16.8
Como la posición 16.8 no coincide con un dato exacto de la distribución se calcula el valor encontrado
entre los dos números donde corresponde dicha posición, en este caso 16.8 se halla entre las posiciones
16 y 17, es decir entre 30 y 31 por lo tanto calculando una interpolación entre ambos valores el percentil
70 es igual a 30.8
Curso: Estadística Industrial
Semestre: Agosto – Diciembre de 2020
Curtosis
• La curtosis de una variable estadística/aleatoria es una característica
de forma de su distribución de frecuencias/probabilidad.
• Según su concepción clásica, una curtosis grande implica una mayor
concentración de valores de la variable tanto muy cerca de la media
de la distribución (pico) como muy lejos de ella (colas), al tiempo que
existe una relativamente menor frecuencia de valores intermedios.
• Esto explica una forma de la distribución de frecuencias/probabilidad
con colas más gruesas, con un centro más apuntado y una menor
proporción de valores intermedios entre el pico y colas.
• Una mayor curtosis no implica una mayor varianza, ni viceversa.
Curtosis
Un coeficiente de apuntamiento o de curtosis es el cuarto
momento con respecto a la media estandarizado que se
define como:
Donde:
g2 = Coeficiente de curtosis
N= Número de datos
Xi = Cada uno de los datos de la distribución
X= Media aritmética
σ = Desviación típica de la distribución
Curtosis
Una vez tenemos esta tabla hecha, simplemente tendríamos que aplicar la fórmula expuesta con anterioridad.
g2 = 1,518.27/13*(2,43)^4 = 3.34
En este caso dado que g2 es mayor que 3, la distribución sería leptocúrtica, presentando un mayor apuntamiento que la
distribución normal.
Exceso de curtosis
En algunos casos se presenta como exceso de curtosis. En este caso esta se compara directamente con la de la
distribución normal. Dado que la distribución normal, tiene curtosis 3, para obtener el exceso, solo habría restarle 3 a
nuestro resultado.
Exceso de curtosis = g2-3 = 3.34-3 = 0.34
La interpretación del resultado en este caso, sería la siguiente:
g2-3 > 0 -> distribución leptocúrtica.
g2-3 = 0 -> distribución mesocúrtica (o normal).
g2-3 < 0 -> distribución platicúrtica.
MEDIDAS DE APUNTAMIENTO O CURTOSIS
Ejercicio 4:
Supongamos que queremos calcular la curtosis de la siguiente distribución:
8,5,9,10,12,7,2,6,8,9,10,7,7.
Primero calculamos la media aritmética (µ), que sería 7.69.
A continuación,calculamos la desviación típica,que sería 2.43.
Tras tener estos datos y para comodidad en el cálculo, se puede realizar una tabla
para calcular la parte del numerador (cuarto momento de la distribución). Para el
primer cálculo sería: (Xi-µ)^4 = (8-7.69)^4 = 0.009
DATOS (Xi – μ)4
8 0.0090
5 52.5411
9 2.9243
10 28.3604
12 344.3330
7 0.2297
2 1049.9134
6 8.2020
8 0.0090
9 2.9243
10 28.3604
7 0.2297
7 0.2297
N = 13 ∑ 1,518.27
TIPOS DE ASIMETRÍAS
PAÍS HOMBRES MUJERES
Austria 4.2 5.2
Alemania 10.2 9.4 Ejercicio práctico:
Bélgica 7.4 9.3
Bulgaria 8.6 9.3
República Checa 5.8 8.8
La tasa de desempleo en Europa se determinó en 6.6%
Chipre 4.0 5.4 para los hombres y en un 8.0% para las mujeres. Para
Dinamarca 3.3 4.5 analizar más a detalle estos resultados, con la información
Eslovaquia 12.3 14.7
Eslovenia 4.9 7.2
que a continuación se proporciona realice lo siguiente:
España 6.3 11.6 Para los hombres:
Estonia 6.2 5.6 a) Calcule todos los cuartiles, los deciles cuarto y sexto, y
Finlandia 7.4 8.1
Francia 8.7 10.4
los percentiles 30, 65 y 85
Gran Bretaña 5.7 4.9 b) Analice las posiciones de Polonia, Holanda y España
Grecia 5.6 13.6
Holanda 3.5 4.4
Hungría 7.2 7.8
Irlanda 4.6 4.1
Italia 5.4 8.8
Letonia 7.4 6.2
Lituania 5.8 5.4
Luxemburgo 3.5 6.2
Malta 6.5 8.9
Polonia 13.0 14.9
Portugal 6.5 9.0
Rumania 8.2 6.1
Suecia 6.9 7.2
Resultados de Ejercicio práctico: PAÍS
TASA DE
DESEMPLEO
HOMBRES
A) ANÁLISIS DE LA TASA DESEMPLEO EN LOS Dinamarca 3.3
HOMBRES Holanda 3.5
Luxemburgo 3.5
Q1 – 4.9 25% Chipre 4
Q2 – 6.3 Austria 4.2
Irlanda 4.6
Q3 - 7.4 Eslovenia 4.9 Q1
D4 – 5.8 Italia 5.4
Grecia 5.6
D6 – 6.82 Gran Bretaña 5.7
P30 – 5.48
25% República Checa 5.8
P65 – 7.24 Lituania 5.8
P85 – 8.68 Estonia 6.2
España 6.3 Q2
Malta 6.5
ASIMETRÍA = 1.03, DISTRIBUCIÓN ASIMÉTRICA CON SESGO
Portugal 6.5
POSITIVO, LA MAYOR CANTIDAD DE LOS DATOS SE Suecia 6.9
ENCUENTRA ENTRE EL PRIMER 50 % DE LA DISTRIBUCIÓN 25% Hungría 7.2
Bélgica 7.4
DE LOS DATOS ORDENADOS DE MENOR A MAYOR. Finlandia 7.4
Letonia 7.4 Q3
Rumania 8.2
CURTOSIS = 1.19, TIPO LEPTOCÚRTICA, MUCHOS DE LOS Bulgaria 8.6
DATOS SE CONCENTRAN ALREDEDOR DE LA MEDIA DE LOS 25%
Francia 8.7
Alemania 10.2
DATOS. Eslovaquia 12.3
Polonia 13
PROMEDIO 6.6
• Calcular los cuartiles, la Curtosis y la asimetría de las tasas
de desempleo de las mujeres
• Interpretar los resultados