ESTADÍSTICA APLICADA
Clase 9
Dr. Roberto Volfovicz-Leon
([Link]@[Link])
2023
Menú del Día
• Medidas de la Forma de la Distribución (Ap:
Coeficiente de Asimetría de Pearson)
• Medidas de la Posición Relativa (Valores
Dr. Roberto Volfovicz-Leon 2023
Estandarizados Z)
• Detección de Observaciones Atípicas por el
criterio Z
2
Medidas de la Forma de la
Distribución
Dr. Roberto Volfovicz-Leon 2023
(Ap: Coeficiente de Asimetría
de Pearson )
3
Medidas de la Forma de la
Distribución
• En clase previas hemos descrito medidas de
posición y de dispersión de los datos
• Además de esas medidas veremos una
medida de la forma de la distribución.
Dr. Roberto Volfovicz-Leon 2023
• En la Clase 3 vimos que un histograma es una
representación gráfica que muestra la forma
de una distribución de datos de una variable
cuantitativa.
• Una medida numérica importante de la forma 4
de una distribución es el sesgo o simetría.
Coeficiente de Asimetría (Sesgo)
• Esta medida indica cómo se distribuye la
variable de estudio en torno a un eje de
simetría que pasa por el promedio de la
distribución
Dr. Roberto Volfovicz-Leon 2023
• La media, la mediana y la moda (en caso de
ser única) coinciden en toda distribución
simétrica
• A medida que la distribución se vuelve
asimétrica, la media, mediana y moda
difieren de acuerdo a las pautas que se
5
muestran a continuación.
Asimetría de la Distribución de una Variable
Asimetría Negativa Asimetría Positiva
(izquierda) (derecha)
Asimetría negativa (o a la izquierda)
Dr. Roberto Volfovicz-Leon 2023
• Se dice que una distribución tiene asimetría negativa o a la izquierda si existen
muchos valores pequeños con frecuencias bajas.
• Describimos la asimetría negativa (o a la izquierda) si la "cola" izquierda de la
distribución es más larga que la derecha.
• Esto significa que los datos están mas concentrados en los valores altos de la
variable
Asimetría positiva (o a la derecha)
• Se dice que una distribución tiene asimetría positiva o a la derecha si existen
muchos valores altos con frecuencias bajas.
6
• La "cola" derecha de la distribución es más larga que la izquierda
• Los datos están mas concentrados en los valores bajos de la variable
Indicador de Asimetría: Coeficiente de Asimetría
de Pearson
Existen varios indicadores de asimetría, en el curso veremos el
coeficiente de Asimetría de Pearson: AP
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟
Dr. Roberto Volfovicz-Leon 2023
• Ap está generalmente acotado entre -3 y +3
El signo y el valor indican la dirección y magnitud de la asimetría:
• Si Ap ≈ 0 entonces la variable en estudio tiene una distribución
simétrica
• Si Ap > 0 entonces la distribución presenta asimetría positiva o
derecha (desplazada hacia la derecha).Si Ap tiende a +3,
entonces presenta fuerte asimetría positiva
• Si Ap < 0 entonces la distribución presenta asimetría negativa o 7
izquierda (desplazada hacia la izquierda). Si Ap tiende a - 3,
entonces presenta fuerte asimetría negativa
Relación entre el Coeficiente de Asimetría (Ap),
la forma de la Distribución
y el Diagrama de Caja
Ap < 0 Ap = 0 Ap > 0
Dr. Roberto Volfovicz-Leon 2023
Asimetría Negativa Simetría Asimetría Positiva
(Izquierda) (Derecha) 8
Ejemplo 1
La siguiente tabla describe el número de personas según sus
edades para una muestra de jóvenes de una localidad del país:
Intervalo de Número de
Edades (años) personas
[10 12) 4
[12 14) 21
[14 16) 14
Dr. Roberto Volfovicz-Leon 2023
[16 18) 12
[18 20) 3
1. Complete la tabla de distribución de frecuencias incluyendo:
marcas de clase (Mi), frecuencias absolutas (ni), frecuencias
relativas (fi) , frecuencia relativas acumuladas (Fi) y densidad
empírica (hi).
2. Realice un Histograma y comente en cuanto a su simetría.
9
3. Determine la clase modal, media, mediana y el desvió estándar
4. Calcule y comente el coeficiente de asimetría de Pearson (AP)
Ejemplo 1 - Respuesta
La siguiente tabla describe el número de personas según sus edades para una
muestra de jóvenes de una localidad del país:
1. Complete la tabla de distribución de frecuencias incluyendo: marcas de
Dr. Roberto Volfovicz-Leon 2023
clase (Mi), frecuencias absolutas (ni), frecuencias relativas (fi) , frecuencia
relativas acumuladas (Fi) y densidad empírica (hi):
Intervalo de Mi ni fi Fi hi
Edades (años)
[10 12)
[12 14)
[14 16)
[16 18)
[18 20) 10
TOTAL
Ejemplo 1 - Respuesta
La siguiente tabla describe el número de personas según sus edades para una
muestra de jóvenes de una localidad del país:
1. Complete la tabla de distribución de frecuencias incluyendo: marcas de
Dr. Roberto Volfovicz-Leon 2023
clase (Mi), frecuencias absolutas (ni), frecuencias relativas (fi) , frecuencia
relativas acumuladas (Fi) y densidad empírica (hi):
Intervalo de Mi ni fi Fi hi
Edades (años)
[10 12) 11 4 4/54 = 0,074 0,074 0,074/2=0,037
[12 14) 13 21 21/54= 0,389 0,463 0,389/2=0,1945
[14 16) 15 14 14/54= 0,259 0,722 0,259/2=0,1295
[16 18) 17 12 12/54= 0,222 0,944 0,222/2=0,111
[18 20) 19 3 3/54= 0,056 1,000 0,056/2=0,028 11
TOTAL 54 1,000
Ejemplo 1 - Respuesta
2. Realice un Histograma y comente en cuanto a su simetría.
0,25 Histograma: Distribución de jóvenes según edad
0,2
0,15
Densidad
Empirica 0,1
Dr. Roberto Volfovicz-Leon 2023
0,05
0
[10 ,12) [12 ,14) [14 ,16) [16 ,18) [18 ,20)
Edades
Fuente: elaboración propia.
Comentarios:
• A partir del histograma podemos observar que la distribución de edades
de los jóvenes de esta muestra presenta una asimetría de tipo positiva o
derecha.
12
• La "cola" derecha de la distribución es más larga que la izquierda.
• Las edades de los jóvenes de esta muestra se concentran en las
categorías de edades mas bajas.
Ejemplo 1 - Respuesta
3. Determine la clase modal, media, mediana y el desvió estándar
Dr. Roberto Volfovicz-Leon 2023
• Clase Modal: [12 , 14) años.
(Se trata del intervalo con mayor densidad empírica hi)
• Media: 𝑿 = 14,59 años (obtenida con calculadora)
𝟎,𝟓𝟎 −𝟎,𝟒𝟔𝟑
• Mediana = 14 + ∙ (𝟏𝟔 − 𝟏𝟒) = 14,28 años
𝟎,𝟐𝟓𝟗
13
• Desvió Estándar = 2,10 años (obtenido con calculadora)
Ejemplo 1 - Respuesta
4. Calcule y comente el coeficiente de asimetría de Pearson (Ap)
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟
Donde: Media: 𝑋 = 14,59 años
0,50 −0,463
Mediana = 14 + ∙ (14 − 12) = 14,28 años
0,259
Dr. Roberto Volfovicz-Leon 2023
Desvió Estándar = 2,10 años (obtenido con calculadora)
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟
(14,59 −14,28)
𝐴𝑝 = 3 ∙ = 0,443
2,10
Comentarios:
• Dado que A𝒑 > 0, concluimos que la distribución de las edades de esta muestra
de jóvenes presenta una asimetría de tipo positivo. 14
• Los jóvenes de la muestra se concentran en las categorías de edades mas
bajas.
Medidas de la Posición
Dr. Roberto Volfovicz-Leon 2023
Relativa
(Valores Estandarizados Z)
15
Valor Estandarizado: Puntos Z
• Además de las medidas de posición, variabilidad y
simetría, interesa conocer también la ubicación
relativa de los valores de un conjunto de datos.
• Las medidas de localización relativa (valores
Dr. Roberto Volfovicz-Leon 2023
estandarizados) ayudan a determinar qué tan lejos
de la media se encuentra un determinado valor.
• Valores estandarizados (puntos Z):
𝑿𝒊−𝑿
𝒁𝒊 =
𝑺
16
donde: Zi = punto Z para Xi , S=desvío estándar, 𝑋 = media
Valor Estandarizado: Puntos Z
• El punto Zi puede ser interpretado como el número de
desviaciones estándar a las que Xi se encuentra de la media
• Por ejemplo, si Z1 = 1 indica que X1 es 1 desviación estándar
mayor que la media.
• Por ejemplo, si Z2 = - 1 indica que X2 es 1 desviación estándar
menor que la media.
Dr. Roberto Volfovicz-Leon 2023
• Por ejemplo si Z3 = 1,5, esto indica que X3 es 1,5 desviaciones
estándar mayor que la media.
• Puntos Z mayores a cero corresponden a observaciones cuyo
valor es mayor a la media
• Puntos Z menores que cero corresponden a observaciones
cuyo valor es menor a la media.
• Si el punto Z =0, el valor de la observación correspondiente es 17
igual a la media.
EJEMPLO 2
Los puntajes de un grupo de estudiantes en un
examen de Estadística Descriptiva tuvieron una
media de 78 y una desviación estándar de 7
puntos.
Dr. Roberto Volfovicz-Leon 2023
Encuentre los puntajes Z para estudiantes que
obtuvieron:
a) un examen de 85 puntos,
b) un examen de 70 puntos,
18
c) un examen de 78 puntos.
Ejemplo 2 - Respuesta
𝑿−𝑿
𝒁=
𝑺
a) 𝑿 = 78, S = 7, x = 85
𝑋−𝑋 85 78 1.0 Este examen estuvo 1 desvío
𝑍=
7 estándar por encima del promedio
𝑆
de su grupo
Dr. Roberto Volfovicz-Leon 2023
b) 𝑿 = 78, S = 7, x = 70
𝑋−𝑋 70 78 1.14 Este examen estuvo 1.14 desvíos
𝑍=
𝑆 7 estándares por debajo del
promedio de su grupo
c) 𝑿 = 78, S = 7, x = 78
𝑋−𝑋 78 78 0 Este examen coincidió con el
𝑍=
7
19
𝑆 promedio de su grupo.
EJEMPLO 3
Juan obtuvo un resultado de 75 puntos en un examen donde el
promedio de su grupo fue de 73.2 puntos con una desviación
estándar de S = 4.5.
Martina obtuvo un resultado de 68.6 en un examen donde el
promedio de su grupo fue de 65 con un desvío estándar de 3.9
puntos.
Dr. Roberto Volfovicz-Leon 2023
¿Cuál de los dos ha tenido un mejor examen en relación a los
estudiantes de sus grupos?
20
𝑋−𝑋
Ejemplo 3 Respuesta 𝑍=
𝑆
Juan obtuvo un resultado de 75 puntos en un examen donde el promedio de su
grupo fue de 73.2 puntos con una desviación estándar de S = 4.5.
Martina obtuvo un resultado de 68.6 en un examen donde el promedio de su
grupo fue de 65 con un desvío estándar de 3.9 puntos.
Juan: valor z Martina: valor z
Dr. Roberto Volfovicz-Leon 2023
75 73.2 68.6 65
4.5 3.9
0.4 0.92
• Juan Z = 0.4, esto significa que su examen estuvo 0,4 desvíos
estándares por encima del promedio de su grupo.
• Martina con un Z = 0,92 estuvo 0,92 desvíos estándares por
encima del promedio de su grupo. 21
• El resultado de Martina fue superior en comparación con los
promedios de sus respectivos grupos.
EJEMPLO 4
Al terminar sus carreras, un Contador Publico y un Licenciado
en Dirección de Empresas reciben ofertas laborales con
sueldos mensuales iniciales de $42.000 y $40.000,
respectivamente.
Supongamos que el promedio de los sueldos de los recién
egresados de Contador Publico es de $38.000, con una
desviación estándar de $4.000 y el promedio de los sueldos de
Dr. Roberto Volfovicz-Leon 2023
los recién egresados de la Licenciatura en Dirección de
Empresas es de $34.000, con una desviación estándar de
$3.000.
Pregunta:
¿Cuál de los dos ha tenido una mejor oferta laboral, en
relación a los sueldos de su profesión? 22
Responda calculando y comparando los valores
estandarizados Z para cada profesional.
Respuesta
Dr. Roberto Volfovicz-Leon 2023
23
Detección de
Dr. Roberto Volfovicz-Leon 2023
observaciones Atípicas
por el criterio Z
24
Detección de observaciones atípicas
• Algunas veces un conjunto de datos tiene una o más
observaciones cuyos valores son mucho más grandes o
mucho más pequeños que la mayoría de los datos
• A estos valores extremos se les llama observaciones
atípicas (‘outliers’)
Dr. Roberto Volfovicz-Leon 2023
• En la CLASE 8 vimos como detectar observaciones
atípicas mediante un Diagrama de Caja (Box Plot)
• Para identificar las observaciones atípicas en una
población con distribución acampanada podemos
emplea los valores estandarizados (puntos Z) de acuerdo
al siguiente criterio:
• Criterio: 25
Observación atípica si: Z >3 o Z < -3
Criterio para detectar datos atípicos:
Dr. Roberto Volfovicz-Leon 2023
Observación atípica si: Z >3 o Z < -3
26
Ejemplo 5
De acuerdo con una nota aparecida recientemente en la
prensa, el cargo promedio mensual de una tarjeta de
crédito es de $6.538. En una muestra de 14 usuarios de
tarjetas de crédito se observaron los siguientes cargos
mensuales($):
Dr. Roberto Volfovicz-Leon 2023
3.536 5.710 6.951 8.625 7.750 3.560 6.535
19.350 1.784 3.970 9.950 3.496 1.800 1.450
1. Calcule la media, la mediana y la desviación estándar.
2. Calcule e interprete el coeficiente de Asimetría de
Pearson. Comente la forma de la distribución.
3. ¿Hay observaciones atípicas en estos datos? Justifique 27
mediante el calculo de valores estandarizados Z.
Ejemplo 5 – Respuesta
De acuerdo con una nota aparecida recientemente en la prensa, el cargo promedio mensual de una
tarjeta de crédito es de $6.538. En una muestra de 14 usuarios de tarjetas de crédito se observaron
los siguientes cargos mensuales($):
3.536 5.710 6.951 8.625 7.750 3.560 6.535 19.350 1.784 3.970 9.950 3.496 1.800 1.450
1. Calcule la media, la mediana y la desviación estándar.
2. Calcule e interprete el coeficiente de Asimetría de Pearson. Comente la forma de la distribución.
3. ¿Hay observaciones atípicas en estos datos? Justifique mediante el calculo de valores
estandarizados Z.
1. Media = $ 6033,4
Dr. Roberto Volfovicz-Leon 2023
Mediana = $ 4840
Desviación estándar = $ 4670,4
3(6033,4−4840)
2. Ap= = + 0,767
4670,4
Comentaros:
• La distribución de los cargos mensuales de la muestra presenta una 28
asimetría de tipo positiva (derecha).
• Los cargos mensuales se concentran en valores bajos.
3. ¿Hay observaciones atípicas en estos datos? Justifique mediante el calculo
de valores estandarizados Z.
Valores Z
Montos ($) (Montos estandarizados)
1450 -0.98
1784 -0.91
1800 -0.91
3496 -0.54
3536 -0.53
3560 -0.53
Dr. Roberto Volfovicz-Leon 2023
3970 -0.44
5710 -0.07
6535 0.11
6951 0.20
7750 0.37
8625 0.55
9950 0.84
19350 2.85
Comentarios:
Observar que todos los valores estandarizados Z están 29
comprendidos entre -3 y +3, por lo tanto no se detectaron
observaciones atípicas.
Preguntas?
Dr. Roberto Volfovicz-Leon 2023
30