0% encontró este documento útil (0 votos)
26 vistas30 páginas

Clase 9 Estadistica Descriptiva 2023

La clase 9 de Estadística Aplicada se centra en medidas de la forma de la distribución, específicamente el coeficiente de asimetría de Pearson, que indica la simetría de los datos. Se discuten las asimetrías negativa y positiva, así como la interpretación del coeficiente de asimetría. Además, se presentan ejemplos prácticos sobre la aplicación de estas medidas en conjuntos de datos.

Cargado por

Eduardo Rizzo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
26 vistas30 páginas

Clase 9 Estadistica Descriptiva 2023

La clase 9 de Estadística Aplicada se centra en medidas de la forma de la distribución, específicamente el coeficiente de asimetría de Pearson, que indica la simetría de los datos. Se discuten las asimetrías negativa y positiva, así como la interpretación del coeficiente de asimetría. Además, se presentan ejemplos prácticos sobre la aplicación de estas medidas en conjuntos de datos.

Cargado por

Eduardo Rizzo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA APLICADA

Clase 9

Dr. Roberto Volfovicz-Leon


([Link]@[Link])

2023
Menú del Día
• Medidas de la Forma de la Distribución (Ap:
Coeficiente de Asimetría de Pearson)

• Medidas de la Posición Relativa (Valores

Dr. Roberto Volfovicz-Leon 2023


Estandarizados Z)

• Detección de Observaciones Atípicas por el


criterio Z
2
Medidas de la Forma de la
Distribución

Dr. Roberto Volfovicz-Leon 2023


(Ap: Coeficiente de Asimetría
de Pearson )

3
Medidas de la Forma de la
Distribución
• En clase previas hemos descrito medidas de
posición y de dispersión de los datos
• Además de esas medidas veremos una
medida de la forma de la distribución.

Dr. Roberto Volfovicz-Leon 2023


• En la Clase 3 vimos que un histograma es una
representación gráfica que muestra la forma
de una distribución de datos de una variable
cuantitativa.
• Una medida numérica importante de la forma 4
de una distribución es el sesgo o simetría.
Coeficiente de Asimetría (Sesgo)
• Esta medida indica cómo se distribuye la
variable de estudio en torno a un eje de
simetría que pasa por el promedio de la
distribución

Dr. Roberto Volfovicz-Leon 2023


• La media, la mediana y la moda (en caso de
ser única) coinciden en toda distribución
simétrica
• A medida que la distribución se vuelve
asimétrica, la media, mediana y moda
difieren de acuerdo a las pautas que se
5
muestran a continuación.
Asimetría de la Distribución de una Variable

Asimetría Negativa Asimetría Positiva


(izquierda) (derecha)
Asimetría negativa (o a la izquierda)

Dr. Roberto Volfovicz-Leon 2023


• Se dice que una distribución tiene asimetría negativa o a la izquierda si existen
muchos valores pequeños con frecuencias bajas.
• Describimos la asimetría negativa (o a la izquierda) si la "cola" izquierda de la
distribución es más larga que la derecha.
• Esto significa que los datos están mas concentrados en los valores altos de la
variable

Asimetría positiva (o a la derecha)


• Se dice que una distribución tiene asimetría positiva o a la derecha si existen
muchos valores altos con frecuencias bajas.
6
• La "cola" derecha de la distribución es más larga que la izquierda
• Los datos están mas concentrados en los valores bajos de la variable
Indicador de Asimetría: Coeficiente de Asimetría
de Pearson
Existen varios indicadores de asimetría, en el curso veremos el
coeficiente de Asimetría de Pearson: AP
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟

Dr. Roberto Volfovicz-Leon 2023


• Ap está generalmente acotado entre -3 y +3
El signo y el valor indican la dirección y magnitud de la asimetría:
• Si Ap ≈ 0 entonces la variable en estudio tiene una distribución
simétrica
• Si Ap > 0 entonces la distribución presenta asimetría positiva o
derecha (desplazada hacia la derecha).Si Ap tiende a +3,
entonces presenta fuerte asimetría positiva
• Si Ap < 0 entonces la distribución presenta asimetría negativa o 7
izquierda (desplazada hacia la izquierda). Si Ap tiende a - 3,
entonces presenta fuerte asimetría negativa
Relación entre el Coeficiente de Asimetría (Ap),
la forma de la Distribución
y el Diagrama de Caja

Ap < 0 Ap = 0 Ap > 0

Dr. Roberto Volfovicz-Leon 2023


Asimetría Negativa Simetría Asimetría Positiva
(Izquierda) (Derecha) 8
Ejemplo 1
La siguiente tabla describe el número de personas según sus
edades para una muestra de jóvenes de una localidad del país:
Intervalo de Número de
Edades (años) personas
[10 12) 4
[12 14) 21
[14 16) 14

Dr. Roberto Volfovicz-Leon 2023


[16 18) 12
[18 20) 3

1. Complete la tabla de distribución de frecuencias incluyendo:


marcas de clase (Mi), frecuencias absolutas (ni), frecuencias
relativas (fi) , frecuencia relativas acumuladas (Fi) y densidad
empírica (hi).
2. Realice un Histograma y comente en cuanto a su simetría.
9
3. Determine la clase modal, media, mediana y el desvió estándar
4. Calcule y comente el coeficiente de asimetría de Pearson (AP)
Ejemplo 1 - Respuesta
La siguiente tabla describe el número de personas según sus edades para una
muestra de jóvenes de una localidad del país:

1. Complete la tabla de distribución de frecuencias incluyendo: marcas de

Dr. Roberto Volfovicz-Leon 2023


clase (Mi), frecuencias absolutas (ni), frecuencias relativas (fi) , frecuencia
relativas acumuladas (Fi) y densidad empírica (hi):
Intervalo de Mi ni fi Fi hi
Edades (años)
[10 12)
[12 14)
[14 16)
[16 18)
[18 20) 10
TOTAL
Ejemplo 1 - Respuesta
La siguiente tabla describe el número de personas según sus edades para una
muestra de jóvenes de una localidad del país:

1. Complete la tabla de distribución de frecuencias incluyendo: marcas de

Dr. Roberto Volfovicz-Leon 2023


clase (Mi), frecuencias absolutas (ni), frecuencias relativas (fi) , frecuencia
relativas acumuladas (Fi) y densidad empírica (hi):
Intervalo de Mi ni fi Fi hi
Edades (años)
[10 12) 11 4 4/54 = 0,074 0,074 0,074/2=0,037
[12 14) 13 21 21/54= 0,389 0,463 0,389/2=0,1945
[14 16) 15 14 14/54= 0,259 0,722 0,259/2=0,1295
[16 18) 17 12 12/54= 0,222 0,944 0,222/2=0,111
[18 20) 19 3 3/54= 0,056 1,000 0,056/2=0,028 11
TOTAL 54 1,000
Ejemplo 1 - Respuesta
2. Realice un Histograma y comente en cuanto a su simetría.

0,25 Histograma: Distribución de jóvenes según edad


0,2

0,15
Densidad
Empirica 0,1

Dr. Roberto Volfovicz-Leon 2023


0,05

0
[10 ,12) [12 ,14) [14 ,16) [16 ,18) [18 ,20)
Edades
Fuente: elaboración propia.
Comentarios:
• A partir del histograma podemos observar que la distribución de edades
de los jóvenes de esta muestra presenta una asimetría de tipo positiva o
derecha.
12
• La "cola" derecha de la distribución es más larga que la izquierda.
• Las edades de los jóvenes de esta muestra se concentran en las
categorías de edades mas bajas.
Ejemplo 1 - Respuesta
3. Determine la clase modal, media, mediana y el desvió estándar

Dr. Roberto Volfovicz-Leon 2023


• Clase Modal: [12 , 14) años.
(Se trata del intervalo con mayor densidad empírica hi)
• Media: 𝑿 = 14,59 años (obtenida con calculadora)
𝟎,𝟓𝟎 −𝟎,𝟒𝟔𝟑
• Mediana = 14 + ∙ (𝟏𝟔 − 𝟏𝟒) = 14,28 años
𝟎,𝟐𝟓𝟗

13
• Desvió Estándar = 2,10 años (obtenido con calculadora)
Ejemplo 1 - Respuesta
4. Calcule y comente el coeficiente de asimetría de Pearson (Ap)
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟

Donde: Media: 𝑋 = 14,59 años


0,50 −0,463
Mediana = 14 + ∙ (14 − 12) = 14,28 años
0,259

Dr. Roberto Volfovicz-Leon 2023


Desvió Estándar = 2,10 años (obtenido con calculadora)
(𝑀𝑒𝑑𝑖𝑎 − 𝑀𝑒𝑑𝑖𝑎𝑛𝑎)
𝐴𝑝 = 3 ∙
𝐷𝑒𝑠𝑣𝑖𝑜 𝐸𝑠𝑡𝑎𝑛𝑑𝑎𝑟
(14,59 −14,28)
𝐴𝑝 = 3 ∙ = 0,443
2,10

Comentarios:
• Dado que A𝒑 > 0, concluimos que la distribución de las edades de esta muestra
de jóvenes presenta una asimetría de tipo positivo. 14
• Los jóvenes de la muestra se concentran en las categorías de edades mas
bajas.
Medidas de la Posición

Dr. Roberto Volfovicz-Leon 2023


Relativa
(Valores Estandarizados Z)

15
Valor Estandarizado: Puntos Z
• Además de las medidas de posición, variabilidad y
simetría, interesa conocer también la ubicación
relativa de los valores de un conjunto de datos.
• Las medidas de localización relativa (valores

Dr. Roberto Volfovicz-Leon 2023


estandarizados) ayudan a determinar qué tan lejos
de la media se encuentra un determinado valor.
• Valores estandarizados (puntos Z):
𝑿𝒊−𝑿
𝒁𝒊 =
𝑺
16
donde: Zi = punto Z para Xi , S=desvío estándar, 𝑋 = media
Valor Estandarizado: Puntos Z
• El punto Zi puede ser interpretado como el número de
desviaciones estándar a las que Xi se encuentra de la media
• Por ejemplo, si Z1 = 1 indica que X1 es 1 desviación estándar
mayor que la media.
• Por ejemplo, si Z2 = - 1 indica que X2 es 1 desviación estándar
menor que la media.

Dr. Roberto Volfovicz-Leon 2023


• Por ejemplo si Z3 = 1,5, esto indica que X3 es 1,5 desviaciones
estándar mayor que la media.
• Puntos Z mayores a cero corresponden a observaciones cuyo
valor es mayor a la media
• Puntos Z menores que cero corresponden a observaciones
cuyo valor es menor a la media.
• Si el punto Z =0, el valor de la observación correspondiente es 17
igual a la media.
EJEMPLO 2

Los puntajes de un grupo de estudiantes en un


examen de Estadística Descriptiva tuvieron una
media de 78 y una desviación estándar de 7
puntos.

Dr. Roberto Volfovicz-Leon 2023


Encuentre los puntajes Z para estudiantes que
obtuvieron:

a) un examen de 85 puntos,
b) un examen de 70 puntos,
18
c) un examen de 78 puntos.
Ejemplo 2 - Respuesta
𝑿−𝑿
𝒁=
𝑺

a) 𝑿 = 78, S = 7, x = 85
𝑋−𝑋 85  78  1.0 Este examen estuvo 1 desvío
𝑍= 
7 estándar por encima del promedio
𝑆
de su grupo

Dr. Roberto Volfovicz-Leon 2023


b) 𝑿 = 78, S = 7, x = 70
𝑋−𝑋 70  78  1.14 Este examen estuvo 1.14 desvíos
𝑍= 
𝑆 7 estándares por debajo del
promedio de su grupo
c) 𝑿 = 78, S = 7, x = 78
𝑋−𝑋 78  78  0 Este examen coincidió con el
𝑍= 
7
19
𝑆 promedio de su grupo.
EJEMPLO 3

Juan obtuvo un resultado de 75 puntos en un examen donde el


promedio de su grupo fue de 73.2 puntos con una desviación
estándar de S = 4.5.
Martina obtuvo un resultado de 68.6 en un examen donde el
promedio de su grupo fue de 65 con un desvío estándar de 3.9
puntos.

Dr. Roberto Volfovicz-Leon 2023


¿Cuál de los dos ha tenido un mejor examen en relación a los
estudiantes de sus grupos?

20
𝑋−𝑋
Ejemplo 3 Respuesta 𝑍=
𝑆
Juan obtuvo un resultado de 75 puntos en un examen donde el promedio de su
grupo fue de 73.2 puntos con una desviación estándar de S = 4.5.
Martina obtuvo un resultado de 68.6 en un examen donde el promedio de su
grupo fue de 65 con un desvío estándar de 3.9 puntos.

Juan: valor z Martina: valor z

Dr. Roberto Volfovicz-Leon 2023


75  73.2 68.6  65
 
4.5 3.9
 0.4  0.92
• Juan Z = 0.4, esto significa que su examen estuvo 0,4 desvíos
estándares por encima del promedio de su grupo.
• Martina con un Z = 0,92 estuvo 0,92 desvíos estándares por
encima del promedio de su grupo. 21
• El resultado de Martina fue superior en comparación con los
promedios de sus respectivos grupos.
EJEMPLO 4
Al terminar sus carreras, un Contador Publico y un Licenciado
en Dirección de Empresas reciben ofertas laborales con
sueldos mensuales iniciales de $42.000 y $40.000,
respectivamente.
Supongamos que el promedio de los sueldos de los recién
egresados de Contador Publico es de $38.000, con una
desviación estándar de $4.000 y el promedio de los sueldos de

Dr. Roberto Volfovicz-Leon 2023


los recién egresados de la Licenciatura en Dirección de
Empresas es de $34.000, con una desviación estándar de
$3.000.

Pregunta:
¿Cuál de los dos ha tenido una mejor oferta laboral, en
relación a los sueldos de su profesión? 22
Responda calculando y comparando los valores
estandarizados Z para cada profesional.
Respuesta

Dr. Roberto Volfovicz-Leon 2023


23
Detección de

Dr. Roberto Volfovicz-Leon 2023


observaciones Atípicas
por el criterio Z

24
Detección de observaciones atípicas
• Algunas veces un conjunto de datos tiene una o más
observaciones cuyos valores son mucho más grandes o
mucho más pequeños que la mayoría de los datos
• A estos valores extremos se les llama observaciones
atípicas (‘outliers’)

Dr. Roberto Volfovicz-Leon 2023


• En la CLASE 8 vimos como detectar observaciones
atípicas mediante un Diagrama de Caja (Box Plot)
• Para identificar las observaciones atípicas en una
población con distribución acampanada podemos
emplea los valores estandarizados (puntos Z) de acuerdo
al siguiente criterio:
• Criterio: 25

Observación atípica si: Z >3 o Z < -3


Criterio para detectar datos atípicos:

Dr. Roberto Volfovicz-Leon 2023


Observación atípica si: Z >3 o Z < -3

26
Ejemplo 5
De acuerdo con una nota aparecida recientemente en la
prensa, el cargo promedio mensual de una tarjeta de
crédito es de $6.538. En una muestra de 14 usuarios de
tarjetas de crédito se observaron los siguientes cargos
mensuales($):

Dr. Roberto Volfovicz-Leon 2023


3.536 5.710 6.951 8.625 7.750 3.560 6.535
19.350 1.784 3.970 9.950 3.496 1.800 1.450

1. Calcule la media, la mediana y la desviación estándar.


2. Calcule e interprete el coeficiente de Asimetría de
Pearson. Comente la forma de la distribución.
3. ¿Hay observaciones atípicas en estos datos? Justifique 27
mediante el calculo de valores estandarizados Z.
Ejemplo 5 – Respuesta
De acuerdo con una nota aparecida recientemente en la prensa, el cargo promedio mensual de una
tarjeta de crédito es de $6.538. En una muestra de 14 usuarios de tarjetas de crédito se observaron
los siguientes cargos mensuales($):
3.536 5.710 6.951 8.625 7.750 3.560 6.535 19.350 1.784 3.970 9.950 3.496 1.800 1.450
1. Calcule la media, la mediana y la desviación estándar.
2. Calcule e interprete el coeficiente de Asimetría de Pearson. Comente la forma de la distribución.
3. ¿Hay observaciones atípicas en estos datos? Justifique mediante el calculo de valores
estandarizados Z.

1. Media = $ 6033,4

Dr. Roberto Volfovicz-Leon 2023


Mediana = $ 4840
Desviación estándar = $ 4670,4

3(6033,4−4840)
2. Ap= = + 0,767
4670,4

Comentaros:
• La distribución de los cargos mensuales de la muestra presenta una 28
asimetría de tipo positiva (derecha).
• Los cargos mensuales se concentran en valores bajos.
3. ¿Hay observaciones atípicas en estos datos? Justifique mediante el calculo
de valores estandarizados Z.

Valores Z
Montos ($) (Montos estandarizados)
1450 -0.98
1784 -0.91
1800 -0.91
3496 -0.54
3536 -0.53
3560 -0.53

Dr. Roberto Volfovicz-Leon 2023


3970 -0.44
5710 -0.07
6535 0.11
6951 0.20
7750 0.37
8625 0.55
9950 0.84
19350 2.85

Comentarios:
Observar que todos los valores estandarizados Z están 29
comprendidos entre -3 y +3, por lo tanto no se detectaron
observaciones atípicas.
Preguntas?

Dr. Roberto Volfovicz-Leon 2023


30

También podría gustarte