0% encontró este documento útil (0 votos)
16 vistas13 páginas

Sesion 2

Cargado por

Katherine Mejía
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
16 vistas13 páginas

Sesion 2

Cargado por

Katherine Mejía
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

1

Maestría en Administración

Curso: Fundamentos de
Análisis de Datos

Docente: Carmen Peláez

Sesión N°2: Estadística Descriptiva: Medidas


Numéricas

2024
2

MEDIDAS DE POSICIÓN
3
1. MEDIDAS DE POSICIÓN

1.1. MEDIA ARITMÉTICA


✔ Es la medida de localización más importante, llamada también
promedio de la variable. Es una de las medidas de tendencia
central, conocida como el punto de equilibrio de los datos ó
centro de gravedad.

✔ Para calcular la media aritmética se observa como se registra la


información: si los datos están ó no organizados en tablas de
frecuencias.
n

Datos no agrupados: x i
X = i 1

Con información muestral n


Xi : valores que toma la variable X
n : número de observaciones
4
1. MEDIDAS DE POSICIÓN

1.1. MEDIA ARITMÉTICA


1.1.1. PROPIEDADES DE LA MEDIA ARIRMÉTICA

✔ La media, para un grupo de datos es única.

✔ Para el cálculo se utiliza todas las observaciones disponibles.

✔ El valor de la media, se ve afectado por la presencia de valores


extremos; por ello pierde representatividad cuando hay
presencia de ellos entre los datos.

✔ La suma de los valores observados desviados respecto a su media


es cero.
5
1. MEDIDAS DE POSICIÓN

1.2. MEDIANA

✔ Es el valor central de un grupo de datos


ordenados de mayor a menor o
viceversa.
✔ Si el número de datos es impar, la
mediana está en el valor que
corresponde a la posición central.
✔ Ejemplo: Edades de 11 empleados de
cierta empresa (previamente ordenadas
de menor a mayor.
20, 23, 25, 28, 32, 38, 46, 47, 48, 49, 52
✔ La mediana correspondería al valor que
esta en la sexta posición 38.
6
1. MEDIDAS DE POSICIÓN

1.3. MODA
✔ Es el valor que ocurre con mayor
frecuencia.

✔ Si varios valores comparten la mayor


frecuencia de aparición, cada uno de
ellos es una moda.

✔ Ejemplo: Edades de 11 empleados de


cierta empresa (previamente
ordenadas de menor a mayor.
20, 23, 25, 28, 32, 38, 46, 47, 48, 49, 52

✔ La La moda es el número 32 (unimodal)


7
1. MEDIDAS DE POSICIÓN

1.4. POSICIONES RELATIVAS DE LA MEDIA, MEDIANA Y MODA


✔ La distribución de una variable puede ser determinada de acuerdo
al valor de las medidas de posición (centralidad), esta puede ser
simétrica o asimétrica positiva o asimétrica negativa.
8

MEDIDAS DE VARIABILIDAD
9
2. MEDIDAS DE VARIABILIDAD

2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN

✔ Las medidas de dispersión son útiles para


una mejor comprensión de la distribución de
un conjunto de datos de una variable de
interés y se complementa con las medidas de
tendencia central.
✔ Cuando se calcula se aprovecha el hecho, de
que si los datos son semejantes entre si,
están más cerca a la media aritmética,
entonces se dice que tienen poca
variabilidad ó que son homogéneos.
✔ Por el contrario si son muy diferentes
entre si, estarán muy dispersos respecto a
la media aritmética y se dice de ellos que
son muy variables o que son heterogéneos.
10
2. MEDIDAS DE VARIABILIDAD

2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN


2.1.1. RANGO

✔ El Rango de variación o recorrido de una serie de datos, esta


representado por la diferencia entre sus valores máximo y mínimo,
resultando ser la medida de variabilidad más sencilla y menos
confiable, ya que sólo usa dos datos para su cálculo.

R = Xmáx – Xmín

donde:
Xmáx : valor máximo
Xmín : valor mínimo
11
2. MEDIDAS DE VARIABILIDAD

2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN


2.1.2. VARIANZA
✔ La varianza ó variancia es una medida de variabilidad absoluta, que se
expresa en unidades al cuadrado y que utiliza todos los datos para su
cálculo (el cual se basa en las diferencias entre el valor de las
observaciones y su media).
✔ Se defina como el promedio de las desviaciones, elevadas al cuadrado,
de cada uno de los datos con respecto del promedio (media aritmética)

 X 
n n

 i
2
i  X
2
X
Cálculo: 2
S 
2 i 1
 i 1
X
Xi : i-ésima observación
n n
n : Número de datos
12
2. MEDIDAS DE VARIABILIDAD

2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN


2.1.3. DESVIACIÓN ESTÁNDAR
✔ La varianza se mide en unidades al cuadrado, por ejemplo si los datos
están expresados en metros, la varianza se medirá en metros al
cuadrado.
✔ Esto trae dificultades para su interpretación real. Es por ello que en
ocasiones se prefiere el uso de la Desviación Estándar, definida como
la raíz cuadrada (positiva) de la varianza.
✔ El valor numérico de la varianza y la desviación estándar cuantifican el
grado de dispersión absoluta de los datos de la variable en estudio,
con respecto a su media aritmétia, la primera en unidades al cuadrado
y la segunda en unidades reales. Por lo que a mayor variabilidad mayor
varianza.
Desviación Estándar : s s 2
13
2. MEDIDAS DE VARIABILIDAD

2.1. MEDIDAS DE DISPERSIÓN O VARIACIÓN


2.1.4. COEFICIENTE DE VARIACIÓN
✔ Esta medida de dispersión es muy útil cuando se quiere comparar el
grado de dispersión (homogeneidad o variabilidad) en dos conjuntos de
datos que tienen un promedio diferente y/o que tienen diferentes
unidades de medida.
✔ En general se considera lo siguiente:
Si CV < 25% implica baja dispersión
Si CV > 50% implica Alta dispersión
En otro caso se tiene Dispersión moderada

Cálculo:
S S
CV ( X )  CV ( X )%  (100)
X X

También podría gustarte