Medidas de tendencia central
• Las medidas de posición nos facilitan información sobre la
serie de datos que estamos analizando. Estas medidas
permiten conocer diversas características de esta serie de
datos.
• Las medidas de posición son de dos tipos:
a) Medidas de posición central: informan sobre los valores
medios de la serie de datos.
b) Medidas de posición no centrales: informan de como se
distribuye el resto de los valores de la serie.
Las principales medidas de posición central son las siguientes:
Media: es el valor medio ponderado de la serie de datos.
Mediana: es el valor de la serie de datos que se sitúa justamente en el
centro de la muestra (un 50% de valores son inferiores y otro 50% son
superiores).
Moda: es el valor que más se repite en la muestra.
-Media Aritmética (Promedio)
-Mediana
MEDIDAS DE TENDENCIA CENTRAL -Moda
Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor
x x Mediana
x
1 Media Aritmética o Promedio
x
(
1) M E x( k ) Si n es impar
x n
x
2
xi (
2)
x( k ) x( k 1) Si n es par
x i 1 ME
2
x n x
n (
n) x( k ) dato del centro
Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"
3
-Percentil (ejemplo: 25, 50, 75)
Percentiles, Deciles
-Decil (ejemplo: 4, 5, 8)
o Cuartiles -Cuartil (ejemplo: 1, 2, 3)
Percentil, Decil o Cuartil: corresponde al
valor que toma la variable (cuantitativa),
cuando los n datos están ordenados de
Menor a Mayor
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el
40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato
que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este
en la posición 34.
Medidas de dispersión
Estudia la distribución de los valores de
la serie, analizando si estos se
encuentran más o menos concentrados,
o más o menos dispersos.
Existen diversas medidas de dispersión,
entre las más utilizadas podemos
destacar las siguientes:
-Rango
-Varianza
MEDIDAS DE DISPERSIÓN -Desviación Estándar
Datos Cuantitativos Varianza
x Rango n n
1 n
x ( xi x ) 2
x ( xi ) 2
n i 1
2
i
1 n 2
1 R max(xi ) min(xi ) s 2 i 1 i 1
xi x 2
x
2 n n n i 1
Desviación Típica o Estándar
x
n
s s2
Comparación entre Variables
Se refiere al comportamiento de las variables cuantitativas en un Coeficiente de Variación
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se s
les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta cv
mayor variación? x
7
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL - Correlación Cuantitativos
x
x
1
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x
2 (Varianza y Desviación Estándar) para una Variable
Cuantitativa (x).
x
n
Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x 1 , x2) o bien (x , y)
1 n
x y cov( x , y ) ( xi x )( yi y )
y
n i 1
x
(
1) (1
)
Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional, es
x
(2
)
y
(2) decir que cuando x aumenta y también aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x y es decir que cuando x aumenta y disminuye; y viceversa.
(n
) (n)
Si Cov(x,y) es cero: no existe asociación entre x e y.
8
- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL - Correlación Cuantitativos
Correlación: Se refiere al grado de asociación entre dos variables (x 1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal entre
dos variables Cuantitativas
n
x y
x y r
cov( x , y ) xi yi nx y 1 r 1
(1
)
(
1)
sx s y r i 1
x
(2
)
y
(2)
( n 1 )s x s y
Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x
(n
)
y
(n) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.
9
EJEMPLO : Representación gráfica de las variables x e y
r=1 r=-1
10
Datos Cuantitativos
REGRESION LINEAL SIMPLE
Objetivo 1 Objetivo 2
Determinar si dos variables están x y Estudiar si los valores de una
asociadas y en qué sentido se da la x y
(1)
variable pueden ser utilizados para
(1
)
asociación. predecir el valor de la otra
x
(2
)
y
(2)
Determinar si existe relación x
(n
)
y
(n) Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
11
Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x
(
1)
y
(1
) Notación
x y
(2)
Variable Respuesta: y
(2
)
Variable Explicativa: x
Modelo de Regresión Lineal Simple: yi=+xi+ei
x
(n
)
y
(n)
Intercepto:
Pendiente:
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a y bx
n n n Residuos o Errores
yˆ a bx n xy xi y i ei y i yˆ i
i 1 i 1 i 1
b 2
n
n
n x xi
2
i 1 i 1
12
REGRESION LINEAL SIMPLE
EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
M o d e lo E s t im a d o
yˆ a bx
b 2 , 44 a 53 , 64
yˆ 53 , 64 2 , 44 x
Interpretación de los resultados
- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
13
TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares
Distribución de las unidades de
análisis de acuerdo a variable 1
Distribución de las unidades de análisis de
acuerdo a variable 1 D
10% A
20%
C
D A 40% B
10% 20% 30%
Distribución de las unidades de
análisis de acuerdo a variable 1
C B
40% 30%
D A
10% 20%
C
B
40%
30%
14
TIPOS DE GRÁFICOS 2. Gráfico de Barras
Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a
variable 1
de acuerdo a variable 1
D
500
variable 1
400 C
300
B
Nº
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
-Cuando una variable es cuantitativa se puede utilizar
D
este tipo de gráfico sólo si la variable se ha
transformada en categorías.
variable 1
B
-Hay distintas versiones de estos gráficos (por ejemplo
en Excel), y en algunos casos son muy útiles para
A
describir el comportamiento de una variable en distintos
0 20 40 60 80 100 grupos.
% unidad de análisis
15
TIPOS DE GRÁFICOS 3. Histograma
Histograma
Distribución de los hijos de trabajadores de Histograma
la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
10
- El eje x se refiere a la
Frecuencia
variable.
5
- El eje y se refiere a la
frecuencia (Nº , %).
Nº
0
- Cada barra representa la
7 8 9 10 11 12 13 14 frecuencia de la variable en la
edad edad población en estudio (o la
muestra).
Ejemplo
-El histograma se puede
En el gráfico se puede observar el número de
hijos , de menor edad (7-8 años), las de mayor construir desde los datos de la
edad (13-14 años); y además que la mayoría de tabla de frecuencia de la
hijos de los trabajadores están entre los 10 y 12 variable en estudio.
años.
16
TIPOS DE GRÁFICOS 5. Polígono de Frecuencia
Distribución de los hijos de trabajadores de
la empresa de acuerdo a edad -Esta representación se basa en
15
el Histograma.
-Sólo es útil para variables
10
Nº Frecuencia
edad
cuantitativas.
-El eje x se refiere a la
5
variable.
- El eje y se refiere a la
0 frecuencia (Nº , %).
7 8 9 10 11 12 13 14 -Los puntos que permiten la
edad
unión de las líneas representa
el centro de clase (o marca de
clase).
17
TIPOS DE GRÁFICOS 5. Diagrama de Caja
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000
100
90
80
70
60 - Permite identificar gráficamente la
mediana, los cuartiles 1 y 3
Edad
50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
- Sólo es útil para variables
30
cuantitativas.
20 -El eje x permite identificar la
10 población en estudio.
0
- El eje y representa los valores de la
N= 584 1473 variable en estudio.
Mujeres Hombres
18
TIPOS DE GRÁFICOS 6. Otros
Número de alumnos matriculados en la Número de alumnos matriculados en la
Carrera A según año de ingreso Carrera B según año de ingreso
100 100
Nº de alumnos
Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso
Número de alumnos matriculados en las Carreras
según año de ingreso
Nº de alumnos
200
año de ingreso Carrera A Carrera B
Nº de alumnos
1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
0
2003 70 75
1998 1999 2000 2001 2002 2003
Carrera B año ingreso
Carrera A
19