ESTADÍSTICA
APLICADA
Escuela: Ing. Civil
Docente: Ing. Thainna Leyva Sánchez
ANÁLISIS DE
CORRELACIÓN
LINEAL SIMPLE
Semana 09
CONDICION LABORAL Y
PRODUCTIVIDAD
EXPERIENCIA Y
DESEMPEÑO LABORAL
ESTUDIO Y
PROSPERIDAD
EDAD Y ESTATURA
SEGURIDAD LABORAL Y REMUNERACION Y
AUTOCONFIANZA SATISFACCION LABORAL
Relaciones:
• Basquetbolista = Persona alta
• Coeficiente intelectual alto = Buenas calificaciones en
matemática
• Mayor altura = Mayor peso
¿Fuertes? ¿Débiles?
¿Hay relaciones?
¿En que medida están relacionadas?
Si medimos la relación decimos que medimos una
CORRELACION entre variables.
ANALISIS DE DATOS
Coeficientes de correlación:
• El coeficiente de correlación de Pearson.
• El coeficiente de rangos de Sperman.
LOGRO DE LA SESIÓN
Al término de la sesión, el estudiante
se encontrará en la capacidad de
calcular en forma precisa el
coeficiente de correlación de Pearson
para problemas de situaciones
reales, además de interpretar
debidamente el resultado obtenido.
DIAGRAMA DE DISPERSIÓN
• Es el primer paso a realizar para determinar si existe una
relación entre dos variables.
• Este grafico consiste en un conjunto de puntos (x, y)
presentados en un plano cartesiano.
• Este diagrama permite visualizar el patrón de comportamiento
de estas variables.
Nube de Puntos
Sea un conjunto de pares de
valores de las variables X e Y. Si
los representamos en un diagrama
de dispersión obtendremos una
“nube de puntos” que nos dará una
idea gráfica de la posible
correlación entre ambas variables.
Nube de Puntos
ANALISIS DE CORRELACIÓN
Es una técnica estadística que mide el grado de asociación
lineal entre dos o mas variables cuantitativas de un estudio.
Se llamará Correlación Simple cuando se trate de analizar la
relación entre dos variables cuantitativas o cualitativas.
Se llamará Correlación Lineal si la función es una recta y de
Correlación no Lineal cuando la función es una curva o una
función de grado superior.
COEFICIENTE DE CORRELACIÓN DE PEARSON
• El coeficiente de correlación lineal de Pearson “r”, nos indica si los
puntos tienden a ubicarse en forma lineal.
• “r” es útil para determinar si hay relación lineal entre dos variables
cuantitativas “X” e “Y”.
• El signo de “r” determina si la posible relación entre 2 variables es
directa o inversa.
COEFICIENTE DE CORRELACIÓN DE PEARSON
Propiedades:
• Es adimensional, no tiene unidad física que lo defina.
• Sólo toma valores en [-1,1]
• Las variables son incorrelacionadas: r = 0
• Relación lineal perfecta entre dos variables:
r = +1 ó r = -1
• Cuanto más cerca esté r de +1 ó -1 mejor será el grado de
relación lineal.
Interpretación del Coeficiente de
correlación de Pearson
Relación Inversa Relación Directa
-1 -0.6 -0.3 0 0.3 0.6 1
Correlación Correlación Correlación Correlación Correlación Correlación
Alta Moderada Baja Baja Moderada Alta
Correlación Correlación
No Correlación
Perfecta Perfecta
COEFICIENTE DE CORRELACION DE PEARSON
El coeficiente se halla por medio de:
𝑆 𝑥𝑦
𝑟=
𝑆𝑥 𝑆 𝑦
Donde: Sxy: covarianza de las variables “X” e “Y”.
Sx : desviación estándar de la variable “X”.
Sy : desviación estándar de la variable “Y”.
COVARIANZA
La covarianza de dos variables “Sxy”, nos indica si existe o no
relación entre dos variables cuantitativas. También, en caso de
existir una relación nos indica si esta es directa o inversa.
• Relación Directa: Sxy > 0
• Relación Inversa: Sxy < 0
• No existe relación: Sxy = 0
(Incorrelacionadas)
COVARIANZA
La covarianza se halla por medio de:
∑ 𝑥 𝑖 ∗ 𝑦 𝑖 − 𝑛∗ ¯𝑥 ∗ ¯𝑦
𝑖
𝑆 𝑥𝑦 =
𝑛 −1
El signo de la covarianza nos indica si la tendencia de la nube de puntos es
creciente (o decreciente), pero no indica el grado de relación entre las
variables.
Ejemplo:
Se tiene información de los costos de Tiempo Costo
Máquina X Y
mantenimiento de seis máquinas llenadoras 1 30
1
de gaseosas de la Empresa Coca Cola S.A. 2 1 40
La Gerencia desea hacer pronósticos acerca 3 2 70
4 2 80
del costo de mantenimiento de cada máquina,
5 3 100
en función del tiempo operativo de la misma. 3 100
6
Para los datos, se pide:
1. Realizar el gráfico de dispersión
2. Hallar el coeficiente de Pearson.
Anuncios Ventas
Semana
X Y
X2 Y2 X*Y
1 1 30 1 900 30
2 1 40 1 1600 40
3 2 70 4 4900 140
4 2 80 4 6400 160
5 3 100 9 10000 300
6 3 100 9 10000 300
SUMA 12 420 28 33800 970
1.- Diagrama de dispersión:
RELACION TIEMPO-COSTO
120
Costo de mantenimiento ($)
100
80
60
40
20
0
0.5 1 1.5 2 2.5 3 3.5
Tiempo de operación (años)
2.- Coeficiente de Pearson:
Hallamos el promedio para cada variable: Hallamos la varianza para cada variable:
12 28 − 6 ∗2
2
𝑋 = =2 𝑆𝑥 =
2
=0.8
6 5
2
420 2 33800 −6 ∗7 0
𝑌= =70 𝑆𝑦 = =880
6 5
Hallamos la covarianza entre las variables: Hallamos la desviación estándar para cada variable:
𝑆 𝑥𝑦
2
=
970 − 6 ∗2 ∗70
=26 𝑆 𝑥 = √ 0. 8=0.8944
5
𝑆 𝑦 = √ 880=2 9.6648
Calculamos e interpretamos el coeficiente de correlación:
𝑆 𝑥𝑦 26
𝑟= =
𝑆 𝑥 𝑆 𝑦 0.8 944 ∗ 2 9.6648
𝑟 =0.98
Existe una alta correlación lineal entre el tiempo operativo de la
máquina y el costo de mantenimiento de la misma. Además, como el
signo de “r” es positivo, entonces esta relación es directa.