0% encontró este documento útil (0 votos)
135 vistas7 páginas

Análisis de Correlación y Regresión

El documento describe el coeficiente de correlación lineal (r) y el coeficiente de determinación (R2), que miden la relación entre variables cuantitativas. Explica que r varía de -1 a 1, donde valores cercanos a -1 o 1 indican una fuerte correlación negativa o positiva, respectivamente. También presenta un ejemplo que calcula r = -0.9777 y R2 = 0.9559 para mostrar la fuerte correlación negativa entre el consumo de cigarrillos y la esperanza de vida.

Cargado por

Emhr Mar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
135 vistas7 páginas

Análisis de Correlación y Regresión

El documento describe el coeficiente de correlación lineal (r) y el coeficiente de determinación (R2), que miden la relación entre variables cuantitativas. Explica que r varía de -1 a 1, donde valores cercanos a -1 o 1 indican una fuerte correlación negativa o positiva, respectivamente. También presenta un ejemplo que calcula r = -0.9777 y R2 = 0.9559 para mostrar la fuerte correlación negativa entre el consumo de cigarrillos y la esperanza de vida.

Cargado por

Emhr Mar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADISTICA GENERAL

COEFICIENTE DE CORRELACION LINEAL ( r )

El análisis de correlación, emplea métodos, para medir la significación del

grado o intensidad de relación entre dos o más variables cuantitativas

(numéricas).

El coeficiente de correlación lineal de Pearson, mide la relación entre variables

cuantitativas (numéricas) de datos normales, para su cálculo se utiliza la

siguiente fórmula matemática:

n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿

El coeficiente de correlación, tiene una variación de −1 ≤r ≤ 1

Para interpretar el coeficiente de correlación utilizaremos la siguiente escala:


Valor Significado
-1 Correlación negativa perfecta
-0.90 – -0.99 Correlación negativa muy fuerte
-0.75 – -0.89 Correlación negativa considerable
-0.50 – -0.74 Correlación negativa media
-0.25 – -0.49 Correlación negativa débil
-0.10 – -0.24 Correlación negativa muy débil
No existe correlación alguna entre las
0
variables
0.10 – 0.24 Correlación positiva muy débil
0.25 – 0.49 Correlación positiva débil
0.50 – 0.74 Correlación positiva media
0.75 – 0.89 Correlación positiva considerable
0.90 – 0.99 Correlación positiva muy fuerte
1 Correlación positiva perfecta
Fuente: Hernández, Fernández y Baptista[CITATION Her14 \n \t \l 10250 ]

El coeficiente de correlación tiene una variación de −1 ≤r ≤ 1

 Si r = 0, no existe ninguna correlación. El índice indica, por tanto, una


independencia total entre las dos variables, es decir, que la variación de una de
ellas no influye en absoluto en el valor que pueda tomar la otra.
 Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa: cuando
una de ellas aumenta, la otra también lo hace en idéntica proporción.
ESTADISTICA GENERAL

 Si 0 < r < 1, existe una correlación positiva.


 Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa: cuando una
de ellas aumenta, la otra disminuye en idéntica proporción.
 Si -1 < r < 0, existe una correlación negativa.

COEFICIENTE DE DETERMINACION ( R2 )

Es la variación explicada por la recta de regresión, es decir en que porcentaje la variable


independiente X explica la variabilidad en la variable dependiente (o respuesta) Y. para
su cálculo se utiliza la siguiente relación:

R2=r 2∗100 %

VARIBLE
Ejemplo DEPENDIENTE
Y
1. Un
VARIBLE VARIBLE VARIBLE VARIABLE
INDEPENDIENTE INDEPENDIENTE INDEPENDIENTE INDEPENDIENTE
x1 x2 x3 Xn
investigador desea establecer la relación que existe entre el tiempo de vida de
una persona y la cantidad de cigarros que fuma mensualmente. Con tal fin
selecciona una muestra de 12 personas obteniendo los siguientes resultados.

Nº de 12 1 16 2 25 26 3 32 3 36 3 40
cigarrillos 5 4 0 5 8
Tiempo de vida 75 7 70 6 66 66 6 64 6 58 5 55
3 8 5 0 7

a) Halle el coeficiente de correlación

Nº de
N  cigarrillos Tiempo de   Y2
 
(X) vida (Y)

1 12 75 900 144 5625


2 15 73 1095 225 5329
3 16 70 1120 256 4900
4 24 68 1632 576 4624
5 25 66 1650 625 4356
6 26 66 1716 676 4356
7 30 65 1950 900 4225
8 32 64 2048 1024 4096
9 35 60 2100 1225 3600
10 36 58 2088 1296 3364
ESTADISTICA GENERAL

11 38 57 2166 1444 3249


12 40 55 2200 1600 3025
  329 777 20665 9991 50749

n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
−7653
r= = - 0.9777
107.9398(72.5189)

Interpretación : Existe una correlación negativa muy fuerte al 97.77% entre el consumo de
cigarros y el tiempo de vida.

b) Halle el coeficiente de determinación

R2 = ( - 0.9777 )2 = 0.9559

Y
Tiempo de vida
95.59%
4.41%

X
Consumo de alcohol, drogas, el
Consumo de no hacer ejercicio, malos
cigarros habitos alimenticios, etc

Interpretación : El tiempo de vida es afectado o depende del consumo de cigarros en un


95.59%, el 4.41% lo afectara otros factores como el consumo de alcohol drogas, no hacer
ejercicio, malos hábitos alimenticios, etc.

BONDAD DE AJUSTE DEL MODELO

Dado el modelo lineal en la ecuación de regresión:

^y =¿ 82.85 – 0.666 x
a) Si la persona fumaría 45 cigarrillos cual sería su tiempo de vida esperado?

Como x = 45

y=?  ^y =¿ 82.85 – 0.666 x


^y =82.85 – 0.666 ( 45 ) =53.15=53
ESTADISTICA GENERAL

Rpta:__ Si una persona fuma 45 cigarros al mes, su tiempo de vida esperado sera de 53
años aprox, estimación valida al 95.59%____________________________

2. Realizar un análisis completo para la Regresión Lineal entre la cantidad de Producción y el


correspondiente Costo unitario de cierto producto. Los datos se muestran e la siguiente tabla.

PRODUCCION EN MILES 2 4 8 12 14 18 16 10
(X)
COSTO UNIT EN SOLES (Y) 15 12 9 6 5 2 5 8

PRODUCCIO COSTO
N EN MILES UNIT EN XY X2 y*2
X SOLES Y
 
1 2 15 30 4 225
2 4 12 48 16 144
3 8 9 72 64 81
4 12 6 72 144 36
5 14 5 70 196 25
6 18 2 36 324 4
7 16 5 80 256 25
8 10 8 80 100 64
  84 62 488 1104 604

a) Halle el coeficiente de correlación

n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
r= -0.985

Interpretación : Existe una correlación negativa muy fuerte al 98.5% entre el costo
unitario y el producto en miles

b) Halle el coeficiente de determinación

R2 = ( -0.985 )2 = 0.97

Y
Costo unitario
97%
ESTADISTICA GENERAL

3%

X
Product en miles Por factores de
producción en planta

Interpretación : El costo unitario es afectado o depende de la producción en miles en un 97 %,


el 3% lo afectara otros factores como el producción en planta

BONDAD DE AJUSTE DEL MODELO

Dado el modelo lineal en la ecuación de regresión:


^y =bo+b 1 x

^y =15.457−0.734 x

La ecuación matemática mide la validez de la estimación en un 96.90%

C) Si la producción fuera de 13 mil productos, ¿Cuánto seria el costo?

Como x = 13
y=¿  y = 15.457 – 0.734(13)
y = 5.915

Rpta:__ Si la producción fuera de 13 mil productos, entonces el costo unitario seria de 5.915 soles,

3. Con los datos de la siguiente tabla que representan las estaturas (m.) y los

pesos (kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se

observó el peso de una persona seleccionada de entre el grupo con dicha estatura,

resultando:

Estatura 1.52 1.5 1.52 1.5 1.57 1.5 1.57 1.6 1.62 1.7 1.83 1.78
(X) 5 5 2 5 8
Peso (y) 50 61. 54.5 57. 63.5 59 61 72 66 72 84 82
5 5

Estatura(m) Peso (kg)


XY X2
  X Y y*2
1 1.52 50 76 2.3104 2500
2 1.55 61.5 95.325 2.4025 3782.25
3 1.52 54.5 82.84 2.3104 2970.25
ESTADISTICA GENERAL

4 1.55 57.5 89.125 2.4025 3306.25


5 1.57 63.5 99.695 2.4649 4032.25
6 1.52 59 89.68 2.3104 3481
7 1.57 61 95.77 2.4649 3721
8 1.65 72 118.8 2.7225 5184
9 1.62 66 106.92 2.6244 4356
10 1.78 72 128.16 3.1684 5184
11 1.83 84 153.72 3.3489 7056
12 1.78 82 145.96 3.1684 6724
  19.46 783 1282 31.7 52297

a) Halle el coeficiente de correlación

n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
r= 0.934

Interpretación : Existe una correlación positiva de 93.4% entre el peso y la estatura

b) Halle el coeficiente de determinación

R2 = ( 0.934 )2 = 0.87

Y
peso
87%
13%

X
Los factores que lo afectan pueden ser
altura la obesidad u otros males

Interpretación : El peso es afectado o depende de la altura en un 87 %, el 13% lo afectara


otros factores como el la obesidad u otros males
BONDAD DE AJUSTE DEL MODELO

Dado el modelo lineal en la ecuación de regresión:

^y =−73.97+85.94 x

La ecuación matemática mide la validez de la estimación en un 87.97%

Si la estatura fuera 1.60, cuanto seria el peso esperado


ESTADISTICA GENERAL

Como x = 1.60
y=¿  ^y =−73.97+85.94 ( 1.60 )=63.534
Rpta:___ Si la estatura fuera 1.60m , el peso esperado será de 63.534 kg,

También podría gustarte