REGRESIÓN LINEAL SIMPLE
BREYMAN DAVID ESTACIO
DANIELA RAMÍREZ MARADIAGO
ANGELA ISABEL VILLOTA
Trabajo presentado a:
Prof. CESAR ANDRES PAZ SUAREZ
En Estadística Aplicada a la Salud Ocupacional II
6490B
INSTITUCIÓN UNIVERSITARIA ANTONIO JOSE
CAMACHO
SANTIAGO DE CALI
2020
1
INSTITUCIÓN UNIVERSITARIA “ANTONIO JOSÉ CAMACHO”
TALLER SEXTO ENCUENTRO
CUARTA UNIDAD CURSO DE ESTADÍSTICA APLICADA A LA SALUD OCUPACIONAL II
Regresión
Temas:
Regresión lineal simple
Correlación
TALLER
1. Identificar la variable dependiente y la independiente en cada uno de estos casos:
a) El tiempo estudiando para un examen y la nota obtenida
Variable dependiente: Nota obtenida
Variable Independiente: Tiempo estudiando para un examen
b) La estatura de un hijo y la estatura del padre
Variable dependiente: La estatura de un hijo
Variable Independiente: La estatura del padre
c) La edad de una mujer y el costo de su seguro de vida
Variable dependiente: Costo de su seguro de vida
Variable independiente: La edad de una mujer
d) El precio de un producto y el número de unidades vendidas
Variable dependiente: Precio de un producto
Variable independiente: número de unidades vendidas
e) La demanda de un producto y el numero de consumidores en el mercado
Variable dependiente: Demanda de un producto.
Variable independiente: Numero de consumidores en el mercado.
2. El gerente de una compañía, que tiene una fuerza de venta muy numerosa en Estados Unidos y Canadá,
quiere determinar si existe una relación entre el número de llamadas de ventas que se realizan al mes y el
número de fotocopiadoras que se venden durante este mes. El gerente selecciona una muestra aleatoria
de 10 vendedores y determina el numero de llamadas de ventas que cada uno hizo el mes pasado y la
cantidad de fotocopiadoras vendidas. La información se muestra en la siguiente tabla:
2
Numero de llamadas de ventas Numero de fotocopiadoras vendidas
a) Determine la variable dependiente y 20 40
la independiente 40 60
20 40
Variable independiente (X): Número
de llamadas de ventas. 30 60
10 30
Variable dependiente (Y): Numero de 10 40
fotocopias vendidas. 20 40
20 50
20 40
b) Elabore y analice el diagrama de 30 50
dispersión
Diagrama de dispersión:
Análisis: La recta de regresión atraviesa los puntos, lo cual no son aleatorios, y si tiene relación las llamadas
de ventas y las fotocopias vendidas. La grafica evidencia que entre mayor sea las llamadas de venta, mayor
será las fotocopiadoras vendidas.
c) ¿Cuántas fotocopiadoras se esperan vender en promedio si se hacen 20 llamadas?
Si se usa la regresión lineal, la línea de tendencia tiene la ecuación:
Por lo cual si se reemplaza la x=20 se obtiene que:
R// Se espera vender 43 fotocopiadoras en promedio si se realizan 20 llamadas en ventas.
3
d) Calcule e interprete el coeficiente de correlación de Pearson
Debido a que el coeficiente de correlación Pearson está dado por:
Se tiene que el coeficiente de correlación para los datos es:
r= 0,87092705
Interpretación: Si hay correlación lineal entre las variables, esto significa que entre más aumenta las llamadas
de ventas, aumenta las ventas de fotocopiadora.
e) Calcule e interprete el coeficiente de determinación
Se tiene que el coeficiente de determinación es igual al cuadrado del coeficiente de correlación de Pearson,
por lo cual:
R²=(r)²= 0,758513932
Interpretación: Existe un 75,85% de precisión que los puntos se acerquen a la correlación lineal, por lo cual si
existe una relación lineal.
f) ¿Podemos llegar a la conclusión de que la correlación en la población es diferente de 0?
Se puede concluir que la correlación es diferente a cero, debido a que la correlación lineal está más cercana a
la tendencia lineal.
3. Un articulo reciente mencionó las “Mejores Pequeñas Empresas”. Nos interesa conocer los resultados
actuales de las ventas y ganancias de las compañías. Se seleccionó una muestra aleatoria de 12 empresas
y a continuación se reportan sus ventas y ganancias en millones de pesos.
Ventas (millones de pesos) Ganancias (millones de pesos)
89,2 4,9
a) Determine la variable dependiente y la 18,6 4,4
independiente
18,2 1,3
Variable independiente: Cantidad de ventas. 71,7 8,0
58,6 6,6
Variable dependiente: Ganancias de las 46,8 4,1
compañías. 17,5 2,6
11,9 1,7
b) Elabore y analice el diagrama de dispersión 19,6 3,5
51,2 8,2
Diagrama de dispersión: 28,6 6,0
69,2 12,8
4
Análisis: Se puede evidenciar que tienen una relación no tan fuerte este par de datos, dado que, aunque en
algunos casos cuando la cantidad de ventas aumenta las ganancias aumentas, hay casos que, aunque la
cantidad de ventas aumento las ganancias disminuyeron.
c) Calcule e interprete el coeficiente de correlación de Pearson
Debido a que el coeficiente de correlación Pearson está dado por:
Se tiene que el coeficiente de correlación para los datos es:
r= 0,673499252
Interpretación: Y esto quiere decir que la correlación de los datos es positiva.
d) Calcule e interprete el coeficiente de determinación
Se tiene que el coeficiente de determinación es igual al cuadrado del coeficiente de correlación de Pearson,
por lo cual:
R²=(r)²= 0,453601243
Interpretación: Debido a que es un valor cercano al 0 se tiene que nuestro modelo no es muy bueno.
e) ¿Podemos llegar a la conclusión de que la correlación en la población significativa?
Debido a los resultados de los puntos anteriores se puede decir que la correlación entre los datos no es muy
significativa.
f) ¿Cuáles son las ganancias esperadas si se venden 50 millones de pesos?
5
Si se usa la regresión lineal, la línea de tendencia tiene la ecuación:
Por lo cual si se reemplaza la x=50 se obtiene que:
R// Se espera vender 50 millones en promedio para que las ganancias sean de 6.0317 millones.