UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA
Tema: ‘’Proyecto Final’’
Alumnos:
Anette Cristina Torres Carrazco
Walter Meade Minor
Rolando Martínez Quevedo
Nataly Belen Rocha Vega
Roberto Guiza Mosqueda
Citlaly Santoyo Dueñas
José Miranda Sandoval
Materia: Estadística
Mexicali, Baja California, México 28/05/23
1
Índice
Tema Núm. de Página
Introducción 2
Correlación y Coeficientes 3-4
Análisis de regresión lineal 4-5
Regresión Múltiple 6-12
Conclusiones 13
Fuentes Bibliográficas 14
2
Introducción
La correlación y coeficientes, el análisis de regresión lineal y la regresión múltiple
son tres métodos estadísticos utilizados para los negocios, la economía y las
evaluaciones de mercado, esto con el fin de llegar a conclusiones, comparar
variables como de ingresos y egresos entre otras cosas, es de suma importancia
conocerlos y saber cómo calcularlos y razonar sobre ellos. A continuación se podrá
encontrar una explicación teórica sobre cada uno de ellos así como un ejercicio
explicado para su realización.
3
Correlación y Coeficientes
El coeficiente de correlación en estadística es un indicador que mide la tendencia de
dos variables cuantitativas X e Y a tener una relación de linealidad o
proporcionalidad entre ellas.
Donde el numerador representa la covarianza entre las variables X e Y, mientras
que el denominador es el producto de la desviación estándar para la variable X y la
desviación estándar para la variable Y.
Ejercicio:
(X, Y): {(1, 1); (2, 3); (3, 6) y (4, 7)}.
En primer lugar calculamos la media aritmética para X e Y, como sigue:
<X> = (1 + 2 + 3 + 4) / 4 = 2.5
<Y> = (1 + 3 + 6 + 7) / 4 = 4.25
Luego se calculan los restantes parámetros:
Covarianza Sxy
Sxy = [ (1 – 2.5)(1 – 4.25) + (2 – 2.5)(3 – 4.25) + (3 – 2.5)(6 – 4.25) +…. ….(4 –
2.5)(7 – 4.25) ] / (4-1)
Sxy = [ (-1.5)(-3.25) + (-0.5)(-1.25) + (0.5)(1.75) +….
4
….(1.5)(2.75) ] / (3) = 10.5 / 3 = 3.5
Desviación estándar Sx
Sx = √ [ (-1.5)2 + (-0.5)2 + (0.5)2 + (1.5)2) / (4-1)] = √[5/3] = 1.29
Desviación estándar Sy
Sx = √ [ (-3.25)2 + (-1.25)2 + (1.75)2 + (2.75)2) / (4-1)] =
√[22.75/3] = 2.75
Coeficiente de correlación r
r = 3.5 / (1.29 * 2.75) = 0.98
Análisis de Regresión Lineal
El análisis de regresión es quizá la técnica estadística más utilizada para investigar
o estimar la relación entre las variables dependientes y un conjunto de variables
explicativas independientes.
Este tipo de análisis de datos también se utiliza como término general para una
variedad de técnicas de análisis de datos que se utilizan en un método de
investigación cualitativo para modelar y analizar numerosas variables.
En el método de regresión, la variable dependiente es un predictor o un elemento
explicativo y la variable dependiente es el resultado o una respuesta a una consulta
específica.
Permite modelar una relación entre dos conjuntos de variables. Como resultado se
obtiene una ecuación utilizable para hacer proyecciones o estimaciones sobre los
datos.
5
Este modelo se caracteriza por predecir la variable Y a través de la siguiente
ecuación:
Y X =+ + αβ ε
Ejercicio:
6
Regresión Múltiple
La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre
una variable dependiente y más de una variables independientes. En este tipo de
modelos es importante testar la heterocedasticidad, la multicolinealidad y la
especificación.
El Análisis de regresión lineal múltiple es una técnica estadística utilizada para
estudiar la relación entre variables en una amplia variedad de situaciones y
predecir fenómenos diversos. La función de regresión más simple es la lineal,
donde cada variable participa de forma aditiva y constante para todo el fenómeno
observado (Hernández, Ramírez y Ferri, 2005). La regresión lineal múltiple
pone en juego más de dos variables que se exploran.
Para poder crear un modelo de regresión lineal es necesario que se cumpla
con los siguientes supuestos:
7
Linealidad: Que la relación entre las variables sea lineal.
Independencia: Que los errores en la medición de las variables
explicativas sean independientes entre sí.
8
Homocedasticidad: Que los errores tienen varianza constante.
Normalidad: Que las variables sigan la Ley Normal.
9
No Colinealidad: Que las variables independientes no estén correlacionadas
entre ellas.
10
Ejercicio:
Supongamos que tenemos el siguiente conjunto de datos con una variable de
respuesta y y dos variables predictoras X 1 y X 2 :
Paso 1: Calcule X 1 2 , X 2 2 , X 1 y, X 2 y y X 1 X 2 .
Paso 2: Calcule las sumas de regresión.
A continuación, realice los siguientes cálculos de suma de regresión:
● Σ x 1 2 = Σ X 1 2 – (sx 1 ) 2 / n = 38 767 – (555) 2 /8 = 263,875
● Σ x 2 2 = Σ X 2 2 – (sx 2 ) 2 / n = 2823 – (145) 2 /8 = 194,875
11
● Σ x 1 y = Σ X 1 y – (ΣX 1 Σy) / n = 101,895 – (555 * 1,452) / 8 = 1,162.5
● Σ x 2 y = Σ X 2 y – (ΣX 2 Σy) / n = 25,364 – (145 * 1,452) / 8 = -953.5
● Σ x 1 x 2 = Σ X 1 X 2 – (ΣX 1 ΣX 2 ) / n = 9,859 – (555 * 145) / 8 =
-200,375
Paso 3: Calcule b 0 , b 1 y b 2 .
La fórmula para calcular b 1 es: [(Σx 2 2 ) (Σx 1 y) – (Σx 1 x 2 ) (Σx 2 y)] / [(Σx 1 2 )
(Σx 2 2 ) – (Σx 1 x 2 ) 2 ]
Por lo tanto, b 1 = [(194.875) (1162.5) – (-200.375) (- 953.5)] / [(263.875) (194.875) –
(-200.375) 2 ] = 3.148
La fórmula para calcular b 2 es: [(Σx 1 2 ) (Σx 2 y) – (Σx 1 x 2 ) (Σx 1 y)] / [(Σx 1 2 )
(Σx 2 2 ) – (Σx 1 x 2 ) 2 ]
Por lo tanto, b 2 = [(263.875) (- 953.5) – (-200.375) (1152.5)] / [(263.875) (194.875) –
(-200.375) 2 ] = -1.656
La fórmula para calcular b 0 es: y – b 1 X 1 – b 2 X 2
Por lo tanto, b 0 = 181.5 – 3.148 (69.375) – (-1.656) (18.125) = -6.867
12
Paso 5: Coloque b 0 , b 1 y b 2 en la ecuación de regresión lineal estimada.
La ecuación de regresión lineal estimada es: ŷ = b 0 + b 1 * x 1 + b 2 * x 2
En nuestro ejemplo, es ŷ = -6.867 + 3.148x 1 – 1.656x 2
¿Cómo la interpretamos?
A continuación se explica cómo interpretar esta ecuación de regresión lineal
estimada: ŷ = -6.867 + 3.148x 1 – 1.656x 2
b 0 = -6,867 . Cuando ambas variables predictoras son iguales a cero, el valor
medio de y es -6,867.
b 1 = 3,148 . Un aumento de una unidad en x 1 se asocia con un aumento de 3,148
unidades en y, en promedio, suponiendo que x 2 se mantiene constante.
b 2 = -1,656 . Un aumento de una unidad en x 2 se asocia con una disminución de
1.656 unidades en y, en promedio, asumiendo que x 1 se mantiene constante.
13
Conclusión
La correlación y coeficientes tiene el propósito de encontrar una relación entre dos
variables positivas en pocas palabras es la medida específica que cuantifica la
intensidad de la relación lineal entre dos variables en un análisis de correlación. El
análisis de regresión lineal ayuda muchas veces en su mayoría para analizar al
consumidor, por ejemplo: los precios a menudo afectan el comportamiento del
consumidor, y la regresión lineal puede ayudar a analizar cómo lo hace.
Como pudimos observar, la regresión lineal múltiple consiste cuando existen dos
variables o más, podemos observar que solamente para dos variables la fórmula es:
Y= a + b1x1 +b2x2, mientras que para dos variables o más es: Y= a +
b1x1+b2x2+b3x3… b7x7, cabe recalcar que para poder utilizar las fórmulas de
regresión las variables deben de ser lineales.
Estos 3 métodos son importantes para el análisis de los proyectos por eso es
importante conocerlos y conocer sus funciones.
14
Fuentes bibliográficas:
Población, M. A. Y. D. (2001). Análisis de regresión múltiple.
[Link]
Vista de Anàlisi de regressió lineal múltiple amb SPSS: un exemple pràctic. (s. f.).
[Link]
Statologos: El sitio web para que aprendas estadística en Stata, R y Phyton. (2021). Regresión
lineal múltiple a mano (paso a paso). Statologos: El sitio web para que aprendas estadística
en Stata, R y Phyton. [Link]
Cruzito. (2020, 16 septiembre). Análisis de regresión: definición y ejemplos | Estudyando.
Estudyando. [Link]