0% encontró este documento útil (0 votos)
58 vistas31 páginas

Análisis de Regresión Lineal Simple

1) La sesión aborda el análisis de regresión lineal simple para evaluar la relación entre dos variables y pronosticar la variable dependiente. 2) Los objetivos son identificar las variables en regresión lineal, calcular la recta de regresión para realizar pronósticos, y mostrar las ventajas de la regresión lineal para la toma de decisiones. 3) La regresión lineal determina la relación entre una variable dependiente y una o más independientes para pronosticar valores de la variable dependiente.

Cargado por

danna rojas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
58 vistas31 páginas

Análisis de Regresión Lineal Simple

1) La sesión aborda el análisis de regresión lineal simple para evaluar la relación entre dos variables y pronosticar la variable dependiente. 2) Los objetivos son identificar las variables en regresión lineal, calcular la recta de regresión para realizar pronósticos, y mostrar las ventajas de la regresión lineal para la toma de decisiones. 3) La regresión lineal determina la relación entre una variable dependiente y una o más independientes para pronosticar valores de la variable dependiente.

Cargado por

danna rojas
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Bienvenido a la sesión seis de la materia «Estadística Aplicada» de la Licenciatura en

Administración de Empresas.

1
En esta sesión abordaremos el tema de “Análisis de regresión lineal simple”.

2
El objetivo general de esta sesión consiste en evaluar la relación entre dos variables
aplicando el método de regresión lineal simple para pronosticar la variable dependiente.

3
Esta es la agenda para esta sesión:

Subtema 1. Ecuación y recta de regresión;


Subtema 2. El método de mínimos cuadrados;
Subtema 3. Determinación de la ecuación de regresión;
Subtema 4. El modelo de regresión y sus supuestos;
Subtema 5. Inferencias estadísticas sobre la pendiente de la recta de regresión

4
Los objetivos específicos de esta sesión son los siguientes.

Objetivo cognitivo: identificar las variables que intervienen en la aplicación del


método de regresión lineal para realizar proyecciones.

Objetivo procedimental: calcular la recta de regresión por medio de ejercicios


prácticos para realizar pronósticos que permitan tener información confiable para la
toma de decisiones.

Objetivo actitudinal: mostrar las ventajas del uso de la regresión lineal para generar
información en base a datos muestrales para crear proyecciones con el fin de tomar
mejores decisiones.

5
Para tomar decisiones es útil hacer predicciones futuras con base en la relación de algo ya
conocido y lo que se desea estimar. En esta sesión lo que se pretende es mostrar cómo
determinar la relación entre variables y para eso se utilizaran las herramientas conocidas
como análisis de regresión y correlación que sirven para determinar la naturaleza y la
fuerza de una relación entre dos variables. Es posible pronosticar el valor de una variable
desconocida con base en observaciones anteriores de ésa y otras variables.

6
El término regresión se usó por primera vez como un concepto estadístico en 1877 por sir
Francis Galton, quien realizó un estudio que mostró que la estatura de los hijos de padres
altos tiende a retroceder o “regresar” hacia la estatura media de la población.

Llamó así al proceso general de predecir una variable (la estatura de los niños) a partir de
otra (la estatura del padre o de la madre) (Levin, 2004, p. 510).

7
El análisis de regresión se basa en la relación entre dos (o más) variables.
La variable (o variables) conocida(s) se llaman variable(s) independiente(s).
La que se trata de predecir es la variable dependiente.

Ejemplo:
Se espera que las ventas de una empresa se incrementen al aumentar los gastos de
publicidad.

8
En una relación directa al incrementarse la variable independiente, la variable dependiente
también lo hace. Se puede graficar colocando la variable independiente en el eje X y la
variable dependiente en el eje Y.

La pendiente de la recta sube cuando X toma valores más grandes. Se dice que la pendiente
de esta recta es positiva, porque Y crece si X crece. (Levin, 2004).

9
Es una relación inversa cuando la variable dependiente disminuye al aumentar la variable
independiente y se caracteriza por una pendiente negativa (la variable dependiente Y
disminuye al aumentar la variable independiente X).

El primer paso para determinar si existe una relación entre dos variables es analizar la
gráfica de los datos observados o conocidos. Esta gráfica es conocida como diagrama de
dispersión.

10
Ejemplo (Levin, 2004, p. 512): El director de admisiones de una universidad desea
determinar si existe una relación entre las calificaciones de un estudiante en su examen de
admisión y su promedio general al graduarse. Se ha reunido una muestra aleatoria de datos
de los registros de la universidad en la siguiente tabla.

11
Se transfiere la información de la tabla a una gráfica.

Como el director desea utilizar las calificaciones de los exámenes para pronosticar éxitos
en la universidad se coloca el promedio de calificaciones acumulado (la variable
dependiente) en el eje vertical o Y, y la calificación del examen de admisión (la variable
independiente) en el eje horizontal o X. La figura nos muestra el diagrama de dispersión
completo.

12
El patrón de puntos resulta al registrar cada par de datos de la tabla como un punto.
Cuando vemos todos estos puntos juntos, se puede visualizar la relación que existe entre
las dos variables. Se puede “ajustar” una línea recta a través del diagrama de dispersión
para representar la relación (Lind, 2012).

13
La línea trazada a través de los puntos representa una relación directa, porque Y se
incrementa al aumentar X. Como los puntos están relativamente cerca de esta línea, se
puede decir que existe un alto grado de asociación entre las calificaciones de exámenes y el
promedio de calificaciones acumulativo.
La relación descrita por los puntos está bien descrita por una línea recta por lo q que es una
relación lineal. La relación entre las variables X y Y también puede tomar la forma de una
curva. Los especialistas en estadística la llaman relación curvilínea.

14
En el diagrama de dispersión utilizado, se colocó la recta de regresión ajustando la línea
visualmente entre los puntos de datos, para calcularla de forma más precisa se utiliza una
ecuación que relaciona las dos variables matemáticamente.

La ecuación para una línea recta donde la variable dependiente Y está determinada por la
variable independiente X. (Lind, 2012).

15
Para estimar la ecuación de la recta Y con base en X se le denomina ecuación de regresión.

Ecuación de Regresión: Ecuación que expresa la relación lineal entre dos variables (Lind,
2012, p. 476).
En el análisis de regresión lo que se pretende es utilizar los datos para trazar una línea que
represente mejor la relación entre las dos variables.
La recta trazada con una regla tiene una desventaja su posición se basa en el criterio de la
persona que traza la recta.

16
Es preferible utilizar un método que proporcione una sola y mejor línea de regresión.
Este método se conoce como principio de los mínimos cuadrados, genera lo que
comúnmente se conoce como recta del “mejor ajuste”.
Principio de los mínimos cuadrados: Determina una ecuación de regresión al minimizar la
suma de los cuadrados de las distancias verticales entre los valores reales de Y, y los valores
pronosticados de Y (Lind, 2012, p. 477).

17
La fórmula de la recta de mejor ajuste es:
𝑌 = 𝑎 + 𝑏𝑋
𝑌 es el valor de la estimación de la variable Y para un valor X seleccionado.
𝑎 es la intersección Y. Es el valor estimado de Y cuando X = 0.
𝑏 es la pendiente de la recta.
X es cualquier valor de la variable independiente que se seleccione.

18
La forma general de la ecuación de la regresión lineal es la misma que la de cualquier línea,
a es la intersección con Y y b es la pendiente.
El objetivo de un análisis de regresión es calcular los valores de a y b para desarrollar una
ecuación lineal que se ajuste mejor a los datos.
Las fórmulas de a y b son:
𝑠𝑦
Pendiente de la recta de regresión 𝑏 = 𝑟 𝑠
𝑥
donde :
r es el coeficiente de correlación.
𝑠𝑦 es la desviación estándar de Y (la variable dependiente).
𝑠𝑥 es la desviación estándar de X (la variable independiente).

19
Intersección con el eje Y 𝑎 = 𝑌 − 𝑏𝑋
donde:
𝑌es la media de Y (la variable dependiente).
𝑋 es la media de X (la variable independiente).

20
Las suposiciones para aplicar de forma adecuada la regresión lineal.
1. Para cada valor de X, existen valores Y correspondientes. Estos valores Y siguen la
distribución normal.
2. Las medias de estas distribuciones normales se encuentran en la recta de regresión.

21
3. Todas las desviaciones estándar de estas distribuciones normales son iguales. La mejor
estimación de esta desviación estándar común es el error estándar de la estimación.
4. Los valores Y son estadísticamente independientes. Esto significa que, al seleccionar una
muestra, una X particular no depende de ningún otro valor de X. Esta suposición es
importante cuando los datos se recopilan durante cierto periodo. En esas situaciones, los
errores de un periodo particular con frecuencia están correlacionados con los de otros
períodos. (Levin, 2004).

22
La gráfica ilustra las suposiciones:

1. Sigue una distribución normal;


2. Tiene una media en la recta de regresión;
3. Tiene el mismo error estándar de estimación y;
4. Es independiente de las demás. (Lind, 2012).

23
El objetivo de la ecuación de regresión es cuantificar una relación lineal entre dos variables.
El siguiente paso es analizar la ecuación de regresión mediante una prueba de hipótesis
para ver si la pendiente de la recta de regresión es distinta a cero lo que implica concluir
que al usar la ecuación de regresión aumenta la capacidad de pronosticar la variable
dependiente con base en la variable independiente (Lind, 2012, p. 483).

24
Si no se puede demostrar que esta pendiente es distinta de cero, entonces se concluye que
no tiene caso utilizar la variable independiente como elemento de predicción y que se
puede utilizar la media de la variable dependiente como factor de predicción, en vez de
usar la ecuación de regresión (Lind, 2012, p. 483).

25
De acuerdo con el procedimiento de prueba de hipótesis, las hipótesis nula y alternativa
son:
𝐻0 : 𝛽 = 0
𝐻1 : 𝛽 ≠ 0
La letra griega beta 𝛽 representa la pendiente de la población de la ecuación de regresión y
se identifica el valor de la pendiente como b. Así que la pendiente “b” calculada se basa en
una muestra y es una estimación de la pendiente de la población, identificada como “𝛽".

26
La hipótesis nula es que la pendiente de la ecuación de regresión de la población es cero, si
es el caso la recta de regresión es horizontal y no existe relación entra la variable
independiente, X, y la variable dependiente, Y. Es decir, el valor de la variable dependiente
es el mismo para cualquier valor de la variable independiente, y no ayuda para calcular el
valor de la variable dependiente (Lind, 2012).

27
Si se rechaza la hipótesis nula y se acepta la hipótesis alternativa, se deduce que la
pendiente de la recta de regresión de la población no es igual a cero. Por lo tanto, conocer
el valor de la variable independiente permite realizar una mejor estimación de la variable
dependiente y existe una relación significativa entre ambas variables (Lind, 2012).

28
Para probar la hipótesis nula se usa la distribución t con (n – 2 grados de libertad) y la
siguiente fórmula:
𝑏−0
Prueba de la pendiente 𝑡 = 𝑠
𝑏
Con n - 2 grados de libertad
donde:
b es la estimación de la pendiente de la recta de regresión, calculada a partir de la
información de la muestra.
𝑠𝑏 es el error estándar de la estimación de la pendiente, determinado a partir de la
información de la muestra.

29
• En la toma de decisiones es útil el poder hacer predicciones de una variable basándose
en información de otra variable.
• El diagrama de dispersión es una herramienta que permite ver la relación de las
variables mediante puntos en los ejes X Y.
• Para encontrar la recta más adecuada en la relación de las variables se utiliza la ecuación
de regresión y el método de los mínimos cuadrados.
• A partir de la pendiente de la recta de regresión se pueden hacer inferencias.

30
Para profundizar en los temas de esta sesión te sugerimos la siguiente bibliografía.

31

También podría gustarte