100% encontró este documento útil (1 voto)
120 vistas18 páginas

Regresión Lineal

Este documento describe el análisis de regresión lineal simple. Explica que la regresión lineal analiza la relación entre una variable dependiente (Y) y una variable independiente (X). Detalla los pasos para realizar un análisis de regresión, incluyendo el cálculo del coeficiente de correlación, el coeficiente de determinación y el modelo de regresión lineal. El objetivo es estimar la relación entre las dos variables y predecir valores de Y basados en valores de X.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
120 vistas18 páginas

Regresión Lineal

Este documento describe el análisis de regresión lineal simple. Explica que la regresión lineal analiza la relación entre una variable dependiente (Y) y una variable independiente (X). Detalla los pasos para realizar un análisis de regresión, incluyendo el cálculo del coeficiente de correlación, el coeficiente de determinación y el modelo de regresión lineal. El objetivo es estimar la relación entre las dos variables y predecir valores de Y basados en valores de X.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

ANÁLISIS DE

REGRESIÓN LINEAL
ANÁLISIS DE REGRESIÓN

En muchas aplicaciones estadística se debe


resolver problemas que contienen dos
variables cuantitativas. En el análisis de
regresión simple:
X: Variable independiente
Y: Variable dependiente

ANÁLISIS DE CORRELACIÓN MODELO DE REGRESIÓN


- Diagrama de dispersión (método El modelo de regresión es simple:
grafico)
- Coeficiente de Correlación (r)
- coeficiente de determinación (r2)
DIAGRAMA DE DISPERSIÓN
El diagrama de dispersión es la grafica de los valores (xi, yi) de las variables X e Y
en el sistema cartesiano. En el diagrama se visualiza el tipo de correlación
existente entre las variable dependiente (Y) y la variable independiente (X).

Correlación Correlación
Correlación no
Lineal Positiva o Lineal Negativa o Correlación Nula
Lineal
Directa Inversa
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON (r)

Si el modelo tiene pendiente positiva:


El coeficiente de correlación (r) mide 0.00 ≤ r < 0.20; correlación no significativa
el grado de afinidad o asociación 0.20 ≤ r < 0.40; correlación baja
entre dos o más variables cuando 0.40 ≤ r < 0.70; correlación moderada
están relacionadas mediante una línea 0.70 ≤ r < 1; alto grado de correlación
recta. Si el modelo tiene pendiente negativa:
El coeficiente de correlación r es un -1 < r ≤ -0.70; alto grado de correlación
numero comprendido entre -1 y 1. -0.70 < r ≤ -0.40; correlación moderada
El coeficiente de correlación lineal de -0.40 < r ≤ -0.20; correlación baja
Pearson: -0.20 < r ≤ 0.00; correlación no significativa
Importante:
Si r = 1; correlación perfecta positiva entre X e
Y, todos los puntos se encuentran sobre la
recta de regresión.
Si r = -1; correlación perfecta negativa entre X
e Y, si todos los puntos se encuentran sobre la
recta de regresión.
Si r = 0; los datos son incorrelacionados.
COVARIANZA

La covarianza es una estadística que mide el grado de dispersión conjunta de


dos variables X e Y.
Las covarianzas de n valores (x1, y1), (x2, y2),..., (xn, yn) de una variable

bidimensional (X, Y) que denotaremos por Cov(X, Y) o SXY se define como la


media aritmética de los productos de la diferencia de los datos con respecto a
su correspondientes medias. Esto es:
INTERPRETACIÓN DE LA COVARIANZA
La covarianza es un valor que indica el grado de variación conjunta de
dos variables. Es el dato básico para determinar si existe una dependencia entre
ambas variables y además es el dato necesario para estimar otros parámetros
básicos, como el coeficiente de correlación lineal o la recta de regresión.
Si COV(X, Y)=SXY>0; hay dependencia directa (positiva), es decir, a grandes valores
de x corresponden grandes valores de y.
Si COV(X, Y)=SXY=0; no existe una relación lineal entre las dos variables estudiadas.

Si COV(X, Y)=SXY<0; dependencia inversa o negativa, es decir, a grandes valores de


x corresponden pequeños valores de y.
COEFICIENTE DE DETERMINACIÓN

La primera forma del estudio de la asociación entre las variables X e Y, es


denominada correlación, que consiste en determinar la variación conjunta
de las dos variables, su grado de relación y su sentido. Tal medida se
denomina coeficiente de correlación (r). El cuadrado del índice de
correlación se denomina coeficiente de determinación (r2).
El coeficiente de determinación mide la variación de Y que se explica por la
variable independiente X en el modelo de regresión.
AJUSTE DE UNA FUNCIÓN DE REGRESIÓN

Ajustar una función de regresión significa buscar o definir la función que exprese con
mayor precisión la relación entre variables. Gráficamente será aquella función que
mejor se adecué al diagrama de dispersión (nube de puntos)
En el ajuste de funciones de regresión simple, se pueden utilizar diversas funciones
matemáticas conocidas:

LÍNEA RECTA CURVA EXPONENCIAL CURVA POTENCIAL


REGRESIÓN LINEAL SIMPLE

Los parámetros b0 y b1 de la
El objetivo de la regresión simple es
función de regresión se obtienen a
estimar la relación que existe entre dos partir de las Ecuaciones Normales
variables X e Y(valor real). El modelo de obtenida por el Método de los
regresión es: Mínimos Cuadrados

= Valor estimado
Esto expresa “ es un valor estimado a
partir de valores reales de X”, que sería
un “modelo de regresión de Y sobre X”,
donde:
Y = Variable dependiente o explicada
(Valor real o valor observado)
X = Variable independiente o explicativa
SIGNIFICADO DE LA PENDIENTE DEL MODELO DE REGRESION
Si b1> 0, entonces, la tendencia lineal es creciente, es decir a mayores valores de X
corresponden mayores valores de Y.
Si b1< 0, entonces, la tendencia lineal es decreciente, es decir a mayores valores de
X corresponden menores valores de Y.
Si b1= 0, entonces, ; permanece estacionario para cualquier valor de X.

ERROR ESTANDAR DE ESTIMACION


El error estándar de estimación llamado también desviación estándar, es una
medida de dispersión de los valores observados, con respecto a la línea de
regresión (valores estimados).
Entre el valor observado y el valor estimado existe una diferencia o sesgo ,
que puede ser menor o mayor, en la medida que los n-puntos del diagrama de
dispersión estén más o menos cerca de la línea de regresión.
Ejemplo: Analizar la relación entre la edad y el tiempo efectivo de servicio de los
trabajadores, para el efecto se consideró una muestra de 15 trabajadores:
Edad
48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de
24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicio
Realizar un análisis de correlación y construir un modelo de regresión adecuado

Solución:
PASO 1: Definir las variables:
¿Cuál será la variable dependiente e
independiente?
Y: Tiempo de Servicio (Variable Dependiente)
X: Edad (Variable Independiente)
PASO 2: Diagrama de dispersión
En el grafico se observa que la nube de
puntos tiene un comportamiento lineal, con
una relación positiva en donde es posible
ajustar un modelo de regresión lineal la cual
será:
Paso 3: Realizar el siguiente procedimiento para cálculos posteriores.

Edad X Tiempo de
Servicio Y XY X2 Y2 Y estimado
48 24 1152 2304 576 23.685
40 18 720 1600 324 16.677
30 9 270 900 81 7.917
39 14 546 1521 196 15.801
46 22 1012 2116 484 21.933
42 22 924 1764 484 18.429
27 4 108 729 16 5.289
36 13 468 1296 169 13.173
34 10 340 1156 100 11.421
46 20 920 2116 400 21.933
32 12 384 1024 144 9.669
42 18 756 1764 324 18.429
40 16 640 1600 256 16.677
32 8 256 1024 64 9.669
27 6 162 729 36 5.289
561 216 8658 21643 3654 215.991
Paso 4: Análisis de correlación

El coeficiente de correlación es: Interpretación: El coeficiente


de correlación se aproxima a
1, esto significa que hay un
alto grado de asociación
entre la edad y el tiempo de
servicio

Interpretación: El 93.37% de
El coeficiente de determinación es: la variación en el tiempo de
servicio se explica por la
variación en la edad de los
trabajadores. Edad explica
muy bien al modelo de
regresión.
Paso 5: Modelo de Regresión Lineal
Interpretación:
El modelo de regresión es: b0 =-18.363 no tiene
interpretación (Casi siempre b0
no tiene interpretación)
b1 = 0.876; significa que por
cada edad adicional de los
trabajadores puede esperarse
aumentar casi 1 año de tiempo
de servicio

¿Cuál es el tiempo de servicio estimado Interpretación:


para un trabajador de 35 años de edad? Aproximadamente tendría 12
años de tiempo de servicio
efectivo
Paso 6: Error Estándar

El error estándar es:

Interpretación: El error estándar es


1.6641, indica que las observaciones
reales están bastante cerca de la línea
de regresión, esto se puede verificar
con el coeficiente de correlación, como
también observando el siguiente
grafico.
Paso 6: Error Estándar

El error estándar es:

Interpretación: El error estándar es


1.6641, indica que las observaciones
reales están bastante cerca de la línea
de regresión, esto se puede verificar
con el coeficiente de correlación, como
también observando el siguiente
grafico.
REGRESION NO LINEAL

En análisis de regresión, cuando el diagrama de dispersión no se


ajusta a una línea recta, hablamos de modelos no lineales, la cual
se pueden trasformar los valores de las variables X e Y, obtener los
estadígrafos de la misma forma como hemos hallado
anteriormente. Los modelos de regresión a estudiar son:
MUCHAS
GRACIAS

También podría gustarte