RESUMEN S01-02 TAM - REGRESIÓN LINEAL
Los modelos de regresión estudian la relación estocástica cuantitativa entre una variable de interés y un
conjunto de variables explicativas. Estos modelos son muy utilizados y su estudio conforma un área de
investigación clásica dentro de la disciplina de la Estadística desde hace muchos años.
Cuando se estudia la relación entre una variable de interés, variable respuesta o variable dependiente
Y
y un conjunto de variables regresoras (explicativas, independientes)
X1 , X2 , … , Xn
pueden darse diferentes situaciones.
En la mayoría de los problemas de investigación en los que se aplica el análisis de regresión se necesita más de
una variable independiente para el modelo de regresión. La complejidad de la mayoría de mecanismos
científicos es tal que, con el fin de predecir una respuesta importante, se requiere un modelo de regresión.
MODELO DE REGRESIÓN LINEAL SIMPLE
y=β 0 + β 1 x 1 +ε
o bien
y= ^y + e=b0 +b 1 x 1 +e
donde ε y e son el error aleatorio y el residual, respectivamente, asociados con la respuesta y y con el valor
ajustado ^y .
β i y b i son estimadores poblacionales y muéstrales respectivamente (pendientes o coeficientes asociadas a la
variable).
Se dice que y ≈ ^y , por tanto, nosotros encontraremos ^y =b0 +b 1 x 1
EJEMPLO-1 RLS
Las empresas suelen utilizar la regresión lineal para comprender la relación entre el gasto en publicidad y los
ingresos. Por ejemplo, podrían ajustarse a un modelo de regresión lineal simple utilizando el gasto en
publicidad como variable de predicción y los ingresos como variable de respuesta.
El modelo de regresión tomaría la siguiente forma:
ingresos=b0 +b1 (gasto publicitario)
El coeficiente b 0 representaría los ingresos totales esperados cuando la inversión publicitaria es cero.
El coeficiente b 1 representaría el cambio promedio en los ingresos totales cuando la inversión publicitaria
aumenta en una unidad (por ejemplo, un lempira).
Si b 1 es negativo, significaría que una mayor inversión publicitaria se asocia con menos ingresos.
Si b 1 está cerca de cero, significaría que la inversión publicitaria tiene poco efecto sobre los ingresos.
Y si β 1 es positivo, significaría que una mayor inversión publicitaria se asocia con más ingresos.
Dependiendo del valor de b 1, una empresa puede decidir disminuir o aumentar su gasto publicitario.
EJEMPLO-2 RLS
Los investigadores médicos suelen utilizar la regresión lineal para comprender la relación entre la dosis del
fármaco y la presión arterial de los pacientes. Por ejemplo, los investigadores pueden administrar varias dosis
de un determinado medicamento a los pacientes y observar cómo responde su presión arterial. Pueden
ajustarse a un modelo de regresión lineal simple utilizando la dosis como variable predictiva y la presión
arterial como variable de respuesta.
El modelo de regresión tomaría la siguiente forma:
presión arterial=b 0+ b1 (dosis)
El coeficiente b 0 representaría la presión arterial esperada cuando la dosis es cero.
El coeficiente b 1 representaría el cambio promedio en la presión arterial cuando la dosis se incrementa en una
unidad.
Si b 1 es negativo, significaría que un aumento de la dosis se asocia con una disminución de la presión arterial.
Si b 1 está cerca de cero, significaría que un aumento en la dosis se asocia con ningún cambio en la presión
arterial.
Si b 1 es positivo, significaría que un aumento de la dosis se asocia con un aumento de la presión arterial.
Dependiendo del valor de b 1, los investigadores pueden decidir cambiar la dosis administrada a un paciente.
CONCLUSIÓN
La regresión lineal se utiliza en una amplia variedad de situaciones de la vida real en muchos tipos diferentes
de industrias. Afortunadamente, el software estadístico facilita la realización de regresiones lineales.
ELEMENTOS E INTERPRETACIÓN EN LA REGRESIÓN LINEAL
En este proceso:
1. Describimos la ecuación de regresión lineal simple;
2. Examinamos el coeficiente de correlación múltiple y de determinación.
3. Utilizamos el análisis de correlación múltiple para determinar qué tan bien la ecuación de regresión describe
los datos observados.
4. Además, en la regresión múltiple podemos observar el error estándar, hacer predicciones, interpretar cada
una de las pendientes en las variables independientes y probar si contribuyen de manera significativa a la
forma en que la regresión describe los datos.
A)Idea para la interpretación de la ecuación de regresión lineal simple, coeficiente de
correlación múltiple y el coeficiente de determinación.
Previamente:
Digitar los datos en Excel.
Utilizar la herramienta de análisis de datos en Excel para generar la hoja de resultados.
Ver las grabaciones de semana 01 en caso de olvidar cómo hacerlo.
A partir de un análisis de regresión lineal simple, se obtiene el modelo;
^y =b0 ±b 1 x
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.86 (poner el
número con dos decimales) indica una relación muy buena (buena 0.60-0.79, muy buena 0.80-0.99,
perfecta 1) entre las dosis y la presión arterial. (nombrar la variable independiente x y la variable
dependiente ^y ).
Además, se observa que las dosis (nombrar la variable independiente x ) explica en un 83.02%(poner el
número con dos decimales pero en porcentaje) el comportamiento de la presión arterial (nombrar la
variable dependiente ^y ).
Idea para hacer una predicción e interpretar involucrando el error típico de la
regresión.
Previamente:
Buscar en Excel, los valores mínimo y máximo de todas las variables involucradas.
Dar un valor cualquiera a la variable x (variable independiente), que esté en el rango [mínimo, máximo]
encontrado como referencia para esta misma variable.
Sustituir el valor de x (variable independiente) y evaluar en Excel.
Verificar que el valor obtenido está en el rango [mínimo, máximo] de ^y (variable dependiente).
Formar los intervalos posibles en Excel:
IC 68.3 %= ^y ± ( 1 )( error típico )
IC 95.5 %= ^y ±(2)(error típico )
IC 99.7 %= ^y ±(3)(error típico )
Con un 95.5% (68.3, 95.5 o 99.7) de confianza y considerando 3 dosis (nombrar y dar el valor para la variable
independiente x ), se estiman que la presión arterial estimada en VALOR DE PREDICCION varíe entre esto y
lo otro (nombrar y dar los valores obtenidos para la variable dependiente ^y ).
c) Idea para hacer una interpretación de la pendiente obtenida en la variable
independiente y cómo establecer e interpretar un intervalo de confianza al
95%(90% o más) para la pendiente de la variable independiente.
Pendiente:
Si b 1 es una pendiente positiva: Por cada (x), entonces (y) aumenta en b 1
Si b 1 es una pendiente negativa: Por cada (x), entonces (y) disminuye en b 1
Intervalo de confianza:
Si ambos límites son positivos: Con un nivel de confianza del 95%, por cada (x), entonces (y) aumenta entre
LI y LS.
Si ambos límites son negativos: Con un nivel de confianza del 95%, por cada (x), entonces (y) disminuye
entre LI y LS.
Si el LI es negativo y el LS es positivo: Por cada (x), entonces (y) puede disminuir hasta en LI o aumentar
hasta LS.
Por cada dosis (nombrar la variable independiente x ), la presión arterial (nombrar la variable dependiente ^y )
aumenta tanto (dar el valor de b 1). Con un nivel de confianza de 95% (90% o más), se esperaría que la presión
arterial aumente entre tanto y tanto (dar el valor LI y LS).
ÁREA DE CIENCIAS Y MATEMÁTICAS
Técnicas y análisis multivariado _ Práctica S01-02
Instrucciones: a continuación, se le presenta un caso en el cual se debe aplicar el análisis de regresión lineal múltiple para dar
respuestas a las preguntas formuladas.
Considere el conjunto de datos de la tabla 12.15, los cuales reflejan el interés de un
fabricante de grava asfáltica en la relación que existe entre las ventas durante un año
específico y los factores que influyen en ellas. (Los datos fueron tomados de Kutner et al.,
2004).
Se recolectaron los siguientes datos:
Cuentas promocionales Cuentas activas Marcas en competencia Potencial Ventas (miles Lps.)
Distrito X1 X2 X3 X4 Y
1 5.5 31 10 8 79.3
2 2.5 55 8 6 200.1
3 8.0 67 12 9 163.2
4 3.0 50 7 16 200.1
5 3.0 38 8 15 146.0
6 2.9 71 12 17 177.7
7 8.0 30 12 8 30.9
8 9.0 56 5 10 291.9
9 4.0 42 8 4 160.0
10 6.5 73 5 16 339.4
11 5.5 60 11 7 159.6
12 5.0 44 12 12 86.3
13 6.0 50 6 6 237.5
14 5.0 39 10 4 107.2
15 3.5 55 10 4 155.0
Tabla 12.15
RESULTADOS DE LA REGRESIÓN LINEAL SIMPLE
a. Determinar la ecuación de regresión lineal simple. Incluya la interpretación del coeficiente de correlación
múltiple y el coeficiente de determinación.
Nota
Coeficiente de correlación Relación
0 Nula
(0 , 0.20] Muy débil
(0.20 , 0.40] Débil
(0.40 , 0.60) Neutra
[0.60 , 0.80) Buena Hay un buen ajuste en el
[0.80 , 1) Muy buena modelo.
1 Perfecta
A partir de un análisis de regresión lineal simple, se obtiene el modelo;
^y =396.1−25.1 x
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.80 indica una
relación muy buena entre las marcas en competencia y las ventas (en miles de lempiras).
Además, se observa que Marcas en competencias explica en un 64% el comportamiento de ventas (en miles
de dólares).
b. Haga una predicción e interprete el error típico de la regresión.
Con un 95.5% de confianza y considerando 7 marcas en competencias se estiman que ventas serán de 220.7
en miles de lempiras aproximadamente, lo cual puede variar entre 120.7 y 320.7 en miles de lempiras.
o
Con un 95.5% de confianza y considerando 7 marcas en competencias se estiman que
ventas serán de L 220,700.00 aproximadamente, lo cual puede variar entre L 120,700.00 y L 320,700.00 .
c. Interprete la pendiente y establezca un IC al 90%.
Por cada marca en competencia, las ventas disminuyen en 25.1 miles de lempiras.
o
Por cada marca en competencia, las ventas disminuyen en L 25,100.00 aproximadamente.
Con un nivel de confianza del 90% por cada marca en competencia, las ventas pueden disminuir entre 15.8
y 34.3 miles de lempiras.
O
Por cada marca en competencia, las ventas disminuyen en L 25,100.00 aproximadamente. Con una
confianza del 90%, las ventas disminuyen entre L 15,800.00 y L34,300.00
Otra situación (-34.3, +15.8)
Por cada marca en competencia, las ventas disminuyen en L 25,100.00 aproximadamente. Con una
confianza del 90%, las ventas pueden disminuyen hasta L 34,300.00 o pueden aumentar hasta L 15,800.00
PAUTA SOBRE LA ESTRUCTURA PARA PRESENTAR EL AC#1
Portada
Introducción (Regresión Lineal Simple y la mercadotecnia)
Describir la situación (La situación que se le proporcionó y la tabla)
Resultados del AC#1
A partir de un análisis de regresión lineal simple, se obtiene el modelo;
^y =396.1−25.1 x
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.80 indica una
relación muy buena entre las marcas en competencia y las ventas (en miles de lempiras).
Además, se observa que Marcas en competencias explica en un 64% el comportamiento de ventas (en miles
de dólares).
Con un 95.5% de confianza y considerando 7 marcas en competencias se estiman que
ventas serán de L 220,700.00 aproximadamente, lo cual puede variar entre L 120,700.00 y L 320,700.00 .
Por cada marca en competencia, las ventas disminuyen en L 25,100.00 aproximadamente. Con una confianza
del 90%, las ventas disminuyen entre L 15,800.00 y L34,300.00
Conclusiones (Regresión Lineal Simple y la mercadotecnia)
Recomendaciones (Regresión Lineal Simple y la mercadotecnia)
ANEXOS (Todo los apuntes previos de a), b) y c) )
RESUMEN S03-04 TAM - REGRESIÓN LINEAL
MODELO DE REGRESIÓN LINEAL MÚLTIPLE
y=β 0 + β 1 x 1 + β 2 x 2 +∙∙ ∙+ β k x k + ε
o bien
y= ^y + e=b0 +b 1 x 1 +b2 x 2+∙ ∙∙+ bk x k + e
donde ε y e son el error aleatorio y el residual, respectivamente, asociados con la respuesta y y con el valor
ajustado ^y .
β i y b i son estimadores poblacionales y muéstrales respectivamente (pendientes o coeficientes asociadas a la
variable).
Se dice que y ≈ ^y , por tanto, nosotros encontraremos ^y =b0 +b 1 x 1+ b2 x 2 +∙ ∙∙+b k x k
EJEMPLO-3 RLM
Los científicos agrícolas suelen utilizar la regresión lineal para medir el efecto de los fertilizantes y el agua en el
rendimiento de los cultivos. Por ejemplo, los científicos pueden usar diferentes cantidades de fertilizante y
agua en diferentes campos y ver cómo afecta el rendimiento de los cultivos. Pueden ajustarse a un modelo de
regresión lineal múltiple utilizando fertilizantes y agua como variables predictoras (variables “x”) y el
rendimiento del cultivo como variable de respuesta (Variable “y”).
El modelo de regresión tomaría la siguiente forma:
rendimiento del cultivo=b 0 +b1 ( cantidad de fertilizante ) +b 2 (cantidad de agua)
El coeficiente b 0 representaría el rendimiento esperado del cultivo sin fertilizante ni agua.
El coeficiente b 1 representaría el cambio promedio en el rendimiento del cultivo cuando el fertilizante se
incrementa en una unidad, asumiendo que la cantidad de agua permanece sin cambios.
El coeficiente b 2 representaría el cambio promedio en el rendimiento del cultivo cuando el agua se incrementa
en una unidad, asumiendo que la cantidad de fertilizante permanece sin cambios.
Dependiendo de los valores de b 1 y b2, los científicos pueden cambiar la cantidad de fertilizante y agua utilizados
para maximizar el rendimiento del cultivo.
EJEMPLO-4 RLM
Los científicos de datos de los equipos deportivos profesionales a menudo utilizan la regresión lineal para
medir el efecto que tienen los diferentes regímenes de entrenamiento en el rendimiento del jugador. Por
ejemplo, los científicos de datos de la NBA podrían analizar cómo diferentes cantidades de sesiones semanales
de yoga y sesiones de levantamiento de pesas afectan la cantidad de puntos que anota un jugador. Pueden
ajustarse a un modelo de regresión lineal múltiple utilizando sesiones de yoga y sesiones de levantamiento de
pesas como variables predictoras y los puntos totales anotados como variable de respuesta.
El modelo de regresión tomaría la siguiente forma:
puntos obtenidos=b0 +b 1 ( sesiones de yoga ) +b2 ( sesiones de levantamiento de pesas )
El coeficiente b 0 representaría los puntos esperados anotados para un jugador que participa en cero sesiones
de yoga y cero sesiones de levantamiento de pesas.
El coeficiente b 1 representaría el cambio promedio en los puntos obtenidos cuando las sesiones semanales de
yoga se incrementan en uno, asumiendo que el número de sesiones semanales de levantamiento de pesas
permanece sin cambios.
El coeficiente b 2 representaría el cambio promedio en los puntos obtenidos cuando las sesiones de
levantamiento de pesas semanales se incrementan en uno, asumiendo que el número de sesiones de yoga
semanales permanece sin cambios.
Dependiendo de los valores de b 1 y b 2 , los científicos de datos pueden recomendar que un jugador participe en
sesiones de yoga y levantamiento de pesas más o menos semanales para maximizar sus puntos obtenidos.
ÁREA DE CIENCIAS Y MATEMÁTICAS
Técnicas y análisis multivariado _ Práctica S03-04
Instrucciones: a continuación, se le presenta un caso en el cual se debe aplicar el análisis de regresión lineal múltiple para dar
respuestas a las preguntas formuladas.
Considere el conjunto de datos de la tabla 12.15, los cuales reflejan el interés de un fabricante de grava asfáltica en la
relación que existe entre las ventas durante un año específico y los factores que influyen en ellas. (Los datos fueron
tomados de Kutner et al.,
2004).
Se recolectaron los siguientes datos:
Cuentas promocionales Cuentas activas Marcas en competencia Potencial Ventas (miles Lps.)
Distrito X1 X2 X3 X4 Y
1 5.5 31 10 8 79.3
2 2.5 55 8 6 200.1
3 8.0 67 12 9 163.2
4 3.0 50 7 16 200.1
5 3.0 38 8 15 146.0
6 2.9 71 12 17 177.7
7 8.0 30 12 8 30.9
8 9.0 56 5 10 291.9
9 4.0 42 8 4 160.0
10 6.5 73 5 16 339.4
11 5.5 60 11 7 159.6
12 5.0 44 12 12 86.3
13 6.0 50 6 6 237.5
14 5.0 39 10 4 107.2
15 3.5 55 10 4 155.0
Tabla 12.15
RESULTADOS DE LA REGRESIÓN LINEAL MÚLTIPLE
a) Determinar la ecuación de regresión lineal múltiple. Incluya la interpretación del coeficiente de correlación
múltiple y el coeficiente de determinación.
A partir de un análisis de regresión lineal múltiple, se obtiene el modelo;
^y =177.2+2.2 x 1+ 3.5 x 2 +(−22.2) x3 +0 . 2 x 4
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.999 indica una
relación muy buena, casi perfecta entre las cuentas promocionales, cuentas activas, marcas en competencia y
potencial con respecto a las ventas.
Además, se observa que cuentas promocionales, cuentas activas, marcas en competencia y potencial, explican
en un 99.7% las ventas.
b) Haga una predicción e interprete el error típico de la regresión.
Con un 95.5% de confianza y considerando 5 cuentas promocionales, 55 cuentas activas, 7 marcas en
competencias y un potencial de 10, se estiman que las ventas serán de L 229,600.00 aproximadamente, lo
cual puede variar entre L 219,400.00 y L 239,800.00.
c) Interprete todas las pendientes y establezca solamente para una pendiente un IC al 95%.
^y =177.2+2.2 x 1+ 3.5 x 2 +(−22.2) x 3+ 0.2 x 4
Por cada cuenta promocional, por cada cuenta activa y por cada punto en el potencial, las ventas aumentan
aproximadamente en L 2,200.00, L 3,500.00 y L 200.00 respectivamente. Además, por cada marca en
competencia, las ventas disminuyen en L. 22,200.00 aproximadamente.
Con un nivel de confianza del 95%, se esperaría que, por cada punto en el potencial, las ventas pueden
disminuir hasta en L 500.00 o aumentar hasta L 900.00 aproximadamente.
PAUTA SOBRE LA ESTRUCTURA PARA PRESENTAR EL AC#2
Portada
Introducción
Describir la situación
Resultados del AC#2
A partir de un análisis de regresión lineal múltiple, se obtiene el modelo;
^y =177.2+2.2 x 1+ 3.5 x 2 +(−22.2) x3 +0 . 2 x 4
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.999 indica una
relación muy buena, casi perfecta entre las cuentas promocionales, cuentas activas, marcas en competencia y
potencial con respecto a las ventas.
Además, se observa que cuentas promocionales, cuentas activas, marcas en competencia y potencial, explican
en un 99.7% las ventas.
Con un 95.5% de confianza y considerando 5 cuentas promocionales, 55 cuentas activas, 7 marcas en
competencias y un potencial de 10, se estiman que las ventas serán de L 229,600.00 aproximadamente, lo
cual puede variar entre L 219,400.00 y L 239,800.00.
Por cada cuenta promocional, por cada cuenta activa y por cada punto en el potencial, las ventas aumentan
aproximadamente en L 2,200.00, L 3,500.00 y L 200.00 respectivamente. Además, por cada marca en
competencia, las ventas disminuyen en L. 22,200.00 aproximadamente.
Con un nivel de confianza del 95%, se esperaría que, por cada punto en el potencial, las ventas pueden
disminuir hasta en L 500.00 o aumentar hasta L 900.00 aproximadamente.
Conclusiones
Recomendaciones
ANÁLISIS DE PROBABILIDAD EN LA REGRESIÓN LINEAL MÚLTIPLE
Inferencias acerca de una pendiente individual Bi
• Diferencia entre la ecuación de regresión verdadera y una estimada a partir de las observaciones de la
muestra.
• Prueba de una hipótesis acerca de Bi .
• Error estándar del coeficiente de regresión.
• Estandarización del coeficiente de regresión.
• Intervalo de confianza para Bi
Coeficiente de regresión estandarizado
bi−Bi
t= 0
sb i
b i=¿ Pendiente de la regresión ajustada
Bi =¿ Pendiente real hipotética para la población
0
sb =¿ Error estándar del coeficiente de regresión
Prueba para determinar si una variable es o no significativa
−t c ≤ t o ≤ t c
t c =¿Valor t adecuado (con-k-1 grados de libertad) para el nivel de significancia de la prueba
t o=¿ Valor t observado (o calculado) obtenido con el paquete de sofware
Procedimiento para pruebas de hipótesis
Establecer la hipótesis nula
Establecer la hipótesis alterna
Definir el nivel de significancia
Conocer la región critica
Cálculos necesarios
Decisión
ÁREA DE CIENCIAS Y MATEMÁTICAS
Técnicas y análisis multivariado _ Práctica S04
Instrucciones: a continuación, se le presenta un caso en el cual se debe aplicar el análisis de regresión lineal múltiple
para dar respuestas a las preguntas formuladas.
Considere el conjunto de datos de la tabla 12.15, los cuales reflejan el interés de un
fabricante de grava asfáltica en la relación que existe entre las ventas durante un
año específico y los factores que influyen en ellas. (Los datos fueron tomados de
Kutner et al.,
2004).
Se recolectaron los siguientes datos:
Cuentas promocionales Cuentas activas Marcas en competencia Potencial Ventas (miles Lps.)
Distrito X1 X2 X3 X4 Y
1 5.5 31 10 8 79.3
2 2.5 55 8 6 200.1
3 8.0 67 12 9 163.2
4 3.0 50 7 16 200.1
5 3.0 38 8 15 146.0
6 2.9 71 12 17 177.7
7 8.0 30 12 8 30.9
8 9.0 56 5 10 291.9
9 4.0 42 8 4 160.0
10 6.5 73 5 16 339.4
11 5.5 60 11 7 159.6
12 5.0 44 12 12 86.3
13 6.0 50 6 6 237.5
14 5.0 39 10 4 107.2
15 3.5 55 10 4 155.0
Tabla 12.15
RESULTADOS DEL ANÁLISIS DE PROBABILIDAD EN LA REGRESIÓN LINEAL MÚLTIPLE
Iniciar con el modelo de la RLM
A partir de un análisis de regresión lineal múltiple, se obtiene el modelo;
^y =4438.52+32.16 x 1±3.23 x 2+ 4.75 x3
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.81 indica una
relación muy buena entre las remuneraciones, ventas y utilidades con respecto a la cantidad de empleo.
Además, se observa que las remuneraciones, las ventas y las utilidades, explican en un 66% la cantidad de
empleos generados.
Interpretar: El valor P para cada variable independiente
Establezca cuáles de las variables independientes (x) involucradas en el análisis son significativas explicativas.
Indique lo anterior utilizando el valor P (Columna de probabilidad) de la hoja de resultados. Con un nivel de
significancia del 15%.
Con un nivel de significancia del 15% en la prueba de significancia global y en la individual, por cada millón de
dólares en ventas, entonces la generación de empleo aumenta significativamente en 3.23 o su equivalente,
en aproximadamente 3 nuevos empleos.
Plantear una prueba de hipótesis. Para realizarlo deben de formular las hipótesis (nula y alterna) que
quieren probar, mostrar los resultados numéricos de sustento, contrastar los resultados contra las hipótesis
y determinar conclusiones.
¿“Las ventas” es una variable explicativa significativa? Respuesta: Si.
Hipótesis nula
H 0 : β 2=0 No se acepto
H 0 : β i=0
Supongo que, no hay aumento significativo a través de la pendiente positiva de esa variable.
Hipótesis alterna
H 1 : β2 >0 Si se acepto
H 1 : βi <0 para pendientes negativas
H 1 : βi >0 para pendientes positivas
Supongo que, si hay aumento significativo a través de la pendiente positiva de esa variable.
Nivel de significancia
α =0.15 ( 15 % )
α =0.05 ( 5 % ) o α =0.10 ( 10 % ) o α =0.15(15 %)
Región crítica
Grados de libertad
v=n−k−1=14−3−1=10
Los grados de libertad también se visualizan en la parte de “Residuos”
t 0.15 ,10=1.093
t=1.722
Si el estadístico de prueba queda en la parte sombreada se acepta la hipótesis alterna (de lo contrario se
acepta la hipótesis nula)
Estadístico de prueba
t=1.723
Decisión e interpretación
Se acepta H 1 , con un nivel de significancia del 15% hay suficiente evidencia estadística para decir que la
variable ventas es significativa explicativa, o lo mismo, muestra un aumento significativo en la predicción de
empleos.
PAUTA SOBRE LA ESTRUCTURA PARA PRESENTAR EL RT#1
Portada
Introducción
Describir la situación
Resultados del RT#1
A partir de un análisis de regresión lineal múltiple, se obtiene el modelo;
^y =4438.52+32.16 x 1+3.23 x 2 +4.75 x 3
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.81 indica una
relación muy buena entre las remuneraciones, ventas y utilidades con respecto a la cantidad de empleo.
Además, se observa que las remuneraciones, las ventas y las utilidades, explican en un 66% la cantidad de
empleos generados.
Con un nivel de significancia del 15% en la prueba de significancia global y en la individual, por cada millón de
dólares en ventas, entonces la generación de empleo aumenta significativamente en 3.23 o su equivalente,
en aproximadamente 3 nuevos empleos.
Evidencia Prueba de Hipótesis
Hipótesis nula
H 0 : β 2=0
Hipótesis alterna
H 1 : β2 >0
Nivel de significancia
α =0.15 ( 15 % )
Región crítica
Grados de libertad
v=n−k−1=14−3−1=10
t 0.15 ,10=1.093
t=1.722
t=1.723
Decisión e interpretación
Se acepta H 1 , con un nivel de significancia del 15% hay suficiente evidencia estadística para decir que la
variable ventas es significativa explicativa, o lo mismo, muestra un aumento significativo en la predicción de
empleos.
Conclusiones
Recomendaciones
Otro ejemplo _ /2023
A partir de un análisis de regresión lineal múltiple, se obtiene el modelo;
^y =4438.52+32.16 x 1+3.23 x 2 +4.75 x 3
Se muestra un buen ajuste, considerando que el coeficiente de correlación múltiple de 0.81 indica una
relación muy buena entre las remuneraciones, ventas y utilidades con respecto a la cantidad de empleo.
Evidencia Prueba de Hipótesis para la tercera pendiente
Hipótesis nula
H 0 : β 3=0
Hipótesis alterna
H 1 : β3 >0
Nivel de significancia
α =0.05 ( 5 % )
Región crítica
Grados de libertad (Residuos)
v=n−k−1=14−3−1=10
t 0.05 ,10=1.812
t=0.181
t=1.723(t calculado el que está en lahoja de resultados de excel)
Decisión e interpretación
Se acepta H 0 , con un nivel de significancia del 5% no hay suficiente evidencia estadística para decir que la
variable utilidades es significativa explicativa, o lo mismo, muestra un aumento pero no es significativo en la
predicción de empleos.