100% encontró este documento útil (1 voto)
438 vistas31 páginas

Análisis de Regresión Lineal Múltiple

El análisis de regresión lineal múltiple permite establecer la relación entre una variable dependiente y múltiples variables independientes. Se aplica cuando se desea predecir o explicar el comportamiento de una variable basado en varias variables que influyen en ella. Por ejemplo, para predecir la resistencia a las arrugas de la tela de algodón, un investigador químico considerará múltiples predictores como variables independientes.

Cargado por

Miguel Reyes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
438 vistas31 páginas

Análisis de Regresión Lineal Múltiple

El análisis de regresión lineal múltiple permite establecer la relación entre una variable dependiente y múltiples variables independientes. Se aplica cuando se desea predecir o explicar el comportamiento de una variable basado en varias variables que influyen en ella. Por ejemplo, para predecir la resistencia a las arrugas de la tela de algodón, un investigador químico considerará múltiples predictores como variables independientes.

Cargado por

Miguel Reyes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

REGRESIÓN

UNIDAD 4. TEMA 2

LINEAL
MÚLTIPLE
DISEÑO EXPERIMENTAL

Ing. Angélica Indacochea Vásquez


El Análisis de Regresión Lineal Múltiple nos
permite establecer la relación que se produce
entre una variable dependiente Y y un conjunto
de variables independientes (X1, X2, ... XK).
INTRODUCCIÓN
INTRODUCCIÓN
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a


situaciones de análisis real puesto que los fenómenos, hechos y procesos
sociales, por definición, son complejos y, en consecuencia, deben ser explicados
en la medida de lo posible por la serie de variables que, directa e indirectamente,
participan en su concreción.
Al aplicar el análisis de regresión múltiple lo
más frecuente es que tanto la variable
dependiente como las independientes sean
variables continuas medidas en escala de
intervalo o razón.
No obstante, caben otras posibilidades:
(1) también podremos aplicar este análisis
cuando relacionemos una variable dependiente
continua con un conjunto de variables
categóricas;
(2) o bien, también aplicaremos el análisis de
regresión lineal múltiple en el caso de que
relacionemos una variable dependiente
nominal con un conjunto de variables
continuas.
INTRODUCCIÓN En muchas situaciones prácticas existen varias variables
independientes que se cree que influyen o están relacionadas
con una variable de respuesta Y, y por lo tanto, será necesario
tomar en cuenta si se quiere predecir o entender mejor el
comportamiento de Y.

Por ejemplo, para explicar o predecir el consumo de


electricidad en una casa habitación tal vez sea necesario
considerar el tipo de residencia, el número de personas que la
habitan, la temperatura promedio de la zona, etcétera.
MODELO DE REGRESIÓN LINEAL
MÚLTIPLE
Sea X1, X2, …, Xk variables independientes o

DISEÑO EXPERIMENTAL
regresoras, y sea Y una variable de respuesta,
entonces el modelo de regresión lineal múltiple
con k variables independientes es el polinomio de
primer orden:

donde los Bj son los parámetros del modelo que se conocen como
coeficientes de regresión y E es el error aleatorio, con

En general, la ecuación representa un hiperplano en el espacio de k


dimensiones generado por las variables {Xj}.
El término lineal del modelo de regresión se emplea debido a que la
ecuación es función lineal de los parámetros desconocidos B0, B1, …, Bk.

La interpretación de éstos es muy similar a lo ya explicado para el caso de


regresión lineal simple: B0 es la ordenada al origen y Bj mide el cambio
esperado en Y por cambio unitario en Xj cuando el resto de las variables
regresoras se mantienen fijas o constantes.
Es frecuente que en la práctica se requieran modelos de mayor orden para explicar
el comportamiento de Y en función de las variables regresoras. Por ejemplo,
supongamos que se tienen dos variables independientes y que se sospecha que la
relación entre Y y algunas de las variables independientes es cuadrática, por ello
quizá se requiera un polinomio de segundo orden como modelo de regresión:

Éste también es un modelo de regresión lineal múltiple, ya que la ecuación es una


función lineal de los parámetros desconocidos B0, B1, ..., B22. Pero, además, si
definimos entonces la ecuación puede escribirse
así:
PARA ESTIMAR LOS PARÁMETROS DE LA REGRESIÓN LINEAL MÚLTIPLE SE NECESITA
CONTAR CON N DATOS (N > K), QUE TIENEN LA ESTRUCTURA DESCRITA EN LA TABLA, EN
ÉSTA SE APRECIA QUE PARA CADA COMBINACIÓN DE VALORES DE LAS VARIABLES
ANÁLISIS DE REGRESIÓN MÚLTIPLE

REGRESORAS, (X1I, …, XKI), SE OBSERVA UN VALOR DE LA VARIABLE DEPENDIENTE, YI .

En términos de los datos, el modelo de regresión lineal múltiple puede escribirse de la siguiente manera:
GRÁFICA DE RESIDUOS

REGRESIÓN LINEAL MÚLTIPLE


Gráfica de probabilidad
Histograma de residuos
normal de los residuos

Residuos vs. ajustes Residuos vs. orden


WHAT YOU'LL BE DOING
HISTOGRAMA DE
RESIDUOS
El histograma de residuos muestra la
distribución de los residuos para todas las
observaciones.
Interpretación
Utilice el histograma de los residuos para determinar si los datos son asimétricos o incluyen valores atípicos.
Los patrones en la siguiente tabla pueden indicar que el modelo no cumplen con las premisas del modelo.

Una larga cola en una Una barra que se encuentra muy


dirección alejada de las otras barras

Asimetría Un valor atípico

Puesto que la apariencia de un histograma depende del número de intervalos usados para agrupar los datos,
no utilice un histograma para evaluar la normalidad de los residuos. En su lugar, utilice una gráfica de
probabilidad normal.

Un histograma es más efectivo cuando tiene aproximadamente 20 o más puntos de datos. Si la muestra es
demasiado pequeña, entonces cada barra en el histograma no contiene suficientes puntos de datos para de
manera fiable mostrar asimetría o valores atípicos.
LA GRÁFICA DE PROBABILIDAD NORMAL
DE LOS RESIDUOS MUESTRA LOS

GRÁFICA DE RESIDUOS VS. SUS VALORES ESPERADOS


CUANDO LA DISTRIBUCIÓN ES NORMAL.

PROBABILIDAD
NORMAL DE LOS
RESIDUOS
Los patrones siguientes no cumplen con el supuesto de que los residuos están distribuidos
normalmente.
La curva descendente implica una Algunos puntos alejados de la
La curva S implica una distribución La curva S invertida implica una
distribución con asimetría a la línea implican una distribución
con colas largas. distribución con colas cortas.
derecha. con valores atípicos.

UTILICE LA GRÁFICA DE PROBABILIDAD NORMAL DE LOS RESIDUOS PARA VERIFICAR EL SUPUESTO DE QUE LOS RESIDUOS ESTÁN
DISTRIBUIDOS NORMALMENTE. LA GRÁFICA DE PROBABILIDAD NORMAL DE LOS RESIDUOS DEBE SEGUIR APROXIMADAMENTE UNA
LÍNEA RECTA.
La gráfica de residuos vs. ajustes muestra los residuos en el eje Y y los valores ajustados en el eje X.

Gráfica con Valor atípico Gráfica con varianza no


Uno de los puntos es mucho más grande que constante
todos los otros puntos. Por lo tanto, el La varianza de los residuos aumenta con los
Residuos vs. ajustes
punto es un valor atípico. Si hay demasiados valores ajustados. Tenga en cuenta que, a
valores atípicos, el modelo podría no ser medida que el valor de los ajustes aumenta,
aceptable. Usted debe tratar de identificar la dispersión entre los residuos se amplía.
la causa de cualquier valor atípico. Corrija Este patrón indica que las varianzas de los
cualquier error de entrada de datos o de residuos son desiguales (no constante).
medición. Considere eliminar los valores de
datos que estén asociados con eventos
anormales y únicos (causas especiales). A
continuación, repita el análisis.

Dispersión en abanico o irregular de los


residuos en los valores ajustados
RESIDUOS Interpretación

VS. ORDEN
Utilice la gráfica de residuos vs. orden para verificar el supuesto
de que los residuos son independientes entre sí. Los residuos
independientes no muestran tendencias ni patrones cuando se
La gráfica de residuos vs. orden muestran en orden cronológico. Los patrones en los puntos
muestra los residuos en el orden en podrían indicar que los residuos que están cercanos entre sí
que se recopilaron los datos. podrían estar correlacionados y, por lo tanto, podrían no ser
independientes. Lo ideal es que los residuos que se muestran en la
gráfica se ubiquen aleatoriamente alrededor de la línea central:
RESIDUOS VS. ORDEN

Tendencia Cambio Ciclo

Si observa un patrón, investigue la causa. Los siguientes tipos de patrones


pueden indicar que los residuos son dependientes.
EJERCICIO
UN INVESTIGADOR QUÍMICO DESEA ENTENDER CÓMO SE ASOCIAN DIFERENTES
PREDICTORES Y LA RESISTENCIA A LAS ARRUGAS DE LA TELA DE ALGODÓN. EL
QUÍMICO EXAMINA 32 PIEZAS DE CELULOSA DE ALGODÓN A DIFERENTES
CONFIGURACIONES DE TIEMPO DE CURADO, TEMPERATURA DE CURADO,
CONCENTRACIÓN DE FORMALDEHÍDO Y RELACIÓN DE CATALIZADOR. SE
REGISTRÓ LA CALIFICACIÓN DEL PLANCHADO PERMANENTE, UNA MEDIDA DE
RESISTENCIA A LAS ARRUGAS, PARA CADA PRODUCTO.

El químico realiza un análisis de regresión múltiple para ajustar un modelo con los predictores y eliminar los
predictores que no tengan una relación estadísticamente significativa con la respuesta.
MINITAB
1. Elija Estadísticas > Regresión > Regresión >
Ajustar modelo de regresión.
2. En Respuestas, ingrese Calificación.
3. En Predictores continuos, ingrese Conc Relación
Temp Tiempo.
4. Haga clic en Gráficas.
5. En Gráficas de residuos, elija Cuatro en uno.
6. En Residuos versus las variables, ingrese Conc
Relación Temp Tiempo.
7. Haga clic en Aceptar en cada cuadro de diálogo.
ELIJA ESTADÍSTICAS > REGRESIÓN > REGRESIÓN > AJUSTAR
MODELO DE REGRESIÓN.
EN RESPUESTAS, INGRESE CALIFICACIÓN.
EN PREDICTORES CONTINUOS, INGRESE CONC, RELACIÓN, TEMP,
TIEMPO.
HAGA CLIC EN GRÁFICAS > EN GRÁFICAS DE RESIDUOS, ELIJA CUATRO EN UNO > EN
RESIDUOS VERSUS LAS VARIABLES, INGRESE CONC, RELACIÓN, TEMP Y TIEMPO.
INTERPRETACIÓN DE
RESULTADOS

Los predictores temperatura, relación de catalizador y concentración de


formaldehído tienen valores  p que son menores que el nivel de significancia de
0.05. Estos resultados indican que estos predictores tienen un efecto
estadísticamente significativo sobre la resistencia a las arrugas. El valor  p de
tiempo es mayor que 0.05, lo que indica que no hay suficiente evidencia para
concluir que el tiempo está relacionado con la respuesta. El químico debería volver
a ajustar el modelo sin este predictor.
Los predictores explican el 72.92% de
72.92% la varianza de la calificación del
planchado.
GRÁFICA DE RESIDUOS
Los puntos de la gráfica de residuos
vs. ajustes no parecen estar
distribuidos aleatoriamente alrededor
de cero. Parece haber conglomerados
de puntos que podrían representar
diferentes grupos en los datos. El
químico debería investigar los grupos
para determinar su causa.
La gráfica de residuos vs. relación muestra curvatura,
lo que sugiere una relación curvilínea entre la relación
de catalizador y las arrugas. El químico debería
considerar agregar al modelo un término cuadrático
para la relación.

También podría gustarte