Sesión 4
“Estadística Descriptiva e Inferencial
Mediante el uso de Minitab”
Instructor: Mtro. Francisco Antonio Torres Espriú
Sesión 4
• Regresión Lineal Simple
• Prueba de normalidad
• Gráfica de línea ajustada
• Ajuste de modelo de regresión
• Gráficas factoriales
• Predicción
• Optimizador de respuesta
• Correlación
• Pearson
• Spearman
Regresión Lineal
• Análisis de Regresión
• Un análisis de regresión genera una ecuación para describir la relación estadística
entre uno o más predictores y la variable de respuesta y para predecir nuevas
observaciones.
• La regresión lineal generalmente utiliza el método de estimación de mínimos
cuadrados ordinarios, del cual se obtiene la ecuación al minimizar la suma de los
residuos al cuadrado.
Regresión Lineal
• Análisis de Regresión
• Los resultados de la regresión identifican la dirección, el tamaño y la significancia
estadística de la relación entre un predictor y una respuesta.
• El signo de cada coeficiente indica la dirección de la relación.
• Los coeficientes representan el cambio medio en la respuesta para una unidad de
cambio en el predictor mientras se mantienen constantes otros predictores incluidos
en el modelo.
• El valor p de cada coeficiente prueba la hipótesis nula de que el coeficiente es igual a
cero (sin efecto). Por lo tanto, los valores p bajos indican que el predictor es una
adición significativa al modelo.
• La ecuación predice nuevas observaciones dados los valores predictores
especificados.
Sesión 4
Regresión
Lineal
Simple
Regresión Lineal Simple
• Regresión Lineal Simple
• Examina la relación lineal entre dos variables continuas: una respuesta (Y) y un
predictor (X).
• Cuando las dos variables están relacionadas, es posible predecir un valor de respuesta
a partir de un valor predictor con una exactitud mayor que la asociada únicamente a
las probabilidades.
• La regresión proporciona la línea que "mejor" se ajusta a los datos. Esta línea se
puede utilizar después para:
• Examinar cómo cambia la variable de respuesta a medida que cambia la variable
predictora.
• Predecir el valor de una variable de respuesta (Y) para cualquier variable predictora
(X).
Regresión Lineal Simple
• Método de Mínimos Cuadrados
• Modelo de Regresión Lineal Simple
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
Regresión Lineal Simple
• Consideraciones
• Los predictores pueden ser continuos o categóricos.
• La variable de respuesta debe ser continua.
• La recolección de datos debe ser adecuada.
• La correlación entre los predictores, también conocida como multicolinealidad (FIV), no
debe ser severa.
• El modelo debe proveer un ajuste adecuado a los datos.
• Se posee un tamaño de muestra adecuado.
• Normalidad en los datos.
Regresión Lineal Simple
• Práctica 14
• Análisis de Regresión Lineal Simple
Regresión Lineal Simple
• La prueba de acondicionamiento físico es un aspecto importante del entrenamiento
atlético. Una medida común para determinar la aptitud cardiovascular es el volumen
máximo de oxígeno que se inhala al realizar un ejercicio extenuante. Se realizo un
estudio con 24 hombres de mediana edad para analizar como el tiempo que les
tomaba correr una distancia de dos millas influía en el oxígeno que consumían, el cual
se midió con métodos estándar de laboratorio mientras los sujetos se ejercitaban en
una banda sin fin. El trabajo fue publicado en el artículo “Maximal Oxygen Intake
Prediction in Young and Middle Aged Males”, Journal of Sports Medicine 9, 1969, 17-
22. Realice un análisis completo de regresión e interprételo a detalle.
Regresión Lineal Simple
1. Prueba de Normalidad
2. Gráfica de Línea Ajustada
3. Ajustar Modelo de Regresión
4. Gráficas Factoriales
5. Predictor y Optimizador de Respuesta
Prueba de Normalidad
Prueba Uso
Detectar desviaciones en las colas de la
Anderson-Darling
distribución
Muestras menores o iguales a 50
Ryan-Jones (similar a Shapiro-Wilk)
elementos
Kolmogorov-Smirnov Muestras mayores a 50 elementos
• Hipótesis
• 𝐻0 : Los datos siguen la distribución especificada
• 𝐻1 : Los datos no siguen la distribución especificada
Prueba de Normalidad
• Abrir “Estadísticas” / • Introducir en “Variable”, • Seleccionar la prueba de
“Estadísticas Básicas” / la columna “Volumen normalidad a emplear
“Prueba de Normalidad” Máximo de O2” (en este caso, usaremos
“Anderson-Darling”)
Prueba de Normalidad
Decisión Estadística:
𝑯𝟎 se acepta, dado que
𝒑 > 𝜶 (. 𝟕𝟑𝟕 >. 𝟎𝟓)
Conclusión:
Los datos presentan
una distribución normal
Gráfica de Línea Ajustada
• Abrir “Estadísticas” / • Introducir en “Respuesta (Y)”, la columna
“Regresión” / “Gráfica “Volumen Máximo de O2”; en “Predictor (X)”,
de Línea Ajustada” la columna “Tiempo en Segundos”; en “Tipo
de modelo de regresión”, seleccionar “Lineal”
Gráfica de Línea Ajustada
Observaciones:
• Correlación Lineal
Negativa
• Correlación entre
moderada y fuerte
• Algunos datos dispersos
• Coeficiente de
Correlación de Pearson
−. 𝟖𝟏𝟐 . 𝟔𝟔
Ajustar Modelo de Regresión
• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Ajustar Modelo de Regresión”
Ajustar Modelo de Regresión
• En “Respuestas”, introducir “Volumen Máximo de O2”; en “Predictores Continuos”, introducir
“Tiempo en Segundos”
Ajustar Modelo de Regresión
• En la opción “Gráficas”, seleccionar “Pareto”;
en “Residuos para Gráficas” seleccionar
“Estandarizado” y en “Gráficas de residuos”,
seleccionar “Residuos vs ajustes”
Ajustar Modelo de Regresión
Análisis:
• Ecuación: 𝒚
ෝ = 𝟗𝟎. 𝟖𝟗 − 𝟎. 𝟎𝟓𝟏𝟑𝟑𝒙
• Ambos términos son significativos en el
modelo, dado que 𝒑 < 𝜶, por lo cual, se
justifica su presencia en la ecuación de
regresión.
• El ajuste del modelo no es adecuado, dado
que únicamente el 65.99% de la variación de
la variable respuesta se atribuye al predictor
analizado (mínimo debe ser 70%).
Ajustar Modelo de Regresión
Análisis:
• El modelo de regresión es significativo,
dado que 𝒑 < 𝜶. En este caso como sólo
tiene un predictor, sus valores son similares
al modelo.
• La suma de cuadrados del error es alta; por
ello la falta de ajuste del modelo.
• Se presentan observaciones atípicas en el
modelo, ya sea con residuos grandes o bien,
poco comunes.
Ajustar Modelo de Regresión
Análisis:
• El predictor es significativo
en el modelo de regresión.
Ajustar Modelo de Regresión
Análisis:
• Los residuos no presentan
una distribución en
particular, ya que se
encuentran aleatorizados.
Gráficas Factoriales
• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Gráficas Factoriales”
Gráficas Factoriales
• En “Respuestas”, seleccionar “Volumen Máximo • En el botón “Gráficas”, seleccionar
de O2”; en “Variables que serán incluidas en las “Gráfica de efectos principales”
gráficas”, seleccionar “Tiempo en Segundos”
Gráficas Factoriales
Análisis:
• La correlación lineal es
negativa, de forma que
conforme aumenta el
tiempo en segundos,
disminuye el volumen
máximo de O2.
Predictor
• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Predecir”
Predictor
• En “Respuestas”, seleccionar
“Volumen Máximo de O2”;
en “Tiempo en Segundos”,
ingresar el valor de “x” del
cual se quiere obtener la
predicción.
Predictor
Análisis:
• El modelo indica que a los 58
segundos, se tendría un volumen
máximo de O2 de 87.9130.
• Es posible encontrar dicho valor en un
intervalo de 75.3034 a 100.523, con un
95% de confiabilidad.
• Para observaciones futuras, es posible
encontrar el valor O2 a los 58 segundos
en un intervalo de 75.3705 a 102.456.
Optimizador de Respuesta
• Abrir “Estadísticas” / “Regresión” / “Regresión” / “Optimizador de respuesta”
Optimizador de Respuesta
• En “Meta”, seleccionar alguna de las
cuatro opciones disponibles:
• No optimizar
• Máximo
• Mínimo
• Objetivo
Optimizador de Respuesta – Minimizar
Análisis:
• El valor mínimo de O2 se dará a los 1045
segundos, con un valor de 37.25.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 33.39 y
41.10, a los 1045 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 29.04 y 45.45.
Optimizador de Respuesta – Maximizar
Análisis:
• El valor máximo de O2 se dará a los 683
segundos, con un valor de 55.83.
• Con un 95% de confianza es posible
encontrar el valor de O2 entre 53.06 y
58.60, a los 683 segundos.
• Para observaciones futuras, el valor de O2
se podrá ubicar, con un 95% de
confiabilidad, entre 48.07 y 63.58.
Receso
• Volvemos en 15 minutos
Regresión Lineal Simple
• En una industria se desea investigar Temperatura Presión
cómo influye la temperatura (°C) en la 13 2.9
presión del vapor de B-trimetilboro, los 19.5 5.1
datos obtenidos para tal propósito se 45.7 30.5
muestran en la siguiente tabla. 56.1 51.4
64.4 74.5
71.4 100.2
• Realice un análisis completo de 80.5 143.7
regresión e interprételo a detalle. 85.7 176.9
22.5 8.5
27.2 10.3
31.8 14.6
Sesión 4
Correlación
Correlación
• Correlación
• Se emplea para medir la fuerza y la dirección de la asociación entre dos variables.
• La correlación de Pearson (también conocida como r), que es el método más común,
mide la relación lineal entre dos variables continuas. Una relación es lineal cuando un
cambio en una variable se asocia con un cambio proporcional en la otra variable.
• La correlación de Spearman mide la relación monótona entre dos variables continuas
o dos variables ordinales. En una relación monótona, las variables tienden a cambiar
al mismo tiempo, pero no necesariamente a un ritmo constante. El coeficiente de
correlación de Spearman se basa en los valores jerarquizados de cada variable y no en
los datos sin procesar.
Correlación
• Consideraciones
• Los datos deben incluir al menos 2 columnas de datos numéricos o de fecha/hora.
• Los datos deben ser continuos u ordinales.
• El tamaño de la muestra debe ser de medio a grande, n ≥ 25.
• La relación entre las variables debe ser lineal (Pearson) o monótona (Spearman).
• Los valores poco comunes pueden tener un gran efecto en los resultados.
• La correlación de Pearson es más sensible a las desviaciones de la normalidad, en
tanto que la correlación de Spearman es más robusta a éstas.
Correlación
• Correlación Lineal • Correlación Monótona
Correlación
• Interpretación Coeficiente de Correlación de Pearson
Correlación
• Interpretación Coeficiente de Correlación de Spearman
Correlación
• Práctica 15
• Análisis de Correlación
Correlación
• Los solicitantes de préstamo deben proporcionar a un banco los ocho datos siguientes:
ingresos, nivel de educación, edad, tiempo viviendo en la residencia actual, tiempo
trabajando para el empleador actual, ahorros, deuda y número de tarjetas de crédito.
El administrador del banco desea analizar estos datos para determinar la mejor
manera de agruparlos y comunicarlos. El administrador recopila esta información para
30 solicitantes de préstamo.
• El administrador del banco utiliza la correlación de Pearson para examinar la fuerza y la
dirección de la relación lineal entre cada par de variables. Realice el análisis
empleando Minitab.
Correlación
• Abrir “Estadísticas” / • En el cuadro de blanco, • En “Opciones”,
“Estadísticas Básicas” / introducir desde “Edad” hasta seleccionar el método
“Correlación” “Tarj Crédito”. de “Pearson”.
Correlación
Análisis:
• Correlaciones positivas fuertes:
• Residencia – Edad (.838)
• Empleo – Edad (.848)
• Empleo – Residencia (.952)
• Correlaciones negativas:
• Tarj. Crédito – Edad (-.130)
• Deuda - Ahorros (-.393)
• Tarj. Crédito – Ahorros (-.410)
Correlación
Correlación
• Las cifras que se listan en la tabla Contenido de Contenido de
siguiente, publicadas por la Comisión Marca
Alquitrán Nicotina
Federal de Comercio, muestran los Viceroy 14 0.9
miligramos de alquitrán y nicotina que Marlboro 17 1.1
se encontraron en 10 marcas de Chesterfield 28 1.6
cigarrillos. Calcule el coeficiente de Kool 17 1.3
correlación de rangos para medir el Kent 16 1.0
grado de relación entre el contenido de Raleigh 13 0.8
alquitrán y de nicotina en cigarrillos, Old Gold 24 1.5
Philip Morris 25 1.4
empleando Minitab.
Oasis 18 1.2
Players 31 2.0
Correlación
• Abrir “Estadísticas” / • En el cuadro de blanco, • En “Opciones”,
“Estadísticas Básicas” / introducir “Contenido de seleccionar el método
“Correlación” Alquitrán” y “Contenido de de “Spearman”.
Nicotina”.
Correlación
Análisis:
• Correlación positiva muy
fuerte (.967)
Dudas
• Preguntas
• Comentarios
• Quejas
• Sugerencias
• Traumas de Regresión
Gracias Por su Asistencia
¡Ya casi terminamos!