¿Qué tipo de análisis de regresión se puede realizar con Minitab?
Investiga y explica cada una de ellas
MiniTab es una gran herramienta para los estadísticos, desde su
desarrollo como estudiante hasta cuando ya se encuentran en un área laboral
como bien se describen ciertas reseñas en institutos universitarios y negocios.
Existen diversos análisis de regresión en este programa, que nos ayudaran
dependiendo de lo que llevemos a cabo entre ellos tenemos que más destaco
son:
Regresion lineal: Este tipo de regresión también la podríamos
conseguir en libros, revistas o en internet u otra herramienta similar que
Minitab como regresión lineal simple, o también regresión lineal bivariada,
quise hacer un poco de énfasis aquí porque a nivel de investigación de este
trabajo me di cuenta a nivel de un foro que uno persona no conseguía la
regresión lineal y bien en aquella herramienta no era más que la regresión
lineal bivariada, y creía que había un tipo de diferencia en contra otras cosas.
Ahora de que va este tipo de regresión pues es aquella que vamos a utilizar
para los problemas de predicción de un valor en una variable, pero esto va a
depender en función del valor de una variable independiente. Ahora ¿Que es
esa variable dependiente? Bueno la podemos denominar como la variable de
resultado, o bien de objetivo o criterio del problema, por otro lado, la variable
independiente la denominamos como la variable predictora, explicativa o bien
regresiva. Es mucho donde aparecen estas variables y es por ello que lo mejor
es conocer que es cada una, y como puede denominarse. Quisiera hacer un
ejemplo de manera más acorde al mundo real. Por ejemplo podríamos usar la
regresión lineal para comprender la adrenalina que podrían experimentar los
jugadores de la selección Mexicana ante un partido de futbol, esto lo podemos
predecir en función del tiempo de partido, con esto podríamos decir que la
variable dependiente seria la “Adrenalina ante el partido importante” medida a
través de un índice de adrenalina, y la variable que denominamos
anteriormente como independiente no sería otra que “tiempo de revisión”, que
podemos medir en horas (Mejor aún si el partido se va al segundo tiempo
extra). Optativo a esto, podemos usar esa regresión lineal para comprender la
aceleración de la respiración (Aquí es donde la sangre moviliza más oxígeno y
desecha más dióxido de carbono) esto se puede predecir en función del tiempo
dedicado (La variable dependiente seria la “concentración de sangre” medida
en función a la volemia que es una fórmula de 70mL x peso de persona está a
su ves depende de la grasa corporal siendo más grasa equivalente a menos
sangre pero todo lo podemos formular en una variable. o bien pensé
formularlo asi con la información previa dada y la variable independiente seria
el “Tiempo que se dedique a la actividad”). Algo que me parece interesante
ya en este punto es la diversidad del programa en función a lo que podemos
conseguir a los libros. Por ejemplo, si nos conseguimos con el caso de que
tenemos ya sea dos o más variables ya aparece la regresión múltiple que
podemos usar en el programa, más adelante hablare de esta. Ahora si el caso
aparece que, si se quiere realizar una relación lineal, pero no buscamos hacer
una predicción, podemos usar algo llamado ‘Correlación de Pearson’. Si el
caso es que la variable dependiente es dicotómica es decir que hay solo dos
opciones ‘Si y no’, ‘Niño y niña’, podemos usar la opción de regresión
logística binomial me baso en la versión 19 del software.
Ahora quisiera hacer un poco más de énfasis porque a la hora de utilizar
este tipo de regresión hay que tener en cuenta algo 7 supuestos:
1. Que la variable dependiente debe medirse a nivel continuo ya sea
de intervalo o de una razón variable.
2. Que la variable independiente debe medirse a nivel continuo o
categórico.
3. Es necesario una relación lineal entre las variables dependientes e
independientes.
4. No deben existir valores atípicos significativos
5. Debemos tener independencia de las observaciones, esto la
herramienta nos da la facilidad de verificar con la estadistia de Durbin-Watson
6. Los datos deben mostrar Homocedasticidad.
7. Verificar los residuos es decir los errores
Regresion ortogonal: Este tipo de regresión es otra que podemos
conseguir con el nombre de regresión de Deming, aunque en justo en el
programa aparece ‘Regresion ortogonal’ pero es para cualquier caso que
tengamos que resolver es decir que en el libro o ejercicio aparezca regresión
de Deming y no como regresión ortogonal. Ahora bien esta regresión examina
la relación lineal entre dos variables continuas. Es muy usado para calcular
equivalencia de instrumentos en la parte clínica. A diferencia de la regresión
lineal simple, tanto la respuesta como el predictor en la regresión ortogonal
contienen un error de medición. En la regresión simple, solo la variable de
respuesta contiene un error de medición.
Regresión lineal múltiple: Esta sección de minitab en cuanto a
regresión múltiple no es más que una prueba de hipótesis que determina si
existe una correlación entre dos o más valores de X y la salida, Y, de datos
continuos. Es útil para determinar el nivel al que los cambios en Y pueden
atribuirse a una o más X. La regresión múltiple produce aquí algo que
denominamos una "ecuación de predicción" que estima el valor de Y que se
puede esperar para valores dados de uno o más valores de X dentro del rango
del conjunto de datos.
Un ejemplo seria para los conductores de trailers del país quisieran
probar el rendimiento de la gasolina pero que estuviera correlacionado con la
cantidad de zonas empinadas y uso del aire acondicionado, calcularíamos
aproximadamente cuantas zonas empinadas existen por donde este pasa y
tiempo de uso del aire acondicionado se requiere para lograr el rendimiento
optimo o deseado de la diésel.
Regresión de mínimos cuadrados: Para este caso son aquellos datos
que sugieren una relación lineal entre ‘X’ e ‘Y’, la línea para este caso que
mas ajusta es la línea de regresión con la ecuación ŷ = a + b x. Ahora la línea
de regresión de mínimos cuadrados hace la distancia vertical desde los puntos
de datos hasta la línea de regresión sea lo más pequeña posible. Ahora por que
a diferencia de las demás regresiones esta tiene un nombre tan en particular
como ‘mínimos cuadrados’ porque la mejor línea de ajuste es aquella que
minimiza la varianza es decir la suma de los cuadrados de los errores.
Resultaria un tanto complejo ver esto a primera vista al comienzo pero su
objetivo es aquella ecuación que se ajuste lo mas posible a los puntos
Regresión Logística: Bueno aquí nos encontramos con un método
estadístico que predice la probabilidad de que ocurra un evento ajustando los
datos a una curva logística utilizando una función logística. El análisis de
regresión utilizado aquí es para predecir el resultado de una variable
dependiente categórica, basado en una o más variables predictoras. La función
logística utilizada para modelar las probabilidades describe el posible
resultado de un solo ensayo en función de las variables explicativas. La
variable dependiente en una regresión logística puede ser binaria (por ejemplo,
1/0, sí / no, pasa / no pasa), nominal (azul / amarillo / verde) u ordinal
(satisfecho / neutral / insatisfecho). Se utiliza una regresión logística binomial
como dijimos anteriormente para predecir una variable dependiente
dicotómica (como el ejemplo de 1/0 si/no, entre otros) basada en una o más
variables independientes continuas o nominales. Es el tipo más común de
regresión logística como bien aparece en la comunidad y, a menudo, se
denomina simplemente regresión logística. Sin embargo, en Minitab se
refieren a ella como regresión logística binaria. En muchos sentidos, una
regresión logística binomial se puede considerar como una regresión lineal
múltiple dependiendo el caso, pero para una variable dependiente dicotómica
en lugar de continua aquí parte la diferencia.
Investigue la fórmula de regresión línea en Minitab y explica
cada uno de sus términos
y = b + m1 x1 + m2 x2 +… + Mn xn
Donde y es la variable dependiente y las diversas xi Son los independientes
variables. La constante, b, es la intersección en y para todo xi = 0, y los
diversos mi Son las pendientes/ coeficientes de las correspondientes variables
independientes, xi. A diferencia del caso bidimensional , y = mx + b, en el
que la variable independiente x es la única contribuyente a cambios
predecibles en la variable dependiente, en regresión múltiple, diferentes
variables independientes contribuyen de manera desigual a los cambios en la
dependencia variable. Por lo tanto, en cualquier regresión múltiple, es
importante evaluar las contribuciones y es asi como vamos poco a poco
desarrollando la formula y aprendemos lo que hace en cada paso y no solo
agregamos datos y ya. Otra manera de definirlo seria
y = b 0 + b 1 X 1 + b 2 X 2 + ... + b k X k
En la ecuación de regresión, las letras representan lo siguiente:
y es la variable de respuesta
b 0 es la constante
b 1 , b 2 , ..., b k son los coeficientes
X 1 , X 2 , ..., X k son los valores del término
Dos características principales en MatLab son
Como opción para estandarizar las variables continuas, Minitab usó
unidades codificadas para ajustar el modelo.
Minitab no puede transformar los coeficientes codificados en
coeficientes no codificados para la ecuación de regresión porque el
modelo no es jerárquico. Para obtener una ecuación de regresión en
unidades no codificadas, especifique un modelo jerárquico o utilice
unidades no codificadas.
En el documento hay un ejemplo resuelto
¿Qué indican los resultados obtenidos en el cuadro de resumen
del modelo?
No es mas en resumen que el 63.61% de la variación de Y se debe a la
intervención de X y que el promedio de las desviaciones de las estimaciones
es de 0.11. R2(ajustado) muestra un porcentaje de la variación del modelo. R2
por su parte es el resultado de la suma de la resta de los ‘predictivos’ y el
ajustado es la suma de la raíz cuadrada de la diferencia entre el observador y
predictiva
Investigue por lo menos 3 Software para estadística y explica las
características más importantes de cada uno de ellos
Lenguaje R:
Este lenguaje es imposible dejarlo por fuera, dado que es un lenguaje
de programación con toda una interfaz y un entorno de software para la
computación estadística. No son solo los estadistas, se ha viralizado mucho
por toda la web y bien si entras a cualquier foro sobre minación de
criptomonedas puedes conseguirte un tutorial o todo una documentación
donde los mineros implementan el lenguaje para realizar análisis de datos
complejos. Dentro posee el lenguaje que es interpretado y la interfaz principal
con la que te encuentras es una línea de comandos, en su estructuración nativa
incluye vectores, escalares, matrices que bien en lo que programación se
refiere es parecido a una tabla en una base de datos relacional y a partir de ello
no necesita tantas cosas externas. Una de las razones por la que es piloto en su
estilo y tan popular es que cuando realizas operaciones aritméticas matricial
complejas puedes conseguir una velocidad comparable que la que puedes
conseguir con MatLab. Aquí también consigues lo que es la regresión lineal,
una documentación donde al comienzo te das cuenta que es un a de las
técnicas de modelado predictivo que mas se utiliza a nivel universal habla
como el objetivo es que encuentra la ecuación matemática para una variable
continua Y en una o más X variables, asi de este modo nos enseña que se
puede predecir ‘Y’ cuando solo conocemos ‘X’
SPSS:
Es un gran software que al igual que MinTab ofrece análisis
estadísticos que hacen de lo complejo algo más simple a la hora del análisis
gráfico. También ofrece un apartado que donde es aplicable a proyectos o
resolución de ejercicios de cualquier nivel de complejidad. Cuando buscas su
objetivo o lo que lo caracteriza según ellos de otras empresas es que se maneja
de dos grandes ámbitos uno que mejora totalmente la eficiencia de uso y
minimizas en gran escala el riesgo general a partir de enfoque de generación
de hipótesis de abajo arriba. Es un programa versátil y receptivo diseñado para
realizar una variedad de procedimientos estadísticos. El software SPSS se usa
ampliamente en una variedad de disciplinas y su uso esta en escalas
exponenciales en todos los grupos de computadoras de escuelas de estadísticas
de las Universidad de Australia del Sur. El significado de las siglas son SPSS
(Statistical package for the social sciences). Pero La aplicación básica de este
programa es analizar datos científicos relacionados con las ciencias
sociales. Estos datos se pueden utilizar para estudios de mercado, encuestas,
minería de datos . Este software puede manejar y operar información
fácilmente con la ayuda de algunas técnicas. Estas técnicas se utilizan para
analizar, transformar y producir un patrón característico entre diferentes
variables de datos. Además, la salida se puede obtener a través de una
representación gráfica para que el usuario pueda comprender fácilmente el
resultado. Por ejemplo posee MANOVA (análisis multivariado de varianza) :
este método se utiliza para comparar datos de variables aleatorias cuyo valor
se desconoce. La técnica MANOVA también se puede utilizar para analizar
diferentes tipos de población y qué factores pueden afectar sus elecciones.
Stata:
Stata ofrece paquetes muy similares a los 2 software previamente
mencionados. Una cosa atractiva a nivel universal en el área de estadística es
su calidad/precio y que posee una documentación extensa pero más allegada a
las personas que incursionan en el uso de software estadístico. Hay tantas
opciones para crear un gráfico. Se tarda menos de un minuto en copiar de una
plantilla y pegar los comandos en un proyecto que llevemos en ese momento.
De lo averiguado quisiera destacar unos aspectos que este software ofrece:
El análisis se puede realizar utilizando menús desplegables o sintaxis,
para adaptarse tanto a usuarios principiantes como avanzados.
El análisis se puede realizar utilizando menús desplegables o sintaxis,
para adaptarse tanto a usuarios principiantes como avanzados.
Métodos estadísticos de vanguardia.
Excelente soporte integrado para el modelado de ecuaciones
estructurales.
Los modelos que realicemos se pueden especificar mediante sintaxis o
con un diagrama de ruta.
Una Comunidad en línea grande y activa; repositorios de paquetes aportados
por el usuario.
Referencia
La opinión personal a la hora de responder y una investigación ostentosa por
internet y opiniones en foro, las respuestas van a partir de un conocimiento
individual que de a poco he adquirido y adquirí nuevo a la hora de investigar y
por supuesto las clases y ejemplos impartidos por el profesor. Una porción de
la referencia de esta información es a partir de la siguiente obra:
Johnson R.A. (2012). Probabilidad para ingenieros. México: Pearson,
PRENTICE HALL.