Regresión múltiple
1. Introducción
2. Marco teórico
3. Aplicación de Regresión Múltiple
4. Conclusiones
5. Bibliografía de Regresión
I.- INTRODUCCIÓN
Como la Estadística Inferencial nos permite trabajar con una variable
a nivel de intervalo o razón, así también se puede comprender la
relación de dos o más variables y nos permitirá relacionar mediante
ecuaciones, una variable en relación de la otra variable llamándose
Regresión Lineal y una variable en relación a otras variables
llamándose Regresión múltiple.
Casi constantemente en la practica de la investigación estadística, se
encuentran variables que de alguna manera están relacionados entre
si, por lo que es posible que una de las variables puedan relacionarse
matemáticamente en función de otra u otras variables.
II.- MARCO TEORICO
REGRESIÓN.-
Se define como un procedimiento mediante el cual se trata de
determinar si existe o no relación de dependencia entre dos o más
variables. Es decir, conociendo los valores de una variable
independiente, se trata de estimar los valores, de una o más
variables dependientes.
La regresión en forma grafica, trata de lograr que una dispersión de
las frecuencias sea ajustada a una línea recta o curva.
Clases de Regresión
La regresión puede ser Lineal y Curvilínea o no lineal, ambos tipos
de regresión pueden ser a su vez:
a. Regresión Simple: Este tipo se presenta cuando una variable
independiente ejerce influencia sobre otra variable dependiente.
Ejemplo: Y = f(x)
Esta regresión se utiliza con mayor frecuencia en las ciencias
económicas, y sus disciplinas tecnológicas. Cualquier función no
lineal, es linealizada para su estudio y efectos prácticos en las
ciencias económicas, modelos no lineales y lineales
multiecuacionales.
Objetivo: Se utiliza la regresión lineal simple para:
1.- Determinar la relación de dependencia que tiene una variable
respecto a otra.
2.- Ajustar la distribución de frecuencias de una línea, es decir,
determinar la forma de la línea de regresión.
3.- Predecir un dato desconocido de una variable partiendo de
los datos conocidos de otra variable.
Por ejemplo: Podría ser una regresión de tipo lineal:
En una empresa de servicio de Internet busca relacionar las
ganancias que obtiene cada computadora con el numero de usuarios
que ingresan a dicha cabina diariamente. En la tabla representa Y (Ganancias S/.) e
X (Numero de usuarios)
Y 100 98 99 102 102 111 97 104 102 96
X 116 96 110 105 99 106 100 109 98 108
Coeficiente de Regresión
Indica el número de unidades en que se modifica la variable
dependiente "Y" por efecto del cambio de la variable
independiente "X" o viceversa en una unidad de medida.
Clases de coeficiente de Regresión:
El coeficiente de regresión puede ser: Positivo, Negativo y Nulo.
Es positivo cuando las variaciones de la variable independiente X
son directamente proporcionales a las variaciones de la variable
dependiente "Y"
Es negativo, cuando las variaciones de la variable independiente
"X" son inversamente proporcionales a las variaciones de las
variables dependientes "Y"
Es nulo o cero, cuando entre las variables dependientes "Y" e
independientes "X" no existen relación alguna.
Procedimiento para hallar el Coeficiente de Regresión
Para determinar el valor del coeficiente de regresión de una
manera fácil y exacta es utilizando el método de los Mínimos
Cuadrados de dos maneras:
1.- Forma Directa
De la ecuación de la recta:
Si y , se obtienen a partir de las ecuaciones normales:
Aplicando normales Y sobre X tenemos:
El Coeficiente de Regresión es
De la misma manera la recta de regresión de "X" sobre "Y" será
dada de la siguiente manera:
Donde: y se obtienen a partir de las ecuaciones normales:
Aplicando normales X sobre Y tenemos:
2.- Forma Indirecta del Método de los Mínimos Cuadrados.
El fundamento de este método es de las desviaciones de X
respecto a su media aritmética. X
Ecuación de y sobre x Ecuación de y sobre x
Donde:
x, y = desviaciones
X = media aritmética
Y = media aritmética
b. Regresión Múltiple: Este tipo se presenta cuando dos o más
variables independientes influyen sobre una variable
dependiente. Ejemplo: Y = f(x, w, z).
Por ejemplo: Podría ser una regresión de tipo múltiple:
Una Empresa de desarrollo de software establece relacionar
sus Ventas en función del numero de pedidos de los tipos de
software que desarrolla (Sistemas, Educativos y
Automatizaciones Empresariales), para atender 10 proyectos
en el presente año.
En la Tabla representa Y (Ventas miles de S/.) e X (Nº pedidos de sistemas), W
(Nº de pedidos de Aplicaciones Educativas) y Z (Nº de pedidos de
Automatizaciones empresariales).
Y 440 455 470 510 506 480 460 500 490 450
X 50 40 35 45 51 55 53 48 38 44
W 105 140 110 130 125 115 100 103 118 98
Z 75 68 70 64 67 72 70 73 69 74
Objetivo: Se presentara primero el análisis de regresión
múltiple al desarrollar y explicar el uso de la ecuación de
regresión múltiple, así como el error estándar múltiple de
estimación. Después se medirá la fuerza de la relación entre
las variables independientes, utilizando los coeficientes
múltiples de determinación.
Análisis de Regresión Múltiple
Dispone de una ecuación con dos variables independientes
adicionales:
Se puede ampliar para cualquier número "m" de variables
independientes:
Para poder resolver y obtener y en una ecuación de
regresión múltiple el cálculo se presenta muy tediosa porque
se tiene atender 3 ecuaciones que se generan por el método de
mínimo de cuadrados:
Para poder resolver se puede utilizar programas informáticos
como AD+, SPSS y Minitab y Excel.
El error estándar de la regresión múltiple
Es una medida de dispersión la estimación se hace más precisa
conforme el grado de dispersión alrededor del plano de
regresión se hace mas pequeño.
Para medirla se utiliza la formula:
Y : Valores observados en la muestra
: Valores estimados a partir a partir de la
ecuación de regresión
n : Número de datos
m : Número de variables independientes
El coeficiente de determinación múltiple
Mide la tasa porcentual de los cambios de Y que pueden ser
explicados por , y simultáneamente.
III.- APLICACION DE REGRESION MULTIPLE
Mediante el siguiente problema podremos ilustrar la aplicación de
Regresión Multiple:
En la Facultad de Ingeniería de Sistemas y Computo de la
Universidad "Inca Garcilaso de la Vega" se quiere entender los
factores de aprendizaje de los alumnos que cursan la asignatura de
PHP, para lo cual se escoge al azar una muestra de 15 alumnos y
ellos registran notas promedios en las asignaturas de Algoritmos,
Base de Datos y Programación como se muestran en el siguiente cuadro.
Alumno PHP Algoritmos Base de Datos Programación
1 13 15 15 13
2 13 14 13 12
3 13 16 13 14
4 15 20 14 16
5 16 18 18 17
6 15 16 17 15
7 12 13 15 11
8 13 16 14 15
9 13 15 14 13
10 13 14 13 10
11 11 12 12 10
12 14 16 11 14
13 15 17 16 15
14 15 19 14 16
15 15 13 15 10
Lo que buscamos es construir un modelo para determinar la
dependencia que exista de aprendizaje reflejada en las notas de la
asignatura de PHP, conociendo las notas de las asignaturas
Algoritmos, Base de Datos y Programación.
Se presentara la siguiente ecuación a resolver:
Utilizando las formulas de las ecuaciones normales a los datos
obtendremos los coeficientes de regresión o utilizando Regresión de
Análisis de datos, en la Hoja de Calculo de Excel podemos calcular
también los coeficientes de regresión:
Por lo tanto podemos construir la ecuación de regresión que
buscamos:
El Error Estándar de Regresión Múltiple
Mediante esta medida de dispersión se hace más preciso el grado de
dispersión alrededor del plano de regresión, se hace más pequeño.
Para calcularla se utiliza la formula siguiente:
En los resultados de Excel se llama error típico y para explicar la
relación del aprendizaje de PHP que se viene desarrollando es de
0.861
El coeficiente de determinación múltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser
explicados las variables múltiples, utilizando la si siguiente formula:
IV.- CONCLUSIONES
El 69.70% del aprendizaje del Curso de PHP puede ser explicado
mediante las notas obtenidas por las asignaturas de Algoritmos, Base
de Datos y Programación.
V.- BIBLIOGRAFIA DE REGRESION