Ejercicio Resuelto
Considere que se desea analizar los factores que determinan el rendimiento en el curso de econometría. Para
ello cuenta con la siguiente información de 62 estudiantes de semestres anteriores que le facilita su profesor de
econometría:
Nota_Final : Nota final del curso de econometría (puntos)
Asistencia : Porcentaje de asistencia a clase (en puntos porcentuales)
Estadistica : Nota final del curso estadística para negocios (puntos)
Oportunidad : Variable dummie que toma valor 1 si el estudiante cursa la asignatura por primera vez, y 0
en otro caso.
Edad : Edad del estudiante al momento de comenzar el semestre que cursa econometría (en años)
Genero : Variable dummie que toma el valor 1 si el estudiante es de género femenino, 0 en otro caso.
Con dichos datos obtiene los siguientes resultados:
MCO, usando las observaciones 1-62
Variable dependiente: Nota_Final
Coeficiente Desv. Típica Estadístico t Valor p
const 2,21 1,63 1,35 0,1825
Asistencia 0,027 0,0051 5,41 0,0001 ***
Estadistica 0,39 0,18 2,22 0,0307 **
Oportunidad -0,16 0,28 -0,59 0,5591
Edad -0,12 0,06 -2,12 0,0387 **
Media de la vble. dep. 3,393548 D.T. de la vble. dep. 1,099310
Suma de cuad. residuos 33,13359 D.T. de la regresión 0,762424
R-cuadrado 0,550532 R-cuadrado corregido 0,518991
F(4, 57) 17,45418 Valor p (de F) 2,11e-09
Interpretación de Parámetros
Asistencia Como el valor p (0,0001) es menor al 1%, existe
evidencia para rechazar la hipótesis de que el
parámetro es igual a cero (es estadísticamente
distinto de cero), por lo tanto por cada punto
porcentual adicional de asistencia, la nota de
econometría aumenta en 0,27 décimas.
Estadistica Como el valor p (0,0307) es menor al 5%, existe
evidencia para rechazar la hipótesis de que el
parámetro es igual a cero (es estadísticamente
distinto de cero), por lo tanto por cada punto
adicional en la nota final de estadística, la nota de
econometría aumenta en 0,39 puntos (3,9 décimas).
Oportunidad Como el valor p (0,5591) es mayor al 10%, no hay
evidencia que el parámetro sea estadísticamente
distinto de cero, por lo que no se puede concluir que
aquellos alumnos que han cursado en más de una
oportunidad el curso de econometría no tienen una
nota base distinta a aquellos alumnos que lo están
cursando por primera vez.
Edad Como el valor p (0,0387) es menor al 5%, existe
evidencia para rechazar la hipótesis de que el
parámetro es igual a cero (es estadísticamente
distinto de cero), por lo tanto por cada año adicional,
la nota de econometría disminuye en 0,12 puntos (1,2
décimas).
Una pregunta que uno podría hacerse a este nivel es si existen diferencias en el rendimiento entre hombres y
mujeres en el ramo de econometría. Para resolver esa interrogante uno puede recurrir al Test de Chow. En esta
prueba se postula la hipótesis que los parámetros asociados a las variables (incluida la constante) son los mismos
tanto para hombres como para mujeres, esto es:
H 0 : 1H 1M
2H 2M
3H 3M
4H 4M
5H 5M
Para resolver esto, se comparan estadísticamente las sumas de los residuos al cuadrado, del modelo donde los
parámetros son iguales (modelo restringido), con los errores que se obtienen de estimar el modelo para cada
muestra (género) por separado. De esta forma se obtienen los siguientes resultados:
Hombre:
Nota _ Final 1,81 1,59 Asistencia 0, 68 Estadistica 0, 22 Oportunidad 0,13 Edad ˆ
n 33 SRC 14,8274
Mujer:
Nota _ Final 5, 76 3, 74 Asistencia 0,35 Estadistica 0,37 Oportunidad 0,13 Edad ˆ
n 29 SRC 12,5940
De estos modelos, podemos obtener la suma de errores del modelo no restringido, que corresponde a 27,4214.
Luego, el estadístico de prueba sería:
33,1336 27, 4214 62 2 5
FC 2,166 F5,52
27, 4214 5
Como el estadístico de prueba (2,166) es mayor al valor de la
distribución F con 5 grados de liberad en el numerado, 52 grados de
libertad en el denominador y 10% de significancia (1,96), existe
evidencia para rechazar la hipótesis nula, por lo que se puede concluir
que al menos un par de parámetros es distinto entre sí, y por lo tanto se
puede pensar que existe diferencias estructurales en el rendimiento en
econometría entre hombres y mujeres.
Respecto a la multicolinealidad, una de las reglas es que un coeficiente de determinación R2 alto y variables no
significativas es una señal de multicolinealidad severa. En este caso, si bien el coeficiente de determinación no
es demasiado elevado, y las variables, en general, son significativas, por lo que esta regla no nos permite señalar
si existe o no multicolinealidad. Una alternativa, es observar la matriz de correlaciones de las variables. La matriz
de correlación de las variables es:
1 0, 219 0,541 0,330
0, 219 1 0, 077 0, 005
0,541 0, 077 1 0,350
0,330 0, 005 0,350 1
En este caso, podemos observar que ninguna de las correlación entre las variables independientes es muy
grande, la más elevada es la correlación entre Asistencia y Oportunidad (0,541), pero en ningún caso es una señal
de preocupación, i.e., podemos concluir que la multicolinealidad no es un problema.
Por último, para tener más confianza en sus resultados decide realizar el test de White para analizar si existe
homoscedasticidad o heteroscedasticidad. Los resultados obtenidos del software utilizado, le señalan que el
estadístico de prueba tiene un valor de C 5,31 , con un valor p de 0,9678 para la distribución chi-cuadrado
con 13 grados de libertad.
De lo anterior se puede concluir que como el valor p es mayor al 10% de
significancia, no se rechaza la hipótesis nula, y por lo tanto no existe
evidencia que señale que la varianza de los errores sea distinta
(heteroscedástica), por lo que se puede concluir que se cumplen los
supuestos del modelo clásico (homoscedasticidad, no autocorrelación y
no multicolinealidad) y por lo tanto los estimadores son MELI.
Si consideramos ahora como variable dependiente la probabilidad de aprobar, en lugar de la nota como indicador del
rendimiento académico de los estudiantes, debemos estimar un modelo logit, cuyos resultados se muestran a continuación:
Modelo 1: Logit, usando las observaciones 1-62
Variable dependiente: Aprobado
Coeficiente Desv. Típica z Valor P Pendiente
Const -1,34 5,73 -0,23 0,8157
Asistencia 0,0437 0,0206 2,12 0,0340 0,009
Estadistica 1,00 0,63 1,59 0,1129 0,209
Oportunidad 0,78 1,05 0,74 0,4599 0,149
Edad -0,38 0,24 -1,61 0,1083 -0,079
Media de la vble. dep. 0,3871 D.T. de la vble. dep. 0,4911
R-cuadrado de McFadden 0,2828 R-cuadrado corregido 0,1620
Log-verosimilitud −29,6779 Criterio de Akaike 69,3558
Criterio de Schwarz 79,9914 Crit. de Hannan-Quinn 73,5316
Evaluado en la media
Número de casos 'correctamente predichos' = 42 (67,7%)
f(beta'x) en la media de las variables independientes = 0,491
Contraste de razón de verosimilitudes: Chi-cuadrado(4) = 23,4058 [0,0001]
De este modelo, lo que se puede observar que la única variable significativa es Asistencia, puesto que es la única
cuyo valor p es menor al 5% y 10%. En el caso de esta variable, se puede señalar que por cada punto porcentual
que aumente la asistencia, la probabilidad de aprobar aumenta en 0,9 puntos porcentuales.1 En el caso de las
variables Edad y estadística, si bien el valor p es superior al 10%, no es extremadamente superior, por lo que al
12% de significancia, podríamos afirmar que por cada punto adicional en la nota final de estadística, aumenta la
probabilidad de aprobar econometría en 20,9 puntos porcentuales; mientras que por cada año adicional del
estudiante la probabilidad de aprobar disminuye en 7,9 puntos porcentuales.
Distinto es el caso de la variable oportunidad, que no es significativa, por lo que se puede señalar que la
probabilidad de aprobar el curso no es distinta si el alumno está rindiendo el curso por primera vez o ya lo ha
rendido al menos una vez.
En relación a la significancia global, se puede señalar que como el valor p es menor a 1%, se rechaza la hipótesis
nula, por lo que se puede concluir que al menos un parámetro es estadísticamente distinto de cero.
La pregunta con la que finalizaremos el estudio es determinar la probabilidad de que un estudiante en particular
apruebe econometría. Por ejemplo, en el caso de un estudiante que asistió al 80% de las clases, aprobó
estadística con un 4,3, está haciendo el curso por tercera vez y tiene 22 años es, en promedio 12,96%.
Pr Y 0 X 2 80; X 3 4,3; X 4 0; X 5 22
1
1,34 0,04378014,3 0,780 0,3822
12,96%
1 e
1
Observen que no coloco el “o no”, porque si estoy haciendo una afirmación