0% encontró este documento útil (0 votos)
32 vistas35 páginas

Tema 5. Intervalos de Confianza en El Modelo de Regresión Lineal General

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
32 vistas35 páginas

Tema 5. Intervalos de Confianza en El Modelo de Regresión Lineal General

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Tema 5

Econometría

Tema 5. Intervalos de
confianza en el modelo de
regresión lineal general
Índice
Esquema

Ideas clave

5.1. Introducción y objetivos

5.2. Conceptos básicos sobre intervalos de confianza

5.3. Intervalos de confianza para un único coeficiente

5.4. Intervalos de confianza para la combinación lineal de


coeficientes

5.5. Cálculo de los IC con Gretl

5.6. Actividades resueltas para practicar

5.7. Intervalos de confianza en R

A fondo

Teoría de inferencia estadística sobre intervalos de


confianza

Obtención del intervalo de confianza para el caso de un


único coeficiente

Uso de Gretl en la realización de intervalos de confianza

Test
Esquema

Econometría 3
Tema 5. Esquema
© Universidad Internacional de La Rioja (UNIR)
Esquema

Econometría 4
Tema 5. Esquema
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.1. Introducción y objetivos

En este tema, vamos a aplicar otra de las herramientas de inferencia estadística: los

intervalos de confianza. Los intervalos de confianza son una herramienta para la

estimación de nuestros parámetros algo más completa que la de estimación puntual

al construirse teniendo en cuenta el error de estimación y trabajando bajo un margen

de acierto o también llamado nivel de confianza.

¿Qué aporta este análisis a los realizados en los temas anteriores? Podremos dar un

intervalo de valores entre los que se mueve el efecto que una variable explicativa

provoca sobre la variable explicada. De forma que, volviendo al ejemplo de efecto de

los precios del petróleo sobre la cifra de negocios de una empresa, además de saber

si este efecto es negativo podremos cuantificar el rango de valores entre los que bajo

una probabilidad de acierto se mueve dicho efecto.

Nota: en el apartado A fondo se realiza un interesante e ilustrativo repaso a la teoría

de intervalos de confianza en La estadística en cómic.

Los objetivos que se pretenden conseguir en este tema son:

▸ Recordad el concepto de intervalos de confianza y aplicarlo al caso particular de los

coeficientes del modelo de regresión.

▸ Obtener el intervalo de confianza a partir de la distribución del estimador puntual .

▸ Extender el procedimiento anterior para el caso de varios coeficientes.

▸ Aplicar esta metodología para la realización de contrastes de hipótesis.

Econometría 5
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.2. Conceptos básicos sobre intervalos de


confianza

El estimador MCO , bajo las hipótesis básicas del MRL, nos proporciona una

estimación fiable de los coeficientes del modelo de regresión, ya que es el estimador

óptimo, pero al fin y al cabo es solo una aproximación. En este sentido, los intervalos
de confianza se introducen para mejorar dicha estimación proporcionando no solo un

valor puntual si no un rango de valores entre los cuales es posible que se encuentre

el verdadero valor del parámetro bajo un nivel de confianza.

De nuevo vamos a tratar al estimador MCO de los coeficientes, beta, como una

variable aleatoria donde su distribución de probabilidades va a ser el punto de partida

para la obtención del intervalo de confianza. En el caso de la creación de intervalo de

confianza para varios coeficientes (restricción lineal), simplemente generalizaremos

dicha distribución al caso de más de un coeficiente.

Recordemos estas distribuciones de probabilidades:

▸ Para un coeficiente:

▸ Para varios coeficientes o restricciones lineales:

Caso simplificado para dos coeficientes del modelo:

Y de modo general, recurriendo a la forma matricial del modelo:

Econometría 6
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Interpretación de los intervalos de confianza

Un intervalo de confianza es un intervalo cuyos límites son estadísticos, es decir,

variables aleatorias, que contienen el verdadero valor del parámetro con un nivel de

confianza y que dependen del valor de la muestra tomada.

Dado que los intervalos de confianza muestran un intervalo que es probable que

incluya el verdadero valor del parámetro, también se les denomina intervalos de

estimación.

Para cada muestra obtendremos un intervalo de confianza con límites constantes,

con lo que el intervalo de confianza contendrá o no el verdadero valor del parámetro.


Por esto, cuando calculamos un intervalo de confianza para una muestra no tiene

sentido hablar de probabilidad dado que estos se construyen para el parámetro

desconocido.

Nota: cabe recordar que un parámetro no es una variable aleatoria y, por tanto, no

tiene sentido hablar en términos de probabilidades cuando nos referimos a estos.

La interpretación de los intervalos de confianza con nivel de confianza

es la siguiente: si tuviéramos 100 muestras distintas y para cada

una calculamos el intervalo de confianza de un coeficiente, entonces

aproximadamente el de las veces el verdadero valor del coeficiente

estará contenido en el intervalo de confianza calculado.

Es necesario recordar el concepto de nivel de confianza. Por analogía al modo en el

que fue definido el nivel de significación , como margen de error, se

define ahora este como el margen o tasa de acierto, de modo que, podemos

interpretar también los intervalos de confianza de este modo: existe una proporción

Econometría 7
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

de los cuales contienen el verdadero valor del parámetro y, como

complemento, una proporción de de intervalos que no contienen el

verdadero valor del parámetro.

En el siguiente gráfico indicamos cuál sería dicho nivel de confianza, el cual coincide

para la distribución del coeficiente estimado con el centro de la distribución, esto

es, el área de probabilidad que queda encerrada entre los valores y , indicados

en el soporte de la distribución, como se muestra a continuación:

Figura 1. Nivel de confianza en una distribución t-student.

Dichos valores se obtienen de la forma simétrica para la obtención del valor frontera

de la región de rechazo en los contrastes de hipótesis bilaterales. De ahí que, como

veremos más adelante, exista un paralelismo entre la construcción de los intervalos

de confianza y la realización de contraste de hipótesis bilaterales.

Nota: en el apartado A fondo puedes encontrar un buen resumen sobre toda la teoría

de intervalos de confianza dentro de las herramientas de inferencia estadística. Es

importante que repases algunos conceptos, para ello este enlace te será muy útil.

Econometría 8
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.3. Intervalos de confianza para un único coeficiente

El intervalo de confianza vendrá dado por la distribución del parámetro y será

construido teniendo en cuenta el nivel de confianza definido en la sección anterior. Así el

punto de partida para su obtención será la siguiente probabilidad:

A partir de la cual será despejado el parámetro obteniendo así el intervalo de confianza


para un coeficiente.

Nota: en el apartado A fondo podemos ver el desarrollo para la obtención del intervalo para

un coeficiente, de donde se deducirán los límites estadísticos del intervalo que se presenta a

continuación:

í í

Una vez que sustituimos y por los valores correspondientes de la muestra,

estos dejan de ser variables aleatorias y se convierten en estimaciones, valores numéricos.

Ejemplo

Gasto en publicidad de una empresa y la de la competencia y su


repercusión en el porcentaje de ventas

Se quiere estudiar el efecto del gasto en campañas publicitarias sobre el total de

ventas (en miles de unidades) por la empresa A en un determinado período de

tiempo de 173 días. Las estimaciones se realizan para las ventas de la empresa

A, para la cual también se introduce el tamaño de su cuota de mercado en

Econometría 9
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

porcentaje.

Como se observa en el siguiente modelo las variables de gasto en publicidad se

incluyen en logaritmos, por lo que deberemos llevar cuidado con esta cuestión a
la hora de interpretar los coeficientes.

De una muestra de 180 días para las cuales se han tomado datos de las variables

indicadas se obtienen los siguientes resultados:

Se pide obtener un intervalo de confianza para (el efecto sobre las unidades

vendidas de incrementar en un 1 % el gasto en publicidad de la empresa A) para


un nivel de confianza del 95 %.

Aplicando los límites del intervalo de confianza obtenidos se tiene que:

Ya que puede obtenerse de Gretl que los puntos críticos a utilizar para un 95 %

de confianza son –1,97 y 1,97, dado que:

Por tanto, el intervalo resultante es lo que indica que un incremento

del 1 % en el gasto en publicidad provocará un incremento de las ventas de entre

0,05327 y 0,06833 miles de unidades (lo que equivale a un incremento de 53,27 y

68,33 unidades), rango de valores que se cumplirá con un nivel de confianza del

95 %.

Econometría 10
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Nota: para realizar bien esta interpretación y así comprenderla debe ser tenido en cuenta la

forma funcional del modelo. Este incorpora la variable gasto de la empresa A en logaritmos y

la variable ventas en niveles por lo que para una correcta interpretación el coeficiente
estimado, o en este caso, los límites del intervalo obtenidos deberán ser divididos entre 100.

Contraste de hipótesis para un coeficiente

Dado el intervalo obtenido y la forma en la que este ha sido interpretado, podemos realizar

contraste de hipótesis de forma que se realicen afirmaciones sobre el valor de . Dichas

afirmaciones serán no rechazadas siempre y cuando el valor llevado a contraste se


encuentre en los valores límites del intervalo. Dicho contraste estará siendo calculado bajo

un nivel de significatividad del ·100 %.

Existe así una relación entre los intervalos de confianza y los contrastes de hipótesis

bilaterales. Si queremos contrastar la siguiente hipótesis:

Entonces, si no está contenido en el intervalo, rechazamos la hipótesis nula con un

nivel de significación, y si está contenido en el intervalo, no rechazamos la hipótesis


nula con un α % nivel de significación.

Ejemplo

Gasto en publicidad de una empresa y la de la competencia y su

repercusión en el porcentaje de ventas (continuación)

El director del departamento de marketing indica en una reunión que es necesario


y rentable invertir en publicidad ya que dicha inversión repercutirá positivamente

sobre la variable ventas. En concreto, por cada incremento del 1 % en el gasto en

publicidad, la variable ventas se verá incrementa en 0,050 miles de unidades (50

unidades).

Por tanto, el valor, dado que la variable gasto en publicidad está medida en

Econometría 11
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

logaritmos llevado a contraste es el 5 %.

Como dicho valor no se encuentra dentro del intervalo se rechaza

la hipótesis nula al 5 % de significatividad.

Por lo que no hay evidencias en la muestra de que el número de unidades

vendidas se incremente en 0,05 miles de unidades al variar un 1 % el gasto en

publicidad.

Nótese que en realidad el efecto de la variable gasto en publicidad es mayor que

el indicado por el valor llevado a contraste, pero es que el problema de realizar

contraste haciendo uso de los intervalos de confianza es que trabajamos con

contraste bilaterales, no pudiendo así identificar si la hipótesis nula ha sido

rechazada hacia un lado otro de la desigualdad.

Econometría 12
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.4. Intervalos de confianza para la combinación lineal de


coeficientes

El intervalo de confianza será calculado a partir de la distribución de una combinación lineal de parámetros.
Partimos, por tanto, de dicha distribución y reproducimos el procedimiento llevado a cabo para la obtención del

intervalo en la sección anterior.

Así, de la distribución de probabilidades de una combinación lineal de dos coeficientes del tipo

Se deduce análogamente el procedimiento indicado en la sección anterior, el intervalo para la restricción lineal:


í í

Donde para el cálculo del error estándar de la restricción deberá ser tenida en cuenta la covarianza de los dos

coeficientes introducidos en la restricción.

La introducción de la covarianza en el cálculo dependerá del signo de la restricción. Recordemos las siguientes

expresiones:

Ejemplo

Gasto en publicidad de una empresa y la de la competencia y su repercusión en el porcentaje de

ventas (continuación)

Además de los resultados de estimación proporcionados anteriormente para este modelo se nos da la

matriz de varianzas y covarianzas.

Se pide calcular el intervalo de confianza para de un 95 % de confianza:

Econometría 13
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

í í

Para lo que previamente deberá ser calculado el error estándar de la restricción:

Obteniendo así los límites del intervalo:

Forma matricial del intervalo de confianza de una restricción lineal

En el tema anterior ya vimos que cualquier combinación lineal de parámetros puede ser expresada de forma
matricial, , donde es un vector de tamaño con es el número de variables regresoras.

Si se considera la restricción esta puede ser escrita en forma matricial del siguiente modo:

Con lo que en este ejemplo .

Sabemos de las hipótesis básicas del MRL y de la hipótesis de normalidad de los errores, que:

Por lo tanto:

Derivamos ahora un intervalo de confianza de de de confianza es:

Econometría 14
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Donde

Veamos a través del ejemplo realizado con anterioridad como estas expresiones matriciales dan lugar obtenidos.

Ejemplo

Gasto en publicidad de una empresa y la de la competencia y su repercusión en el porcentaje de

ventas (continuación)

Calculemos el intervalo de confianza para de un 95 % de confianza:

Intervalos de confianza y contrastes de hipótesis

Gasto en publicidad de una empresa y la de la competencia y su repercusión en el porcentaje de

ventas (continuación)

Queremos contrastar si «el incremento de un 1 % en el gasto en publicidad realizado por la empresa A

se ve compensado cuando la empresa de la competencia B realiza un gasto equivalente» a partir de la

construcción de un intervalo de confianza. En términos de los coeficientes, queremos contrastar si

Tenemos que contrastar:

En este ejemplo , y el intervalo de confianza de de un 95 % de confianza es:

Como está contenido en el intervalo, no rechazamos la hipótesis nula al nivel de significación del

5 %. Por lo que hay evidencias en la muestra de que el incremento de un 1 % en el gasto en publicidad

de A se compensa con el incremento de un 1 % en el gasto en publicidad de B.

Econometría 15
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.5. Cálculo de los IC con Gretl

El software Gretl proporciona los IC para los coeficientes del modelo desde la venta

de estimación del modelo accediendo a la pestaña Análisis > Intervalos de confianza

para los coeficientes

Debes tener en cuenta que Gretl no cuenta con la opción para llevar a cabo

intervalos de confianza para una restricción lineal por lo que en este caso será

necesario reparametrizar el modelo antes de obtener el intervalo de confianza. Más

adelante puedes encontrar un ejercicio resuelto que te recuerda cómo llevar a cabo

este procedimiento.

Nota: en el apartado A fondo puedes aprender más sobre el uso de Gretl en

intervalos de confianza al tiempo que repasas la teoría aprendida en este tema,

puedes consultar el libro Econometría básica aplicada con Gretl.

Econometría 16
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.6. Actividades resueltas para practicar

Actividades de cálculo numérico

1. Considere el siguiente modelo en el que se pretende explicar el importe neto de la

cifra de negocios que genera la venta de un determinado producto (en millones de

euros) en función a su precio (en euros) y al precio de un producto sustitutivo (en


euros).

Con el objetivo de estudiar el modelo teórico planteado, se extrae una muestra de los

últimos siete años, que arroja los siguientes valores:

Se pide, teniendo en cuenta los resultados obtenidos en el tema 2 para esta misma

actividad:

▸ Elaborar un intervalo al 95 % de confianza para y .

▸ Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos calculados en el apartado a) ¿Coincide la conclusión con la que se dio en


el tema 4 para esta misma actividad?

Econometría 17
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Nota: tenga en cuenta, además, la siguiente información:

tN-k-1, α tN-k-1, α/2


5% 2,1318 2,7765
1% 3,7469 4,6041

2. Considerar el siguiente modelo en el que se pretende explicar el importe neto

de la cifra de negocios que genera la exportación de frutos rojos en la provincia


de Segovia (en millones de euros) en función al número de trabajadores contratados

(en centenas) y a la temperatura media del mes de enero (en grados centígrados).

Con el objetivo de estudiar el modelo teórico planteado, se extrae una muestra de los

últimos nueve años, que arroja los siguientes valores:

Se pide, teniendo en cuenta los resultados obtenidos en el tema 2 para esta misma

actividad:

Nota: tenga en cuenta, además, la siguiente información:

Econometría 18
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

tN-k-1, α tN-k-1, α/2


5% 2,0150 2,5706
1% 3,3649 4,0321

▸ Elaborar un intervalo al 95 % de confianza para y .

▸ Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos ya calculados. ¿Coincide la conclusión con la que se dio en el tema 4 para


esta misma actividad?

3. Considere el siguiente modelo en el que se pretende explicar el importe neto

de la cifra de negocios que genera una cadena de hoteles española (en millones

de euros) en función a la temperatura mínima y máxima registrada (en grados

centígrados).

Con el objetivo de estudiar el modelo teórico planteado, se extrae una muestra de los

siete primeros meses de 2017, que arroja los siguientes valores:7

Se pide, teniendo en cuenta los resultados obtenidos en el tema 2 para esta misma

Econometría 19
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

actividad:

tN-k-1, α tN-k-1, α/2


5% 2,1318 2,7765
1% 3,7469 4,6041

▸ Elaborar un intervalo al 95 % de confianza para y .

▸ Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos ya calculados anteriormente. ¿Coincide la conclusión con la que se dio en


el tema 4 para esta misma actividad?

Solución actividad 1

▸ Elaborar un intervalo al 95 % de confianza para y

Intervalo de confianza para :

Intervalo de confianza para :

Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos ya calculados anteriormente. ¿Coincide la conclusión con la que se

dio en el tema 4 para esta misma actividad?

Dado que cero está comprendido entre el límite superior e inferior de los intervalos al

95 % de confianza para los dos parámetros, se acepta en ambos casos,

Econometría 20
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

coincidiendo con la conclusión obtenida en el tema 4.

Solución actividad 2

▸ Elaborar un intervalo al 95 % de confianza para y

Intervalo de confianza para :

Intervalo de confianza para :

Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos ya calculados en el apartado anteriormente ¿Coincide la conclusión

con la que se dio en el tema 4 para esta misma actividad?

Dado que cero está comprendido entre el límite superior e inferior del intervalo al 95

% de confianza para , se acepta , coincidiendo con la conclusión

obtenida en el tema 4.

Solución actividad 3

▸ Elaborar un intervalo al 95 % de confianza para y

Intervalo de confianza para :

Intervalo de confianza para :

Econometría 21
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Contrastar la significatividad individual de los parámetros haciendo uso de los

intervalos ya calculados anteriormente. ¿Coincide la conclusión con la que se

dio en el tema 4 para esta misma actividad?

Dado que cero está comprendido entre el límite superior e inferior de los intervalos al

95 % de confianza para los dos parámetros, se acepta en ambos casos,

coincidiendo con la conclusión obtenida en el tema 4.

Actividad resuelta de Gretl para practicar

A continuación, se presenta un ejercicio realizado con las bases de datos de Gretl.

▸ Utilizaremos la base de datos de Ramanathan (2002) que se encuentra guardada

con el nombre «data4-1».

La base de datos introduce información sobre el precio de las viviendas, su tamaño,

el número de dormitorios y el número de baños, y a partir de dichas variables se

establece la siguiente relación para tratar de determinar el efecto de las

características de las viviendas sobre su precio:

Se pide:

▸ Construir un intervalo de confianza al 95 % para los tres coeficientes y en base a

estos realice un contraste de significatividad individual de los coeficientes del


modelo.

▸ Contrastar la restricción «el número de habitaciones tiene el mismo efecto sobre el

precio de la vivienda que el número de baños» utilizando la construcción de un

intervalo de confianza al 95 %.

Econometría 22
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Nota: recuerda que Gretl trabaja con el criterio anglosajón de separación de miles

por lo que si reproduces estos resultados en Gretl deberás tenerlo en cuenta.

▸ Construir un intervalo de confianza el 95 % para los tres coeficientes

t(10, 0.025) = 2,228

Variable Coeficiente Intervalo de confianza 95


const 129,062 (-67,6903, 325,814)
sqft 0,154800 (0,0836321, 0,225968)
bedrms -21,5875 (-81,8126, 38,6376)
baths -12,1928 (-108,560, 84,1742)

Ahora podemos realizar contrastes de significatividad de los coeficientes

simplemente viendo si el valor 0, que se toma como igualdad a cada uno de los

coeficientes en la hipótesis nula, cae dentro de los intervalos calculados. Vemos que

esto ocurre para todos salvo para la variable sqft (tamaño de la vivienda) lo que está

indicando que esta es la única variable para la que rechazamos la igualdad a cero y,

por tanto, se trata de la única variable individualmente significativa en nuestro

modelo.

▸ Contrastar la restricción «el número de habitaciones tiene el mismo efecto

sobre el precio de la vivienda que el número de baños» utilizando la


construcción de un intervalo de confianza al 95 %.

La restricción lineal a partir de la cual construiremos el IC al 95 % es

. En este caso se hace necesario reparametrizar para

poder obtener el intervalo de confianza, pues Gretl no incorpora ninguna opción a

partir de la cual podamos construir intervalos de restricciones lineales. El modelo

Econometría 23
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

reparametrizado incluirá un nuevo coeficiente que es igual a la restricción que

queremos introducir ,por tanto, para reparametrizar el modelo debemos

sustituir en nuestro modelo, quedando el modelo:

Reordenando términos:

Por lo que deberemos estimar el modelo donde se introduzca una nueva variable

, suma de las variables número de habitaciones y

baños, además de incluir la variable bedrms y la variable tamaño ( ). Una vez

estimado el modelo se calcula el IC del coeficiente , quedando los siguientes


valores del modelo reparametrizado estimado y de sus intervalos de confianza:

Modelo 3, usando las observaciones 1-14. Variable dependiente: price.

Coeficiente Desv. Típica Estadístico t valor p


const 129,062 88,3033 1,462 0,1746
sqft 0,154800 0,0319404 4,847 0,0007 ***
rooms −12,1928 43,2500 −0,2819 0,7838
bedrms −9,39476 57,5669 −0,1632 0,8736
Media de la vble. dep. 317,4929 D.T. de la vble. dep. 88,49816
Suma de cuad. residuos 16700,07 D.T. de la regresión 40,86572
R-cuadrado 0,835976 R-cuadrado corregido 0,786769
F(3, 10) 16,98894 Valor p (de F) 0,000299
Log-verosimilitud −69,45391 Criterio de Akaike 146,9078
Criterio de Schwarz 149,4641 Crit. de Hannan-Quinn 146,6712

Y los intervalos para los coeficientes del modelo reparametrizado son:

t(10, 0.025) = 2.228

Variable Coeficiente Intervalo de confianza 95


const 129.062 (-67.6903, 325.814)
sqft 0.154800 (0.0836321, 0.225968)
rooms -12.1928 (-108.560, 84.1742)
bedrms -9.39476 (-137.662, 118.872)

Econometría 24
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Vemos que el cero está incluido en el intervalo por lo que concluimos que el número

de baños y el de dormitorios tiene el mismo efecto sobre la variable precio de la

vivienda.

Econometría 25
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

5.7. Intervalos de confianza en R

En el tema 5, has aprendido cómo estimar intervalos de confianza sobre los

parámetros de un MRL. En la línea de lo visto también en el tema 4, los intervalos de

confianza son útiles para contrastar si se cumplen determinadas hipótesis sobre los

parámetros sin necesidad de hacer el contraste. En este apartado, se expone cómo

estimar intervalos de confianza por medio del lenguaje R.

Intervalos de confianza para los parámetros del modelo

Partiremos del modelo en logaritmos estimado en el tema 2:

Como hemos visto, un intervalo de confianza es un abanico de valores posibles que

pueden tomar los parámetros estimados en función de la aleatoriedad de la

estimación. Para estimar un intervalo de confianza para los parámetros de un MRL,


la fórmula a aplicar es:

Al igual que en el tema 4, lo primero que tenemos que definir para estimar un

intervalo de confianza es la desviación típica del parámetro . Dado que esta

aplicación es transversal, la varianza de ya está definida bajo el nombre varb1.

Por ello, para definir la desviación típica, basta con calcular la raíz cuadrada de la

varianza con la función sqrt como sigue:

seb1 <- sqrt(varb1)

Si quisiéramos visualizar a cuánto asciende la desviación típica, bastaría con

consignar lo siguiente:

seb1

Econometría 26
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

[1] 0.04562717

Como indica RStudio, la desviación típica de es de 0.04562717. En la unidad

anterior, ya indicamos que este valor coincide con la columna Std. Error del resumen

que vimos en el tema 2 (se ha marcado en negrita):

Call:

lm(formula = y ~ x1 + x2)

Residuals:

Min 1Q Median 3Q Max

-0.27540 -0.06617 0.01478 0.06265 0.21577

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 2.89946 0.14182 20.44 <2e-16 ***

x1 -0.61283 0.04563 -13.43 <2e-16 ***

x2 0.70849 0.05404 13.11 <2e-16 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’ 1

Residual standard error: 0.1174 on 57 degrees of freedom

Multiple R-squared: 0.7793,Adjusted R-squared: 0.7716

F-statistic: 100.6 on 2 and 57 DF, p-value: < 2.2e-16

Una vez que tenemos definida la desviación típica de , lo siguiente es estimar los

Econometría 27
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

valores críticos . Para ello, lo primero que debemos hacer es definir el

nivel de significación al que queremos hacer el intervalo:

alpha <- 0.05

Hay que tener en cuenta que los grados de libertad (N-k-1) ya están definidos como

df desde el tema 3, por lo que no volveremos a definirlos. Por tanto, lo siguiente será

calcular el valor crítico . Este valor se definirá como:

tc <- qt(1-alpha/2, df)

Por último, se definen los límites inferior y superior del intervalo del siguiente modo

(hay que tener en cuenta que, para RStudio, los parámetros son b1, b2 y b3, como

ya los habíamos definido en el tema 2):

lowb <- b[2]-tc*seb2upb <- b[2]+tc*seb2

A fin de ver cuáles son los límites inferior y superior del intervalo, basta con indicar a

RStudio lo siguiente:

lowbupb

x1

-0.7041973

x1

-0.5214637

El intervalo de confianza de es [-0.704, -0.521], es decir, el parámetro, con un 95

% de confianza, puede tomar valores que van desde -0.704 hasta -0.521. En el caso
de que queramos calcular el intervalo a un 90 % de confianza, bastaría con ejecutar

el mismo código y definir alpha como 0.1 (se ha marcado en rojo ese cambio):

alpha <- 0.1

Econometría 28
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

tc <- qt(1-alpha/2, df)

lowb <- b[2]-tc*seb2upb <- b[2]+tc*seb2

lowbupb

x1

-0.6891204

x1

-0.5365406

El intervalo de confianza de es [-0.689, -0.536], es decir, el parámetro, con un 90

% de confianza, puede tomar valores que van desde -0.689 hasta -0.536. Por último,

en el caso de que queramos calcular el intervalo de a un 99 % de confianza, bastaría

con ejecutar el mismo código y definir alpha como 0.01 (se ha marcado en rojo ese

cambio):

alpha <- 0.01

tc <- qt(1-alpha/2, df)

lowb <- b[2]-tc*seb2upb <- b[2]+tc*seb2

lowbupb

x1

-0.734421

x1

-0.49124

Econometría 29
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

El intervalo de confianza de es [-0.734, -0.491], es decir, el parámetro, con un 99

% de confianza, puede tomar valores que van desde -0.734 hasta -0.491.

Econometría 30
Tema 5. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
A fondo

Teoría de inferencia estadística sobre intervalos de


confianza

Gonick, L. y W. Smith. (1999). La estadística en cómic. Zendrera Zariquiey.


[Link]
[Link]

Encontrarás en este recurso un repaso a la teoría sobre intervalos de confianza.

Dicho recurso cuenta además con una introducción extraída del libro La estadística

en cómic cuyas viñetas nos ponen en contexto con algo de humor.

Econometría 31
Tema 5. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo

Obtención del intervalo de confianza para el caso


de un único coeficiente

En este documento se incluye la demostración formal de cómo se deduce el intervalo

de confianza de un único coeficiente.

Accede al artículo

Econometría 32
Tema 5. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo

Uso de Gretl en la realización de intervalos de


confianza

Esteban, M. V. et al. (2009). Econometría básica aplicada con Gretl. Facultad de

Economía y Empresa, Universidad del País Vasco.


[Link]

Para comenzar a familiarizarte con Gretl al tiempo que estudias los conceptos de

este tema te recomendamos la consulta del capítulo 2 (página 44) y del capítulo 3

(páginas 59-60). En él se introduce el concepto de intervalo de confianza de un

coeficiente y de una combinación lineal de los coeficientes. También analiza cómo

los intervalos de confianza son una alternativa a los contrastes de hipótesis para un

coeficiente o para una combinación lineal de los coeficientes, todo ello con la

utilización del software Gretl.

Econometría 33
Tema 5. A fondo
© Universidad Internacional de La Rioja (UNIR)
Test

1. Los intervalos de confianza:

A. Aportan a la estimación puntual información sobre el margen de error de la estimación.

B. Proporcionan el mismo tipo de información sobre la estimación de los parámetros que el método de la estimación puntual.

C. Tienen adicionalmente en cuenta la distribución del estimador puntual del parámetro.

D. A y C son correctas.

2. El intervalo de confianza:

A. Puede ser utilizado para estimar el valor de un parámetro bajo un cierto nivel de confianza.

B. Puede ser utilizado para analizar si los parámetros de dos variables explicativas pueden ser asumidos como iguales bajo cierto nivel de confianza.

C. Tiene la limitación de que están basados en el supuesto de normalidad, no obstante, un n suficientemente grande permite trabajar con la

aproximación a la normal.

D. Toda las anteriores son correctas.

3. Para el intervalo de confianza de un coeficiente del modelo de regresión utilizamos como distribución de probabilidades para la construcción de este:

A. Normal.

B. T-student.

C. Chi-cuadrado.

4. Para el intervalo de confianza de más de una restricción de parámetros del modelo de regresión utilizamos como distribución de probabilidades para la

construcción de este:

A. F-fisher.

B. T-student.

C. Chi-cuadrado.

5. Para el intervalo de confianza de un coeficiente del modelo de regresión, dados el nivel de confianza (

) y el tamaño muestral, se tiene que:

A. Cuanto mayor sea

, mayor es la longitud del intervalo.

B. Cuanto mayor sea

, tenemos más precisión en las afirmaciones.

C. Cuanto mayor sea

, menor es la longitud del intervalo.

6. Considera el siguiente modelo para el precio de la vivienda:

Unexpected text node: 'log {left (precio right )} rsub {i} = {β} rsub {0} + {β} rsub {1} log {left (area right )} rsub {i} + {β} rsub {2} ha {b} rsub {i} + {β} rsub {3} ba ñ o {s} rsub {i} + {β} rsub {4} eda {d} rsub {i} + {

Donde Unexpected text node: 'precio' es el precio de venta en euros, Unexpected text node: 'area' es la superficie (en Unexpected text node: '{m} ^ {2}' ),

Unexpected text node: 'hab' es el número de dormitorios, Unexpected text node: 'ba ñ os' es el número de baños y Unexpected text node: 'edad' es la antigüedad. Usando

los datos de 142 viviendas se obtiene el siguiente resultado, siendo los números entre paréntesis el error estándar de cada coeficiente:

Unexpected text node: 'matrix {widehat {log {left (precio right )} rsub {i}} ## } matrix {= 9,1 ## } matrix {+ 0,32 log {left (area right )} rsub {i} ## left (0,07 right ) } matrix {+ 0,05 ha {b} rsub {i} ## left (0,02 righ

Teniendo en cuenta que el valor de tN-k-1, ฀/2 para ฀=5% es 1:

A. El intervalo de confianza al 95 % de Unexpected text node: '{β} rsub {1}' es Unexpected text node: '[0.25,0.39]' y por lo tanto hay suficiente evidencia para

afirmar que el incremento de la superficie de la vivienda incrementará el precio.

B. Se puede afirmar que el parámetro Unexpected text node: '{β} rsub {1}' no es significativo.

C. Con los datos disponibles, no se puede estimar el intervalo de confianza asociado al parámetro Unexpected text node: '{β} rsub {1}' .

D. Ninguna de las anteriores es correcta.

Econometría 34
Tema 5. Test
© Universidad Internacional de La Rioja (UNIR)
Test

7. Considerando el modelo anterior, en el caso de que de tN-k-1, ฀/2 para ฀=5% fuera igual a 5:

A. El intervalo de confianza al 95 % de

sería

y, por lo tanto, no habría suficiente evidencia para afirmar que el incremento de la superficie de la vivienda incrementará el precio.

B. Se puede afirmar que el parámetro

es significativo.

C. Con los datos disponibles, no se puede estimar el intervalo de confianza asociado al parámetro

D. Ninguna de las anteriores es correcta.

8. Considera el siguiente modelo que satisface los supuestos básicos del MRL y el supuesto de normalidad de los errores:

Unexpected text node: '{Y} rsub {i} = {β} rsub {0} + {β} rsub {1} {X} rsub {1i} + {β} rsub {2} {X} rsub {2i} + {β} rsub {3} {X} rsub {3i} + {u} rsub {i} , i=1,…,N.'A partir de una muestra

con 138 observaciones se obtiene una estimación del coeficiente Unexpected text node: '{β} rsub {2} , {widehat {β}} rsub {2} =14.8,'y un intervalo de confianza al 95 %

de este coeficiente, [ Unexpected text node: '2.6, 27' ]. Teniendo en cuenta que el valor de tN-k-1, ฀/2 para ฀=5%, el error estándar de

Unexpected text node: '{widehat {β}} rsub {2}' es:

A. Unexpected text node: 'SE left ({widehat {β}} rsub {2} right ) =6,1'

B. Unexpected text node: 'SE left ({widehat {β}} rsub {2} right ) =5,32'

C. Unexpected text node: 'SE left ({widehat {β}} rsub {2} right ) =4,61'

D. Unexpected text node: 'SE left ({widehat {β}} rsub {2} right ) =12,2'

9. Dada la información contenida en la pregunta anterior, si se quiere contrastar la hipótesis H0:

al 95 %:

A. No puede aceptarse la hipótesis planteada, pues el 5 está contenido en el intervalo planteado.

B. Puede aceptarse la hipótesis planteada, pues el 5 está contenido en el intervalo planteado.

C. Con la información facilitada no puede concluirse acerca del contraste planteado.

D. Ninguna de las anteriores es correcta.

10. Una determinada empresa pretende estudiar la elasticidad precio de su producto, así como la influencia que tiene en sus ventas el precio de un producto

sustitutivo. Para ello, plantea el siguiente modelo:

Unexpected text node: 'log {left (ventas right )} rsub {i} = {β} rsub {0} + {β} rsub {1} log {left (precio right )} rsub {i} + {β} rsub {2} {preciosusti} rsub {i} + {u} rsub {i}'Con el objetivo de

conocer qué ocurriría si se produce un incremento simultáneo del precio de su producto, así como el del sustitutivo de un 1 %, elabora el siguiente intervalo de

confianza para Unexpected text node: '{β} rsub {1} + {β} rsub {2}'al 95 %: [-0,987, 1,487]. Si su objetivo es contrastar que el efecto total es nulo, H0:

Unexpected text node: '{β} rsub {1} + {β} rsub {2} =0'al 95 %:

A. No puede aceptarse la hipótesis planteada, pues el 0 está contenido en el intervalo planteado.

B. Puede aceptarse la hipótesis planteada, pues el 0 está contenido en el intervalo planteado.

C. Con la información facilitada no puede concluirse acerca del contraste planteado.

D. Ninguna de las anteriores es correcta.

Econometría 35
Tema 5. Test
© Universidad Internacional de La Rioja (UNIR)

También podría gustarte