0% encontró este documento útil (0 votos)
896 vistas16 páginas

Análisis Estadístico de Importaciones Automotrices

Este trabajo presenta un caso práctico sobre la relación entre el número de autos importados a Estados Unidos y los años comprendidos entre 1969 y 2009. Se emplearon herramientas estadísticas como tablas, gráficas, regresión lineal y correlación para modelar la relación. Los resultados mostraron que existe una relación lineal significativa para el periodo 1969-1988. Asimismo, se realizaron predicciones para los años 2007, 2008 y 2009 usando intervalos de confianza del 95%.

Cargado por

Nicolas Mosquera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
896 vistas16 páginas

Análisis Estadístico de Importaciones Automotrices

Este trabajo presenta un caso práctico sobre la relación entre el número de autos importados a Estados Unidos y los años comprendidos entre 1969 y 2009. Se emplearon herramientas estadísticas como tablas, gráficas, regresión lineal y correlación para modelar la relación. Los resultados mostraron que existe una relación lineal significativa para el periodo 1969-1988. Asimismo, se realizaron predicciones para los años 2007, 2008 y 2009 usando intervalos de confianza del 95%.

Cargado por

Nicolas Mosquera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD EAN

FACULTAD DE ESTUDIOS EN AMBIENTES VIRTUALES


OPTIMIZACIÓN Y ESTADÍSTICA PARA ECONOMISTAS

TRABAJO FINAL

PREPARADO POR:
NICOLAS DANIEL MOSQUERA PERDOMO
GABRIEL FERNANDO CASTELLANOS TÉLLEZ

DIANA CRISTINA BOSA HERNANDEZ

MARIA CONSTANZA ORDOÑEZ SALCEDO

TUTOR:
HERMES JACKSON MARTINEZ NAVAS

BOGOTÁ
SEPTIEMBRE 15 DE 2019
RESUMEN

Este trabajo se desarrolla el caso práctico del libro introducción a la probabilidad y


estadística de Mendenhall, W. Beaver. R beaver B, y Velasque (2015) del capítulo
12 titulado “¿su automóvil está “Hecho en EUA”?”, en el que se aplican herramientas
estadísticas como la relación lineal y la predicción en una situación concreta como
la importación automotriz en diversas épocas comprendidas entre 1969 y 2009

Las herramientas estadísticas se emplearon mediante la elaboración de


tablas, diagramas, regresiones y correlaciones para describir la relación que existe
entre las diversas variables.

Así mismo, con ayuda del programa Excel se determinó la recta de los
mínimos cuadrados, y se pudo obtener la relación lineal entre el número de autos.
Con ayuda del coeficiente de correlación se puedo determinar qué tan confiable
eran las predicciones y por último se determinó que efectos tienen los nuevos
puntos de datos sobre la pendiente.
TABLA DE CONTENIDO

1) Introducción ................................................................................................ 5

2) ¿Su auto está “Hecho en [Link].”? .......................................................... 6

3) Conclusiones ............................................................................................ 15

4) Referencias Bibliográficas....................................................................... 16

LISTA DE TABLAS Y FIGURAS

Tabla 1. Datos de suministrados en el ejercicio ...................................................... 6


Figura 1. Año vs Número de autos importados entre 1969 y 1988 ......................... 7
Tabla 2. Comparación de las observaciones y las predicciones ........................... 10
Figura 2. Año vs Número de autos importados entre 1969 y 2009 ....................... 12
Figura 3. Año vs Número de autos importados entre 1969 y 2009 con diferentes
modelos ................................................................................................................. 13
1) Introducción

Dentro de las ramas de la estadística se encuentra la estadística inferencial, la cual


tiene como objetivo principal obtener los resultados necesarios a partir de la
información que se presenta en la muestra para realizar deducciones sobre una
totalidad. Esta se usa para modelar patrones y extraer inferencias de la muestra que
es objeto de estudio. Dentro de las técnicas de modelamiento se encuentran la
estimación, la correlación, el análisis de regresión y la prueba de hipótesis.

Esta última técnica de modelamiento se realiza mediante el planteamiento de


una hipótesis, que es una afirmación sobre la propiedad de población que se está
estudiando. Luego, esa afirmación se somete a una prueba para comprobar su
veracidad.

Lo primero que debe hacerse es definir una hipótesis nula -una expresión
cuantitativa de la población a analizar-, posteriormente, se plantea una hipótesis
alternativa que sea contraria a la hipótesis nula. En el siguiente paso se debe
determinar un nivel de significancia que permitirá establecer la probabilidad de
rechazar la hipótesis nula cuando sea verdadera y viceversa. Después, se deberá
determinar a partir de qué valor se rechaza o acepta la hipótesis nula con la ayuda
de un estadístico -dicho valor se conocerá como punto crítico-. Finalmente, se
formula una regla de decisión con los pasos anteriores y esta se le aplica a la
muestra para determinar si la hipótesis es aceptada o rechazada, y así se podrá
inferir una propiedad sobre la población.
2) ¿Su auto está “Hecho en [Link].”?

La frase “Hecho en [Link].” se ha convertido en un conocido grito de batalla porque


los trabajadores de Estados Unidos tratan de proteger sus trabajos de la
competencia extranjera. En las últimas décadas, un importante desequilibrio en la
balanza comercial en Estados Unidos ha estado causando una inundación de
productos importados que entran al país y se venden a menor costo que artículos
comparables hechos en él.

Una preocupación principal es la industria automotriz, en la que el número de autos


importados aumentó continuamente durante las décadas de 1970 y 1980. La
industria automotriz de ese país ha estado siendo acosada con quejas por la calidad
de sus productos, despidos de trabajadores y altos precios, y ha gastado miles de
millones de dólares en publicidad e investigación para producir un auto hecho en
Estados Unidos que satisfaga las demandas del consumidor. ¿Han tenido éxito para
detener la inundación de autos importados comprados por consumidores
estadounidenses? Los datos de la tabla siguiente representan los números de autos
importados y vendidos en Estados Unidos (en millones) durante los años 1969-
2009. Para simplificar el análisis, hemos codificado el año usando la variable
codificada x=Año – 1969.

Tabla 1. Datos de suministrados en el ejercicio.

# autos # autos # autos


Año año-1969 Año año-1969 Año año-1969
importados importados importados
1969 0 1.1 1983 14 2.4 1997 28 1.4
1970 1 1.3 1984 15 2.4 1998 29 1.4
1971 2 1.6 1985 16 2.8 1999 30 1.7
1972 3 1.6 1986 17 3.2 2000 31 2
1973 4 1.8 1987 18 3.1 2001 32 2.1
1974 5 1.4 1988 19 3 2002 33 2.2
1975 6 1.6 1989 20 2.7 2003 34 2.1
1976 7 1.5 1990 21 2.4 2004 35 2.1
1977 8 2.1 1991 22 2 2005 36 2.2
1978 9 2 1992 23 1.9 2006 37 2.3
1979 10 2.3 1993 24 1.8 2007 38 2.4
1980 11 2.4 1994 25 1.7 2008 39 2.3
1981 12 2.3 1995 26 1.5 2009 40 1.8
1982 13 2.2 1996 27 1.3
a) Usando una gráfica de dispersión, grafique los datos para los años 1969-
1988. ¿Le parece que hay una relación lineal entre el número de autos
importados y el año?

A continuación se presenta la Figura 1, la cual muestra la gráfica de dispersión del


número de autos importados en función del año entre 1969 y 1988 (Año 0 a 19).

Figura 1. Año vs Número de autos importados entre 1969 y 1988.

Año vs Autos importados


3.5

2.5

1.5

0.5

0
0 2 4 6 8 10 12 14 16 18 20

Fuente elaboración propia mediante la herramienta Excel.

Aparentemente existe una relación lineal aceptable entre las dos variables en este
periodo de tiempo, tal y como se puede apreciar con la línea punteada de color rojo,
trazada en la figura 1.
b) Use un paquete de software para hallar la recta de mínimos cuadrados para
predecir el número de autos importados como función del año para los años
1969-1988.

Utilizando nuevamente la herramienta Excel, se tiene que la recta de mínimos


cuadrados está dada por la ecuación:

𝑦̂ = 0,0987𝑥 + 1,1671
La cual tiene un coeficiente de determinación 𝑟 2 = 0,899.

c) ¿Hay una relación lineal significativa entre el número de autos importados y


el año?

Para determinar que hay una relación lineal significativa entre el número de autos
importados y el año con un nivel de significancia de 0,05, es necesario corroborar
que el coeficiente de correlación está en la zona de rechazo. Esto es:

𝐻0 : 𝜌 = 0 𝑐𝑜𝑛𝑡𝑟𝑎 𝐻𝑎 : 𝜌 ≠ 0

El coeficiente de correlación r esta dado por:

𝑛(∑ 𝑥𝑦) − (∑ 𝑥)(∑ 𝑦)


𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2

20(465,6) − (190)(42,1) 1313


𝑟= = ≈ 0,948
√20(2470)(190)2 √20(95,83)(42,1)2 1384,82

Tomando un margen de error de 0,05, los valores críticos para 20 elementos son
±0,444. 𝑟 = 0,948 > 0,444, por lo que se encuentra en la zona de rechazo, lo
que corrobora la hipótesis nula y se puede afirmar que existe una relación lineal
entre las dos variables.
d) Use el programa de cómputo para predecir el número de autos que serán
importados usando intervalos de predicción de 95% para cada uno de los
años 2007, 2008 y 2009.

Utilizando la ecuación de regresión obtenida en el punto b), se tiene que para el


2007 se estima una importación de 4,9177 millones de autos pues:

𝑦̂(38) = 0,0987(38) + 1,1671 = 4,9177

2007 corresponde a 38 según la codificación presentada en la tabla 1.

Para el 2008, cuya codificación es 39, se estima una importación de 5,0164 millones
de autos pues:

𝑦̂(39) = 0,0987(39) + 1,1671 = 5,0164

Y para el 2009, cuya codificación es 40, se estima una importación de 5,1151


millones de autos pues:

𝑦̂(40) = 0,0987(40) + 1,1671 = 5,1151

Para calcular los intervalos de predicción se debe calcular primero el error estándar
E, el cual está dado por:

1 𝑛(𝑥0 − 𝑥̅ )2
𝐸 = 𝑡𝑎/2 𝑆𝑒 √1 + +
𝑛 𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2

𝑡𝑎/2 = 2,101, valor obtenido de la tabla de distribución t: Valores críticos de t


(Tabla A-3 de Pearson), para n-2 grados de libertad con un nivel de significancia
de 0,05.

El error estándar de predicción 𝑆𝑒 , se obtiene mediante Minitab y su valor es


0,201165.

Es decir que el Error estándar para el 2007 es 𝐸2007 = 0,63698. Usando los

valores ya conocidos en la ecuación de E, y tomando 𝑥0 = 38, la codificación de


2007.
De manera análoga se obtiene 𝐸2008 = 0,6491 y 𝐸2009 = 0,6614.

Entonces, para el 2007, el intervalo de predicción con un nivel de confianza de 95%


es: 4,28072 < 𝑦̂(38) < 5,55468.

Para el 2008, el intervalo de predicción con un nivel de confianza de 95% es:


4,3673 < 𝑦̂(39) < 5,6655.

Y para el 2009, el intervalo de predicción con un nivel de confianza de 95% es:


4,4537 < 𝑦̂(40) < 5,7765.

e) Ahora vea los datos reales para los años 2007-2009. ¿Las predicciones
obtenidas en el paso d) dan estimaciones precisas de los valores reales
observado en estos años? Explique.

La tabla 2 es un cuadro comparativo donde se muestran las observaciones reales


para los años indicados y su respectiva predicción usando la ecuación de regresión
lineal.

Tabla 2. Comparación de las observaciones y las predicciones.

# autos # autos Intervalo de Dentro del


Año Código Diferencia
real predicción predicción Intervalo
2007 38 2.4 4.9177 2.5177 (4.28072;5.55468) NO
2008 39 2.3 5.0164 2.7164 (4.3673;5.6655) NO
2009 40 1.8 5.1151 3.3151 (4.4537;5.7765) NO

La tabla 2 deja en evidencia que las observaciones reales difieren por completo de
los valores predichos en los tres años. La cantidad real de autos importados en
estos años es aproximadamente la mitad de la cantidad predicha en cada uno de
los años, incluso, los valores reales no se encuentran dentro del intervalo de
predicción correspondiente; lo que induce a pensar que la relación lineal se pierde
con el pasar de los años.
f) Agregue los datos para 1989-2009 a su base de datos y recalcule la recta de
regresión. ¿Qué efecto tiene los nuevos puntos de datos sobre la pendiente?
¿Cuál es el efecto en el SSE?

Al agregar lo datos mencionados, se recalcula la ecuación de la regresión lineal,


la cual está dada por:

𝜑̂ = 0,0077𝑥 + 1,8801.
Los efectos sobre la pendiente son notorios, hay que recordar que la pendiente con
el conjunto de datos inicial era 0,0987. Claramente la pendiente con el conjunto de
datos completos es mucho menor (7,8% del valor inicial). Esto, representa que la
inclinación es menor y puede responder a las fluctuaciones que tiene la función a lo
largo de los años.

SSE la suma de cuadrados de error, por sus siglas en inglés (Squere Sum Error)
está dada por:

𝑆𝑆𝐸 = ∑(𝑦 − 𝑦̂)2

Entonces, al calcular SSE inicial, es decir entre los años 1969 y 1988, se tiene que:

19
2
𝑆𝑆𝐸1969−1988 = ∑(𝑦𝑖 − 𝑦̂)
𝑖 = 0,72842
𝑖=0

Por su parte, el cálculo de SSE con los datos completos, es decir entre los años
1969 y 2009, se tiene que:

41

𝑆𝑆𝐸1969−2009 = ∑(𝑦𝑖 − 𝜑̂𝑖 )2 = 9,87184


𝑖=0

Al introducir los demás datos, el SSE se multiplica en un factor de 13,5524 veces,


es decir que el error aumente considerablemente y por consiguiente las
estimaciones que se hagan con esta ecuación no son muy confiables.
Esto puede obedecer a que en la función de numero de autos importados según el
año, no es verdaderamente lineal en el horizonte de tiempo comprendido entre 1969
y 2009, sin embargo, hay un periodo de tiempo, 1969-1988, en donde la función se
asemeja de una manera razonable a una función lineal descrita en el punto b), por
fuera de este periodo de tiempo, las observaciones pierden ese patrón.

g) Dada la forma de la gráfica de dispersión para los años 1969-2009, ¿le


parece que una recta da un modelo preciso para los datos? ¿Qué otro tipo
de modelo podría ser más apropiado? (Use graficas residuales para ayudar
a contestar.

La figura 2 muestra la gráfica de dispersión del número de autos importados en


función de año, en el periodo comprendido entre 1969 y 2009, adicionalmente, se
traza la función lineal producto de la regresión de este conjunto de datos.

Figura 2. Año vs Número de autos importados entre 1969 y 2009.

Año vs Autos importados


3.5

2.5

1.5

0.5

0
0 5 10 15 20 25 30 35 40 45

Fuente elaboración propia mediante la herramienta Excel.


La relación lineal entre las dos variables se pierde por completo en este periodo de
tiempo, las importaciones fluctúan con mayor amplitud alejándose en ocasiones
bastante de la línea de tendencia. El coeficiente de determinación 𝑟 2 = 0,0333, lo
que de manera cuantitativa expresa el bajo nivel de ajuste de la ecuación al conjunto
de datos. Es por ello que una recta no es un modelo preciso para este conjunto de
datos.

La figura 3 muestra el mismo grafico de dispersión de la figura 2, pero con diferentes


tipos de regresión, la curva naranja es un modelo exponencial, la curva morada es
un modelo polinómico de grado 2, la curva fucsia es un modelo polinómico de grado
4 y la línea verde es un modelo polinómico de grado 6.

Figura 3. Año vs Número de autos importados entre 1969 y 2009 con diferentes
modelos.

Fuente elaboración propia mediante la herramienta Excel.


Entre los modelos analizados, se considera al polinómico de grado 6 el más
ajustado al conjunto de datos, adicionalmente, como se utilizó Excel para realizar
las diferentes regresiones, se calculó de manera simultánea, el coeficiente de
determinación en cada caso. Fue el polinómico de grado 6 el que tuvo un mayor
ajuste. Por eso se recomienda usar este modelo para representar el conjunto de
datos.
3) CONCLUSIONES

Cada herramienta matemática permite un acercamiento a la identificación de los


datos, es así como las gráficas de dispersión lo hacen de manera inicialmente fácil
o amigable con el lector, pero estas graficas por si solas no permiten determinar de
la mejor manera la relación que puede existir entre dos variables cuando se está
analizando un gran conjunto de datos. Por otro lado, se observa que al elaborar la
ecuación de correlación de las variables como se hizo en el caso estudiado, se dio
como resultado que si existe una correlación lineal entre las dos variables
analizadas. (años, y numero de autos importados en E.U)

Ahora, más allá de la correlación encontrada de manera gráfica y


matemática, se observa con facilidad la forma en que se puede predecir el
comportamiento de los datos analizados a través de las formulas planteadas en el
ejercicio, como la ecuación de regresión, el error estándar, y se concluye con la
fórmula del intervalo de predicción, los cuales, como se puede apreciar en el caso
planteado, las respuestas de la ecuación de regresión y el intervalo de predicción,
son coherentes con un porcentaje alto de confianza para cada uno de los años
analizados.

No obstante, lo anterior también se observa que, con la inclusión de más datos para
analizar en la tabla, los resultados tienden a variar, lo que indicaría que la relación
lineal puede no seguirse presentando, generando así, variaciones que pueden ser
importantes en los resultados arrojados como por ejemplo la pendiente, y
definiéndose de tal forma, la pérdida de la confianza en las estimaciones que se
hayan realizado como el conjunto de datos incompletos. En este orden de ideas,
se encuentra que probablemente deberán ser analizadas con otro tipo de líneas de
tendencia diferentes a la lineal en atención a la posible mayor fluctuación de los
resultados a lo largo de los años, o frente al análisis más amplio de los datos de los
que se quiera obtener una descripción y predicción más acertada.
4) REFERENCIAS BIBLIOGRAFICAS.

Mendenhall, W. (2010). Introducción̤ a la probabilidad y estadística. México:


Cengage Learning.

También podría gustarte