0% encontró este documento útil (0 votos)
96 vistas20 páginas

PRONOSTICOS

Este documento describe los conceptos de regresión y correlación para analizar la relación entre dos variables cuantitativas. Explica cómo crear un diagrama de dispersión con datos emparejados y calcular el coeficiente de correlación de Pearson (r) para medir la fuerza y dirección de la relación lineal. También cubre el coeficiente de determinación (r2) y la covarianza, y proporciona ejemplos de cómo interpretar diferentes tipos de diagramas de dispersión para determinar si un modelo de regresión lineal es adecuado.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
96 vistas20 páginas

PRONOSTICOS

Este documento describe los conceptos de regresión y correlación para analizar la relación entre dos variables cuantitativas. Explica cómo crear un diagrama de dispersión con datos emparejados y calcular el coeficiente de correlación de Pearson (r) para medir la fuerza y dirección de la relación lineal. También cubre el coeficiente de determinación (r2) y la covarianza, y proporciona ejemplos de cómo interpretar diferentes tipos de diagramas de dispersión para determinar si un modelo de regresión lineal es adecuado.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

UPN ADMINISTRACIÒN DE OPERACIONES

MG. PAULO OLIVARES

REGRESION Y CORRELACION

Si a cada unidad estadística se le observa simultáneamente dos variables cuantitativas


entonces se obtiene dos series de datos emparejados. En este caso con frecuencia se desea
conocer si ambas variables están relacionadas o si son independientes.

Unidad estadística : 1 2 3 n
Variable: X : X1 X2 X3 ............ Xn
Variable: Y : Y1 Y2 Y3 ............ Yn
Es decir, se tiene n observaciones bidimensionales:
( X i , Yi ) : (X1 , Y1) , (X2 , Y2) , ........ , (Xn , Yn)

cada par de datos representa un punto en el sistema


cartesiano.

Este conjunto de puntos ( X i , Yi ) se llama “diagrama


de esparcimiento” , “diagrama de dispersión” ,
“dispersigrama” o ”nube de puntos”.

Se observa que Y aumenta a medida que X aumenta.

Ejemplo: El siguiente diagrama muestra de dispersión muestra las estaturas y los pesos
de un grupo de 29 personas.

El diagrama de dispersión puede tomar diferentes formas:

Si se desea investigar la relación existente entre dos variables el primer paso será trazar el
diagrama de esparcimiento, el cual proporcionará una idea del tipo de relación existente
entre ambas variables, facilitando así la elección de la correspondiente función matemática.

Correlación:

Es el método empleado para determinar el grado de relación entre las variables que se
estudian para así determinar en qué medida una relación funcional describe o explica de
una forma adecuada la relación entre estas variables. Explica el grado de la bondad del
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
ajuste del modelo de regresión. Se ocupa de establecer la magnitud y la dirección de las
relaciones.

Coeficiente de Correlación Lineal Simple: r (Coeficiente de Pearson)

Indica si hay relación lineal entre dos variables y el grado de esta relación (alta, baja o nula).
Permite contestar ¿qué tan estrecha es la relación entre X e Y?
El signo de r tiene que ver sólo con la dirección de la relación entre dos variables, ya sea
directa o inversa y la magnitud del coeficiente tiene que ver con la intensidad o estrechez de
la relación. Equivale a observar el diagrama de dispersión con la recta ajustada y ver si los
puntos coinciden, están cerca o lejos de dicha recta.
El valor de r puede ser positivo, negativo o cero. Su signo depende del signo de b.

La correlación es tanto más fuerte a medida que r se aproxima a –1 ó +1 y es tanto más


débil a medida que se aproxima a 0.

-1 0 +1

Una correlación de r   1 significa que existe una


relación lineal directa perfecta (positiva) entre las
dos variables. Es decir, las puntuaciones bajas de la
primera variable (X) se asocian con las puntuaciones
bajas de la segunda variable (Y), mientras las
puntuaciones altas de X se asocian con los valores
altos de la variable Y.

Una correlación de r   1 significa que existe una


relación lineal inversa perfecta (negativa) entre las
dos variables. Lo que significa que las puntuaciones
bajas en X se asocian con los valores altos en Y,
mientras las puntuaciones altas en X se asocian con
los valores bajos en Y.

Una correlación de r  0 se interpreta como la no


existencia de una relación lineal entre las dos
variables estudiadas.

A la hora de interpretar un coeficiente de correlación hay que tener en cuenta por un lado
su magnitud y por otro su signo. La magnitud se refiere al grado en que la relación entre las
dos variables queda bien descrita con r, mientras que el signo se refiere al tipo de relación.
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

Nota:
 Si r  0,75 la recta de regresión será una buena estimación.
 Todo r 0 indica cierto grado de relación entre dos variables
 Una correlación baja no siempre significa ausencia de relación ya que puede existir
una correlación curvilínea muy estrecha.

Coeficiente de Determinación: r2
Determina el porcentaje de la variación total de Y que queda explicada por la ecuación de
regresión. Mide la bondad del ajuste de la línea de regresión.
0  r2  1

Ejemplo:
Si Si r  0,90  r 2  0,902  100  81%

Interpretación : El 81% de los cambios que se producen en Y pueden ser atribuidos a


los cambios que se producen en X, mientras que el 19% de dichos cambios se
pueden atribuir a otros factores que no han sido tomados en cuenta o a efectos
aleatorios.

Covarianza: Sxy

La covarianza entre dos variables es un estadístico resumen indicador de si las


puntuaciones están relacionadas entre sí. El signo de la covarianza nos dice si el aspecto de
la nube de puntos es creciente o decreciente, pero no nos dice nada sobre el grado de
relación entre las variables.

S XY  Cov ( X , Y ) 
 XY 
X . Y
n n n

 Una covarianza positiva significa que existe una relación lineal positiva entre las dos
variables. Es decir, las puntuaciones bajas de la primera variable X se asocian con
las puntuaciones bajas de la segunda variable Y, mientras las puntuaciones altas de
X se asocian con los valores altos de la variable Y. (La nube de puntos es creciente).

 Una covarianza negativa significa que existe una relación lineal inversa perfecta
(negativa) entre las dos variables. Lo que significa que las puntuaciones bajas en X
se asocian con los valores altos en Y, mientras las puntuaciones altas en X se
asocian con los valores bajos en Y. (La nube de puntos es decreciente).

 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las
dos variables estudiadas.
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
La covarianza no es un parámetro acotado, y puede tomar cualquier valor real, por lo que su
magnitud no es importante; lo significativo es el signo que adopte la misma.

Cálculo del Coeficiente de Correlación:

1.- Coeficiente de Correlación Lineal de Pearson:

r 
n  XY   X Y
n
  X2    X 2  n  Y2    Y 2 

2.- Usando la Covarianza:


S XY
r 
SX S Y

3.- Forma de Regresión:

r  b . b

4.- Conociendo a y b :

r 
a  Y  b  XY  n Y 2
 Y2  n Y2
Regresión:

Es un método que se emplea para encontrar una función que se adapte o ajuste a un
diagrama de esparcimiento con la finalidad de poder obtener una predicción aproximada de
una de las variables a partir de la otra. El objetivo principal de la regresión es descubrir el
modo en que se relacionan dos variables.
Y=f(X)

Donde:
X : variable predictora (variable independiente o explicativa)
Y : variable predictando o variable respuesta (variable dependiente o explicada).

¿Cómo determinar quién es X y quién es Y?


Si se tienen dos variables: Nota de examen y Tiempo de estudio
A la hora de determinar qué variable explica a la otra, está claro que el “tiempo de estudio”
explica la “nota de examen” y no al contrario, pues el alumno primero estudia un tiempo
que puede decidir libremente, y luego obtiene una nota que ya no decide arbitrariamente.
Por tanto,
X = Tiempo de estudio (variable explicativa)
Y = Nota de examen (variable explicada)
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

Al analizar los siguientes diagramas de dispersión:

Una línea recta de pendiente negativa Cualquier recta que se trace deja a
puede aproximarse a casi todos los muchos puntos alejados de ella.
puntos. Hacer un análisis de regresión no tiene
Hacer un análisis de regresión está sentido.
justificado.

Entonces, según la forma del diagrama de dispersión; podemos pensar en un modelo


matemático que mejor describa la relación existente entre X e Y.

La nube de puntos parece ajustarse bien El ajuste lineal no parece adecuado para
a una recta. este dispersigrama.

El ajuste lineal parece adecuado. Existe relación pero no lineal.

No existe relación lineal entre las dos Existen observaciones atípicas (outliers).
variables.

Probablemente influyan en la estimación


No hay indicios de existencia de relación. de la recta.
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

MODELO DE REGRESION BIVARIABLE LINEAL

Si en el diagrama de esparcimiento se observa que los puntos se adaptan a un modelo


lineal, es decir la relación entre las variables se describe mejor mediante una recta entonces
el problema se reduce a encontrar la ecuación de dicha recta.

Recta de Regresión de Y sobre X:

Se llama así a la recta que atraviesa el diagrama de esparcimiento y que mejor se ajusta a
él. Si llegamos a conocer la ecuación, se podrá llegar a estimar valores de Y desconocidos a
partir de valores de X conocidos.

Y = f(X)

Predictando Predictora

Y : variable predictando, predicha, explicada o respuesta.


X : variable predictora o explicativa.

Y = a + bX + ei e : error de estimación, residuo, error residual.

Y = a+ bX Ecuación de Regresión de Y sobre X


(a y b constantes desconocidas)

El caso más simple de una recta de regresión es del tipo Y = X donde la recta pasa por el
origen de coordenadas y su inclinación es de 45º. El caso más general es cuando la recta no
pasa por el origen y su inclinación es cualquiera.

Recta de Regresión de X sobre Y:


Si se hubiera tomado Y como variable predictora o explicativa y X como predictando o
explicada, la recta de regresión estima X a partir de los valores de Y.

X = f(Y)

Predictando Predictora

X = a + bY + ei ei : errores de estimación.

Ecuación de Regresión de X sobre Y :


(a y b constantes desconocidas)

X = a + b Y

por lo general: a  a y b  b

Es decir la ecuación de regresión de Y sobre X difiere de la ecuación de regresión de X sobre


Y. Sólo cuando la coincidencia entre los puntos reales y la recta de regresión sea perfecta,
entonces ambas rectas de regresión serán iguales.
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

Si : a = a y b = b

Las dos rectas de regresión son Los datos presentan una mejor
coincidentes, entonces los datos relación lineal a medida que las dos
quedan perfectamente descritos por rectas se acercan.
una relación lineal. La predicción es
perfecta.

Si ambas rectas son perpendiculares


entonces los datos no presentan una
relación lineal

 Ambas rectas de regresión, se cortan en el punto cuyas coordenadas corresponden a las


medias de ambas variables. A este punto se le suele llamar centro de gravedad de la
distribución

Interpretación de a y b:

a: es la intersección de la recta de regresión con el eje Y.


Es el valor que toma la variable predictando Y cuando la variable predictora X es
cero.

b: Coeficiente de regresión. Es la pendiente de la recta.


Es la cantidad de cambio de la variable predictando Y asociada a un cambio
unitario de la variable predictora X.

Si b > 0:

Existe una relación lineal directa o


positiva (cuando X aumenta Y
también aumenta).
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

Ejemplo:

Si Y = 2 + 0,7 X donde: X : Horas de estudio Y : Nº de respuestas correctas.

a =2:
Cuando la alumna no estudia, se espera que obtenga
2 respuestas correctas.

b = 0,7  1
Por cada hora que se incremente en las horas de
estudio, se espera que el número de respuestas
correctas se incremente en aproximadamente 1.

Si b < 0:

Existe una relación lineal inversa o


negativa. (cuando X aumenta Y
disminuye)

Ejemplo:

Si Y = 19 - 2,2 X donde: X : Horas de estudio Y : Nº de errores cometidos.

a = 19 :
Cuando la alumna no estudia, se espera que
cometa 19 errores.

b = -2,2  -2
Por cada hora que se incremente en las horas de
estudio, se espera que el número de errores
disminuya en aproximadamente 2.

En algunas situaciones, “a” no tiene una interpretación realista si el cero no es un punto del
rango de la X. Por ejemplo, al estudiar la relación entre las variables peso y estatura de un
grupo de personas; no podría decirse que si la estatura de una persona es 0, se espera que
su peso sea tal.

Según el signo de “b” , se tiene:

Existe relación lineal Existe relación lineal No existe


UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
inversa directa. relación

Según el signo de a y b , un modelo lineal puede presentar cualquiera de las siguientes


formas:

Problemas al ajustar un modelo de regresión lineal simple.

Falta de Linealidad, porque la relación entre las dos variables no es lineal o porque
variables explicativas relevantes no han sido incluidas en el modelo.

Existencia de valores atípicos e influyentes, existen datos atípicos que se separan de la


nube de datos muestrales e influyen en la estimación del modelo.

Falta de Normalidad, los residuos del modelo no se ajustan a una distribución normal.

Heterocedasticidad, la varianza de los residuos no es constante.

Dependencia (autocorrelación), existe dependencia entre las observaciones.

NOTA:

Un valor atípico o outlier modifica de forma importante la recta de regresión ajustada.


UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

MÉTODO DE MINIMOS CUADRADOS

En todo ejemplo real, las observaciones no coinciden exactamente con la recta de regresión
debido a los errores casuales que afectan las mediciones. Esto significa que para un valor
dado de X, el valor de Y que le corresponde no será exactamente: a+bX, sino que esta
ecuación usando el valor de X arroja el valor esperado de Y denominado Ŷ . Entonces, para
cada valor medido de X se tendrán dos valores: el valor real u observado Y y su valor
esperado calculado por la recta de regresión Ŷ .
Al observar el diagrama de esparcimiento se puede ver que ninguna recta pasará por todos
los puntos, entonces ¿cuál será la mejor? El método de mínimos cuadrados es una técnica
empleada para llegar a la ecuación de regresión minimizando la suma de los cuadrados de
las distancias verticales entre los valores Y verdaderos y los valores pronosticados de Y .
Este método supone que la recta de mejor ajuste es aquella para la cual la suma de los
cuadrados de las distancias verticales de los puntos (Xi , Yi) a la recta es mínima.

MODELO DE REGRESIÓN DE Y SOBRE X:

Y  abX

 d2i   e2i   ( Yi  Ŷi )2


      
 mínimo
S
Esta expresión se minimiza derivando:
S S
 0  0
a b

S
a


a
 (Y i  Ŷi )2  

a
 (Y i  (a  bX i ) )2   0


a
 (Y i  a  bX i )2   2  (Y i  a  bX i ) (1)

= 2  (  Yi  a  b X i )
=  2 Yi  2 a  2 b X i

=   Yi  n a  b X i  0

 na  b  Xi   Yi
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
S
b


b
 (Y i  Ŷi )2  

b
 (Y i  (a  bX i ) )2   0


b
 (Y i  a  bX i )2   2  ( Y  a  bX ) (X )
i i i

= 2 ( X Y  a X  b X )
i i i
2
i

=  2  X Y  2 a X  2 b X
i i i
2
i

=   X Y  a  X  b X
i i  0 i
2
i

 a  Xi  b  X2i   X i Yi
Estas ecuaciones se llaman Ecuaciones Normales:

na  b  Xi   Yi
a  Xi  b  X2
i   Xi Yi
Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

a 
 X  Y   X  XY
2
b 
n  XY   X  Y
n  X   X  n  X 2   X 
2 2 2

MODELO DE REGRESIÓN DE X SOBRE Y: X  a   b Y

Las ecuaciones normales o paramétricas de regresión son:



 a n  b Y  X


 a  Y  b  Y2  XY

Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

 Y2  X   Y  XY
a' 
n  Y2   Y 
2
b' 
n  XY   Y  X
n  Y2    Y 
2

Forma matricial:

Ecuación de Regresión de Y sobre X: Ecuación de Regresión de X sobre Y:


1
a n  X    Y 
 1
       a n  Y    X 

  X2   XY 
b  X
       
  Y2    XY 
b  Y

Otras fórmulas para obtener las Ecuaciones de Regresión:

a) Conociendo r :
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
S SX
Ŷ  r Y ( X  X )  Y X̂  r (YY )  X
SX SY
b) Conociendo la Covarianza:

SXY SXY
Ŷ  (XX)  Y X̂  (YY)  X
S2X S2Y

Error Estándar de Estimación:

Si todos los valores quedaran alineados por la recta de regresión, no existiría errores al
hacer algún pronóstico, sin embargo este caso no se da. El error estándar de estimación nos
da una medida de la desviación promedio de los errores de predicción en torno a la línea de
regresión. Indica qué tan preciso es el pronóstico de Y con base en X.

Cuantifica los errores de predicción, por lo tanto:


 Cuanto mayor sea su valor, menor confianza se tendrá en la predicción.
 Cuanto menor sea su valor, es probable que la predicción sea más precisa.
El error estándar de la estimación se determina por medio de:

SL 
Y 2
 a Y  b  XY
n  2

Intervalo de Probabilidad para Ŷ :


Y0  t 0 SL

Intervalo de confianza para β :

SL t o  t1 - α/2 , n  2
b  to
  X 2

X 2

n

Ejemplo:

Una encuesta entre vendedores de autos usados para determinar la relación entre la
cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados
del número de avisos clasificados y el número de automóviles usados vendidos para cada
uno de los 27 negocios que no utilizaron ningún otro medio publicitario.
Nº Anuncios clasificados : 74 45 50 38 29 17
Nº Autos vendidos : 139 110 95 78 60 54

a) Trazar el diagrama de esparcimiento.


UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

b) Hallar las ecuaciones normales.


 a n  b  X   Y 

 6 a  253 b  536
 2 

 a X  b  X   X Y  253 a  12575 b  25608

c) Ajustar a los datos un modelo lineal:


Ŷ  a  b X  Ŷ  22,8  1,6 X

a 
 X  Y   X  XY
2

12575  536  253  25608
 22,8
n  X   X 
2
2 6  12575  2532

b 
n  XY   X  Y 
6  25608  253  536
 1,58
n  X 2   X 
2
6  12575  2532

d) Interpretar a y b.

a = 22,8  23 autos vendidos.


Cuando no se publican anuncios clasificados, se espera vender
aproximadamente 23 autos.
b = 1,58  2 autos vendidos
Por cada anuncio clasificado que se incremente, se espera que el número de
autos vendidos se incremente en aproximadamente 2.

e) Calcular e interpretar el coeficiente de correlación.


6  25608  253  536
r   0,958
( 6  12575  2532 ) ( 6  53046  5362 )

Un modelo lineal es confiable, por lo tanto se pueden realizar pronósticos.

f) Calcular e interpretar el coeficiente de determinación.


r2  0,9582  0,92  92%

r 2  92% El 92 % de las variaciones en el número de autos vendidos se


pueden atribuir a las variaciones en el número de anuncios
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
clasificados, mientras que el 8% se pueden atribuir a otros
factores que no han sido considerados en este caso o al azar.

REGRESIÓN Y CORRELACIÓN PARABÓLICA SIMPLE

La parábola por lo general se aplica en aquellos casos en que se presenta una parte
ascendente y en seguida una descendente o viceversa.
En la práctica su uso es poco frecuente sin embargo a veces se utiliza para proyecciones de
utilidad, ingresos.

Ecuación de Regresión parabólica:

Su gráfico:
Ŷ  a  b X  c X2

Para hallar los valores de a, b y c se deben resolver las siguientes ecuaciones normales:

a n  b  X  c  X2   Y
aX  b  X2  c  X3   X Y
a  X2  b  X3  c  X4   X2 Y

Forma matricial:
1
a 
n
 X  X 2    Y 
     

 b   X
c 
 X 2  X 3    XY 
 

   X2
  X 3  X 4    X 2 Y 

Coeficiente de correlación parabólica:

 Y  b  XY  c  X 2 2
a Y  n Y
r 
Y  n Y 2 2

Error de Estimación o de Predicción:

SC 
Y 2
 a Y  b  XY  c  XY
n 2

Intervalo de Probabilidad:


Y0  Z  / 2 SC

Ejemplo:
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
En la fábrica Dacron S.A., se tienen los siguientes datos correspondientes a las horas
trabajadas (en miles) que producen el producto gama (en unidades).

Horas trabajadas : 1 2 4 5 7 8 8 9 10 12
Producción : 25 15 10 10 15 10 20 20 35 45

a) Trazar el diagrama de esparcimiento.

b) Ajustar a los datos un modelo adecuado.

Al trazar el diagrama de esparcimiento, se observa que el modelo parabólico sería un


modelo adecuado.
Ŷ  a  b X  c X 2

205  10 a  66 b  548 c
1560  66 a  548 b  5022 c
14750  548 a  5022 b  48788 c

10 66 548
  66 548 5022  1 337 672
548 5022 48788

205 66 548
40 072 580
a  1560 548 5022   29,957
1 337 672
14750 5022 48788

10 205 548
 10 578 600
b  66 1560 5022    7,908
1 337 672
548 14750 48788

10 66 205
1 043 220
c  66 548 1560   0,780
1 337 672
548 5022 14750

 Ŷ  29,96  7,91 X  0,78 X 2


UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

c) Hallar el volumen de producción esperado para 14 mil de horas.

Si X = 14 :

Ŷ0  29,96  7,91  14  0,78  142  72

d) Calcular e interpretar el coeficiente de correlación parabólica.

29,957  205  7,908  1560  0,780  14750  10  20,5 2


r 
5425  10  20,5 2

r  0,95

 Un modelo parabólico sí es confiable es decir, se pueden realizar pronósticos.

e) Calcular e interpretar el coeficiente de determinación parabólico.


r 2  0,95 2  90%

El 90% de las variaciones que se producen en la producción se pueden atribuir a las


variaciones producidas en el número de horas trabajadas, el 10% restante de estas
variaciones son debidas a otros factores o a efectos aleatorios.
f) Calcular el error de estimación cuadrático.

SC 
Y 2
 a Y  b  XY  c  XY
n 2

5425  29,95696  205  7,90822  1560  0,77988  1560


SC   36,06
8

g) Para 14 mil horas, ¿cuánto se espera que sea la producción mínima y máxima?

Y0  Z  / 2 SC

72  1,96  36,06

1,32  Y  142,68
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

REGRESIÓN Y CORRELACIÓN EXPONENCIAL

Al graficar los valores X e Y se obtiene una curva creciente o decreciente, es decir que la
variable predictora evoluciona en forma aritmética y la variable predictando evoluciona en
forma geométrica.
En la práctica son numerosas las variables que presentan un crecimiento geométrico: la
población, ventas, salarios, ingresos, etc.

Ecuación de Regresión Exponencial:

Ŷ  a . bX

Para facilitar la determinación de las ecuaciones normales, la función anterior se linealiza


aplicando logaritmos:

Log Y = Log a + X log b


Ecuaciones normales:
 log Y  n log a  log b .  X
 X log Y  log a .  X  log b .  X 2

Su gráfico:

Coeficiente de Correlación Exponencial:

r 
n  X log Y   X .  log Y
 n X 2
 (  X )   n  ( log y )  (  log Y ) 
2 2 2

Ejemplo:
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES

La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de


dólares) en un país desde 1998 hasta 2002 fue:
Gastos de Publicidad : 2 4 5 7 12
Demanda de TV : 3 6 12 24 45
a) Trazar el diagrama de esparcimiento.

b) Ajustar a los datos un modelo exponencial.


Ŷ  a . bX
Log Y = Log a + X log b

5,37  5 log a  30 log b


38,96  30 log a  238 log b

5 30
   290
30 238

5,37 30
38,96 208 109,26
log a    0,38  a  2,38
290 290

5 5,37
30 38,96 33,7
log b    0,12  b  1,31
290 290

Por lo tanto el modelo será:


Ŷ  2,38 . 1,31X
c) Calcular e interpretar el coeficiente de correlación:
5  38,96  30  5,37
r   0,95  es confiable.
 5  238  30   5  6,64  5,37 
2 2

d) Realizar un pronóstico:

Si X = 13:
Ŷ  2,38 . 1,3113  79,63  80 unidades
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
PRÁCTICA

1.- Como parte de la evaluación de un sistema de computadora, un gerente de sistemas


quiere predecir el tiempo de respuesta de las terminales de la computadora. El
tiempo de respuesta de una terminal se define como el tiempo (en segundos) que la
computadora tarda en responder a un comando enviado desde una terminal
oprimiendo una de las teclas de función de programa de la terminal. Aunque son
muchas las variables que influyen en el tiempo de respuesta de las terminales, el
gerente de sistemas va a modelar dicho tiempo como una función del número de
usuarios simultáneos (es decir, el número de usuarios que están accediendo a la
unidad central de procesamiento en el momento en que se envía el comando). El
gerente ha recabado los datos de muestra que se presentan a continuación.
Encuentre un modelo lineal adecuado.
Nº usuarios simultáneos : 1 2 3 4 5
Tiempo de respuesta (seg.) : 0,22 0,59 1,01 1,36 1,42
¿Podrá el gerente predecir el tiempo el tiempo de respuesta de las terminales de la
computadora usando un modelo lineal?

2.- Una compañía presenta los siguientes datos con respecto a las ventas de un
producto durante siete años.

Años : 2010 2011 2012 2013 2014 2015 2016


Ventas : 36 28 34 52 58 62 67

a) Ajustar a los datos un modelo parabólico.


b) ¿Se puede afirmar que el modelo hallado será eficiente para realizar
pronósticos?
c) Si tuvieras que elegir entre un modelo lineal y uno parabólico. ¿Por cuál te
decidirías?
d) Interpretar a , b y c.
e) ¿Qué porcentaje de los cambios producidos en las ventas, no es explicado
por el modelo parabólico?
f) Estimar las ventas para el año 2021.
3.- Un nuevo paquete de software de consulta para computadora se diseñó con el
objetivo de lograr un acceso y un mantenimiento más eficientes de los conjuntos de
datos a gran escala. La eficiencia se mide en términos del número de operaciones de
entrada/salida (E/S) de disco (llamadas bloques de almacenamiento) necesarias para
acceder al conjunto de datos y darle mantenimiento; cuanto menor sea el número de
bloques leídos, con mayor rapidez se efectuará la operación. A fin de evaluar el
desempeño del nuevo sistema de software, se registró el número de operaciones de
E/S de disco necesarias para acceder a un conjunto de datos a gran escala, para
cada uno de una muestra de ocho conjuntos de datos de diversos tamaños (donde el
tamaño se mide como el número de registros contenidos en el conjunto de datos).
Nº de Registros : 350 200 450 50 400 150 350 300
(millares)
Nº de E/S a disco : 36 20 45 5 40 18 38 32
(millares)
¿Es confiable un modelo lineal? Si lo es, hallar dicho modelo de regresión.

4.- Un fabricante quiere establecer si hay una relación parabólica entre las ausencias al trabajo. X: número
de permisos al mes e Y: edad del trabajador. Para ello selecciona una muestra aleatoria de 10
trabajadores, obteniendo la siguiente información:
Y : 28 32 46 24 28 36 42 37 51 42
X : 5 8 4 7 10 4 3 4 3 4
a) Hallar la ecuación de regresión parabólica.
UPN ADMINISTRACIÒN DE OPERACIONES
MG. PAULO OLIVARES
b) Estimar la edad para una persona que solicita 6 permisos en el mes.

5.- Se tienen los siguientes datos correspondientes a las horas de estudio y al número
de errores cometidos en un examen de Inferencia Estadística por un grupo de
alumnos del IV ciclo de Ingeniería de Sistemas.
Horas de estudio : 5 2 9 6 7 3 4 8
Nº de errores : 7 14 6 7 5 8 10 4
Nº de alumnos : 3 1 5 3 3 1 2 4
a) Realiza un análisis grafico y contesta ¿Qué tipo de relación existe entre
ambas variables? ¿Por qué?
b) ¿Podemos afirmar que los pronósticos que realicemos con este modelo
estarán cercanos a la realidad? ¿Por qué?

6.- Una compañía recabó los datos adjuntos para comparar el precio de venta de casas
nuevas con el tamaño de la construcción en cientos de pies cuadrados.
Espacio construido : 20 22 18 30 23 25
Precio de venta : 116 118 91 145 105 121
a) ¿Podemos afirmar que a mayor espacio construido mayor precio de venta?
Justifique su respuesta.
b) Si el espacio construido es de 32 ¿cuál es el precio de venta mínimo y
máximo que se espera?

7.- Se tiene la siguiente información con respecto a la producción total (miles de


unidades) y el costo total (miles de dólares) de cierto artículo en una compañía.
Costo total : 30 36 40 48 50 54 66 88
Producción : 10 20 30 40 50 60 70 80
a) Ajustar a los datos un modelo exponencial.
b) ¿Podemos afirmar sin temor a equivocarnos que un modelo exponencial sería
de mayor utilidad que un modelo lineal? Justifique.
c) Si se tiene una producción de 53000 unidades, ¿cuál será el costo total
esperado?

8.- Se desea analizar el número de errores cometidos por una persona en relación con
las horas que lleva desarrollando un trabajo.

Errores cometidos : 10 10 8 6 5 3 4 2 5 8 9 10
Horas trabajadas : 1 2 3 4 5 6 7 8 9 10 11 12
¿Podemos afirmar que el número de errores por hora disminuirá si la persona se
vuelve más eficiente en la tarea, pero después aumentaría debido a otros factores
como por ejemplo la fatiga y el aburrimiento?

También podría gustarte