Estadística Aplicada Producto Académico N° 03
Produc to Ac adémico
adémico N° 03
Desarrolle de manera detallada las preguntas presentadas a continuación y responda a las
preguntas.
1. El gerente de ventas de COPIADORAS SUPER que tienen una gran fuerza de ventas en el
país quiere determinar si hay alguna relación entre el número de llamadas de ventas
hechas en un mes y e l número de copiadoras vendidas en ese mes.
El gerente selecciona una muestra aleatoria de 10 representantes y determina el número
de llamadas de ventas hechas por cada representante el mes pasado y el número de
copiadoras que vendió. La información se muestra a continuación:
Llamadas de ventas 20 40 20 30 10 10 20 20 20 30
Copiadoras vendidas 30 60 40 60 30 40 40 50 30 70
a. Represente gráficamente la relación entre las dos variables.
RELACION ENTRE DOS VARIABLES
S
A 80
D
I
D 70
N
E
V
S 60
A
R 50
O
D
A
I 40
P
O
C 30
20
10
0
0 5 10 15 20 25 30 35 40 45
LLAMADAS REALIZADAS
b. Determine el grado de relación entre las variables.
Grado de coeficiente de correlación:
1|P á g i n a
Estadística Aplicada Producto Académico N° 03
10(10.800) − (220)(450)
=
{10(5.600) −(220) }{10(22.100) −(450) }
√ {10
= 0.759 (coeficiente de correlación)
Correlación
Correlación positi va alta
alta
c. Calcule la variación del número de copiadoras vendidas que se debe a la
variación al número de llamadas de venta.
El coeficiente de determinación es:
=
= 0.576
Interpretación:
Existe una alta asociación entre las variables, 57.6% de la variación en el
número de copiadoras vendidas, se explica, o se debe a, la variación en el
número de llamadas realizadas.
d. Realice la Prueba de hipótesis respecto al coeficiente de correlación.
Llamadas (X) Copiadoras X2 Y2 XY
vendidas
(Y)
10 30 100 900 300
10 40 100 1,600 400
20 30 400 900 600
20 40 400 1,600 800
20 40 400 1,600 800
20 50 400 2,500 1,000
20 30 400 900 600
30 60 900 3,600 1,800
30 70 900 4,900 2,100
2|P á g i n a
Estadística Aplicada Producto Académico N° 03
40 60 1,600 3,600 2,400
220 450 5,600 22,100 10,800
HIPOTESIS FORMULADAS
¿la correlación encontrada se puede generalizar para toda la población, para
todos los vendedores de la compañía?, o ¿la correlación encontrada se debe a
la casualidad?
PRUEBA BASADA EN T
H0: ρ = 0
H1: ρ ≠ 0
Donde ρ: correlación de la población.
El nivel de significancia:
α = 0.05
La estadística de prueba adecuada es t, y la fórmula es:
= 3.297
GRADOS DE LIBERTAD
Gl = n –2
Gl = 10 – 2
Gl = 8
3|P á g i n a
Estadística Aplicada Producto Académico N° 03
Bbuscando en las tablas de la distribución de t, se obtiene el valor crítico de 2.306
La regla de decisión es entonces: No rechazar H 0 si el valor que se encuentre
para t es mayor que – 2.306 y menor que 2.306. Si el valor calculado
calculado no cae en
este rango, se rechaza H 0 y se acepta H 1
Dado que el valor que se encontró para t fue de 3.297, se rechaza la hipótesis
nula.
CONCLUCION: con un nivel de significancia de 0.05 se puede asegurar que la
correlación de la población no es cero. Lo que indica que sí hay correlación para
el total de vendedores, o que es posible generalizar los resultados.
e. Determine la ecuación de regresión (recta de regresión).
FORMA GENERAL DE LA ECUACION DE LA REGRESION LINEAL
Y’ = a + bX
Pendiente de la línea de regresión b = (n ( Σ XY ) – ( Σ X ) ( Σ Y ))/ n ( Σ X2 ) – ( Σ X ) 2
Intercesión con el eje x a= Σ Y/(n) – b Σ X(n)
ECUACION DE LA REGRESION:
Y ’ = (18.9476 + (1.1842) X
f. ¿Cuál es el número esperado de venta de copiadoras para un empleado que
hace 20 llamadas?
EL NÚMERO DE COPIADORAS QUE SE ESPERA VENDER SI UN EMPLEADO REALIZA 20
LLAMADAS.
Representantes Llamadas Copiadoras X2 Y2 XY
de ventas (X) vendidas
(Y)
Representante 1 20 30 400 900 600
Representante 2 40 60 1,600 3,600 2,400
Representante 3 20 40 400 1,600 800
Representante 4 30 60 900 3,600 1,800
Representante 5 10 30 100 900 300
Representante 6 10 40 100 1,600 400
Representante 7 20 40 400 1,600 800
Representante 8 20 50 400 2,500 1,000
Representante 9 20 30 400 900 600
Representante 10 30 70 900 4,900 2,100
4|P á g i n a
Estadística Aplicada Producto Académico N° 03
TOTAL 220 450 5,600 22,100 10,800
Pendiente de la línea de regresión (b)
= 10 ( 10,800 ) – ( 220 ) ( 450 )/ 10 ( 5,600 ) – ( 220 ) 2
= (108000 – 99000)/(56000- 48400)
= 9000/7600
=1.1842
INTERSECCION CON EL EJE Y (a)
=450/10 – 1.1842 (220/10)
= 45 – 1.1842 (22)
=45 – 26.0524
= 18.9476
EN LA ECUACION GENERAL
Y = (18.9476 + (1.1842) 20
Y = 18.9476 + 23.684
Y = 42.6316
RESPUESTA: Esto quiere decir que un vendedor que realiza 20 llamadas puede
esperar ventas de 43 copiadoras.
copiadoras .
g. Determine el error estándar de estimación.
Representantes VENTAS VENTAS DESVIACION DESVIACION AL
de ventas CALCULADAS REALES CUADRADO
Representante 1 20 30 -12.6316 159.557
Representante 2 40 60 -6.3156 39.887
Representante 3 20 40 -2.6316 6.925
Representante 4 30 60 5.5264 30.541
Representante 5 10 30 -0.7896 0.623
Representante 6 10 40 9.2104 84.831
Representante 7 20 40 -2.6316 6.925
Representante 8 20 50 7.3684 54.293
Representante 9 20 30 -12.6316 159.557
Representante 10 30 70 15.5264 241.069
TOTAL 220 450 0 784.208
Error de determinación estándar = ((sumatoria de desviación Al cuadrado)/(n-2))
*½
= (784.208 / 8)*1/2
= (98.035)*1/2
=9.901
5|P á g i n a
Estadística Aplicada Producto Académico N° 03
h. Determine el intervalo de confianza del 95% para todos los re presentantes que
hicieron 20 llamadas.
y=18.9476 + 1.1842X
=18.9476 + 23.684
= 42.6316
N=8 con NC al 95 %
t= 2.306
intervalo de confianza =42.6316 +/- 2.306(9.901)*(1/10)( 20-22)2 )/ 784.208
=42.6316 +/- 22.8317(0.3241)
= 42.6316 +/- 7.3995
i. Determine el intervalo de predicción del 95% para una representante del norte
del país que hizo
hi zo 20 llamadas.
Intervalo de predicción = 42.6316 +/- 2.306(9.901) (1 +0.1 +0.0051) 1/2
= 42.6316 +/- 22.8317(1.1051)1/2
= 42.6316 +/- 1.051
2. La tabla muestra las correlaciones de las variables de la ecuación para estimar la
resistencia a la tensión mecánica de un alambre de acero:
a) Halle e interprete si la muestra es de tamaño 5.
Diámetro ex- Cantidad de
Resistencia (y)
terior (x1) Molibdeno (x2)
Diámetro exterior (x1) 1,000
Cantidad de Molibdeno (x2) 0,971 1,00
Resistencia (y) 0,995 0,990 1,00
6|P á g i n a
Estadística Aplicada Producto Académico N° 03
K= número de variables independientes
N= tamaño de la muestra = 5
R2= 1-(1-R2)5-1/5-2-1
R2 = 1-(1-R2)*2
R2 = 1
R=1
b) Realice el análisis de multicolinealidad.
Evaluaremos cuál de las variables son independientes y dependientes:
1. Diámetro exterior: variable independiente
2. Cantidad de molibdeno: Variable
Variable independiente
3. Resistencia: Variable dependiente
La multicolinealidad no afecta la bondad de ajuste ni la bondad de predicción. Los
coeficientes (función discriminante lineal) no pueden interpretarse de forma fiable, pero
los valores (clasificados) ajustados no se ven afectados.
3. La tabla muestra los días
dí as de inasistencia al trabajo y el bono de
d e reconocimiento (x100
soles) recibido por una muestra de empleados de una empresa por motivo de fiestas
patrias:
Inasistencias (días) (x) 1 4 5 1 2 3
Bono de reconocimiento (y) 49 41 40 48 45 43
a) Grafique el diagrama de dispersión.
di spersión.
7|P á g i n a
Estadística Aplicada Producto Académico N° 03
DIAGRAMA DE DISPERCION
O 6000
T
N
E
I
M
I 5000
C
O
N
O 4000
C
E
R
E
D
3000
O
N
O
B
2000
1000
0
0 1 2 3 4 5 6
INASISTENCIAS
b) Identifique el mejor modelo matemático (lineal, cuadrático, exponencial, loga-
rítmico o potencial) que mejor se ajuste a los datos de la tabla. Argumente su
decisión.
El mejor modelo matemático sería el lineal ya que el ejercicio presenta dos variables en el eje
x y que son constantes pues sería mejor
mejor elección.
c) Realice una predicción para 6 i nasistencias.
Se estima a que en 6 inasistencias el bono
bono de reconocimiento será
será menor a 4000 según la
gráfica ya que se está ejerciendo una función indirectamente proporcional a mayores
asistencias menor bono de reconocimiento.
4. En la tabla
tabl a se presentan datos que corresponden a la cantidad de muertes a causa de
accidentes mensualmente en los Estados Unidos desde el año 1973 a 1978 (Fuente
National Sadety Council).
Media mensual
Meses del año
de muertes
Enero 8044,00
Febrero 7283,83
Marzo 8063,83
Abril 8264,83
Mayo 9126,17
Junio 9595,33
Julio 10452,80
Agosto 9749,17
Septiembre 8700,33
8|P á g i n a
Estadística Aplicada Producto Académico N° 03
Octubre 8984,67
Noviembre 8467,17
Diciembre 8720,67
Su correspondiente
correspondi ente gráfico es:
Gráfico de cantidad de muertes a causa de accidentes mensualmente en los Estados Unidos
desde el año 1973 a 1978 (Fuen te National Sadety Council).
Conteste:
a) ¿En qué mes del
d el año es menos frecuente
fre cuente las muertes? ............................
............................
Como se puede observar en el grafico el mes de febrero es donde hay menos
frecuencia de muertes con un total de 7283,83 media muertos
b) ¿En qué mes del año ocurren más muertes?
mu ertes? ..................................
.......................................
.....
En el mes de julio es donde ocurren más muertes con 1 0452,80
Media de muertos
c) ¿En qué meses del año ocurren picos? …………………………………………… …………………
Julio y octubre
d) ¿En qué meses del año ocurren valles? …………………………………………… ………….
Febrero, septiembre, noviembre
5. A partir de los datos de l a tabla anterior aplique el método de suavizamiento de la serie
del promedio móvil trimestral y realice los pronósticos a partir del mes de febrero
hasta noviembre. Grafique la tendencia de las muertes por accidentes y el
correspondiente suavizamiento trimestral.
MES DEL AÑO DEMANDA PROMEDIO PRONOSTICO Cuando Cuando
DE MOVIL CUANDO α = 0.1 α = 0.5 α = 0.9
MUERTES TRIMESTRAL
N=3
ENERO 8044.00
9|P á g i n a
Estadística Aplicada Producto Académico N° 03
FEBRERO 7283.83 8044 8044 8044
MARZO 8063.83 7968 7664 7360
ABRIL 8264.83 7797.22 7978 7864 7993
MAYO 9126.17 2361.49 8007 8065 8238
JUNIO 9595.33 8484.94 8119 8596 9037
JULIO 10452.80 8995.44 8267
82 67 9096 9539
AGOSTO 9749.17 9724.76 8486 9774 10361
SEPTIEMBRE 8700.33 9932.43 8612 9762 9810
OCTUBRE 8984.67 9634.1 8621 9231 8811
NOVIEMBRE 8467.17 9144.72
9144.7 2 8657 9108 8968
DICIEMBRE 8720.67 8717.39 8638 8788 8517
8724.17 8646 8755 8701
GRAFICA SUAVIZAMIENTO TRIMESTRAL
TRIMESTRAL
12000
10000 9932.43
9724.76 9634.1
8995.44 9144.72
8484.94 8717.39
8000 7797.22
6000
4000
2361.49
2000
10 | P á g i n a
Estadística Aplicada Producto Académico N° 03
GRAFICA DE PRONOSTICOS
PRONOSTICO
11000
10000
9000
8000
7000
6000
5000
DEMANDA X=0.1" X=0.5 X=0.9
11 | P á g i n a