0% encontró este documento útil (0 votos)
11 vistas9 páginas

Soluciones 2.2

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
11 vistas9 páginas

Soluciones 2.2

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

EJERCICIOS TEMA 1 (hoja2)

1. Para rellenar una tabla de frecuencias incompleta. Relaciones entre las


columnas.
Utilizando la siguiente tabla de frecuencias, responder a las preguntas.

a) Completa solo la línea marcada con interrogantes (?)

N3 = 38 – 15 =23
n3 = 23 – 15 = 8
Para calcular las frecuencias relativas debo conocer el valor de n, que lo puedo obtener
relacionando ni y fi de cualquier fila, por ejemplo la segunda:

8 8
0,01 = →n= = 800
n 0,01

Así F3 = 23/800 = 0,02875


f3 = 8/800 = 0,01

b) ¿Que porcentaje de los datos son menores o iguales a 15?


11,75%

c) ¿Qué porcentaje de los datos son superiores o iguales a 88?


1-0,80375 = 0,19625 Æ 19,6%

d) ¿Qué porcentaje de los datos están entre 15 y 62, ambos incluidos?


0,80375 – 0,075 = 0,72875 Æ 72,9%
e) ¿Cuál es el tamaño de la muestra?
n=800

Nota: los puntos suspensivos son datos que no hay que completar.
2. Para comparar histogramas, medias, variabilidad de datos que podemos
relacionar.
El director de una compañía desea estudiar si la experiencia se traduce en una mayor
rapidez al hacer una tarea. Para ello, lleva a cabo un experimento con 25 empleados, a
los cuales les solicita que realicen una tarea 10 veces. A los mismos 25 empleados les
hace la misma solicitud, pero con 20 repeticiones. Y de nuevo, con 50 repeticiones. La
tabla siguiente muestra el tiempo medio (en minutos) necesitado por los empleados para
realizar la tarea en cada caso.

Tiempo (10 repeticiones) Tiempo (20 repeticiones) Tiempo (50 repeticiones)


15 19 16 11 10 8
21 20 10 10 5 10
30 22 12 13 7 8
17 20 9 12 9 7
18 19 7 8 8 8
22 18 11 20 11 6
33 17 8 7 12 8
41 16 9 6 9 6
10 20 5 9 7 4
14 22 15 10 6 15
18 19 10 10 8 7
25 24 11 11 14 20
23 9 9

SOLUCIÓN
a) Representa gráficamente los tres histogramas, uno para cada subconjunto de
datos.

Histogram for repeticiones10


12
10
frequency

8
6
4
2
0
0 10 20 30 40 50
repeticiones10

Histogram for repeticiones 20


15

12
frequency

0
0 10 20 30 40 50
repeticiones 20

Histogram for repeticiones30


18
15
frequency

12
9
6
3
0
0 5 10 15 20 25 30 35 40 45 50
repeticiones30
Aunque no nos lo piden podemos ver los diagramas de cajas y comentarlos:

Box-and-Whisker Plot

epeticiones10

epeticiones 20

epeticiones30

0 10 20 30 40 50
response
b) Compara los histogramas del apartado (a). ¿Opinas que existe una relación entre
el número de veces que se repite la tarea y el tiempo medio necesario para
realizarla? Justifica tu respuesta.
Summary Statistics

repeticiones10 repeticiones 20 repeticiones30


---------------------------------------------------------------------------------------
Count 25 25 25
Average 20,92 10,36 8,88
Median 20,0 10,0 8,0
Mode 10,0 8,0
Variance 40,0767 10,4067 11,9433
Standard deviation 6,33061 3,22594 3,45591
Minimum 10,0 5,0 4,0
Maximum 41,0 20,0 20,0
Range 31,0 15,0 16,0
Lower quartile 18,0 9,0 7,0
Upper quartile 22,0 11,0 10,0
Interquartile range 4,0 2,0 3,0
Coeff. of variation 30,2611% 31,1384% 38,9179%
---------------------------------------------------------------------------------------

Es evidente que la media ha disminuido cuando aumenta el numero de


repeticiones, pero fijémonos que si medimos la variabilidad o dispersión por el
valor de la desviación típica o varianza, éstas aumentan en el experimento de 30
repeticiones con respecto al de 20, aunque ambas son menores que en el de 10.
Recordemos que no debemos comparar con estas medidas!!!

c) Calcula y compara los coeficientes de variación, CV, para los tres conjuntos.
¿Cuáles son las unidades de los CV?

La mayor variabilidad se da en el tercer caso (ver última fila del cuadro anterior)
porque tenemos en cuenta la relación entre las medias y las desviaciones típicas.
Se mide en %
[Link] construir una tabla de frecuencias conjunta de dos variables discretas y
estudiar su información. Frecuencias marginales y condicionadas.
Se han recogido los siguientes datos en una empresa, que representan el número de
trabajadores en un departamento (x) y el volumen de unidades producidas en miles (y)

Num.
5 8 7 3 2 4 5 5 6 7
trabajadores
Miles de
unidades 2 3 4 2 1 2 3 2 4 5
producidas

a) Construye la tabla de frecuencias conjunta con las frecuencias marginales.


Frequency Table for num trabajadores by Unid Producidas

Row
1 2 3 4 5 Total
------------------------------------------------------------------
2 | 1 | 0 | 0 | 0 | 0 | 1
| 10,00% | 0,00% | 0,00% | 0,00% | 0,00% | 10,00%
------------------------------------------------------------------
3 | 0 | 1 | 0 | 0 | 0 | 1
| 0,00% | 10,00% | 0,00% | 0,00% | 0,00% | 10,00%
------------------------------------------------------------------
4 | 0 | 1 | 0 | 0 | 0 | 1
| 0,00% | 10,00% | 0,00% | 0,00% | 0,00% | 10,00%
------------------------------------------------------------------
5 | 0 | 2 | 1 | 0 | 0 | 3
| 0,00% | 20,00% | 10,00% | 0,00% | 0,00% | 30,00%
------------------------------------------------------------------
6 | 0 | 0 | 0 | 1 | 0 | 1
| 0,00% | 0,00% | 0,00% | 10,00% | 0,00% | 10,00%
------------------------------------------------------------------
7 | 0 | 0 | 0 | 1 | 1 | 2
| 0,00% | 0,00% | 0,00% | 10,00% | 10,00% | 20,00%
------------------------------------------------------------------
8 | 0 | 0 | 1 | 0 | 0 | 1
| 0,00% | 0,00% | 10,00% | 0,00% | 0,00% | 10,00%
------------------------------------------------------------------
Column 1 4 2 2 1 10
Total 10,00% 40,00% 20,00% 20,00% 10,00% 100,00%

Cell contents:
Observed frequency
Percentage of table

b) ¿Qué porcentaje de departamentos tiene menos de 5 trabajadores? 30%

c) ¿Cuál es el número medio de trabajadores de los departamentos analizados?


Summary Statistics

num trabajadores Unid Producidas


------------------------------------------------------------
Count 10 10
Average 5,2 2,8
Median 5,0 2,5
Variance 3,51111 1,51111
Standard deviation 1,8738 1,22927
------------------------------------------------------------

d) ¿Cuántos departamentos venden más de 3000 unidades? 2+1=3 departamentos

e) ¿Qué porcentaje de departamentos vende más de 3000 unidades y tiene más de 5


trabajadores? 3 departamentos
f) Realiza el diagrama de dispersión de estas variables (nube de puntos) e
interprétalo.

Plot of Unid Producidas vs num trabajadores


5

Unid Producidas
4

0
2 3 4 5 6 7 8
num trabajadores

Parece que el diagrama de puntos nos permiten “intuir” que sí existe una cierta
correlación lineal.

g) Justifica con el estadístico adecuado si existe una relación lineal entre el número
de trabajadores y el número de unidades producidas.

Para medir la intuición anterior tenemos el coeficiente de correlación lineal:


Correlations

num trabajadores Unid Producidas


-------------------------------------------------------------------
num trabajadores 0,7911
( 10)
0,0064

Unid Producidas 0,7911


( 10)
0,0064

podemos ver que hay cierta correlación lineal positiva aunque no demasiado fuerte.

4. Analizar una tabla de frecuencias conjunta de una variables discreta y otra


continua ya elaborada. Estudiar su información. Frecuencias marginales y
condicionadas.

De los empleados de cierta empresa se dispone de información sobre sus salarios


anuales (en miles de euros) y el número de vehículos a motor adquiridos en los
últimos 5 años:

Para responder a las cuestiones, debemos realizar la tabla conjunta, con las
frecuencias marginales, absolutas y relativas.
Vehículos 0 1 2 3 ni· f i·
Salarios
[18,27) 22,5 2 3 1 0 6 0,6
[27,45] 36 0 0 2 2 4 0,4
n·j 2 3 3 2 10
f·j 0,2 0,3 0,3 0,2 1

a) Calcular el porcentaje de empleados que cobran menos de 27000 euros y tienen


más de un vehículo.

Vehículos 0 1 2 3 ni· f i·
Salarios
[18,27) 22,5 2 3 1 0 6 0,6
[27,45] 36 0 0 2 2 4 0,4
n·j 2 3 3 2 10
f·j 0,2 0,3 0,3 0,2

Se puede ver que las condiciones que nos piden corresponden a las celdas
1+ 0 1
sombreadas, por tanto: = = 0,10 → 10%
n 10

b) De los empleados que cobran más de 27000 euros, calcula el porcentaje de los
que compraron 2 o más vehículos.

Vehículos 0 1 2 3 ni· f i·
Salarios
[18,27) 22,5 2 3 1 0 6 0,6
[27,45] 36 0 0 2 2 4 0,4
n·j 2 3 3 2 10
f·j 0,2 0,3 0,3 0,2

Veamos que las celdas sombreadas cumplen las condiciones, pero el total no son
todos los empleados, sólo los que cobran más de 27000€, es decir,
2+ 2 4
4 empleados, por tanto = = 1 → 100%
n2· 4

c) Calcular el número de vehículos que por término medio compró cada empleado
y su varianza.

Para calcular la media aritmética de los vehículos:

y=

y j ⋅ n j 0·2 + 1·3 + 2·3 + 3·2 15
= = = 1,5
n 10 10

Para calcular su varianza, utilizaremos la quasivarianza

s 2
=
∑ y 2j ⋅ n j − ny 2
=
0 2 ·2 + 12 ·3 + 2 2 ·3 + 32 ·2 − 10·1,5 2 33 − 10·2,25 10,5
= = = 1,167
n −1 9 9 9

NOTA: Practicad con vuestras calculadoras cómo hallar la media y la quasivarianza


o quasidesviación típica.
d) ¿Cuál es el salario medio que cobran los empleados de la empresa? Si la
empresa da una ayuda para la adquisición de los vehículos de 100 euros a todos
sus empleados (adquieran o no vehículo) mas 300 por cada vehículo adquirido,
calcula la ayuda media por empleado.

Para calcular la media aritmética de los salarios:

x=
∑ xi ⋅ ni = 22,5·6 + 36·4 = 279 = 27,9 Æ27900€
n 10 10

La expresión algebraica de la ayuda (Z) en función del número de vehículos


adquiridos (Y) será: Z = 100 + 300·Y y basándonos en las propiedades de la media
podemos obtener:
Z = 100 + 300·Y = 100 + 300·1,5 = 550

5. Calcular coeficiente de correlación, recta de regresión, predicciones y


fiabilidad del ajuste.

Con los siguientes datos del cambio del euro (EUR) en dólares americanos (USD) y
en yens japoneses (JPY) dia a dia, que figuran en la siguiente tabla:

(fijémonos que no hay datos los fines de semana, y por eso, hay un salto en el
número del día)
a. ¿Qué tasa de cambio ha tenido mayor estabilidad durante los días de la
muestra USD o JPY?
Calcularemos los coeficientes de variación de ambas variables (con las calculadoras)

X=USD Y=JPY

x=
∑ xi = 10,2339 = 1,4620 y=
∑ y j = 1111,88 = 158,84
n 7 n 7

2
S X n−1 =
∑ xi2 − nx 2 14,9630 − 7·1,4620 2
= = 2
S Y n−1 =
∑ y 2j − ny 2 176634,901 − 7·158,84 2
= =
n −1 6 n −1 6
= 0,00019653 =3,9803

S = 0,00019653 = 0,0140 S = 03,9803 = 1,99507


X n −1 Y n −1

1,99507
CVUSD =
0,0140
= 0.0096 CVJPY == = 0,0125
1,4620 158,84

por tanto el cambio con mayor estabilidad es el USD, con menor CV .


b. Haz una predicción con base estadística del cambio del dólar (USD) para el
dia 5 de septiembre y otra para el dia 13 de septiembre. Considera qué valores
de la variable “Dia” corresponden a los datos que nos piden para hacer las
predicciones.

Primeramente calcularemos la recta de regresión: donde la variable X será el día


y la variable Y será el cambio USD. Para ello, podemos hallar los estadísticos
correspondientes de X y de Y.

X=DIA x = 5,1429 S x 2 = 9,8095 S x = 3,1320


Y=Cambio USD y = 1,46 20 SY = 0,0002
2
SY = 0,014

S XY =
∑ xi y j − n·x· y = 52,3772 − 7·5,1429·1,4620 = −0,0425
n −1 6

Para calcular la recta Y= a +b X

S XY − 0,0425
b= = = −0,0043
S X2 9,8095
a = y − bx = 1,46 − (−0,0043)·5,14 = 1,4 8

La recta será Y= 1,48 – 0,0043 · X

Para hacer las predicciones, consideraremos que corresponden a los valores


x=10 y x=17=

Si x=10 Æ Y(10)=1,48 – 0,0043 · 10 = 1,437

Si x=17 Æ Y(17)=1,48 – 0,0043 · 17 = 1,4069

e) Valora la calidad de cada una de las predicciones del apartado anterior.


Para calcular la bondad del ajuste en una regresión lineal, podemos
calcularla a partir del coeficiente de correlación:

s xy − 0,0425
rXY = = = −0,9693 nos indica una fuerte correlación lineal
s x ·s y 3,1320·0,014
negativa.

R 2 = (rXY ) 2 = (−0,9693) 2 =0,94 Æ fiabilidad del 94% en las predicciones

aunque debemos tener en cuenta que la predicción para X=17 debemos


considerar que no tiene esta fiabilidad calculada por tratarse de un valor
demasiado alejado del rango de los valores reales en los que hemos basado el
cálculo de la recta de regresión.
6. Calcular una recta de regresión.
Calcula el apartado e) del problema 4 de la hoja 1 de problemas del Tema 1.

Si desconocemos las tarifas del parking, encuentra la mejor aproximación de tarifa


de la forma PREU = PREU 0 + PREUMINUT* TEMPS (donde PREU 0 y
PREUMINUT son números concretos) a partir de la tabla anterior), usando alguna
técnica estadística reconocida. Averigua el precio de la primera hora de estancia y
justifica adecuadamente la confianza de tu averiguación.

Nos piden que calculemos la recta de regresión que nos permita saber el precio del
estacionamiento en el parking, en función del tiempo de la estancia, medido e3n
minutos.

Para calcular los coeficientes de la recta de regresión, consideraremos:

X= Temps
Y= Preu

S XY 28,36
b= 2
= = 0,0337
SX 28,992
a = y − bx = 4,124 − 0,0337·73,78 = 1,6376

La recta será: Y=1,6376+0,0337·X

Para calcular la fiabilidad del resultado, calcularemos

s xy 28,36
rXY = = = 0,8682 nos indica una fuerte correlación lineal
s x ·s y 28,99·1,1268
positiva.

R 2 = ( rXY ) 2 = (0,8682) 2 =0,75 Æ 75% de fiabilidad que es alta pero no


demasiado.

Para calcular el precio de un estacionamiento de una hora, sustituiremos x=60


minutos en la recta anterior:

Precio= 1,6376+0,0337·60=3,64€

También podría gustarte