ESTADÍSTICA
Grado en Relaciones Laborales y [Link].
Relación 2: Variables Bidimensionales
1. Consideremos la siguiente tabla de doble entrada:
HH
Y
HH 8 9 10 11 12
X HH
[0, 10] 10 2 0 2 1
(10, 20] 3 4 4 2 2
(20, 30] 5 3 4 3 5
a) Obtenga los valores de n22, n32 , f32 y f25.
b) Distribuciones marginales y represéntelas.
c) Mediana, moda y cuartiles de X.
d ) ¿Qué media es más representativa?
e) Coeficiente de variación de X condicionada a Y = 8.
f ) ¿Qué porcentaje de pares (X, Y ) tiene X inferior o igual a 20?
2. Consideremos la siguiente tabla de doble entrada:
H
HH Y
8 9 10 11 12
X H
HH
4 10 2 0 0 0
6 0 0 16 2 0
8 0 0 0 18 2
a) Covarianza, coeficiente de correlación e interpretación.
b) Rectas de regresión.
c) Complete los siguientes pares según el modelo: (10, ...), (..., 6).
3. Consideremos el siguiente conjunto de pares (X, Y ):
(1, 2) (4, 5) (7, 7) (10, 12) (13, 13)
a) Rectas de mı́nimos cuadrados de Y sobre X.
b) Represente la recta sobre la nube de puntos.
c) Obtenga e interprete el coeficiente de correlación lineal.
1
4. Los obreros de una empresa presentan la siguiente distribución con respecto a
la antigüedad en años en la empresa (X) y el número de productos defectuosos
elaborados por ellos (Y), durante el último año.
H
HH Y
[0, 10] (10, 20] (20, 30] (30, 40]
X H
HH
[0, 5] 5 20
(5, 10] 15
(10, 15] 7
(15, 20] 2
(20, 25] 1
a) Obtenga el coeficiente de correlación lineal y comente si serı́a adecuado un ajuste lineal
de los datos.
b) Calcule las rectas de regresión y estime el número de productos defectuosos que le corres-
ponderı́an a una persona con 8 años de antigüedad en la empresa.
c) Se quiere clasificar a los obreros en tres grupos: los menos efectivos, normales y más efecti-
vos (con respecto al número de piezas defectuosas), conteniendo respectivamente el 20 %,
el 60 % y el 20 % de la población. Obtenga los números de piezas defectuosas que serı́an
las fronteras que clasificarı́an a estos grupos.
5. Se quiere estudiar la posible relación lineal existente entre X=“Años de antigüedad
en un club e Y=“Grado de satisfacción de pertenecer al mismo”. Se tienen los
siguientes datos:
HH Y 2
HH
4 6 8
X HH
1 10 20
2 10 15
3 15 10
4 20
a) Analice la dependencia de las variables X e Y .
b) Obtenga las rectas de regresión.
c) ¿Qué antigüedad se espera que tenga una persona con un 5 de grado de satisfacción?
d ) Estudie la bondad del ajuste.
6. En una población se consideran las variables X=“Edad” e Y =“Puntuación obte-
nida en un test”.
H Y [9, 10]
HH
(10, 12] (12, 14]
X HHH
[10, 15] 6
(15, 20] 2 10
(20, 25] 1 7
(25, 30] 4
2
a) Halle el centro de gravedad de la nube de puntos.
b) ¿Cuál es la puntuación media de los individuos que tienen entre 20 y 25 años?
c) Calcule las rectas de regresión. ¿En qué punto se cortan?
d ) ¿Cuál deberı́a ser la puntuación de una persona con 32 años? ¿Qué edad podrı́a tener una
persona que ha obtenido un 11 en el test?
e) ¿Qué grado de fiabilidad presentarı́a dicha predicción?
7. Los siguientes datos corresponden a las horas de trabajo semanales (X) y el ı́ndice
medio de productividad por hora (Y) de una muestra de 6 trabajadores de una
determinada empresa.
X 20 25 30 35 40 45
Y 9 8 6 6 5 3
a) ¿Serı́a aceptable un ajuste lineal de los datos? ¿Por qué?
b) ¿Cuál serı́a el ı́ndice medio de productividad esperado para una persona que trabaje 28
horas semanales? ¿Cuál será el número de horas de trabajo para que el ı́ndice de produc-
tividad sea nulo?
8. Un hotel dispone de 5 tipos de habitaciones a diferentes precios (en euros). La
demanda media de dichas habitaciones en los últimos años ha sido:
Precio Habitación 105 87 72 51 42
Demanda Habitación 250 850 1300 1400 1100
a) Calcule y represente las rectas de regresión.
b) Para el siguiente año se piensa abrir habitaciones a un precio de 125 euros, ¿cuál será el
número esperado de clientes que demande estas habitaciones?
c) ¿Cuál serı́a el precio máximo a partir del cual ningún cliente solicitarı́a una habitación?
d ) Estudie la fiabilidad de las estimaciones.
9. En dos pruebas (X, Y ) realizadas a los directivos de una multinacional se obtuvieron
los siguientes resultados:
X = 4, Y = 6, Sx2 = 1,44, Sy2 = 2,25, Sxy = 1,62
a) Obtenga las rectas de regresión.
b) ¿Qué puntuación se espera de una persona en la primera prueba si en la segunda obtuvo
un 8?
c) Calcule y comente una medida para estudiar la fiabilidad de la estimación anterior.
10. El volumen de importaciones y producción, expresado en millones, de una empresa
durante los últimos seis años viene dado por la siguiente tabla:
Importaciones 22 33 45 50 65 67
Producción 105 120 125 130 140 154
3
a) Calcule Sxy .
b) Obtenga el coeficiente de correlación lineal e interprete el resultado.
c) Obtenga la recta de regresión de Y sobre X.
d ) Si el próximo año se piensa importar por valor de 70 millones de euros, ¿cuál será la
producción esperada?
11. En la siguiente tabla se presentan los 50 trabajadores de una empresa, clasificados
según X=“Edad” e Y=“Número de dı́as de baja por accidentes”:
HH Y
H
0 1 2 3
X HHH
[20, 30] 5
(30, 40] 2 3
(40, 50] 5 10
(50, 60] 25
a) Calcule la covarianza y el coeficiente de correlación lineal. Comente si serı́a adecuado un
ajuste lineal de los datos.
b) Obtenga las rectas de regresión y estime con qué edad se suelen presentar 4 dı́as de baja.
c) Debido a que existe mas accidentalidad en los trabajadores de mayor edad, se desea dar
un curso de seguridad en el trabajo. Para ello se selecciona al 30 % de los trabajadores
mayores. Calcule a partir de qué edad deben de ir al curso.
d ) Represente gráficamente la edad y el número de dı́as de baja utilizando frecuencias acu-
muladas.
12. Los siguientes datos corresponden al estudio X=“Población (millones)” e Y=“Tasa
de mortalidad infantil”.
X = 35,52, Y = 21,9, Sx2 = 5,61, Sy2 = 102,21, Sxy = −23,66
a) Calcule el coeficiente de correlación lineal e interprete el resultado.
b) Obtenga las rectas de regresión.
c) Predecir según el modelo, la tasa de mortalidad infantil de una población con 40 millones
de personas.
13. En un centro público se han obtenido los siguientes datos sobre la edad y el número
de dı́as de absentismo laboral de sus empleados:
H
HH Y
[0, 5] (5, 15] (15, 25] (25, 50]
X H
HH
[18, 25] 3 2 1
(25, 35] 3 2 2
(35, 45] 2 3 2
(45, 65] 3 3
4
a) Calcule la edad media de los empleados que se ausentan entre 15 y 25 dı́as.
b) Calcule el número mediano de dı́as de absentismo entre los empleados mayores de 35 años.
c) Calcule la recta de mı́nimos cuadrados de la edad sobre los dı́as de absentismo laboral.
d ) ¿Cuántos dı́as es posible que falte una persona de 61 años? ¿Qué grado de fiabilidad tiene
esa predicción?
e) Se desea gratificar al 10 % de los trabajadores que menos se ausentan. ¿Hasta que dı́as ha
podido faltar una persona para poder ser gratificado?
14. Un alumno conteste en un examen que las rectas de regresión ajustadas a una
determinada distribución son:
RX|Y ≡ x = 2y − 1
RY |X ≡ 3 − 3y = 3x
¿Por qué se sabe que cometió algún error?
15. En el ajuste lineal a una distribución se sabe que: X̄ = 2, Ȳ = 1 y r = 0 ¿Cuáles son
las rectas de regresión? Represéntelas.
16. Un alumno responde que el coeficiente de regresión de una distribución bidimen-
sional (X, Y) son b = −3 y b0 = 31 , y por tanto la correlación es perfecta e inversa, es
decir,r = −1. ¿Es correcto este razonamiento?
17. De una distribución bidimensional se conocen las rectas de regresión:
RX|Y ≡ 4x = y + 10
RY |X ≡ 4y = x + 5
a) ¿Es posible conocer el centro de gravedad de la distribución?
b) ¿Cuál es el coeficiente de correlación lineal?, ¿Es bueno el ajuste?
18. Se han estudiado las calificaciones de cien alumnos en dos asignaturas, Derecho
(X) y Economı́a (Y ), obteniéndose los siguientes datos:
X̄ = 110, Ȳ = 2,5, Sx = 10, Sy = 0,5, r = 0,85
a) ¿Cuánto valen Sx2 y Sy2 ?
b) ¿Qué nota se puede esperar en Economı́a de un alumno que ha obtenido 125 puntos en
Derecho?
c) ¿Se puede decir que aquellos alumnos que tienen mayor calificación en Derecho son los
mismos que tienen mayor calificación en Economı́a?
d ) ¿Cuál es la recta de regresión de X sobre Y ?