EJEMPLOS DE ESTADISTICA PARTE 2
1.- en el estudio de cierta comunidad se verifico lo siguiente:
I. la proporción de individuos solteros es de 0,4.
II. la proporción de individuos que reciben hasta 10 salarios mínimos es de 0,2.
III. la proporción de individuos que reciben hasta 20 salarios mínimos es de 0,7.
IV. la proporción de individuos casados entre los que reciben más de 20 salarios mínimos es de
0,7.
V. la proporción de individuos que reciben hasta 10 salarios mínimos entre los solteros es de
0,3.
a) construya la distribución conjunta de las variables estado civil y faja salarial, y las respectivas
distribuciones marginales.
b) ¿Ud. Diría que existe relación entre las dos variables consideradas.
2.- se hace un estudio para determinar la relación entre las edades de un gran grupo de
máquinas en una fábrica y las eficiencias de las mismas. Los datos se dan en la siguiente tabla:
Edad(X) 2 4 11 9 4 6 7 8
Eficiencia(Y) 90 65 25 40 80 60 35 50
a) Represente los datos en un diagrama de dispersión
b) Calcule el coeficiente de correlación entre X e Y.
c) Adjunte una recta a estos datos y represente la recta en una gráfica de la parte a).
d) ¿Cuál es la mejor estimación de la eficiencia de una máquina de 10 años?
3.- en la siguiente tabla se presentan los gastos de publicidad (como porcentajes de gastos
totales) y los beneficios de operación netos (como porcentaje de ventas) en una muestra de 10
pequeñas joyerías.
Gastos de 1,2 0,7 1,5 1,8 0,5 3,4 1,0 3,0 2,8 2,5
publicidad(X)
Beneficios(Y) 2,7 2,4 2,7 3,3 1,1 5,8 2,2 4,2 4,4 3,8
a) Represente los datos en un diagrama de dispersión.
b) Halle el coeficiente de correlación entre X e Y.
c) Halle la ecuación de recta que mejor se ajusta a estos datos y represente la recta en el
gráfico de la parte a)
d) Pronostique el beneficio neto de una tienda de joyería cuyos gastos de publicidad son X =
2,0%.
4.- las notas obtenidas por 10 alumnos en Estadística Aplicada I y Calculo I son:
Alumno 1 2 3 4 5 6 7 8 9 10
Estad. 11 09 13 10 8,5 12 10 15 10 09
Aplic. I
Calculo 11,5 9,5 12 10 9 13 12 15 11 10
I
a) Calcule la covarianza y el coeficiente de correlación.
b) Determine las rectas de regresión mínimo cuadrático.
c) ¿Cuál será la nota esperada en Calculo I de un alumno que haya obtenido 13,3 en
Estadística aplicada I?
5.- se extrae una muestra aleatoria de 200 habitantes de una ciudad para analizar la actitud
frente a un cierto proyecto de alcaldía. El resultado fue el siguiente:
opinión Local de residencia
urbano Sub-urbano rural Total
A favor 30 35 35 100
En contra 60 25 15 100
total 90 60 50 200
a) Calcule las proporciones en relación al total de las columnas.
b) ¿Ud. Diría que la opinión es independiente del local de residencia?
c) Encuentre una medida de dependencia entre las variables.
6.- una compañía de Seguros analizo la frecuencia con que 2,000 asegurados (1000 hombres
y 1000 mujeres) usaron el hospital. Los resultados fueron:
hombres Mujeres
Usaron el hospital 100 150
No usaron el 900 850
hospital
a) Calcule la proporción de hombres entre los individuos que usaron el hospital.
b) Calcule la proporción de hombres entre los individuos que no usaron el hospital.
c) ¿El uso del hospital es independiente del sexo del asegurado?
d) Encuentre una medida de dependencia entre las variables.
7.- considere las tasas de interés y el número de nuevas construcciones. Las tasas de interés
(X) proporcionan un indicador clave para predecir el número de construcciones (Y). si las tasas
bajan, el número de construcciones aumenta y si suben, el número de construcciones
disminuye. Suponga que los datos de la tabla representan las tasas de interés en primeras
hipotecas y el registro de nuevas construcciones iniciales en los 8 años referidos.
año 1969 1970 1971 1972 1973 1974 1975 1976
Tasa de 6,5 6,0 6,5 7,5 8,5 9,5 10 9
interés (%)
Licencias de 2165 2984 2780 1940 1750 1535 962 1310
construcción
a) Encuentre la recta de mínimos cuadrados para estimar el número de licencias de
construcción a partir de las tasas de interés.
b) Calcule el coeficiente de correlación para estos datos.
c) Si los indicadores económicos indican que la tasa de interés para primeras hipotecas será
el próximo año, pronostique el número de licencias de construcción que se otorgaran
durante el año entrante.
8.- suponga que la tabla de frecuencias relativas dada corresponde a una variable
bidimensional (X;Y)
Y 40 45 50 55 60 65
X
38 0.04 0.05 0.05 0.03 0 0.05
40 0.06 0.10 0 0.07 0.05 0.10
42 0.12 0.05 0.05 0.03 0.10 0.05
Al tener en cuenta que ha sido 200 los elementos extraídos de la población, se pide:
a) Número de elementos que obtuvieron en la Y una puntuación inferior a 52 y en la X
superior a 39.
b) Determinar las distribuciones marginales.
c) Determinar al distribución condicionada de X para Y=55.
d) Determinar la distribución condicionada de Y para X=42.
e) Determinar el centro de gravedad X ; Y .
9.- una investigación para verificar la tendencia de los alumnos en continuar sus estudios,
según la clase social del encuestado, mostro el siguiente cuadro:
¿pretende Clase social
continuar sus Alta media baja Total
estudios?
SI 200 220 380 800
NO 200 380 720 1300
a) ¿Ud. Diría que la distribución de las respuestas afirmativas es igual a la de las
respuestas negativas?
b) ¿Existe dependencia entre los dos factores? De una medida cuantificadora de
dependencia.
c) si de los 400 alumnos de la clase alta, 160 escogen continuar y 240 no, ¿Ud. Cambiaría
su conclusión? Justifique su respuesta
3
10.- sean dos variables X e Y de las que se conoce sx 15 , r
8
C.Vy 0,15 X 150; Y 200
Halle la varianza de X + Y.
11.- en una muestra de 5 obreros de una empresa fueron observadas dos variables: años de
experiencia en un cargo dado (X) y tiempo gastado en minutos en la ejecución de una cierta
obra relacionada con ese cargo. Las observaciones se dan en la siguiente tabla:
X 1 2 4 4 5
Y 7 8 3 2 2
a) ¿Usando un criterio estadístico, diría Ud. Que la variable X puede ser usada para
explicar la variación de Y?
b) ¿Ud. Puede justificar la respuesta dada en a).
12.- se ha medido el contenido de oxigeno Y en miligramos/litro del Lago Titicaca a una
profundidad de X metros, obteniéndose los siguientes datos:
X 15 20 30 40 50 60 70
Y 6,5 5,6 5,4 5,0 4,6 1,4 0,1
Se pide:
a) 0btener una recta de regresión de Y en X.
b) Hallar el coeficiente de correlación.
c) Para una profundidad comprendida entre 75 y 80 metros, ¿Qué contenido de
oxigeno se podría predecir?
13.- muchas veces, la determinación de la capacidad de producción instalada para cierto tipo
de industria en determinadas regiones es un proceso difícil y costoso. Como alternativa, se
puede estimar la capacidad de producción a través de la selección de una u otra variable de
medida más fácil y que este linealmente relacionada con ella.
Suponga que fueron observados los valores para las variables: capacidad de producción
instalada, potencia instalada y área construida. En base a un criterio estadístico, ¿Cuál de las
variables escogería Ud. Para estimar la capacidad de producción instalada?
Capacidad 4 5 4 5 8 9 10 11 12 12
de prod.
Instalada en
toneladas(X)
Potencia 1 1 2 3 3 5 5 6 6 6
instalada en
1000 kw (Y)
Área 6 7 10 10 11 9 12 10 11 14
construida
en 100m (Z)
14.- con el objeto de estudiar la relación entre las variables consumo de energía eléctrica (X)
y volumen de producción en las empresas industriales (Y), se tomó una muestra de 40
empresas, para las cuales se calcularon los siguientes valores:
x 21,34; y 30, 72; x
i i
2
i 22,16
y 94,96; x y 32,13
2
i i i
a) Determine las rectas de regresión Y en X y de X en Y.
b) Determine el coeficiente de correlación rectilíneo.
15.- dada la siguiente distribución bidimensional:
Y [5;15> [15;25> [25;35> [35;45>
X
1 1 2 3 0
2 1 1 1 1
a) Halle las distribuciones marginales.
b) Halle la media, mediana y moda y varianza marginales.
c) ¿Qué medida es más representativa?
d) ¿Qué porcentaje de pares (X;Y) tienen Y inferior a 35?
16.- la obtención de ciertas aleaciones metálicas a altas temperaturas se suelen basar en las
curvas de tensión de ruptura. En muchos casos, la deformación comprendida es inaceptable
y para asegurar una duración de cierto número de horas, es necesario mantener la tensión
aplicada por debajo del valor que produciría ruptura en el mismo número de horas. Un
experimento con dicha aleación fue llevado a cabo a 700°C y los datos que se presentan en
la siguiente tabla se obtuvieron relacionando la tensión aplicada con el tiempo de ruptura.
Tensión f (MN/m2 ) Tiempo de ruptura T (h)
80 22
70 57
60 205
50 1324
a) Estime las constantes en la relación T a bf
b) Calcule el tiempo de ruptura por una estimación de punto que corresponda a una
tensión f 65MN / m2
17.- se ha tomado un grupo de matrimonios (con hijos) y se les ha preguntado a que edad
tuvieron su primer hijo. La información se da en la siguiente tabla (X= edad del marido, Y=
edad de la mujer).
Y [15;17> [17;19> [19;21> [21;23> [23;27>
X
[16;18> 5 2
[18;20> 3 9 1
[20;25> 4 6 10
[25;28> 5 7
[28;32> 3 4
a) ¿Cuántos matrimonios fueron encuestados?
b) Halle las distribuciones marginales.
c) Determine la distribución condicionada de X dado Y=22
d) Encuentre la recta de regresión de X sobre Y.
e) Halle la recta de regresión de Y sobre X.
18.- se lanza simultáneamente una moneda de un sol y una moneda de un dólar. En cada
lanzamiento se anotó el resultado obtenido, cuyos datos están en la tabla adjunta.
Sol cara sello Total
dólar($)
Cara 24 22 46
Sello 28 26 54
total 52 48 100
a) ¿estos datos sugieren que los resultados de la moneda de un sol y los de la
moneda de un dólar están asociados?
b) En la parte a) asigne para ocurrencia de cara el valor de 0 y para sello el valor 1.
Al denotar por X 1 el resultado del sol y por X 2 el resultado del dólar, calcule la
correlación entre X 1 y X 2 .¿esta medida está de acuerdo con la respuesta que
Ud. Dio anteriormente?.
19.- al estudiar la distribución de un par de variables (X;Y) se encontraron los siguientes datos:
(-3;7), (-2;3), (-1;-55), (-4;11), (-5;15).
a) halle las rectas de regresión, representarlas y halle el centro de gravedad ( X ; Y )
b) ¿podemos afirmar que al aumentar X esperamos que disminuya Y?. Razone su
respuesta y complete con los valores que esperamos la ordenada y la abscisa de los puntos
(7; ) y ( ; -5)
c) halle la distribución condicionada de la variable X dado Y =11 y calcule su media y su
desviación típica.
20.- se ha observado que para predecir la demanda (consumo) de combustibles para
calefacción, resulta ser más preciso el pronóstico a largo plazo de la temperatura y el uso de
la relación temperatura-consumo que al tratar de pronosticar directamente demanda
analizando las ventas de combustibles. Un distribuidor de combustibles mantiene un registro
de ventas mensuales de combustible y de temperaturas máximas en esos meses. A
continuación, aparecen los datos de nueve de estos meses seleccionados al azar.
Vol. De 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19.0 10.1
ventas(Y)
Promedio 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52.0 59.8
de temp.
Máximas
(X) °F
a) ¿presentan los datos suficiente evidencia de que las ventas de combustible están
relacionadas linealmente con la temperatura?
b) Encuentre la recta de mínimos cuadrados para estos datos.
21.- una fase de un estudio sociológico y económico a gran escala está dedicada a la relación
entre el nivel de instrucción y la renta. Como parte de este trabajo, un investigador recopila
datos sobre la renta media (en miles de soles) para una muestra aleatoria de ocho ciudades
y el porcentaje de familias en las ciudades que poseen al menos un automóvil.
Ingreso medio 7 4.4 5.4 4.9 7.6 4.2 3.8 6.2
(X)
% de 58 49 53 51 70 53 48 60
propietarios(Y)
a) Represente los datos en un diagrama de dispersión.
b) Ajuste una recta de mínimos cuadrados a estos datos y represente en el gráfico de la
parte a).
c) Estime el porcentaje de familias que poseen al menos un automóvil en una ciudad en
la que la renta media es s/. 6,000.
22.- la MAXTE, es una firma que vende por correo y mantiene una amplia gama de objetos de
arte bastante costosos para hogares y oficinas. Opera anunciando un artículo, ya sea en
revistas seleccionadas o bien en un programa de correo directo. Supóngase que la respuesta
de las ventas varía mucho por artículo y que la administración de la firma no ha podido predecir
anticipadamente que artículos se venderán bien y cuáles no. En consecuencia, la firma
experimenta con frecuencia ya sea agotamiento de artículos, o bien inventarios excesivos de
otros. Para muchos de los productos que vende MAXTE, es posible pedir una cantidad limitada
para el inventario y colocar un pedido subsiguiente para entrega en plazo de dos semanas. Así
pues, si la firma pudiera predecir oportunamente las ventas definitivas de un producto, se
reduciría en gran medida sus problemas de inventario. Como se necesitan aproximadamente
seis semanas para recibir el 90% de una campaña dada, sería útil una predicción precisa de las
ventas totales hechas hasta el final de la primera semana de recibir pedidos. Las ventas de la
primera semana y las ventas totales de las últimas 12 campañas de la firma se indican en la
tabla siguiente:
Ventas 32 20 114 66 18 125 83 65 94 5 39 50
de la
1era.
Semana
Ventas 167 91 560 335 70 650 401 320 470 15 210 265
totales
a) Trace un diagrama de dispersión.
b) Obtenga el coeficiente de correlación muestral.
c) Halle la recta mínimos cuadrados de las ventas totales respecto de las ventas de la
primera semana.
d) Basándose en lo encontrado en las partes a) hasta c), ¿Qué puede pensarse de la
utilización de las ventas de la primera semana para predecir ventas totales?