UNIVERSIDAD NACIONAL DE
TRUJILLO
“Año del Fortalecimiento de la Soberanía Nacional”
REGRESIÓN T-SOCIAL
ESTADISTICA SOCIAL
INTEGRANTES
Gamarra Acuña, Erika
Cazorla Huamán Rosa
Huacha Trujillo, Ruth Noemí
Tanta Romero, Mayshorie Briggith
Tejada Marcelo, Samantha Lissie
DOCENTE:
Tapia Danter, Carlos
CARRERA:
Trabajo Social
CICLO:
I ciclo
AÑO:
2022
REGRESIÓN T-SOCIAL
1. Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersión de puntos. ¿Qué tipo de relación
funcional, cree usted, se podría ajustar mejor a los datos?, ¿Por qué?
2. Se realiza un estudio para determinar el efecto de la reducción de las horas de
sueño sobre la habilidad para resolver problemas sencillos. La reducción de las
horas de sueño es de 8, 12, 16, 20 y 24 horas sin dormir. En el estudio participaron
un total de 10 individuos, con dos en cada nivel de reducción. Después de su
período específico de reducción de horas de sueño, cada individuo fue sometido a
un conjunto de problemas simples de suma, observándose el número de errores.
Los resultados fueron:
a) Gráfica el diagrama de dispersión de puntos.
b) Encuentra la recta de mínimos cuadrados apropiada para estos datos.
c) En el diagrama de dispersión de puntos, gráfica la recta de mínimos
cuadrados.
-La recta mínima de cuadros es la recta 3.
3. Los gastos semanales de publicidad y las ventas semanales de una empresa, en
dólares, para una muestra de diez semanas son:
a) Establece la recta de regresión de mínimos cuadrados que permita predecir las ventas
semanales en función de los gastos en publicidad.
b) Representa gráficamente los puntos y la recta de mínimos cuadrados. Comenta.
c) Interpreta la pendiente de la recta de regresión.
-Como se aprecia en la gráfica, tenemos una pendiente positiva. A partir de
ello podemos decir que la relación de las ventas con el gasto semanal es
directamente proporcional.
d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60 dólares.
e) ¿Cuáles son los errores de estimación cuando se predice las ventas semanales para
gastos semanales de publicidad de 61, 62 y 63 dólares respectivamente?
4.- Las calificaciones en un examen de estadística y el número de horas de estudio para el
examen, de una muestra de doce estudiantes de una sección, se presentan en el siguiente
cuadro.
a) Halla la recta de regresión de mínimos cuadrados considerando la calificación en el
examen como variable dependiente.
b) Interpreta la pendiente de la recta de regresión.
-La pendiente de la gráfica es positiva, a partir de ello podemos decir que la relación del
tiempo de estudio con la nota es directamente proporcional.
c) Calcula el error estándar de estimación. ¿Para qué se utiliza esta medida?
5.- En una empresa se tiene interés en pronosticar el tiempo, en minutos, que toma atender
a un cliente en caja (Y) y se decide utilizar como variable independiente el monto de las
compras en dólares (X). Se tomó una muestra de 18 clientes y se obtuvieron los siguientes
resultados: Sx = 861, Sx2 = 60323, Sxy = 5177.3, Sy = 75.4, Sy2 = 455.86.
[Link] la recta de regresión.
b. Utiliza el gráfico de la recta de regresión para realizar dos predicciones de la variable
dependiente.
6.- Para los puntajes de ansiedad (X) y de aptitud académica (Y) de diez postulantes a un
trabajo se han obtenido los siguientes resultados: å x = 847, å x2 = 71927, å y = 446, å
y2 = 20058, å xy = 37615.
a) Halla la recta de regresión de mínimos cuadrados que se ajusta a estos datos. Interpreta
la pendiente.
b) Interpreta la pendiente de la recta de regresión.
La pendiente es positiva, por lo tanto la relación existente entre las
variables es directamente proporcional.
c) Gráfica la recta de regresión.
7.- Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada venta se han
observado el precio de venta (X) y la cantidad vendida (Y) y se han obtenido los siguientes
resultados: S x = 77.9, S y = 749, SCx = 75.53, SCy = 7114.44 y SCxy = - 489.89.
a) Halla la recta de regresión de mínimos cuadrados.
b) Interpreta la pendiente.
-A medida que se aumenta el precio de venta, la cantidad vendida disminuye, es decir
tienen una relación inversamente proporcional.
c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.
d) Calcula el coeficiente de determinación.
8. Según investigaciones, el porcentaje de desembolso por empresas manufactureras
estadounidenses en plantas y equipo que fue destinado al control de polución
durante el periodo 1975–1987 fue como sigue:
1975 1980 1981 1984 1987
9.3 4.8 4.3 3.3 4.3
Responde:
a) Obtenga un modelo de regresión lineal, donde X: tiempo en años desde 1975.
b) Grafique la ecuación de la Recta.
c) Use el modelo calculado en (a) para estimar el porcentaje en 1985.
8.1) La siguiente tabla muestra el beneficio neto, en millones de dólares, de la
empresa Disney durante los años 1984-1992.
Beneficios estimados al $5 millón más [Link]: Informes de compañía/The New
York Times, Dic. 1992.
Responde:
a) Estime la ecuación de la recta de mejor ajuste para estos datos.
b) Interprete el coeficiente β1.
c) Use el modelo calculado para hacer una estimación.
9) La siguiente tabla muestra la producción de soja, en millones de toneladas, en la
región Cerrados de Brasil, como función del área cultivada en millones de hectáreas.
Área 10,1 12,1 12,9 16,2 21,0
(Millones de hectáreas)
Producción 15 25 30 40 60
(Millones de toneladas)
a) Obtenga la ecuación de la recta de regresión lineal.
b) Interprete el coeficiente β1.
c) Use el modelo calculado para hacer una estimación.
10. Para una muestra de 20 operadores de máquinas se tienen registrados, la nota del
examen de ingreso (X) y la evaluación de eficiencia laboral (Y). A partir de estos
datos se han obtenido los siguientes coeficientes para la recta de regresión de
mínimos cuadrados: b0 = 28.64 y b1 = 1.01.
Responde:
a) Escribe la recta de regresión e interpretar b1 .
b) Estima el puntaje promedio de evaluación de eficiencia laboral para
los operadores que obtuvieron 75 puntos en el examen de ingreso.
c) Gráfica la recta de regresión.
11. La siguiente información corresponde a las calificaciones obtenidas por 10
estudiantes en un examen de Estadística y su calificación final promedio.
a) Gráfica el diagrama de dispersión. Comentar
b) Halla la recta de regresión de mínimos cuadrados. Interpretar la pendiente.
c) Calcula el coeficiente de correlación lineal. Interpreta.
12. En un estudio con 15 observaciones mensuales, un analista financiero quiere
determinar la relación de la tasa porcentual de rendimiento (Y) de las acciones de una
empresa sobre la tasa porcentual de rendimiento (X) de un índice bursátil. Dispone de
la siguiente información:
S x = 33.8, S y = 33.5, S xy = 79.22, S x2 = 80.34, S y2 = 79.45
a) Estima la regresión lineal de Y sobre X. Realiza una predicción.
b) Calcula el coeficiente de correlación lineal. Interpreta.
c) Calcula el coeficiente de determinación. Interpreta.
13. Un vendedor de bienes desea establecer la relación entre el número de semanas
que las casas están en el mercado antes de venderse y el precio que por ellas se
pide. La información es la siguiente:
a) Gráfica la dispersión de puntos. Halla la ecuación de regresión de Y sobre X.
Interpreta la pendiente.
b) Calcula e interpreta el coeficiente de determinación.
c) Calcula el error estándar de estimación.
14. La siguiente tabla y gráfica muestran el consumo mensual de energía en función
del área del domicilio:
a) Establezca la recta de regresión de mínimos cuadrados que permita predecir el
consumo de energía en función del área del domicilio.
b) Represente gráficamente los puntos y la recta de mínimos cuadrados. Comenta
al respecto.
c) Interprete la pendiente de la recta de regresión.
d) Calcule e interprete el Coeficiente de Correlación R.
e) Calcule e interprete el Coeficiente de Determinación R2.
15. En el servicio central de turismo del país se ha observado que el número de
plazas hoteleras ocupadas es diferente según sea el precio de la habitación. Sobre el
total de plazas ocupadas en un año se tiene:
a) Representa gráficamente para comprobar que existe cierta dependencia
lineal entre las variables.
b) Halle la ecuación de la recta de regresión del precio sobre el número de
habitaciones.
c) ¿Cuántas habitaciones se llenarían a US$1500?
16. El volumen de ahorro y la renta del sector familias en billones de pesos, para el
período 77-86 fueron:
a) Encuentre la recta de regresión considerando el ahorro como variable
independiente.
b) Encuentre la recta de regresión considerando la renta como variable
independiente.
c) Para el año 87 que supone una renta de 24.1 billones de pesos. ¿Cuál será
el ahorro esperado para el año 87?
17. La tabla presenta datos ficticios para un estudio de adolescentes en riesgo de
desarrollar obesidad.
a) Trace un diagrama de dispersión del peso regresionado a partir del número de
comidas rápidas consumidas en la última semana.
b) Calcule el coeficiente de correlación R de Pearson para estas dos variables, así
como la ecuación de regresión
18. La tabla siguiente contiene la edad (X) y la máxima de la presión sanguínea (Y) de
un grupo de 10 mujeres:
a) Determine la recta de regresión de Y sobre X, justificando la adecuación
de un modelo lineal.
b) Interprete la pendiente.
● La función presenta una pendiente de correlación positiva fuerte.
c) Mida la bondad del modelo.
● Presenta una bondad lineal.
d) Realice las siguientes predicciones, sólo si tienen sentido:
● Presión sanguínea de una mujer de 51 años.
● Presión sanguínea de una niña de 10 años.
● Presión sanguínea de un hombre de 54 años.
19. El crecimiento de los niños desde la infancia a la adolescencia generalmente
sigue un patrón lineal. Se calculó una recta de regresión mediante el método de
mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9 años y el
resultado fue: β0 = 80 y β1 = 6. La variable dependiente Y es la altura (en cm.) y X es la
edad (en años).
a). Interprete los valores estimados del intercepto y de la pendiente.
● Presenta una pendiente creciente con coordenadas (-13.7,0) en su intercepto.
b). Cuál será la altura predicha de una niña de 8 años.
c). Cuál será la altura predicha de una mujer de 25 años. Comente el resultado.
- El resultado equivale en cm, por lo tanto 230 cm es igual a 2 metros con
30 centímetros.
20. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista
Field Crops Research, los datos usados en la investigación son:
● Con
X = la duración de la cosecha de porotos de soya en día
Y = rendimiento de la cosecha en toneladas por hectárea.
a) Estime la recta de regresión mediante el método de mínimos cuadrados.
Interprete los estimadores en el contexto de la pregunt
b) ¿Existe una relación lineal significativa entre la duración y el rendimiento de
la cosecha?
c) Estime el rendimiento si la duración de la cosecha fue de 104 días
.
21. Un investigador cree que la inteligencia de los niños, medida a través del
coeficiente intelectual (CI en puntos), depende del número de hermanos. Toma una
muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados
aparecen en la tabla adjunta.
- Encuentre e interprete el coeficiente de correlación r.
- Dé la ecuación de la recta de regresión. Interprete los estimadores en el
contexto de la pregunta.
- Verifique los supuestos de regresión.
- ¿Existe una relación lineal significativa entre el número de hermanos y el
coeficiente intelectual?
22. Se desea saber si existe alguna relación entre la ingestión y la absorción de
grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y
absorción cuyos resultados se muestran en la tabla que sigue:
INGESTION Y ABSORCION DE GRASAS EN 20 LACTANTES DESNUTRIDOS.
- Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes
de regresión.
- Encuentre e interprete el coeficiente de correlación r.
- ¿Existe una relación lineal significativa entre la ingestión y la absorción de grasas?
- Verifique los supuestos
- ¿Cuánto vale la suma de los residuos calculados para las 20 determinaciones? -
Conteste SÍ o NO a las siguientes preguntas:
- El gráfico de residuos muestra que la relación entre la ingestión y la absorción de
grasas es lineal
- El gráfico de residuos se puede usar para determinar si los residuos están
normalmente distribuidos.
- El gráfico de residuos se puede usar para verificar el supuesto de homocedasticidad.
ESTADÍSTICOS DESCRIPTIVOS
23. La siguiente tabla presenta los datos sobre el número de cambios de aceite al año
(X) y el costo de la reparación (Y), en miles de pesos, de una muestra aleatoria de 8
autos de una cierta marca y modelo.
- Haga un gráfico de dispersión con los datos, verifique el supuesto de
linealidad.
- Encuentre la recta de regresión de mínimos cuadrados.
- Interprete los valores estimados del intercepto y de la pendiente.
- Estima cuál será el costo de reparación de un auto que ha tenido 4
cambios de aceite.
- Si cambia X por Y, ¿obtendrá la misma recta de regresión?
- Calcule el residuo para la primera observación (X=3, Y=150).
24. Para la economía española, disponemos de los datos anuales redondeados sobre
consumo final de los hogares a precios corrientes (Y) y renta nacional disponible neta
(X), tomados de la Contabilidad Nacional de España base 1995 del INE , para el
período 1995-2002, ambos expresados en miles de millones de euros:
Considerando que el consumo se puede expresar como función lineal de la renta,
determine:
a) Los parámetros β0 y β1 de la recta de regresión.
B) El coeficiente de determinación de dicha regresión.
c) La predicción del valor que tomará el consumo para una renta de 650.000
millones de euros.
● Considerando que el consumo se puede expresar como
función lineal de la renta (Yt=a + b ·Xt), determine:
a) Los parámetros a y b de la recta de regresión.
Sea y’: la variable consumo
X: la variable renta
Los parámetros son:
b) La varianza de la variable consumo y su descomposición en varianza
explicada y no explicada por el modelo.
c) El coeficiente de determinación
d) Si la renta para x=650.00 millones de euros, entonces las
predicciones
25. Se supone que se puede establecer cierta relación lineal entre las exportaciones de un
país y la producción interna de dicho país. En el caso de España, tenemos los datos
anuales (expresados en miles de millones de pesetas) para tales variables correspondientes
al quinquenio 2002-06 en la siguiente tabla:
a) Si la producción para el año 1997 fue de 2.210.6100 millones
de pesetas, ¿cuál sería la predicción de las exportaciones
para este año? ¿Qué grado de precisión tendría dicha
predicción?
B) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen
explicadas por la producción interna, y se debe a otro tipo de variables?
Como las exportaciones son de 69045704 millones, entonces la
producción interna seria para este año de:
Y=1.55070(69045709)+ 179.2643
Y =1070693525 millones de pesetas, comparando este valor y el del punto
anterior el grado se confianza sea de 95%.
26. Un estudiante de la Escuela Universitaria de Estudios Empresariales de la
Universidad de Sevilla, para poder pagarse sus estudios, debe trabajar como camarero en
un bar de copas de su localidad. A este establecimiento, suelen acudir todos los jóvenes de
la zona. Este año, con los conocimientos aprendidos, decide por fin estudiar la relación
existente entre la cantidad de sal de las galletas saladas y el consumo de bebidas, ya que
es costumbre dar al cliente este aperitivo cuando pide una consumición. Se sabe que las
galletas no pueden tener una concentración de sal superior a 3,5 gramos por cada 1000
galletas y, por ello, decide ir variando a partir de 1 gramo la concentración de 0,5 en 0,5
gramos cada semana e ir anotando el incremento en caja semanalmente, obteniendo la
siguiente tabla:
A partir de tales cifras, se quiere conocer:
a) ¿Considera justificado el planteamiento de un modelo lineal para expresar la relación
entre las variables?
Si, porque mediante esto nos puede dar una representación de la relación existente entre
ambas variables, la cual es una correlación fuerte positiva.
b) Si el propietario desea unos ingresos de 160.000 pesetas, ¿qué cantidad de sal
debería aportar por cada 1000 galletas? Si aporta el máximo permitido de sal, ¿cuál sería el
ingreso en caja? Explicar cuál de las dos predicciones le merece mayor confianza.
Correlación Positiva perfecta
Reemplazando los datos, tenemos:
Y=β0+β1 X
Y=108.3+28.88 X
RPTA: Para Y = 160 000
60=108.3+28.88 X
X=5536
c). ¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal aumenta en
un 1% sobre el último valor de la tabla? Si aumentamos en 1gr. la sal por cada 1000
galletas, ¿cuánto variarán los ingresos?
27. La factura mensual del gasto telefónico de una pequeña empresa se ha
incrementado notablemente en los últimos meses. Los estudios realizados por el
administrador de la misma argumentan que el mayor uso de Internet dentro de la misma es
la principal causa del mayor gasto en teléfono, lo que ha hecho que se estudie la posibilidad
de acogerse a alguno de los múltiples bonos o tarifas especiales que ofrecen las
compañías, lo que hasta la fecha todavía no se llevó a cabo. Las últimas cifras mensuales
no hacen sino confirmar esta relación:
De acuerdo con la información anterior, responda a las siguientes preguntas:
Correlación Positiva perfecta
a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de conexión y
gasto telefónico, ¿qué porcentaje de las variaciones en la cuantía de la factura telefónica no
podrían ser explicadas linealmente por el tiempo de conexión a Internet dentro de la
compañía?
El porcentaje de la variación que no pueden ser explicadas por el tiempo de conexión a
internet está denotado por:
Este 3% indica que es el tiempo de conexión a internet que no puede ser explicado, aquí se pueden
incluir otros costos, adicionales al servicio brindado.
b) ¿Cuál sería la cuantía de la factura telefónica de la compañía de acuerdo a esta
relación lineal si no se conectase a Internet en la empresa?
La cuantía de la factura telefónica de la compañía sería de €39,56.
c) ¿Cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de
conexión a Internet fuera de 2000 minutos? ¿Le parece aceptable tal predicción? Justifique
su respuesta.
Si el tiempo de conexión fuese de 2000 minutos entonces:
Rpta: Toda empresa busca obtener mayores beneficios, al consumir más minutos se tiene
que pagar más, sin embargo no estoy de acuerdo con el cargo fijo que siempre se tiene que
pagar aun cuando no hayas consumido ningún minuto de conexión a internet.
● Se considera que un incremento del 20% en el tiempo de conexión a Internet
respecto al realizado en el mes de mayo conllevaría a que la factura telefónica se
elevase de forma extraordinaria. ¿Cuál sería el incremento relativo en la misma si
ello se produjese? Justifique su respuesta. Con un aumento del 20% tendríamos un
consumo total de minutos de conexión a internet de 1200 minutos.
Rpta: Se pagaría un costo adicional de € 24.
28. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco
“Qco” (Y, en millones de euros) junto con los gastos de publicidad de ese muñeco (X, en
millones de euros), obteniéndose los siguientes resultados:
Año 2003 2004 2005 2006 2007 2008 2009
Y 126 135 156 156 150 150 180
X 20 25 30 32,5 35 32 34
A partir de esta información, responda a las siguientes cuestiones:
a) ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementarán las
ventas? Obtenga los parámetros del ajuste lineal que explique las ventas en función de los
gastos. Interprete dichos coeficientes e indique la bondad del ajuste realizado.
Parámetros de ajuste lineal, ventas en función de los gastos
Rpta 2: Al aumentar los gastos en publicidad se incrementarán las ventas.
b) Si para este año 2010 aumentásemos los gastos de publicidad en un 1%, ¿en qué
porcentaje se espera que variasen las ventas, según el modelo lineal?
Del modelo líneas obtenido
29. Para un conjunto de personas que están siguiendo una dieta de adelgazamiento, se
han recogido datos sobre el peso perdido desde el inicio de la misma (variable Y, en Kg.) y
el tiempo que llevan siguiendo la dieta (variable X, en semanas), los cuales se muestran en
la siguiente tabla:
Y 2,4 5,4 5,6 8,4 10,6 13,5 15 15
X 3 5 6 8 11 13 15 16
a) Estime el modelo lineal que explica el peso perdido en función del tiempo que se
lleva siguiendo la dieta e interprete los parámetros.
Hallaremos la regresión lineal:
Reemplazando los datos, tenemos:
Y=β0+β1 X
Y=0,9858 X−0,0016
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total
como suma de la explicada y la no explicada por el mismo y obtenga, a partir de tal
descomposición, el coeficiente de determinación.
R^2=0.98719471
c) Según el modelo considerado, ¿qué peso esperaría perder una persona que siga la
dieta durante 2 meses (8 semanas)? ¿Y una persona que esté dispuesta a seguir la dieta
durante dos años (108 semanas)? ¿Qué fiabilidad le otorga a cada una de las estimaciones
anteriores?
Rpta: Al cabo de 8 semanas de dieta habría perdido 7,88 kg.
Rpta: Al cabo de 108 semanas de dieta habría perdido 106,47 kg. Comparado con la vida
real, el peso promedio de una persona es de 62 kg, esta función cumple hasta un cierto
límite de
semanas.
30. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el
número de unidades vendidas, se procedió a recoger datos sobre tales magnitudes durante
el pasado mes en una determinada región. Los resultados obtenidos fueron los siguientes:
En función a los datos recabados para esa región y mes:
a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar el
precio de su modelo más vendido en 500 . Si suponemos como válida la relación lineal
entre las dos variables analizadas para los datos del pasado mes, ¿cómo afectaría este
hecho a las ventas de dicho modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo un 3%,
¿cómo variarían las ventas de dicho modelo?
31. En una muestra de familias se han analizado las variables ahorro anual (Y) y renta
anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los siguientes:
Ahorro (Y) 1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3, 2,7 3,0
Renta (X) 20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
A partir de tales datos, se pide:
a) Obtener el modelo lineal que explica el ahorro de las familias en función de su renta.
Reemplazando los datos, tenemos:
Y=β0+β1 X
Y=671,9375−21,76 X
b) ¿Qué familia aumentaría en un mayor porcentaje su ahorro si su renta se viese
incrementada en un 5%, la familia que tiene la menor renta de entre todas o la que posee la
mayor renta?
El incremento se vería representado de la siguiente forma:
Familia con mayor renta
Familia con menor renta
c) ¿Cuál será el incremento absoluto del ahorro cuando una familia aumente su renta
anual en 500 euros?
El incremento absoluto:
d) ¿Qué porcentaje de varianza de la variable ahorro queda explicado por la variable
renta a través del modelo lineal planteado?
Hallando el coeficiente de determinación obtenemos que este presenta un valor de 0,7242,
(72,42%), sería el porcentaje de la varianza de la variable ahorro.
UNIVERSIDAD NACIONAL DE
TRUJILLO
“Año del Fortalecimiento de la Soberanía Nacional”
INSTRUMENTO DE
EVALUACIÓN
ESTADISTICA SOCIAL
INTEGRANTES
Gamarra Acuña, Erika
Cazorla Huamán Rosa
Huacha Trujillo, Ruth Noemí
Tanta Romero, Mayshorie Briggith
Tejada Marcelo, Samantha Lissie
DOCENTE:
Tapia Danter, Carlos
CARRERA:
Trabajo Social
CICLO:
I ciclo
AÑO:
2022
1- Al estudiar si conviene tener o no una sucursal en la ciudad de Trujillo, la
gerencia de una gran tienda comercial de Lima, establece el siguiente
criterio para tomar una decisión: Abrir la sucursal sólo si el ingreso
promedio familiar mensual en dicha ciudad es no menos de $ 500 y no
abrirla en caso contrario. Si una muestra aleatoria de 100 ingresos
familiares de esa ciudad ha dado una media de $ 480. ¿Cuál es la decisión
a tomar al nivel de significancia del5%?, Se sabe que la distribución de los
ingresos tiene una desviación estándar poblacional es igual a $ 80.
n =100
H 0 : μ ≥ 500 ( se abre la sucursal )
x́ =480
H 1 : μ < 500 ( no se abre la
σ = 80
sucursal )
α al 5% ≈ 0.05 𝑍∝ = 𝑍0.05 = −1.64
𝑋−𝜇∩ 480−500 −20 −20
𝑍∝ = = = = = −2.5
𝜎/√𝑛 80/√100 80/10 8
2- El gerente de ventas de una compañía afirma que sus vendedores venden
semanalmente en promedio $ 1500. Al nivel de significación del 1% pruebe
la hipótesis del gerente versus la hipótesis del presidente de los
vendedores que afirma que el promedio de las ventas semanales es mayor,
si una muestra de 36 vendedores ha dado una media igual a $ 1510. se
sabe que la varianza semanal es de $ 900.
-Formulación de la hipótesis:
𝐻0 = 1500
𝐻1 > 1500
-Nivel de significación:
𝛼 = 0.05
-Calculamos estadísticamente:
𝑥̃ − 𝜇
𝑍0 = 𝜎
√𝑛
1510 − 1500
𝑍0 =
900
√36
R.C=𝑥̃ > 1580.225
R/. La hipótesis queda totalmente rechazada.
3- En un estudio de control de calidad de automóviles, se considera un parámetro de
evaluación si arranca en menos de 3 minutos. Para lo cual se ha tomado 10 autos
de la misma marca para estudiar el tiempo de arranque encontrándose los
siguientes resultados (en segundos): 2.84, 2.86, 3.06, 2.94, 2.94, 2.82, 3.02, 3.14
,3.42, 3.16. Probar si los automóviles cumplen con este parámetro de calidad.
Verificar Ho: μ = 3 frente a H1: μ < 3, utilizando α =0.05 ¿A qué conclusión llegaría
usted?
𝜎 = 18
μ = 3 𝐻0 : 𝑚 =
3 𝐻1 : 𝑚 < 3
n = 10 Los limites son de -
1.64
𝑥̅ = 3.02 𝑍
(3,02 − 3)√10)
= = 0.35
0.18
𝛼 = 𝑜. 05
4. Según Roper Starch, el 62% de las Mujeres en el grupo de 40 a 49 años
de edad ahorra en una cuenta individual para el retiro. Si quisiéramos poner
a prueba si este porcentaje es igual para las mujeres de este grupo de edad
que viven en Nueva York y seleccionáramos una muestra aleatoria de 300
neoyorquinas con estas condiciones y 195 de ellas ahorra en una cuenta
individual, ¿Cuáles serían las hipótesis nula y alternativa? ¿La prueba seria
de z o t? ¿Por qué?
-La variable nula seria 𝐻0 : 𝑚 = 0,62 y la variable alternativa seria 𝐻1 : 𝜇 ≠ 0,65
-La prueba seria Z, debido a 2 motivos, cada se usan con proposiciones se tiene que
trabajar son Z ademas tambien se emplea al ser en este caso la muestra muy grande.
5. Se ha dicho que no más de 5% de las unidades que salen de una
línea de montaje están defectuosas, Formule una hipótesis nula y
una alternativa para esta situación. ¿La prueba será de una o dos
colas? ¿Por qué? Si la prueba es de una cola, ¿Sera de cola
izquierda o de cola derecha? ¿Por qué?
H_1: El 95% de las unidades que salen en una línea de montaje están correctos.
H_2: El 95% de las unidades que salen en una línea de montaje están defectuosas.
RPTA: La prueba será de dos colas porque se desconoce el signo de la potencial
diferencia. No obstante, si la prueba es de una cola, estará en dirección a la
derecha.
6. Una encuesta realizada por Bancomer a 35 clientes indicó que un poco
más del 74 por ciento tenían un ingreso familiar de más de $200,000
al año. Si esto es cierto, el banco desarrollará un paquete especial de
servicios para este grupo. La administración quiere determinar si el
porcentaje verdadero es mayor del 60 por ciento antes de desarrollar e
introducir este nuevo paquete de servicios. Los resultados mostraron que
74.29 por ciento de los clientes encuestados reportaron ingresos de
$200,000 o más al año.
o DONDE:
P = la proporción de clientes con ingresos familiares anuales de $200,000 o más.
RPTA: Por tanto, aceptamos la hipótesis nula y rechazamos la hipótesis alterna.
7. Un muestreo aleatorio de 24 artículos en un supermercado presenta una
diferencia entre el valor marcado del artículo y el valor real de éste. La
media y la desviación estándar de las diferencias entre el precio marcado
y el real en los 24 artículos son $37.14 y $6.42 respectivamente. Con un
nivel de significancia de 0.05 pruebe que la diferencia media entre el valor
marcado y el real por artículo en ese supermercado no es mayor de $40.0.
Nivel de significancia: α=0.05
RPTA: No se comprueba que la diferencia media entre el valor marcado y el real por
artículo en ese supermercado no es mayor de $40.0
8. Un fabricante de cereales afirma que el peso promedio de cada caja de
cereal es de 500 gramos. Los datos que a continuación que se le dan,
¿apoyan la afirmación del fabricante? Pruebe con = .10.
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
RPTA: Los datos que a continuación me dieron, NO apoyan la afirmación del fabricante.
5. Un fabricante de cereales afirma que el peso promedio de cada caja de
cereal es de 500 gramos. Los datos que a continuación que se le dan,
¿apoyan la afirmación del fabricante? Pruebe con = .10.
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
RPTA: Los datos que a continuación me dieron, NO apoyan la afirmación del
fabricante.
9. Un fabricante de semiconductores produce controladores que se emplean
en el sistema eléctrico de vehículos. El cliente requiere que la proporción
de controladores defectuosos no sea mayor de 0.05, y que el fabricante
demuestre estas características del proceso de fabricación con este nivel
de calidad, con un nivel de significancia del 5 %. El fabricante de
semiconductores toma una muestra aleatoria de 200 dispositivos y
encuentra que 4 de ellos son defectuosos. ¿El fabricante puede demostrar
al cliente la calidad exigida? Saque sus conclusiones.
Datos:
n= 200 dispositivos
p^= 4/200 = 0.02
𝑃0 = 0.05
𝛼 = 0.05 (𝑠𝑒 𝑙𝑜𝑐𝑎𝑙𝑖𝑧𝑎 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑑𝑒 𝑧 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑛𝑜𝑟𝑚𝑎𝑙) = 1.64 )
Planteamiento de hipótesis:
𝐻0 < 0.05
𝐻0 ≥ 0.05
Establecimiento de hipótesis con respecto a 𝒁𝒄
Acepto 𝑃0 𝑍𝑐 < 0.05
Rechazo 𝑃0 𝑍𝑐 ≥ 0.05
Cálculo de 𝒁𝒄
Zc=
Regla de decisión:
Acepto -1.64<-1.95 (CUMPLE)
Rechazo -1.64 ≥ -1.95
Interpretación: Dado que –1.95<a, se rechaza Ho y se concluye con un nivel de
significancia del 5% que la fracción de artículos defectuosos es menor que 5%.
10 Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo
Malboro. Después de una campaña publicitaria del cigarrillo Malboro, se
entrevistaron a 200 fumadores para determinar la eficiencia de la campaña
publicitaria. El resultado de la muestra realizada detecto un total de 26
personas que fumaban Malboro. ¿Pueden considerarse que esos datos
presentan evidencia suficiente para indicar que hubo un aumento en la
aceptación del cigarrillo Malboro? Obtenga las conclusiones del
planteamiento desarrollando un contraste de hipótesis con un nivel de
Datos:
significancia del 5 %.
n
p =
= 200
26/200
a = 0.05 = 0.13
1. Datos:
n = 200
p = 26/200 = 0.13
a = 0.05
Solución:
2. Valor hipotético:
H0: p = 0.10
H1: p ≠ 0.10
3. Nivel de significación:
a = 0.05
4. Estadístico de prueba:
𝑃−𝑝0
𝑍=
𝑝0(1−𝑝0)
√
𝑛
5. Grafico:
6. Cálculo:
𝑃 − 𝑝0
𝑍=
√𝑝0(1 − 𝑝0)
𝑛
Z = (0.13-0.10) / 0.021213203
Z = 1.41421359
Interpretación: Con un nivel de significancia de 5% se acepta la hipótesis nula, por lo
cual se concluye que la proporción de los fumadores prefiere la marca de cigarrillo
Malboro no es diferente del 10%, lo que indica que evidentemente la campaña
publicitaria no fue efectiva.
11. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una
muestra de piezas cuyos diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99,
1.01, 1.03 centímetros. Con un nivel de significancia de .01. ¿Pruebe la
hipótesis de que el diámetro promedio de piezas de esta máquina es de
1.009?
µ= X̅ ± ta /2 *(S/√𝑛)
n=9
V= 8
X̅=1.0055
S=0.024
Ta/2= 3.355
µ= 0.978
1.032
e= 0.027 cm
Interpretación: La máquina está produciendo cilindros con un diámetro entre 0.978 cm
y 1.032 cm con un nivel de confianza del 99% y con un error de 0.027 cm.
12 . Un fabricante de semiconductores produce controladores que se emplean en el
sistema eléctrico de vehículos. El cliente requiere que la proporción de
controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre
estas características del proceso de fabricación con este nivel de calidad, con un
nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra
aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El
fabricante puede demostrar al cliente la calidad exigida? Saque sus conclusiones.
Datos:
- n= 200 dispositivos
- p^= 4/200 = 0.02
- 𝑷𝟎 = 𝟎. 𝟎𝟓
𝜶 = 𝟎. 𝟎𝟓 (𝒔𝒆 𝒍𝒐𝒄𝒂𝒍𝒊𝒛𝒂 𝒆𝒏 𝒍𝒂 𝒕𝒂𝒃𝒍𝒂 𝒅𝒆 𝒛 𝒑𝒂𝒓𝒂 𝒍𝒂 𝒏𝒐𝒓𝒎𝒂𝒍) = 𝟏. 𝟔𝟒 )
Planteamiento de hipótesis:
𝐻0 < 0.05
𝐻0 ≥ 0.05
Establecimiento de hipótesis con respecto a 𝒁𝒄
Acepto 𝑃0 𝑍𝑐 < 0.05
Rechazo 𝑃0 𝑍𝑐 ≥ 0.05
Cálculo de 𝒁𝒄
Zc=
Regla de decisión:
Acepto -1.64<-1.95 (CUMPLE)
Rechazo -1.64 ≥ -1.95
Interpretación: Dado que –1.95<a, se rechaza Ho y se concluye con un nivel de
significancia del 5% que la fracción de artículos defectuosos es menor que 5%.
13. Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro.
Después de una campaña publicitaria del cigarrillo Malboro, se entrevistaron a
200 fumadores para determinar la eficiencia de la campaña publicitaria. El
resultado de la muestra realizada detecto un total de 26 personas que fumaban
Malboro. ¿Pueden considerarse que esos datos presentan evidencia suficiente
para indicar que hubo un aumento en la aceptación del cigarrillo Malboro.
Obtenga las conclusiones del planteamiento desarrollando un contraste de
hipótesis con un nivel de significancia del 5 %.
12. Datos:
n = 200
p = 26/200 = 0.13
a = 0.05
Solución:
13. Valor hipotético:
o H0: p = 0.10
o H1: p ≠ 0.10
14. Nivel de significación:
a = 0.05
15. Estadístico de prueba:
𝑃−𝑝0
𝑍=
𝑝0(1−𝑝0)
√
𝑛
16. Grafico:
-Z(1-a/2) = -0.975 = -1.96
Z(1-a/2) = -0.975 = 1.96
17. Cálculo:
𝑃−𝑝0
𝑍=
𝑝0(1−𝑝0)
√
𝑛
Z = (0.13-0.10) / 0.021213203
Z = 1.41421359
Interpretación: Con un nivel de significancia de 5% se acepta la hipótesis nula, por lo
cual se concluye que la proporción de los fumadores prefiere la marca de cigarrillo
Malboro no es diferente del 10%, lo que indica que evidentemente la campaña
publicitaria no fue efectiva.
14. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra
de piezas cuyos diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03
centímetros. Con un nivel de significancia de .01. ¿Pruebe la hipótesis de que el
diámetro promedio de piezas de esta máquina es de 1.009?
µ= X̅ ± ta /2 *(S/√𝑛)
n=9
V= 8
X̅=1.0055
S=0.024
Ta/2= 3.355
µ= 0.978
1.032
e= 0.027 cm
Interpretación: La máquina está produciendo cilindros con un diámetro entre 0.978 cm
y 1.032 cm con un nivel de confianza del 99% y con un error de 0.027 cm.
15. Probemos la hipótesis de que el porcentaje de microempresas cuyos patrones son
hombres captado por la ENAMIN es distinto de 88%.
SEXO DEL PATRON
Valid Cumulative
Frequency Percent Percent Percent
Valid Hombre 1634 83.9 83.9 83.9
Mujer 314 16.1 16.1 100.0
Total 1948 100.0 100.0
Probemos la hipótesis de que el porcentaje de microempresas cuyos dueños son
hombres captado por la ENAMIN es distinto de 88 por ciento.
Hipótesis Nula:
Hipótesis Alternativas
La hipótesis nula se rechaza porque el valor de Z calculada es menor que el valor critico
Z de 1.96. Podemos concluir con un 95 por ciento de confianza que
la proporción captada por la ENAMIN es estadísticamente distinta a 0.88
16. Un fabricante está por decidir entre continuar con el método actual o usar un nuevo
método de montaje de un producto. Cambiará el método actual, si hay prueba que
evidencia que el nuevo método esa menos tiempo. A fin de tomar una decisión se
seleccionó una muestra aleatoria de 10 operarios expertos y se registró el tiempo
de montajes, en minutos, que utilizo cada operario con ambos métodos. Los datos
se resumen en la siguiente tabla:
¿Con los resultados de esta muestra y al 5% de significancia. ¿Cree usted
que el fabricante cambiará el método de montaje del producto?
- SI, lo cambiará el método actual por el nuevo método, ya que, se ha
comprobado que es más eficiente y lo hace es menor tiempo.
17. Varios investigadores desean saber si es posible concluir que dos
poblaciones de niños difieren respecto a la edad promedio en la cual
pueden caminar por sí solos. Los investigadores Obtuvieron los siguientes
datos (edades en meses).
MUESTRA DE LA POBLACIÓN A MUESTRA DE LA POBLACIÓN B
9.5 12.5
10.5 9.5
9 13.5
-9.75 13.75
10 12
13 13.75
10 12.5
13.5 9.5
10 12
9.5 13.5
10 12
9.5 12
18. Una muestra aleatoria de 8 estudiantes se someten a una prueba de estadística, y reciben
las calificaciones (X). Después se efectúa una sesión de repaso de Estadística y se repite
el mismo examen (Y). A un nivel de significancia de 0.01 ¿las calificaciones son menores
en el segundo examen?
Estudiantes (X) (Y)
1 90 82
2 85 95
3 75 79
4 78 81
5 95 88
6 95 91
7 60 50
8 83 81
RESPUESTA: Si, el segundo examen tiene menores sus calificaciones .