UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CONTADURÍA PÚBLICA Y ADMINISTRACIÓN
PRODUCTO INTEGRADOR DE APRENDIZAJE
Estadística Inferencial
Producto Integrador de Aprendizaje
Lic En Administración
Semestre: 3° Grupo: CG
Maestro: Gabriela Soledad Ulloa Duque
Integrantes de equipo:
Armenta Sánchez Osbaldo 2083959
Chávez Retta Katia 1902527
Coronado Licón Paloma Vanessa 1934341
López Castilleja Mónica Michell 1953715
Guevara Muñoz Jonathan Ramsés 1956585
Contenido Mínimo A Evaluar Cumplimiento
Índice ☐
Introducción. - incluye valores ☐
UANL aplicados
Análisis y emisión de juicio ☐
Conclusiones individuales ☐
Conclusión del equipo ☐
Actividad en inglés ☐
---------------------------------------------------------------------------------------------------
Calificación PIA Calificación final.
Firma:
Ciudad Universitaria, 9 de Mayo de 2022
1|Página
Índice
Introducción…………………………...………2
Abstract general…………………...………….2
Marco metodológico…………………...……..3
Caso práctico 1………………………………….3
Paso practico 2…………………………..……...4
Caso practico3…………………………………..9
Conclusiones…………………………...……..12
Introducción
Con la siguiente evidencia buscamos exponer todos los conocimientos adquiridos
durante todo el semestre mediante una resolución de casos basados en una base
de datos, todo esto con la finalidad de demostrar y explicar nuestra forma de llevar
acabo cada uno de los problemas que fueron impuestos
Finalmente, buscamos establecer una relación entre un caso con datos verdaderos
que nos puedan ayudar a reforzar los aprendizajes.
Introduction
With the following evidence we seek to expose all the knowledge acquired
throughout the semester through a resolution of cases based on a database, all this
with the purpose of demonstrating and explaining our way of carrying out each of
the problems that were imposed.
Finally, we seek to establish a relationship between a case with true data that can
help us reinforce learning.
Abstract general
El presente reporte presenta la solución a problemas de correlación lineal, la
probabilidad de que suceda un acontecimiento, así mismo, aplicamos pruebas de
hipótesis para medir el nivel de confianza y por último, con ecuación de regresión le
dimos solución a diferentes problemas para pronosticar un comportamiento.
2|Página
Marco metodológico
1. Consulte los datos de Béisbol 2009, que incluyen información sobre los 30
equipos de la Liga Mayor de Béisbol de la temporada 2009. En la última
década, la asistencia media por equipo siguió una distribución normal, con
una media de 2.25 millones por equipo y una desviación estándar de 0.70
millones.
a. Utilice un software estadístico para calcular la asistencia media por
equipo durante la temporada 2009. Ahora determine la probabilidad de
una media muestral de este tamaño o mayor de la población.
Comenzamos realizando el cálculo de la asistencia media por equipo con
siguiente formula:
∑ 𝑥 73.43
𝑋̅ = = = 2.44
𝑛 30
Por lo tanto, tenemos que la asistencia media es de 2.44 millones en la
temporada.
A continuación, determinamos la probabilidad de que pueda ser mayor a la
de la población
𝑋̅ − 𝜇 2.44 − 2.25 0.19
𝑍= 𝜎 = = = 1.4866
0.70 0.1278
√𝑛 √30 X =0.4319
𝑃(𝑋̅ > 2.25) = 0.5 − 0.4319
𝑃(𝑋̅ > 2.25) = 0.0681 = 6.81% 𝜇
Por lo tanto, la probabilidad de que la asistencia media por equipo sea mayor
o igual al de la población es de 6.81%
b. Para los equipos de liga Americana calcule la asistencia media por
equipo durante la temporada 2009. Ahora determine la probabilidad de
una media muestral de este tamaño o menor de la población.
Comenzamos realizando el cálculo de la asistencia media por equipo con
siguiente formula:
∑ 𝑥 32.29
𝑋̅ = = = 2.3064
𝑛 14
Por lo tanto, tenemos que la asistencia media es de 2.30 millones en la
temporada.
3|Página
A continuación, determinamos la probabilidad de que pueda ser mayor a la
de la población
𝑋̅ − 𝜇 2.3064 − 2.25 0.05
𝑍= 𝜎 = = = 0.3912
0.70 0.1278
√𝑛 X =0.1517
√30
𝑃(𝑋̅ > 2.25) = 0.5 + 0.1517
𝑃(𝑋̅ > 2.25) = 0.6517 = 65.17%
𝜇
Por lo tanto, la probabilidad de que la asistencia media por equipo sea menor
o igual al de la población es de 65.17%
c. Para los equipos de liga Nacional calcule la asistencia media por equipo
durante la temporada 2009. Ahora determine la probabilidad de una
media muestral de este tamaño o mayor de la población
Comenzamos realizando el cálculo de la asistencia media por equipo con
siguiente formula:
∑ 𝑥 41.14
𝑋̅ = = = 2.5712
𝑛 16
Por lo tanto, tenemos que la asistencia media es 2.57 millones en la
temporada.
A continuación, determinamos la probabilidad de que pueda ser mayor a la
de la población de 2.25 millones
𝑋̅ − 𝜇 2.5712 − 2.25 0.3212
𝑍= 𝜎 = = = 2.5133
0.70 0.1278
X =0.4940
√𝑛 √30
𝑃(𝑋̅ > 2.25) = 0.5 − 0.4940
𝜇
𝑃(𝑋̅ > 2.25) = 0.006 = 0.6%
Por lo tanto, la probabilidad de que la asistencia media por equipo sea mayor
o igual al de la población es de 6.81%
2. Con la información sobre los 30 equipos de la Liga Mayor de Béisbol de la
temporada 2009.
a. Construya el intervalo de confianza de 95% de la cantidad media de
cuadrangulares por equipo. Si se cambia el nivel de confianza a 98%
¿Qué cambios observa en el intervalo de confianza? Justifique su
respuesta.
4|Página
Calculamos la media y la desviación estándar de los cuadrangulares de los
equipos
∑(𝑥 − 𝑥̅ )2
∑ 𝑥 5042 𝜎= = 33.07
𝑋̅ = = = 168.06 𝑁
𝑛 30
Posteriormente, hacemos lo mismo con los intervalos de confianza
𝜎 𝜎
𝑋̅ ± 𝑍 𝑋̅ ± 𝑍
√𝑛 √𝑛
33.07 33.07
168.06 ± 1.96 168.06 ± 2.33
√30 √30
168.06 ± 11.8339 168.06 ± 14.0679
𝐼𝐶 = [156.3261; 179.9939] 𝐼𝐶 = [153.9921; 182.1279]
Por lo tanto, se tiene un 95% de seguridad de Por lo tanto, se tiene un 98% de seguridad de
que la media de cuadrangulares se encuentra que la media de cuadrangulares se encuentra
entre los rangos de 156.32 y 179.99. entre los rangos de 153.99 y 182.12.
Después de analizar los dos intervalos de confianza se ve que en el intervalo
de 95%, el rango de los valores es más pequeño, pues tiene una diferencia
de 23, mientras que en el intervalo de 98%, los rangos son más abiertos y
cuenta con una diferencia de 28.
b. Construya el intervalo de confianza de 95% de la cantidad media de
errores que cometió cada equipo. Si se cambia el nivel de confianza a
99% ¿Qué cambios observa en el intervalo de confianza? Justifique su
respuesta.
Calculamos la media y la desviación estándar de los errores de los equipos
∑ 𝑥 2856 ∑(𝑥 − 𝑥̅ )2
𝑋̅ = = = 95.2 𝜎= = 15.59
𝑛 30 𝑁
Posteriormente, hacemos lo mismo con los intervalos de confianza
𝜎 𝜎
𝑋̅ ± 𝑍 𝑋̅ ± 𝑍
√𝑛 √𝑛
15.59 15.59
95.2 ± 1.96 95.2 ± 2.58
√30 √30
.
95.2 ± 5.5788 95.2 ± 7.3435
𝐼𝐶 = [89.6212; 100.7788] 𝐼𝐶 = [87.8565; 102.5435]
Por lo tanto, se tiene un 95% de seguridad Por lo tanto, se tiene un 95% de seguridad
de los errores de equipos se encuentre de los errores de equipos se encuentre
entre los rangos de 89.62 y 100.77. entre los rangos de 87.85 y 102.54.
5|Página
Después de analizar los dos intervalos de confianza se ve que en el intervalo
de 95%, el rango de los valores es más pequeño, por lo tanto, hay menos
variabilidad en el valor real, en cambio, en el intervalo de 99%, los rangos
son más abiertos y cuenta con una diferencia de 15, lo que hace tener más
variabilidad en el valor real.
c. Construya el intervalo de confianza de 95% de la cantidad media de
robos de base de cada equipo. Si se cambia el nivel de confianza a 90%
¿Qué cambios observa en el intervalo de confianza? Justifique su
respuesta.
Calculamos la media y la desviación estándar de los robos de base de los
equipos
∑ 𝑥 2970 ∑(𝑥 − 𝑥̅ )2
𝑋̅ = = = 99 𝜎= = 30.70
𝑛 30 𝑁
Posteriormente, hacemos lo mismo con los intervalos de confianza
𝜎 𝜎
𝑋̅ ± 𝑍 𝑋̅ ± 𝑍
√𝑛 √𝑛
30.70 30.70
99 ± 1.96 99 ± 1.65
√30 √30
99 ± 10.9858 99 ± 9.2482
𝐼𝐶 = [88.0142; 109.9858] 𝐼𝐶 = [89.7518; 108.2482]
Por lo tanto, se tiene un 95% de certeza de Por lo tanto, se tiene un 98% de certeza de
que la media de robos de base se encuentra que la media de robos de base se encuentra
entre los rangos de 88.01 y 109.98. entre los rangos de 87.75 y 108.24.
Después de analizar los dos intervalos de confianza se ve que en el intervalo
de 95%, el rango de los valores es más pequeño, pues tiene una diferencia
de 21, mientras que en el intervalo de 98%, los rangos son más abiertos y
cuenta con una diferencia de 19, por lo tanto, tiene menos variabilidad en el
valor real.
d. Lleve a cabo una prueba de hipótesis para determinar si el salario medio
de los equipos fue distinto de $80.0 millones. Aplique un nivel de
significancia de 0.05.
Calculamos la media del salario medio:
6|Página
∑ 𝑥 2655.4
𝑋̅ = = = 88.51
𝑛 30
Primero establecemos las hipótesis: 𝐻0 = 𝜇 = 80.0
𝐻1 = 𝜇 ≠ 80.0
Seguido de esto, calculamos el estadístico de prueba mediante:
𝑋̅ − 𝜇 88.51 − 80.0 8.51
𝑍= 𝜎 = = = 1.3770
33.90 6.18
√𝑛 √30
Proseguimos a calcular el valor crítico
𝑍 = 0.5 − 0.05 = 0.45
Donde ubicado en la tabla de la Z normal nos da Z=1.65
Para terminar, definimos la regla de decisión: -1.65 µ 1.65
Se rechaza la hipótesis nula si el valor estadístico de prueba de 1.37 es
mayor al valor critico de -1.65 y 1.65, lo cual es una afirmación falsa, por lo
tanto, no se rechaza la hipótesis nula.
Finalmente, llegamos a la conclusión:
Se acepta la hipótesis nula, porque no se cuenta con suficiente evidencia
para rechazarla, por lo tanto, el salario medio de los equipos es igual a 80.0
millones
e. Lleve a cabo una prueba de hipótesis para determinar si la asistencia
media fue superior a 2 000 000 por equipo. Aplique un nivel de
significancia de 0.05 y posteriormente 0.01. Compare resultados y
describa el comportamiento.
Calculamos la media del salario medio:
∑ 𝑥 73.43
𝑋̅ = = = 2.44
𝑛 30
Primero establecemos las hipótesis: 𝐻0 = 𝜇 < 2.0
𝐻1 = 𝜇 > 2.0
Seguido de esto, calculamos el estadístico de prueba mediante:
𝑋̅ − 𝜇 2.44 − 2.0 0.44
𝑍= 𝜎 = = = 3.4401
0.6983 0.1274
√𝑛 √30
Proseguimos a calcular el valor crítico
𝑍 = 0.5 − 0.05 = 0.45
Donde ubicado en la tabla de la Z normal nos da Z=1.65
Para terminar, definimos la regla de decisión: µ 1.65
7|Página
Se rechaza la hipótesis nula si el valor estadístico de prueba de 3.44 es
mayor al valor critico de 1.65, lo cual es una afirmación verdadera, por lo
tanto, se rechaza la hipótesis nula.
Finalmente, llegamos a la conclusión:
No se acepta la hipótesis nula, porque no se cuenta con suficiente evidencia
para aceptarla, por lo tanto, la asistencia media de los equipos es mayor a 2
millones.
Ahora con un nivel se significancia de 0.01
Calculamos la media del salario medio:
∑ 𝑥 73.43
𝑋̅ = = = 2.44
𝑛 30
Primero establecemos las hipótesis: 𝐻0 = 𝜇 < 2.0
𝐻1 = 𝜇 > 2.0
Seguido de esto, calculamos el estadístico de prueba mediante:
𝑋̅ − 𝜇 2.44 − 2.0 0.44
𝑍= 𝜎 = = = 3.4401
0.6983 0.1274
√𝑛 √30
Proseguimos a calcular el valor crítico
𝑍 = 0.5 − 0.01 = 0.49
Donde ubicado en la tabla de la Z normal nos da: Z=2.33
Para terminar, definimos la regla de decisión: µ 2.33
Se rechaza la hipótesis nula si el valor estadístico de prueba de 3.44 es
mayor al valor critico de 2.33, lo cual es una afirmación verdadera, por lo
tanto, se rechaza la hipótesis nula.
Finalmente, llegamos a la conclusión:
No se acepta la hipótesis nula, porque no se cuenta con suficiente evidencia
para aceptarla, por lo tanto, la asistencia media de los equipos es mayor a 2
millones.
En conclusión, hubo cambio en el valor crítico, lo que nos permitió obtener
diferentes resultados, aunque no cambio el valor estadio de prueba, nos
percatamos que claramente cambio la regla de decisión y la conclusión, se
consideró que el nivel se significancia que muestra la realidad es 0.05, porque
los valores son más cercanos y muestran menos diferencias.
8|Página
3. Continuando con los datos de Béisbol 2009, donde se reporta información
sobre la temporada 2009 de la Liga Mayor. Sean los juegos ganados la
variable dependiente, y el salario total del equipo, en millones de dólares, la
variable independiente. Determine la ecuación de regresión y conteste las
siguientes preguntas.
a. Trace un diagrama de dispersión. Con base en ese diagrama,
¿parece haber una relación directa entre ambas variables?
Diagrama de dispersión Presenta una
120 correlación positiva
100 débil. En algunos
80
victorias
puntos se ganan
60
menos partidos que
40 y = 0.1568x + 67.124
20 R² = 0.216
en otros, pero se
0 genera más dinero a
0 50 100 150 200 250
pesar de tener
Salario del equipo
menos victorias.
Partimos calculando el coeficiente de correlación
∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑟= = 0.4647
(𝑛 − 1)𝑆𝑥 𝑆𝑦
𝑆𝑦
𝑏=𝑟 = 0.15676 a= 𝑌̅ − 𝑏𝑋̅ = 67.1238
𝑆𝑥
b. ¿Cuántas victorias estimaría para un salario de 100 millones?
𝑌̂ = 𝑎 + 𝑏𝑋 = 67.1238 + 0.15676(100)
𝑌̂ = 82.79 Victorias
c. ¿Cuántas victorias adicionales traería un salario de 105
millones?
𝑌̂ = 𝑎 + 𝑏𝑋 = 67.1238 + 0.15676(105)
𝑌̂ = 83.5836 Victorias
d. ¿Qué porcentaje de la variación de victorias representa el
salario?
21.60% representa el porcentaje de variación.
9|Página
e. Determine la correlación entre victorias y el promedio de bateo
por equipo, y entre las victorias y el promedio de carreras. Realice la
correspondiente prueba de hipótesis para cada grupo de variables
considerando un nivel de significancia de 0.01. ¿Cuál es la
correlación más fuerte? y justifique su respuesta.
Utilizamos la siguiente fórmula para calcular la correlación entre las
variables anteriormente mencionadas, lo que nos da los próximos
resultados:
∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅) ∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)
𝑟1 = = 0.4671 𝑟2 = = −0.6347
(𝑛 − 1)𝑆𝑥 𝑆𝑦 (𝑛 − 1)𝑆𝑥 𝑆𝑦
Victorias y promedio de bateo Victorias y promedio de carreras
Por lo tanto, establecemos las hipótesis de las victorias y promedio de
bateos
Pasamos a calcular el valor estadístico de prueba con la
𝐻0 = 𝜇 =≥ 0 siguiente formula:
𝐻0 = 𝜇 =< 0 √𝑛 − 2 √30 − 2 5.2915
𝑡=𝑟 = 0.4671 = 0.4671 = 2.7953
√1 − 𝑟 2 √1 − (0.4671)2 0.8842
Pasamos a calcular el valor crítico en la Tabla T-student, usando el
número de muestra y restándole 2 (n-2) grados de libertad y el valor de
alpha, así obtenemos un valor de 2.467.
Posteriormente se formuló la regla de decisión para la prueba:
Se rechaza la hipótesis nula si el estadístico de prueba 2.7953 es mayor
al valor crítico -2.467, lo cual es una afirmación verdadera, por lo tanto,
se rechaza la hipótesis nula
Y se llega a una conclusión:
Se rechaza la hipótesis nula, por lo
tanto, tenemos que la correlación
es negativa y la gráfica arroja que
no existe correlación entre las -2.467 2.795
variables.
10 | P á g i n a
Pasamos a establecer las hipótesis de las victorias y promedio de
carreras Pasamos a calcular el valor estadístico de prueba con la siguiente
formula:
𝐻0 = 𝜇 =≥ 0
𝐻0 = 𝜇 =< 0 √𝑛 − 2 √30 − 2 5.2915
𝑡=𝑟 = −0.6347 = −0.6347 = −5.6247
√1 − 𝑟 2 √1 − (−0.6347)2 0.5971
Pasamos a calcular el valor crítico en la Tabla T-student, usando el
número de muestra y restándole 2 (n-2) grados de libertad y el valor de
alpha, así obtenemos un valor de -2.467.
Posteriormente se formuló la regla de decisión para la prueba:
Se rechaza la hipótesis nula si el estadístico de prueba -5.6247 es mayor
al valor crítico -2.467, lo cual es una afirmación falsa, por lo tanto, no se
rechaza la hipótesis nula
Y se llega a una conclusión:
No se rechaza la hipótesis nula, por
lo tanto, tenemos que la correlación
es negativa, mayor a 0 e
interpretando la gráfica, tenemos que
-5.6247 -2.467
si existe una correlación
Por lo tanto, tomando en cuenta el coeficiente de correlación, tenemos
que las variables de victorias y promedio de carreras, es más cercano al
1, aunque este sea negativo, en cambio las variables de victorias y
promedio de bateo es menor, 0.4671, esto nos indica que la variable de -
0.6347 es más fuerte.
Pasando a tomar en cuenta las pruebas de hipótesis tenemos:
Primero calculamos si existía una correlación entre las variables de
victorias y bateos, lo cual, después del cálculo, no existe una correlación,
en cambio, con las variables de victorias y carreras, después de realizar
el cálculo arrojo que si existe una correlación entre las variables, por lo
tanto, las variables de victorias y promedio de carreras contiene la
correlación más fuerte de las variables.
11 | P á g i n a
Conclusión general:
En conclusión a este trabajo final nos pareció muy interesante ya que se aplicaron temas que
vimos durante todo el semestre, los cuales son muy interesantes y de suma importancia para
nuestro aprendizaje y nuestro desarrollo escolar, en este trabajo aplicamos casi todos los temas
aprendidos en clase, en algunos puntos se nos llegó a complicar un poco pero en base a los
videos vistos en clases, apuntes realizados durante el semestre y resolviendo dudas en clase
logramos concluir con éxito este trabajo y realizado de la mejor manera posible.
El proyecto en general nos ayudó a mejorar nuestra práctica con los conocimientos previos que
adquirimos clase con clase, así que de igual manera fue de gran ayuda para reforzar nuestros
conocimientos.
Armenta Sánchez Osbaldo
La implementación de la estadísticas en problemas que se asemejen a lo que se ve en la vida
real como lo fue en este PÍA, es y será de gran ayuda para nosotros como futuros profesionales
de la administración, ya sea en el ámbito laboral altamente competitivo o en la creación y
administración de nuestras propias empresas, ya que este conocimiento muy pocas personas lo
manejan y más tratándose de estudiantes recién egresados. Un trabajo muy enriquecedor y el
cual nos ayudaron a establecer aún mejor nuestras bases de la estadística inferencial para
nuestro futuro.
Chavez Retta Katia
Esta evidencia represento un reto, sin embargo, con todas las actividades que se realizaron
durante todo el semestre pude tener todas las herramientas para colaborar y contestar todos los
casos, así como analizar cuáles son los resultados que se obtienen, así mismo este aprendizaje
puedo aplicarlo durante mi vida profesional para obtener mejor un mejor desempeño.
López Castilleja Mónica Michell
En conclusión este Producto Integrador de Aprendizaje, fue un gran trabajo ya que involucramos
todo lo visto a lo largo del semestre, tuvimos complicaciones pero como equipo pudimos
resolverlo, es muy interesante todo lo que vimos a lo largo del semestre ya que realmente lo
pusimos en práctica y fue de gran ayuda para elaborar este trabajo final.
Coronado Licón Paloma Vanessa
En conclusión a nuestro trabajo final puedo mencionar que en lo personal me resultó algo
complicado ya que no dominó del todo los problemas pero durante el semestre se vieron todo
tipo de problemas de los que fueron aplicados en este trabajo, es de suma importancia decir de
igual manera que la materia nos ayuda para el desarrollo de nuestro aprendizaje y que adquirí
mucho conocimiento.
Guevara Muñoz Jonathan Ramsés
En este producto innovador se hizo más que nada una implementación de lo que vimos a lo largo
del semestre y como es que se puede hacer en varios problemas para poder sacar un resultado
específico, ya que esto nos ayudara en algún momento para poder hacerlo de12manera más fácil
|Página
y sin ningún problema.