Proyecto Final de Estadística I
Proyecto Final de Estadística I
Catedrático:
Asignatura:
Estadística I
Estudiante:
201730060013
Trabajo:
Proyecto Final
Fecha: 08/12/2021
Índice
Contenido Página
Introducción 3
Conclusión 39
Fuentes bibliográficas 40
Tabla 1
Página 2
Introducción
Observando la gran variedad de temas, todos tienen una relación que ha hecho que desde
el I parcial hasta este momento hayamos podido asegurarnos de aprender bien,
comprendiendo un conjunto de métodos que nos permite todo lo necesario desde el inicio
de la clase, aprender que si en estadística no se sabe qué es una variable, población,
muestra, peor vamos a realizar una distribución de frecuencia, graficar o buscar la
probabilidad de un conjunto de datos.
La estadística ha sido desde los inicios de la historia del hombre una disciplina, ciencia
que cuyo objetivo es reunir información para facilitar las técnicas de lo estadístico que ha
beneficiado a obtener datos sobre grandes poblaciones para que las sociedades no pierdan
el rumbo al querer lograr sus objetivos. Es así como nosotros como estudiantes la
debemos utilizar para beneficio propio y para la sociedad en la que logremos desempeñar
un rol como profesionales.
Página 3
Proyecto final
Frecuen Frecuencia
Marca de Frecuencia
Clase cia simple
clase relativa
simple acumulada
(0.3- 0.55) 0.425 4 4 0.2
[0.55-0.8[ 0.675 2 6 0.1
[0.8-1.05[ 0.925 5 11 0.25
[1.05-1.3[ 1.175 5 16 0.25
[1.3-1.55[ 1.425 0 16 0
[1.55-1.8[ 1.675 2 18 0.1
[1.8-2.05[ 1.925 2 20 0.1
20
Página 4
Tabla 2
c) A partir de lo que ha hecho hasta este punto, ¿qué conclusiones puede sacar acerca
del crecimiento en la muestra?
d) Construya una ojiva que le ayude a determinar qué fracción del maíz creció a una
tasa mayor que una pulgada por semana.
Gráfica 1
Observando la ojiva, la fracción de maíz que creció más de una pulgada por
semana es de 71% ya que solo un poco más del 25% creció menos de una pulgada
por semana.
2. La fábrica de cremalleras High Point fabrica 15 productos básicos. La compañía
tiene registros del número de unidades de cada producto fabricadas al mes, con el
fin de examinar los niveles relativos de producción. Los registros muestran los
siguientes números de cada producto fabricado por la compañía el último mes que
tuvo 20 días laborales:
Página 5
9,897 10,052 10,028 9,722 9,908 10,098
10,587 9,872 9,956 9,928 10,123 10,507
9,910 9,992 10,237
Tabla 3
Página 6
Gráfica 2
Cantidad Frecuencia
Gastada Relativa
$0 – 5.99 1%
6.00 – 10.99 3%
Página 7
11.00 – 15.99 4%
16.00 – 20.99 6%
21.00 – 25.99 7%
26.00 – 30.99 9%
31.00 – 35.99 11%
36.00 – 40.99 19%
41.00 – 45.99 32%
46.00 o mas 8%
Total 100%
Tabla 4
● Histograma
Eje vertical: frecuencia relativa porcentual
Eje horizontal: Puntos medios de las clases.
Página 8
Gráfica 3
● Polígono
Eje vertical: frecuencia porcentual
Eje horizontal: Punto medio de la clase.
Gráfica 4
4. El 14 de diciembre de 1992, la tabla de posiciones de la NFL era la siguiente:
Página 9
Imagen 1
Rango:0.87-0.143 = 0.727
Intervalos o clase:5
Amplitud = 0.727/5 = 0.15
b) Determine las frecuencias absoluta y relativa de cada clase.
Página 10
Frecuencia
Marca de Frecuencia relativa
Intervalo Frecuencia
clase relativa porcentual
%
[0.143– 0.218 7 0.25 25%
0.293[
[0.293 – 0.368 4 0.14 14%
0.443[
[0.443 – 0.518 6 0.21 21%
0.593[
[0.593 – 0.668 8 0.29 29%
0.743[
[0.743 – 0.818 3 0.11 11%
0.893[
28 1 100%
Tabla 7
Gráfica 5
Página 11
Intervalo Frecuencia Frecuen Frecuencia
cia relativa
Frecuenc acumulada
acumulada
ia relativa
[0.143– 7 7 0.25 0.25
0.293[
[0.293 – 4 11 0.14 0.39
0.443[
[0.443 – 6 17 0.21 0.6
0.593[
[0.593 – 8 25 0.29 0.89
0.743[
[0.743 – 3 28 0.11 1
0.893[
28 1
Tabla 8
Gráfica 6
Datos ordenados: 3 4 7 7 9 12
a. Calcule la media, la mediana y la moda.
● Mediana
Página 12
Valorposición 𝑛+1 6+1
= = 3.5
2 2
Mediana = (7+7)/2
Mediana= 7
● Media
7+4+9+7+3+12
m= 6
m=7
● Moda
Mo=7
● Rango
Rango= 12-3 = 9
● Rango intercuartil
Calcular Q1 y Q3
𝑛+1
Q1 = Valorposición ( 4 ) Q3=Valorposición
Q1 = Valorposición (6 + 1) Q3=Valorposición
4
Q1 = Valorposición (1.75) Q3=Valorposición (5.25)
Q1 = 4 Q3 = 9
Rango intercuartil: Q3 - Q1
Rango intercuartil: 9-4
Rango intercuartil: 5
Página 13
● La varianza
Dato Paso 1 Paso 2
3 -4 16
4 -3 9
7 0 0
7 0 0
9 2 4
12 5 25
Sumatoria 54
Tabla 9
s2= 54
7−1
54
s2= 6
s2=9
● La desviación estándar
S=
S= 3
● El coeficiente de variación
𝑆
CV=
𝑢
CV=0.42∗100
CV=42.86 %
6. A continuación aparece un conjunto de datos procedentes de una muestra n=5
7 -5 -8 7 9 Datos ordenados: -8 -5 7 7 9
𝑛+1 5+1
= =3
Mediana 2 2
Página 14
Valorposición=
Mediana= 7
• Media
m=
m=2
• Moda
Mo=7
● Rango
Rango= 9-(-8) =17
● Rango intercuartil
Calcular Q1 y Q3
Rango intercuartil: Q3 - Q1
Rango intercuartil: 8+6.5
Rango intercuartil: 14.5
Página 15
● La varianza
Dato Paso 1 Paso 2
-8 -10 100
-5 -7 49
7 5 25
7 5 25
9 7 49
Sumatoria 248
Tabla 10
s2= 248
5−1
s2=248
4
2
s =62
● La desviación estándar
S=
S= 7.87 ●
El coeficiente de variación
𝑆
CV=
𝑢
CV
CV=3.94∗100 CV=393.5%
Página 16
Tipo X
• Mediana
• Media
m=
m=575
• La varianza
Dato Paso 1 Paso 2
568 -7 49
570 -5 25
575 0 0
578 1 1
584 9 81
Sumatoria 156
Tabla 11
s2= 156
5−1
s2=156
4
s2=39
● La desviación estándar
Página 17
S=
S= 6.24
• El coeficiente de variación
𝑆
CV=
𝑢
CV
CV=0.011∗100
CV=1.085%
Tipo Y
● Mediana
Página 18
• Media
m=
m=575.4
• La varianza
Dato Paso 1 Paso 2
573 -2.4 5.76
574 -1.4 1.96
575 0 0
577 1.6 2.56
578 2.6 6.76
Sumatoria 17.04
Tabla 12
s2=17.04
5−1
s2=17.04 4
s2=4.26
● La desviación estándar
S=
S= 2.06
●El coeficiente de variación
𝑆
CV=
𝑢
CV
CV=0.0036∗100
CV=0.35%
Página 19
lOMoARcPSD|11000467
c. ¿Qué efecto tendría en sus respuestas a los incisos a) y b) si el último valor del
tipo Y fuese 588 en lugar de 578? Explique su respuesta. Los valores de
aumentaría, por lo tanto, la varianza en el diámetro del neumático seria mayor, y
por lo tanto el de mejor calidad sería el del tipo X.
8. Los siguientes datos COFFEDRINK representan las calorías y las grasas (en
gramos), que contienen las raciones con 16 onzas de bebidas a base de café servidas
en Dunkin’ Donuts y Starbucks.
Imagen 2
Para cada una de las variables (calorías y grasa)
Grasa
3.5 8.0 16.0 19.0 20.0 22.0 22.0
Tabla 13
Calorías
240 260 350 350 420 510 530
Tabla 14
Página 20
● Media
m=3.5
m=15.79
Calcular Q1 y Q3
Calorías
● Mediana
● Media
m=
m=380
● Primer y Tercer cuartil
Calcular Q1 y Q3
Página 21
lOMoARcPSD|11000467
s2=316.904
7-1
s2=52.82
● La desviación estándar
S=
S= 7.26
● Rango
Rango= 22-3.5=18.5
● Rango intercuartil
Rango intercuartil: Q3 - Q1
Rango intercuartil: 22-19
Rango intercuartil: 3
Página 22
Calorías
● La varianza
Dato Paso 1 Paso 2
240 -140 19600
260 -120 14400
350 -30 900
350 -30 900
420 40 1600
510 130 16900
530 250 32500
Sumatoria 86800
Tabla 16
s2= 86800
7−1
s2=14466.66
● La desviación estándar
S=
S= 120.28
● Rango
Rango= 530-240=290
● Rango intercuartil
Rango intercuartil: Q3 - Q1
Rango intercuartil: 510-350
Rango intercuartil: 160
BATTERIES:
Página 23
lOMoARcPSD|11000467
342, 426, 317, 545, 264,451, 1,049, 631, 512, 266, 492, 562,298
264 266 298 317 342 426 451 492 512 545 562 631 1,049
● Mediana
● Media
m=
m=473.46
● Moda
No hay una moda, porque no hay un dato que se repita.
● La varianza
Dato Paso 1 Paso 2
264 -209 43681
266 -207 42849
298 -175 30625
Página 24
317 -156 24336
342 -131 17161
426 -47 2209
451 -22 484
492 19 361
512 39 1521
545 72 5184
562 89 7921
631 158 24964
1049 576 331776
Sumatoria 533072
Tabla 17
s2= 533072
7−1
s2=88845.33
● La desviación estándar
S=
S= 298.07
d. Suponga que, en lugar de 342, el primer valor fue de 1,342. Repita los incisos a) y
c) utilizando este valor. Elabore un comentario sobre la diferencia de los
resultados.
264 266 298 317 426 451 492 512 545 562 631 1,049 1342
● Mediana
Página 25
lOMoARcPSD|11000467
● Media
m=
m=550.38
● Moda
No hay una moda, porque no hay un dato que se repita.
10. Durante el periodo de 2000 a 2003, se observó una gran volatilidad en el valor
de los metales. Los datos que se presentan en la siguiente tabla representan la tasa
de rendimiento total de platino, oro, y plata de 2000 a 2003.
Año Platino Oro Plata
2003 34.2 19.5 24.0
2002 24.5 24.5 5.5
2001 -21.3 1.2 -3.0
2000 -23.3 1.8 -5.9
Tabla 18
a. Calcule la tasa rendimiento geométrica de platino, oro y plata.
Para obtener la tasa de rendimiento geométrico se tendría que calcular la media
geométrica porque podríamos saber la tasa de rendimiento a partir de esa medida.
Página 26
PLATINO
● Media geométrica
ORO
● Media geométrica
mG=0.45
PLATA
● Media geométrica
Página 27
lOMoARcPSD|11000467
B B’
A 0.1 0.3 0.40
A’ 0.25 0.35 0.60
0.35 0.65 1
Tabla 20
c. ¿Evento A’ y B’?
A’ ∩ B’
= =0.35
Página 28
B B’
A 10 20 30
A’ 20 40 60
30 60 90
Tabla 21
B B’
A 0.1 0.2 0.3
A’ 0.2 0.4 0.6
0.3 0.6 0.9
Tabla 22
¿Cuál es la probabilidad de
a.
b. ¿A|B?
c. ¿A|B’?
d. A’|B’?
Página 29
lOMoARcPSD|11000467
14. Una inversión producirá $1 000, $2 000 y $5 000 a fin de año. Las probabilidades
de estos valores son de 0.25, 0.60 y 0.15, respectivamente. Determine la media y la
varianza del valor de la inversión.
La media es de $2,200
Página 30
La varianza
x P(x) (x - µ ) Desviación
estándar
$1 000 0.25 1000- 1,440,00 360,000
2200 0
$2 000 0.6 2000- 40000 24000 =
2200
$5 000 0.15 5000- 7,840,00 1,176,00 = $1249
2200 0
=
1,560,000
Tabla 24
La varianza es de $1,560,000
15. Croissant Bakery, Inc., ofrece pasteles con decorados especiales
para cumpleaños, bodas y otras ocasiones. La pastelería también
tiene pasteles normales. La siguiente tabla incluye el número total
de pasteles vendidos al día, así como la probabilidad
correspondiente. Calcule la media, la varianza y la desviación
estándar del número de pasteles vendidos al día.
Número de pasteles
Probabilidad
vendidos al día
12 0.25
13 0.40
14 0.25
15 0.10
Tabla 25
• Media
Página 31
lOMoARcPSD|11000467
x P(x) x.P(x)
12 0.25 3
13 0.40 5.2
14 0.25 3.5
15 0.10 1.5
Total 1 µ=
13.2
Tabla 26
La media es de 13 pasteles al día
La varianza y desviación estándar
x P(x) (x - µ ) Desviación
estándar
12 0.25 12-13.2 1.44 0.36
13 0.40 13-13.2 0.04 0.016
14 0.25 14-13.2 0.64 0.16 =
= 0.86
Tabla 27
Página 32
16. Ensayo
Importancia de la estadística
La estadística es muy importante ya que es una de las ramas de la ciencia matemática que
se centra en obtener datos e informaciones numéricos o que se encarga de transformar en
números. La estadística, es una ciencia de extracción exacta, tiene una injerencia directa
en cuestiones sociales por lo cual su utilidad práctica es mucho más comprensible que lo
que sucede normalmente con otras ciencias exactas como la matemática. La estadística
es una ciencia muy importante en la vida cotidiana de las personas ya que con ella
podemos llevar el adecuado control de muchas cosas desde las más sencillas hasta las
más complejas, además que tiene como fundamento describir, organizar y resumir datos
numéricos, actividades, estudios de consumidores, análisis (resultados en deportes
administradores de instituciones en la organismos políticos; médicos) ; las técnicas
estadísticas se aplican de manera amplia en mercadotecnia contabilidad, control de
calidad ya que esto interviene en la toma de las decisiones.
Página 33
lOMoARcPSD|11000467
La estadística tiene una gran importancia en todos los aspectos sociales, económicos y
políticos por cuanto que sirve para todo tipo de investigación científica si se tiene en
cuenta que los datos estadísticos son el resultado de varios casos de entre los cuales se
toma un promedio. Así, una estadística puede servir para una investigación científica al
demostrar que un porcentaje determinado de los casos observados representó un resultado
particular y no otro. La Estadística puede dar respuesta a muchas de las necesidades que
la sociedad actual puede experimentar. Su tarea fundamental es la reducción de datos que
se obtiene a partir de experimentos, con el objetivo de representar la realidad y
transformarla, predecir su futuro o simplemente conocerla.
Página 34
la empresa X está en un rango de peso evitando generar pérdidas al productor y detrimento
al consumidor, que los valores de venta diaria van en crecimiento en Y% en meses
definido dentro de un negocio, o simplemente la curva de resultados de un examen de
matemáticas básicas en un salón de clase fue en un rango especifico pudiendo definir un
pronóstico de nivel de aprobados final o de dificultad para subsiguientes evaluaciones
La estadística descriptiva nos ofrece el detalle de las herramientas para definir elementos
básicos en la toma de decisión como son la media, mediana, moda, desviación estándar y
los diferentes diagramas de cajas, histogramas, tablas de contingencia y graficas de
dispersión entre otros. Que nos ayudara en la obtención, organización, presentación y
descripción de la información numérica.
Página 36
Estadísticas comunes
Varios estudios estadísticos comunes que aparecen con frecuencia en los medios de
comunicación son los siguientes:
Encuesta de Población Activa
Índice de Precios al Consumo
Producto Interior Bruto
Poder adquisitivo
20. Explique y ejemplifique en que consiste el teorema del límite central. R//= El teorema
del límite central es un teorema fundamental de probabilidad y estadística. El teorema
describe la distribución de la media de una muestra aleatoria proveniente de una
población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente
grande, la distribución de las medias sigue aproximadamente una distribución normal. El
teorema se aplica independientemente de la forma de la distribución de la población.
Muchos procedimientos estadísticos comunes requieren que los datos sean
aproximadamente normales. El teorema de límite central le permite aplicar estos
procedimientos útiles a poblaciones que son considerablemente no normales. El tamaño
que debe tener la muestra depende de la forma de la distribución original. Si la
distribución de la población es simétrica, un tamaño de muestra de 5 podría producir una
aproximación adecuada. Si la distribución de la población es considerablemente
asimétrica, es necesario un tamaño de muestra más grande.
Página 37
lOMoARcPSD|11000467
EJEMPLO:
Una empresa de mensajería que opera en la ciudad tarda una media de 35 minutos en
llevar un paquete, con una desviación típica de 8 minutos. Supongamos que durante el
día de hoy han repartido 200 paquetes.
P (30 ≤ X ≤ 35) P ((30 – 35) /0,566) ≤ (X− 35/0,566) ≤ (35 – 35) /0,566 que es
aproximadamente igual a la probabilidad siguiente: P (30 – 35/0,566 ≤ Z
≤35 – 35/0,566)
= P (−8,83 ≤ Z ≤ 0)
= P (Z ≤ 0) − P (Z ≤ −8,83)
= 0,5 – 0
= 0,5
Donde Z es una normal (0,1).
Es decir, tenemos una probabilidad aproximada del 0,4616 de que la media del tiempo de
entrega de hoy haya estado entre 30 y 35 minutos.
Por lo que respecta a la segunda pregunta, de entrada, debemos pasar las horas a minutos,
ya que ésta es unidad con la que nos viene dada la variable.
Observen que 115 horas por 60 minutos nos dan 6.900 minutos. Se nos pide que
calculemos la probabilidad siguiente: P (Z >6900/200) = P(X> 34,5)
Y como que sabemos que la media se distribuye aproximadamente como una normal de
media 35 y desviación típica 0,566 (supondremos siempre que la distribución de la media
es normal, ya sea porque la variable de interés es normal o porque la muestra es lo
bastante grande), esta probabilidad se puede aproximar por la probabilidad de una
distribución normal estándar Z: P (Z > ((34,5 – 35) /2000,566) = P (Z > 0,88) = 1 − P (Z
< 0,88_ = 1 − 0,1894 =0.8194
Página 38
CONCLUSIÓN
La estadística es de suma importancia para la obtención, recolección y análisis de datos;
dichos resultados ayudan en la creación de proyectos y manejo de una mejor calidad de
vida para las personas que viven en la sociedad en donde la estadística es aplicada.
Página 39
lOMoARcPSD|11000467
BIBLIOGRAFÍA
● [Link]
● [Link]/watch?v=xWQun-Lyk7o
● [Link]/cursos/ciencias/2001065/.../cont_141_41. ht
● [Link] educativas/
● [Link]
03/a_6884/[Link]
● [Link]
Página 40