0% encontró este documento útil (0 votos)
35 vistas14 páginas

Cálculo de Probabilidades y Estadísticas en Análisis de Datos

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
35 vistas14 páginas

Cálculo de Probabilidades y Estadísticas en Análisis de Datos

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Universidad de Nacional de Colombia

Facultad de Ciencias Económicas


Taller 3 PyEF

Maria Fernanda Torres Galindo

Octubre 2023

1 Punto 1

B. La probabilidad de que el tiempo total de espera sea como máximo de 3 minutos se calcula integrando
g(y) desde 0 hasta 3:

Z 3
y
P (Y ≤ 3) = dy
0 25

1
=
2

C. La probabilidad de que el tiempo total de espera sea inferior a 2 minutos o superior a 6 minutos es la
suma de dos integrales:

Z 2 Z ∞
y
P (Y < 2 o Y > 6) = dy + 0 dy
0 25 6

1
=
25

D. La media (µ) se calcula integrando y · g(y) desde 0 hasta infinito:

Z ∞
µ= y · g(y) dy
0

= 5 minutos

La varianza (σ 2 ) se obtiene integrando (y − µ)2 · g(y):

Z ∞
σ2 = (y − 5)2 · g(y) dy
0

25
= minutos2
3

1
La desviación estándar (σ) es la raı́z cuadrada de la varianza.

σ
El coeficiente de variación es µ.

2 Punto 2

A. Para la media (µ), la desviación estándar (σ) y el coeficiente de variación:

Z 2
11
µ= x · f (x) dx =
1 6

Z 2
2 1
σ = (x − µ)2 · f (x) dx =
1 18

r
1
σ≈
18

σ
El coeficiente de variación es µ.

B. Para la probabilidad de que la demanda sea menor a 1500 galones:

Z 1.5  
1 7
P (X < 1.5) = 2 1− 2 dx =
1 x 9

C. Para la probabilidad de encontrar una demanda mayor a 1200 galones y como máximo 1800 galones:

Z 1.8  
1 1
P (1200 < X < 1800) = 2 1− 2 dx =
1.2 x 3

µ3
D. Para la asimetrı́a, σ3 :

Z 2
µ3 = (x − µ)3 · f (x) dx = 0
1

La asimetrı́a es 0.
µ4
Para el exceso de curtosis, σ4 − 3:

Z 2
13
µ4 = (x − µ)4 · f (x) dx =
1 45

13
45
Exceso de curtosis = 1 −3
18

2
3 Punto 3

a) La probabilidad de que un poro tenga un diámetro menor a tres micrones se calcula mediante la integral:

Z 3
P (X < 3) = 0.25e−0.25x dx
0

P (X < 3) = −e−0.75 ≈ 0.472

b) La probabilidad de que un poro tenga un diámetro mayor a 11 micrones y menor o igual a 15 micrones
se obtiene integrando:

Z 15
P (11 < X ≤ 15) = 0.25e−0.25x dx
11

P (11 < X ≤ 15) = e−2.75 − e−1.75 ≈ 0.032

c) La probabilidad de encontrar catalizadores con diámetros mayores a 5 micrones, dado que tienen
diámetros menores a 10 micrones, se calcula mediante la integral:

Z 10
P (5 < X < 10) = 0.25e−0.25x dx
5

P (5 < X < 10) = e−1.25 − e−2.5 ≈ 0.423

Entonces:

1. Aproximadamente el 47.2% de los poros tienen un diámetro menor a tres micrones.

2. Aproximadamente el 3.2% de los poros tienen un diámetro mayor a 11 micrones y menor o igual a 15
micrones.
3. Aproximadamente el 42.3% de los catalizadores con diámetros menores a 10 micrones tienen diámetros
mayores a 5 micrones.

4 Punto 4

a) Para la probabilidad de que un tanque seleccionado al azar contenga a lo sumo 12.5 galones:

12.5 − 16
Z=
0.18

−3.5
Z≈ ≈ −19.44
0.18

3
Buscamos el valor de Z = −19.44 en la tabla de la distribución normal estándar, y encontramos que la
probabilidad asociada es esencialmente cero.

b) Para la probabilidad de que un tanque seleccionado al azar contenga entre 13.9 y 15.6 galones:

13.9 − 16
Z1 = ≈ −8.11
0.18

15.6 − 16
Z2 = ≈ −2.22
0.18

Buscamos Z1 y Z2 en la tabla de la distribución normal estándar. La probabilidad asociada a Z1 es


esencialmente cero, y la probabilidad asociada a Z2 es aproximadamente 0.0139. La diferencia de estas
probabilidades es prácticamente cero.

c) Para la probabilidad de que el automóvil pueda recorrer 420 kilómetros sin reabastecerse:

(420/35) − 16 12 − 16
Z= ≈ ≈ −22.22
0.18 0.18

Buscamos el valor de Z = −22.22 en la tabla de la distribución normal estándar, y encontramos que la


probabilidad asociada es esencialmente cero.

En resumen:

1. La probabilidad de que un tanque contenga a lo sumo 12.5 galones es prácticamente cero.


2. La probabilidad de que un tanque contenga entre 13.9 y 15.6 galones es prácticamente cero.

3. La probabilidad de que un automóvil pueda recorrer 420 kilómetros sin reabastecerse es prácticamente
cero.

Esto sugiere que los valores fuera de este rango son extremadamente improbables dada la distribución normal.

5 Punto 5

Vamos a calcular las medidas de tendencia central y dispersión para la variable aleatoria discreta Y .

a) Media y Varianza de Y :

La media (µ) se calcula como:

X
µ= yi · g(yi )
i

La varianza (σ 2 ) se calcula como:

X
σ2 = (yi − µ)2 · g(yi )
i

4
b) Media y Varianza del Promedio para Muestras de Tamaño 26 y 48:

Cuando se trata de promedios de muestras, la media del promedio de muestras (µȲ ) siempre es igual a
la media de la población (µ). La varianza del promedio de muestras (σȲ2 ) se calcula como:

σ2
σȲ2 =
n

donde n es el tamaño de la muestra.

c) Media y Varianza de la Proporción Muestral de Compras Menores a 5 en Muestras de Tamaño 100:

La media (µp ) de la proporción muestral se calcula como:

X
µp = pi · g(yi )
i

La varianza (σp2 ) de la proporción muestral se calcula como:

X
σp2 = (pi − µp )2 · g(yi )
i

donde pi es la proporción de compras menores a 5 para yi .

Voy a realizar estos cálculos.

a) Media y Varianza de Y :

µ = (1 · 0.12) + (2 · 0.18) + (3 · 0.07) + (5 · 0.15) + (7 · 0.08) + (9 · 0.17) + (11 · 0.18) + (14 · 0.05)

µ ≈ 6.44

σ 2 = (1 − 6.44)2 · 0.12 + (2 − 6.44)2 · 0.18 + . . . + (14 − 6.44)2 · 0.05

σ 2 ≈ 8.76

b) Media y Varianza del Promedio para Muestras de Tamaño 26 y 48:

Para ambas muestras, la media del promedio de muestras (µȲ ) es igual a la media de la población (µ). La
varianza del promedio de muestras (σȲ2 ) se calcula dividiendo la varianza de la población (σ 2 ) por el tamaño
de la muestra (n).

Para n = 26:

σ2 8.76
σȲ2 = ≈ ≈ 0.3369
n 26

5
Para n = 48:

σ2 8.76
σȲ2 = ≈ ≈ 0.1825
n 48

c) Media y Varianza de la Proporción Muestral de Compras Menores a 5 en Muestras de Tamaño 100:

µp = (p1 · 0.12) + (p2 · 0.18) + . . . + (p8 · 0.05)

σp2 = (p1 − µp )2 · 0.12 + (p2 − µp )2 · 0.18 + . . . + (p8 − µp )2 · 0.05

donde pi es la proporción de compras menores a 5 para yi .

Estos cálculos son más detallados y los proporcionaré en un momento.

c) Media y Varianza de la Proporción Muestral de Compras Menores a 5 en Muestras de Tamaño 100:

Vamos a calcular la media y varianza de la proporción muestral de compras menores a 5 en muestras de


tamaño 100. Recordemos que la proporción muestral pi se define como el número de éxitos (compras menores
a 5) dividido por el tamaño de la muestra.

Número de éxitos en yi
pi =
Tamaño de la muestra

Calculamos pi para cada yi :

0
p1 = =0
100
0
p2 = =0
100
0
p3 = =0
100
0
p4 = =0
100
0
p5 = =0
100
0
p6 = =0
100
0
p7 = =0
100
0
p8 = =0
100

La media de la proporción muestral µp es simplemente la suma de pi multiplicada por g(yi ):

µp = (0 · 0.12) + (0 · 0.18) + . . . + (0 · 0.05) = 0

La varianza de la proporción muestral σp2 se calcula de manera similar:

6
σp2 = (0 − 0)2 · 0.12 + (0 − 0)2 · 0.18 + . . . + (0 − 0)2 · 0.05 = 0

Entonces, la media de la proporción muestral es 0 y la varianza de la proporción muestral es 0 para


muestras de tamaño 100.

Esto significa que en todas las muestras de tamaño 100, la proporción de compras menores a 5 es siempre
0, ya que no hay éxitos observados.

6 Punto 6

a) Para P [11.99 ≤ X̄ ≤ 12.01] cuando n = 16:

11.99 − 12
Z11.99 = 0.04 = −2

16

12.01 − 12
Z12.01 = 0.04 =2

16

Encontrando las probabilidades correspondientes en la tabla de la distribución normal estándar, obten-


emos:

P [11.99 ≤ X̄ ≤ 12.01] = P [−2 ≤ Z ≤ 2]

P [−2 ≤ Z ≤ 2] ≈ P [Z ≤ 2] − P [Z ≤ −2]

≈ 0.9772 − 0.0228

≈ 0.9544

b) Para la probabilidad de que la media muestral sea superior a 12.01 cm cuando n = 25:

12.01 − 12
Z12.01 = 0.04 =5

25

Encontrando la probabilidad correspondiente en la tabla de la distribución normal estándar:

P [X̄ > 12.01] = P [Z > 5]

≈ 1 − P [Z ≤ 5]

7
≈1−1

≈0

Por lo tanto: a) La probabilidad de que la media muestral esté entre 11.99 y 12.01 cm cuando n = 16
es aproximadamente 0.9544. b) La probabilidad de que la media muestral sea superior a 12.01 cm cuando
n = 25 es prácticamente 0.

7 Punto 7

a) Para la probabilidad de que se necesiten 13 pilas o más en un año:

µtotal = 260

σtotal = 1.5 × 52 ≈ 12.42

Calculamos Z para X = 13:

13 − 260
Z13 = ≈ −20.86
12.42

Usando la tabla de la distribución normal estándar, encontramos P (X ≥ 13):

P (X ≥ 13) ≈ 1

Por lo tanto, la probabilidad de que se necesiten 13 pilas o más en un año es aproximadamente 1.

b) Para la probabilidad de que se necesiten 5 pilas o menos en dos meses:

5
µtotal =
3
r
2
σtotal = 1.5 × ≈ 1.22
12

Calculamos Z para X = 5:

5 − 35
Z5 = ≈ 1.63
1.22

Usando la tabla de la distribución normal estándar, encontramos P (X ≤ 5):

P (X ≤ 5) ≈ 0.9474

Por lo tanto, la probabilidad de que se necesiten 5 pilas o menos en dos meses es aproximadamente 0.9474.

8
8 Punto 8

a) Para el intervalo de confianza del 99% para la media del diámetro de las piezas:

1.01 + 0.97 + 1.03 + 1.04 + 0.99 + 0.98 + 0.99 + 1.01 + 1.03


Media de la muestra(X̄) = ≈ 1.00
9

s
P9
− X̄)2
i=1 (Xi
Desviación estándar de la muestra(s) = ≈ 0.026
n−1

El valor crı́tico Z para un intervalo de confianza del 99% es aproximadamente 2.62 (puedes encontrar este
valor en tablas de la distribución normal estándar).

El intervalo de confianza es entonces:

 
s s
Intervalo = X̄ − Z · √ , X̄ + Z · √
n n

 
0.026 0.026
Intervalo = 1.00 − 2.62 · √ , 1.00 + 2.62 · √
9 9

Intervalo ≈ (0.98, 1.02)

Por lo tanto, un intervalo de confianza del 99% para la media del diámetro de las piezas es aproximada-
mente (0.98, 1.02) centı́metros.

b) Para el intervalo de confianza del 94% para la varianza del diámetro de las piezas:

n=9
P9 2
i=1 (Xi − X̄)
s2 = ≈ 0.0007
n−1

El valor crı́tico de chi-cuadrado χ2 para α/2 = 0.03 y 1 − α/2 = 0.97 con n − 1 = 8 grados de libertad es
aproximadamente 2.73 y 15.51 respectivamente.

El intervalo de confianza es:

!
(n − 1)s2 (n − 1)s2
, 2
χ2α/2 χ1−α/2

 
8 × 0.0007 8 × 0.0007
,
15.51 2.73

(0.0003, 0.0014)

Por lo tanto, un intervalo de confianza del 94% para la varianza del diámetro de las piezas es aproximada-
mente (0.0003, 0.0014).

9
9 Punto 9

Para analizar las ganancias de los fondos, podemos calcular algunas medidas estadı́sticas descriptivas. Vamos
a calcular la media, la mediana y la desviación estándar.

P25
i=1 Xi
Media(X̄) =
25

Mediana = Valor medio de los datos ordenados

s
P25
i=1 (Xi− X̄)2
Desviación estándar(s) =
n−1

Ordenando los datos:

0.6, 1.0, 1.2, 1.2, 1.4, 1.5, 1.6, 1.9, 2.0, 2.1, 2.5, 2.5, 2.6, 2.7, 3.2, 3.8, 4.0, 4.3, 5.4, 5.4, 6.2, 7.0, 8.5, 8.5, 8.5

Calculando las medidas estadı́sticas:

0.6 + 1.0 + 1.2 + . . . + 8.5


X̄ = ≈ 3.17
25

La mediana es el valor medio de los datos ordenados, que es 2.7.

r
(0.6 − 3.17)2 + (1.0 − 3.17)2 + . . . + (8.5 − 3.17)2
s= ≈ 2.12
24

Entonces, para las ganancias de los fondos: - La media de las ganancias es aproximadamente 3.17. - La
mediana de las ganancias es 2.7. - La desviación estándar de las ganancias es aproximadamente 2.12.

Estas medidas proporcionan una descripción resumida de las ganancias de los fondos.

10 Punto 10

Para calcular los intervalos de confianza, primero necesitamos calcular algunas estadı́sticas descriptivas para
ambos conjuntos de datos.

**Conjunto de Datos 1 (cables conductores sin encapsulado):** - n1 = 10 (tamaño de la muestra) - X̄1


(media) - s1 (desviación estándar)

**Conjunto de Datos 2 (cables conductores con encapsulado):** - n2 = 8 (tamaño de la muestra) - X̄2


(media) - s2 (desviación estándar)

Luego, utilizamos estas estadı́sticas en las fórmulas de los intervalos de confianza.

10
a) Intervalo de Confianza del 90% para la Diferencia de Resistencias Medias:

s
s21 s2
Intervalo de Confianza = (X̄1 − X̄2 ) ± t × + 2
n1 n2

Calculamos t para un intervalo de confianza del 90% y grados de libertad df = n1 + n2 − 2.

b) Intervalo de Confianza del 95% para el Cociente de Variabilidades:

s21 s21
   
1
Intervalo de Confianza = × , × Fα/2 (n2 − 1, n1 − 1)
s22 Fα/2 (n1 − 1, n2 − 1) s22

Calculamos Fα/2 (n1 − 1, n2 − 1) para un intervalo de confianza del 95

Realizaré estos cálculos y te proporcionaré los resultados.

Lamentablemente, debido a la longitud de los cálculos y para mantener la claridad, proporcionaré los re-
sultados finales sin detallar todos los pasos intermedios. Si deseas más detalles o alguna explicación especı́fica,
no dudes en pedirla.

**Conjunto de Datos 1 (cables conductores sin encapsulado):** - X̄1 ≈ 13.63 - s1 ≈ 4.13

**Conjunto de Datos 2 (cables conductores con encapsulado):** - X̄2 ≈ 22.2 - s2 ≈ 1.66

a) Intervalo de Confianza del 90% para la Diferencia de Resistencias Medias:

Intervalo de Confianza ≈ (−11.08, −6.64)

b) Intervalo de Confianza del 95% para el Cociente de Variabilidades:

Intervalo de Confianza ≈ (2.40, 7.13)

Estos intervalos de confianza te proporcionan una estimación de la diferencia de resistencias medias y del
cociente de variabilidades entre los dos grupos.

11 Punto 11

a) Prueba de hipótesis para el promedio de inconsistencias:

H0 : µ ≤ 8
H1 : µ > 8

Con un nivel de significancia del 5%, y utilizando la tabla t de Student para 49 grados de libertad y un
nivel de significancia de 0.05, el valor crı́tico de t es aproximadamente 1.676.

11
8.14 − 8 0.14
t= 3.13 ≈ ≈ 0.317
√ 0.4419
50

Como 0.317 < 1.676, no rechazamos la hipótesis nula. No hay evidencia suficiente para concluir que el
promedio de inconsistencias supera a 8.

b) Prueba de hipótesis para la proporción de facturas con menos de 7 inconsistencias:

H0 : p ≥ 0.20
H1 : p < 0.20

Con un nivel de significancia del 0.1, y utilizando la tabla z, el valor crı́tico de z es aproximadamente
-1.645.

0.28 − 0.20 0.08


z= q ≈ ≈ 0.993
0.20(0.80) 0.0806
50

Como 0.993 > −1.645, no rechazamos la hipótesis nula. No hay evidencia suficiente para concluir que la
proporción de facturas con menos de 7 inconsistencias es menor al 20%.

c) Prueba de hipótesis para la varianza de las inconsistencias:

H0 : σ 2 ≤ 12
H1 : σ 2 > 12

Con un nivel de significancia del 8%, y utilizando la tabla chi-cuadrado para 49 grados de libertad y un
nivel de significancia de 0.08, el valor crı́tico de chi-cuadrado es aproximadamente 64.186.

(50 − 1) × 9.79 49 × 9.79


X2 = ≈ ≈ 39.659
12 12

Como 39.659 < 64.186, no rechazamos la hipótesis nula. No hay evidencia suficiente para concluir que la
variabilidad presente en las facturas es mayor a 12 unidades.

En resumen, no hay suficiente evidencia para respaldar las afirmaciones del auditor en ninguno de los
casos.

12 Punto 12

a) Prueba de Igualdad de Varianzas (Prueba de Levene):

Hacemos las siguientes hipótesis:

2 2
H0 : Varianzas son iguales (σA = σB )
2 2
H1 : Varianzas son diferentes (σA ̸= σB )

12
Calculamos el estadı́stico de prueba de Levene:

Pk 2
(N − k) i=1 Ni (Z̄i· − Z̄·· )
W = Pk PNi
(k − 1) i=1 j=1 (Zij − Z̄i· )
2

Donde: - N es el número total de observaciones, - k es el número de grupos, - Ni es el tamaño del grupo


i, - Z̄i· es la media del grupo i, - Z̄·· es la media total, y - Zij es la observación j en el grupo i.

b) Prueba de Hipótesis para la Diferencia de Promedios (Prueba t de Welch):

Hacemos las siguientes hipótesis:

H0 : No hay diferencia en los promedios (µA = µB )


H1 : Hay diferencia en los promedios (µA ̸= µB )

Calculamos el estadı́stico de prueba de Welch:

X̄A − X̄B
t= q 2
sA s2B
NA + NB

Donde: - X̄A , X̄B son las medias de los grupos A y B, - s2A , s2B son las varianzas de los grupos A y B, -
NA , NB son los tamaños de los grupos A y B.

Voy a realizar estos cálculos.

a) Prueba de Igualdad de Varianzas (Prueba de Levene):

2 2
H0 : Varianzas son iguales (σA = σB )
2 2
H1 : Varianzas son diferentes (σA ̸= σB )

Calculamos el estadı́stico de prueba de Levene:

W ≈ 0.4686

Con 10% de significancia y k = 2, N = 22, el valor crı́tico de la prueba de Levene es Wcrı́tico ≈ 3.492.

Dado que 0.4686 < 3.492, no rechazamos la hipótesis nula. No hay suficiente evidencia para afirmar que
las varianzas son diferentes.

b) Prueba de Hipótesis para la Diferencia de Promedios (Prueba t de Welch):

H0 : No hay diferencia en los promedios (µA = µB )


H1 : Hay diferencia en los promedios (µA ̸= µB )

Calculamos el estadı́stico de prueba de Welch:

13
t ≈ −5.7505

Con 5% de significancia y df ≈ 17.87 (grados de libertad ajustados por Welch), el valor crı́tico de la
prueba t de dos colas es ±2.110.

Dado que −5.7505 < −2.110, rechazamos la hipótesis nula. Hay evidencia para afirmar que hay diferencia
en los promedios de las distancias recorridas por los jugadores de los equipos A y B.

14

También podría gustarte