Tecnoló gico Nacional de México
Campus Cd. Juá rez
04 - abril - 2022
Lista de cotejo. U4
Probabilidad y estadística
Nombre: Ernesto Lázaro Ramírez
Número de control: 21111433
Carrera: Ing. en Tecnologías de la
Información y Comunicaciones
Maestro: Raúl Humberto Avitia Renova
4.1 Variables aleatorias continuas.
Las variables aleatorias continuas son aquellas que presentan un número
incontable de valores; por ejemplo, el peso de las vacas en una granja (una vaca
puede pesar 632.12 kg, otra puede pesar 583.123 kg, otra 253.156 kg, otra
198.087 kg y nunca terminaríamos de enumerar todos los posibles valores).
Ejemplo 1. La longitud de ciertos tornillos (en centímetros) es una variable
aleatoria con la siguiente función de densidad:
Para hacer cierto trabajo se prefieren tornillos con longitud entre 1,7 cm y 2,4 cm.
¿Cuál es la probabilidad de que un tornillo tenga dicha longitud?
Si la longitud de cada tornillo es independiente de la longitud de otro tornillo. ¿Cuál
es la probabilidad de que tres tornillos tengan la longitud que se prefiere?
Si para construir lo que se necesita con uno de estos tornillos hay que hacer un
gasto de $10 por cm de longitud que tenga el tornillo más un gasto fijo de $4.
¿Cuál es el gasto medio esperado por un tornillo?
Solución.
a) La variable es X: longitud de ciertos tornillos (en cm).
Calculamos la probabilidad pedida P (1,7 ≤ X ≤ 2,4) como el área bajo la curva de
densidad entre x=1,7 y x=2,4:
Una gráfica de la curva de densidad f mostrando el área comprendida
entre x=1,7 y x=2,4 es la siguiente:
b) Si llamamos T i al suceso de que el tornillo i tiene la longitud que se prefiere. La
probabilidad que buscamos puede expresarse así:
P (T 1∩ T 2∩ T 3)
Como son sucesos independientes:
P (T 1∩T 2∩T 3) = P (T 1 ¿P (T 2 ¿P (T 3)
Pero ya conocemos P (T i) porque la calculamos en el ítem a. Entonces:
P (T 1∩ T 2∩ T 3) =(0,50225)3 ≅ 0,1267
c) La variable gasto G depende de la variable X de la siguiente forma:
G = 10X + 4
Aplicando esperanza a cada miembro y usando propiedades de la esperanza
obtenemos:
E (G) = 10E (X) + 4
Entonces debemos calcular E (X).
Notemos que la función de densidad es simétrica respecto de x = 2. Así que es
razonable que hallamos obtenido que E (X) = 2.
Entonces:
E (G) = 10 * 2 + 4 = 24
Ejercicio 2. Las marcas obtenidas por un lanzador (distancias medidas en
decámetros) es una variable aleatoria continua con la siguiente función de
densidad:
Encontrar el valor de k.
Encontrar la probabilidad de que la distancia conseguida por el lanzador
sea mayor a 2 decámetros.
Encontrar la probabilidad de que la marca sea superior a 2,5 decámetros si
se sabe que es superior a 2 decámetros.
Encontrar la distancia media esperada.
Solución.
a) Si f es función de densidad, entonces el área bajo la curva en todo su recorrido
debe ser 1:
b) Podemos calcular la probabilidad de que X > 2 como el área bajo la curva de
densidad:
c) La “probabilidad de que la marca sea superior a 2,5 decámetros si se sabe que
es superior a 2 decámetros” es una probabilidad condicional:
Aplicando la definición de probabilidad condicional:
La intersección entre {X > 2,5} y {X > 2} es {X > 2,5}:
El denominador ya fue calculado en el ítem b, así que sólo queda calcular P (X >
2,5):
d) Recordemos que la esperanza matemática de una variable aleatoria continua
se define:
Entonces:
4.1.1 Valor esperado y varianza de una variable aleatoria
continua.
La media, llamada también valor esperado o esperanza, se denota con μ o E(X) y
su fórmula es:
La varianza, por su parte, es una medida de dispersión que se representa
con σ2 o V(X) y su fórmula es:
Por último, la desviación estándar es una medida de dispersión. Se representa
con σ y se calcula teniendo en cuenta que es la raíz cuadrada (positiva) de la
varianza:
Ejemplo 1. La variable aleatoria continua X tiene la siguiente función de densidad
de probabilidad:
Calcular el valor esperado, la varianza y la desviación estándar.
Solución.
Empezaremos graficando esta función de densidad de probabilidad.
Ten en cuenta que la función de densidad obtenida, tiene 3 tramos.
Ahora sí, calculamos la media o valor esperado:
Como la función tiene 3 tramos, expresaremos la integral original como la suma de
3 integrales:
Luego, calcularemos la varianza. Es mejor usar la fórmula alternativa:
Terminamos con la desviación estándar, que es la raíz cuadrada positiva de la
varianza:
Ejemplo 2. La variable aleatoria continua X tiene la siguiente función de densidad
de probabilidad:
Calcular el valor esperado, la varianza y la desviación estándar.
4.1.2 Regla empírica y Teorema de Chebyshev.
La regla empírica sugiere que cada dato que se puede observar caerá bajo tres
desviaciones estándar diferentes de la media en una distribución normal. De
acuerdo con la regla, el 68% de los datos caerán en la primera desviación
estándar, el 95% caerán en la primera y la segunda desviación y el 99,7% de los
datos caerán en las tres desviaciones:
68% – (µ ± σ),
95% – (µ ± 2σ)
99,7% – (µ ± 3σ)
El Teorema de Chebyshev dice que: para algún valor de k >1, la probabilidad de
que una variable aleatoria se encuentre entre la media menos k veces la
desviación estándar, y la media más k veces, la desviación estándar es mayor o
igual que (1 –1/k2).
La ventaja de este teorema es que se aplica a variables aleatorias discretas o
continuas con cualquier distribución de probabilidad, pero la regla definida a partir
de él no siempre es muy precisa, pues depende de la simetría de la distribución.
La regla empírica definida a partir de este teorema es:
Si k = √2, se dice que el 50% de los datos están en el intervalo: [µ – √2 s, µ + √2 s]
Si k = 2, se dice que el 75% de los datos están en el intervalo: [µ – 2 s, µ + 2 s]
Si k = 3, se dice que el 89% de los datos están en el intervalo: [µ – 3 s, µ + 3 s]
Ejemplo 1. En una reserva de fauna silvestre se estima que hay un promedio de
16.000 conejos con una desviación estándar de 500 conejos. Si se desconoce la
distribución de la variable ‘número de conejos en la reserva’, ¿es posible estimar
cuál es la probabilidad de que la población de conejos esté entre 15.000 y 17.000
conejos?
Solución.
Se puede presentar el intervalo en estos términos:
15000 = 16000 – 1000 = 16000 – 2(500) = µ – 2 s
17000 = 16000 + 1000 = 16000 + 2(500) = µ + 2 s
Por tanto: [15000, 17000] = [µ – 2 s, µ + 2 s]
Aplicando el teorema de Tchebyshev, se tiene una probabilidad de al menos el
0.75 de que la población de conejos de la reserva de fauna silvestre esté entre
15.000 y 17.000 conejos.
Ejemplo 2. El peso promedio de niños de un año en un país se distribuye
normalmente con una media de 10 kilogramos y una desviación estándar de
aproximadamente 1 kilogramo.
a) Estimar el porcentaje de niños de un año en el país que tienen un peso
promedio entre 8 y 12 kilogramos.
8 = 10 – 2 = 10 – 2(1) = µ – 2 s
12 = 10 + 2 = 10 + 2(1) = µ + 2 s
Por tanto: [8, 12] = [µ – 2s, µ + 2s]
Según la regla empírica se puede afirmar que el 68.27% de los niños de un año
del país tienen entre 8 y 12 kilogramos de peso.
b) ¿Cuál es la probabilidad de hallar un niño de un año de 7 kilogramos o menos
de peso?
7 = 10 – 3 = 10 – 3(1) = µ – 3 s
Se sabe que 7 kilogramos de peso representan el valor µ – 3s, así como también
se conoce que el 99.73% de los niños están entre 7 y 13 kilogramos de peso. Eso
deja solo el 0.27% del total de niños para los extremos. La mitad de ellos, el
0.135%, tiene 7 kilogramos de peso o menos y la otra mitad, 0.135%, tiene 11
kilogramos de peso o más.
Entonces, se puede concluir que hay una probabilidad de 0.00135 de que un niño
tenga 7 kilogramos de peso o menos.
c) Si la población del país alcanza 50 millones de habitantes y los niños de 1 año
representan el 1% de la población del país, ¿Cuántos niños de un año tendrán un
peso entre 9 y 11 kilogramos?
9 = 10 – 1 = µ – s
11 = 10 + 1 = µ + s
Por tanto: [9, 11] = [µ – s, µ + s]
De acuerdo con la regla empírica, el 68.27% de los niños de un año en el país
están en el intervalo [µ – s, µ + s]
En el país hay 500000 niños de un año (el 1% de 50 millones), por lo que 341350
niños (el 68.27% de 500000) tienen entre 9 y 11 kilogramos de peso.
4.2 Distribución de probabilidad de una variable aleatoria
uniforme.
La distribución Uniforme es el modelo continuo más simple. Corresponde al caso
de una variable aleatoria que sólo puede tomar valores comprendidos entre dos
extremos a y b, de manera que todos los intervalos de una misma longitud (dentro
de (a, b)) tienen la misma probabilidad. También puede expresarse como el
modelo probabilístico correspondiente a tomar un número al azar dentro de un
intervalo (a, b)
La función de densidad de la variable aleatoria uniforme continua X en el intervalo
[A, B] es:
Asimismo, la media y la varianza de la distribución uniforme continua ʄ (x;A,B) son:
Ejemplo 1. Una compañía que brinda servicio eléctrico provee niveles de voltajes
uniformemente distribuidos, entre 123.0 V y 125.0 V. Esto significa que en la toma
doméstica es posible obtener cualquier valor de voltaje que pertenezca a dicho
intervalo.
Entonces, según lo visto anteriormente, la gráfica de la función de densidad es el
rectángulo en rojo:
Calcular la probabilidad de tener un voltaje dentro del intervalo dado es muy fácil,
por ejemplo ¿cuál es la probabilidad de que la compañía envíe un voltaje menor a
123.5 V?
Esta probabilidad equivale al área del rectángulo sombreado en azul:
P (X<123.5) = (123.5 −123.0) x 0.5 = 0.25
Y ¿cuál es la probabilidad de que el voltaje entregado sea mayor que 124.0 V?
Como el área total es igual a 1, la probabilidad buscada es:
P (X>124.0 V) = 1 – (1×0.5) = 0.5
Tiene sentido, ya que 124.0 es precisamente el valor en el centro del intervalo.
Ejemplo 2. Cierta variable aleatoria X tiene una distribución uniforme en el
intervalo [0,100]. Determinar:
La probabilidad de que el valor de X sea menor que 22.
La probabilidad de que X tome valores entre 20 y 35.
El valor esperado, la varianza y la desviación estándar de esta distribución.
a) Se determina de modo semejante al ejemplo anterior, pero antes hay que
determinar la altura del rectángulo, recordando que el área total debe ser igual a 1:
Área = 100 × altura = 1
Por lo tanto, el rectángulo tiene una altura igual a 1 / 100 = 0.01
P (X < 22) = 22 × 0.01 = 0.22
b) La probabilidad pedida equivale al área del rectángulo cuyo ancho es (35 – 20)
y cuya altura es 0.01:
P (22 <X <35) = (35 – 20) × 0.01 = 0.15
Si se prefiere acudir directamente a la función de distribución dada anteriormente,
entonces solo hay que sustituir los valores en:
P (20 ≤ X ≤ 35) =F (35) - F (20)
Con F(x) dada por:
F (x) = (x - a) / (b - a)
Los valores a introducir son:
a=0
b= 100
F (35) = (35 - 0) / (100 - 0) = 0.35
F (20) = (20 - 0) / (100 - 0) = 0.20
P(20 ≤ X ≤ 35) =0.35 - 0.20 = 0.15
c) El valor esperado es:
E(X)= (a + b) / 2 = (100 + 0) / 2 = 50
La varianza es:
V(X) = (b - a) 2 / 12= (100 - 0) 2 / 12 = 833.33
Y la desviación estándar es:
D(X) = √833.33 = 28.87
4.3 Distribución de probabilidad de una variable aleatoria
normal
La función de densidad de probabilidad para la variable aleatoria continua fue
descubierta por Carl Gauss al estudiar el comportamiento de los procesos
aleatorios. Es ampliamente utilizada en estadística y teoría de las probabilidades.
Esta función, también conocida como distribución normal tiene la forma de una
campana, por este motivo también es conocida como la campana de Gauss. Sus
características son las siguientes:
Es una distribución simétrica.
Es asintótica, es decir sus extremos nunca tocan el eje horizontal, cuyos
valores tienden a infinito.
En el centro de la curva se encuentran la media, la mediana y la moda.
El área total bajo la curva representa el 100% de los casos.
Los elementos centrales del modelo son la media y la varianza.
De acuerdo con lo anterior, se aprecian las siguientes características:
1. Su dominio es
2. Es continua.
3. Su rango es
4.
5. Su derivada es:
6. El máximo de la función se ubica en el punto
Ejemplo 1. Los salarios mensuales de los recién graduados que acceden a su
primer empleo se distribuyen según una ley normal de media 1300 € y desviación
típica 600 €. Calcular el porcentaje de graduados que cobran:
a) Menos de 600 € al mes.
b) Entre 1000 y 1500 € al mes.
c) Más de 2200 € al mes.
Solución.
o x: variable aleatoria “salarios mensuales, en euros, de los recién graduados
en su primer empleo”.
o La distribución de la variable x es N (1300, 600); μ = 1300; σ = 600.
o Hay que tipificar la variable para obtener las probabilidades a partir de la
tabla N (0, 1).
Ejemplo 2. Se estima que el tiempo en horas que se necesita para memorizar un
tema de Historia de la Filosofía es una variable aleatoria normal, cuya media y
varianza se desconocen. Calcular la media y la desviación típica de esta
distribución si se sabe que las tres cuartas partes de las estudiantes necesitan
más de 3 horas y que el 5% necesita más de 6 horas para memorizarlo.
Solución:
o x: variable aleatoria “tiempo, en horas, necesario para memorizar un tema
de Historia de la Filosofía”.
La distribución de la variable x es N (μ, σ), siendo ambos parámetros
desconocidos.
o Las tres cuartas partes de las estudiantes necesitan más de 3 horas → P (x
> 3) = 0,75.
o El 5% necesita más de 6 horas → P (x > 6) = 0,05.