0% encontró este documento útil (0 votos)
47 vistas20 páginas

Modelos Probabilísticos

Modelos probabilísticos útiles para exámenes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
47 vistas20 páginas

Modelos Probabilísticos

Modelos probabilísticos útiles para exámenes
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Modelos.

pdf

S_Sublime

Probabilidad y Estadística

2º Grado en Ingeniería de Tecnologías y Servicios de


Telecomunicación

Escuela Politécnica Superior


Universidad Autónoma de Madrid

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
© Maria Durban 2016

Chapter 3

Reservados todos los derechos.


Modelos de probabilidad

Muchos sistemas fı́sicos se pueden modelizar mediante variable aleatorias muy similares.
En este tema vamos a estudiar varias variables discretas y continuas que aparecen sis-
temáticamente en aplicaciones y problemas reales.

1 El proceso de Bernouilli
m
Cuando tenemos un exterimento con las siguientes caracterı́sticas:

1. Sólo hay dos posibles resultados:


3

• Aceptable (A)
uc

• Defectuoso (D)

2. La proporciónde A y D es constante en la población y se mantiene contanste indepen-


dientemente del tamaño de la muestra observada.

P (D) = p
P (A) = 1 − p = q

3. Las observaciones son independientes.

Enetonces, tenemos un experimento de Bernouilli. Ejemplos serı́an:

• Lanzar una moneda.

• Observar si una pieza es defectuosa o no.

• El sexo de un recién nacido.

• Transmisión (correcta o incorrecta) de un bit en un canal digital.

37

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
De este modo, la distribución de Bernoiulli se puede resumir como:

0 si A ocurre → P (X = 0) = 1 − p = q
X=
1 si A no ocurre → P (X = 1) = p

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La función de probabilidad viene dada por:

p(x) = px (1 − p)1−x x = 0, 1

La media y la varianza son:

µ = E[X] = 0 × (1 − p) + 1 × p = p
σ 2 = V ar[X] = (0 − p)2 (1 − p) + (1 − p)2 p = p(1 − p)

1.1 Distribución Binomial


Cuando un experimento de Bernouilli (con probabilidad de éxtito p) se repite un número fijo

Reservados todos los derechos.


de veces, n, la variable X que mide el número de éxitos es una variable aleatoria Binomial
con parámetros n y p, y que se identifica de la siguiente forma:
3m
X ∼ B(n, p), x = 0, 1, . . . n

La función de probabilidad es:


 
n r
P (X = r) = p (1 − p)n−r , r = 0, 1, . . . n
r

uc

La cantidad nr es el número total de posibles resultados en los que hay r éxitos y n − r


fracasos, y pr (1 − p)n−r es la probabilidad de que cada uno de ellos ocurra. La función de
probabilidad no es simétrica, a menos que el valor de n sea grande:
1 Bernouilli Process
n=5

n=25 p=0.75 p=0.5 p=0.2

9
Estadística, Profesora: María Durbán

Si X es una variable aleatoria Binomial con parámetros n y p:

E[X] = np V ar[X] = np(1 − p)

38

Compra Coins y descarga sin publicidad.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
Ejemplo
Un aparato eléctrico tiene 40 circuitos integrados. La probabilidad de fallo de cada circuito
es 0.01, y fallan de forma independiente. El aparato funciona si ningún circuito falla. ¿Cuál
es la probabilidad de que el aparato funcione?.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Lo primero que hemos de hacer es definir la variable aleatoria que está detrás del exper-
imento: X =número de circuitos que fallan entre 40. Entonces, es fácil ver que nos piden
P (X = 0). Pero, ¿es ésta una variable Binomial?.

• Experimento: Observar si un circuito falla o no, se repite 40 veces.

• Los circuitos fallan de forma independiente.

• La probabilidad de fallo es constante, 0.01.

Entonces X ∼ B(40, 0.01), y,

Reservados todos los derechos.


 
40
P (X = 0) = 0.010 (1 − 0.01)4 0 = 0.669
0
3m
1.2 Distribución Geométrica
Supongamos de nuevo que tenemos un exterimento de Bernouilli, pero en vez de repetir
el experimento un número determinado de veces, los experimentos se repiten hasta que
se obtiene un éxito. La variable aleatoria X =número de experimentos realizados hasta
conseguir el primer éxito es una1 variable
Bernouilli Process
aleatoria geometrica con parámetro p y se identifica
uc

como:
X ∼ Ge(p)
Geometric distribution
Si Xi , i = 1, . . . son variables Bernouilli:
X i i = 1,.....n are Bernouilli
X1 X 2 X3 X4 L X
↓ ↓ ↓ ↓ ↓
1 0 0 0 L ⇒ X =1 Pr( X = 1) = p
0 1 0 0 L ⇒ X = 2 Pr( X = 2) = qp
0 0 1 0 L ⇒ X = 3 Pr( X = 3) = qqp
0 0 0 1 L ⇒ X = 4 Pr( X = 4) = qqqp

The probability
La función de probabilidad es: function is:

−1 r = 1, 2, . . .
P( X = r ) = (1 − p)
P (X = r) = (1 − p)r−1rp,
p, r = 1, 2, K
14
Estadística, Profesora: María Durbán

39

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
1 Bernouilli Process
Geometric distribution
© Maria Durban 2016

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
16
Estadística, Profesora: María Durbán
y
E[X] = 1/p V ar[X] = (1 − p)/p2

Reservados todos los derechos.


Hay otras variables relacionadas con el proceso de Bernouilli, como la Binomial Negativa,
Multinomial, etc., pero no son el objeto de este tema.
3m
Ejemplo
La probabilidad de que un bit transmitido a través de un canal digital, sea recibido como un
error es 0.01. Si las transmisiones son independientes, cuál es la probabilidad de que haya
exactamente 125 transmisiones antes de que ocurra el primer error?. ¿Cuál es el número
medio de transmisiones que hemos de realizar hasta que ocurre el primer error?.
uc

definimos X =Número de transmisiones hasta que ocurre el primer error, entonces:

P (X = 125) = 0.99124 × 0.01 = 0.0029 E[X] = 1/p = 1/0.01 = 100

2 Proceso de Poisson
Ahora vamos a describir un modelo probabilı́stico que se utiliza para describir sucesos im-
predecibles y que muestran una cierta regularidad. Ejemplos serı́an, el momento en el que
un cliente entra en una tienda, o el número de errores en un trozo de código.

Un proceso de Poisson se caracteriza por las siguientes propiedades:

1. El número de sucesos en un intervalo de tiempo o en una región especı́fica es indepen-


diente del número de sucesos ocurridos en otro intervalo o región disjunta. En este
sentido diremos que el proceso de Poisson no tiene memoria.

2. La probabilidad de que un suceso ocurra en un intervalo pequeño de espacio o tiempo


es proporcional al tamaño del intervalo y no depende del número de sucesos ocurridos
fuera del intervalo.

40

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
© Maria Durban 2016
3. La probabilidad de que más de un suceso ocurra en un intervalo pequeño es negligible.

2.1 Distribución de Poisson


El siguiente ejemplo (tomado de Montgomery y Runger (2003)) nos ayudará a introducir la
variable de Poisson como el lı́mite de una variable Binomial.
Poisson Process
Consideremos la transmisión de n bits, y definimos la variable aleatoria X= número de
bits erroneos. Cuando la probabilidad de error es constante y las transmisiones son inde-
Poissoncon
pendientes, la variable X es Binomial distribution
parámetros n y p (la probabilidad de error). Si

Reservados todos los derechos.


llamamos λ = np = E[X], entonces p = λ/n, y la función de probabilidad de X en función
de λ viene dada por:X = Number of events  inan
 interval
r  of fixed
n−rlength
n λ λ
P (X = r) = 1− .
r n as a limit
Poisson distribution can be obtained n of the Binomial
distribution
Supongamos que when
el número → transmitidos
de nbits ∞ y p → 0 aumenta y la probabilidad de error decrece
de modo que np = λ permanece constante, es decir, n → ∞ y p → 0, entonces:
λ = np → Average number of events in that interval
n−r
⎛ n⎞⎛ λ ⎞ ⎛ λ⎞
r

lim Pr( X = r ) = lim ⎜ ⎟ ⎜ ⎟ ⎜1 − ⎟ n n −1 n − r + 1


3m
lim L =1
n→∞ n→∞
⎝ r ⎠⎝ n ⎠ ⎝ n⎠ n→∞ n−λ n−λ n−λ

λr n(n − 1) K (n − r + 1) ⎛ λ ⎞
n
⎛ λ⎞
n

= lim ⎜1 − ⎟ lim ⎜1 − ⎟ = e − λ
n→∞
⎝ n⎠
⎛ λ⎞ r ⎝ n⎠
n→∞ r
k!
⎜1 − ⎟ n
⎝ n⎠
uc

Si X =número de sucesos en un intervalo con media λ

X ∼ P (λ)

y la función de probabilidad es,

e−λ λr
P (X = r) = X = 1, 2, . . . E[X] = λ V ar[X] = λ
r!
y
X ∼ P (λ1 ) Y ∼ (P (λ2 ) independiente X + Y ∼ P (λ1 + λ2 )

Ejemplo
Las llegadas de cliente a un puesto de servicio son estables e independientes, en media, llega
1 cliente por minuto.¿Cuál es la probabilidad de que no lleguen clientes en 3 minutos?.

X = número de clientes por minuto → X ∼ P (λ = 1)


Y = número de clientes en 3 minutos → Y ∼ P (λ = 3)

41

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
−3 0
e 3
P (Y = 0) = = e−3
0!
Si mantener abierto el puesto de servicio durante 8 horas al dı́a cuesta 6000 euros al dı́a.
¿Cuál debe ser la tarifa mı́nima por servicio para que es puesto de servicio de beneficios?.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
W = number of clients in 8 hours → Y ∼ P (λ = 60 × 8 = 240

Beneficio=Tarifa × W -6000

Beneficio esperado = tarifa × E[W ] − 6000 > 0


= Tarifa × 480 − 6000 > 0

Entonces, Tarifa > 12.5 euros.

2.2 Distribución Exponencial


Vamos a utilizar el ejemplo anterior como introducción. El tiempo entre clientes que llegan

Reservados todos los derechos.


al puesto de servicio puede ser también una variable de interés. Sea T la variable que mide
el tiempo transcurrido entre dos clientes; es de esperar que la distribución de T se pueda
obtener a partir de de lo que sabemos sobre la variable que mide el número de clientes. La
3m
clave de la relación entre las dos variables es el siguiente concepto: el tiempo transcurrido
entre dos clientes es mayor que 1 minuto sı́ y sólo sı́ no hay clientes en un intervalo de
longitud igual a1 minuto. En general:

X = Número de eventos por unidad de tiempo → X ∼ P (λ)


Y = Número de eventos en (0, t) → Y ∼ P (λt)
uc

P (X > t0 ) = P r(Y = 0) = e−λt

Entones, la función de distribución de T es:

FT (t) = P (T ≤ t) = 1 − P (T > t) = 1− = e−λt t≥0

y la función de densidad:
2 Poisson Process
fT (t) = λe−λt t ≥ 0 E[T ] = 1/λ V ar[T ] = 1/λ2

f ( x ) = 2e −2 x

f ( x ) = 0.5e −0.5 x
f ( x ) = 0.1e −0.1 x

29
Estadística, Profesora: María Durbán

42

Compra Coins y descarga sin publicidad.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
Ejemplo
Las llegadas de cliente a un puesto de servicio son estables e independientes, en media, llega
1 cliente por minuto.¿Cuál es la probabilidad de que no lleguen clientes en 3 minutos?.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora en vez de usar una variable Poisson, utilizamos una exponencial.

X = Número de clientes por minuto → X ∼ P (λ = 1)


Y = Tiempo entre clientes → Y ∼ Exp(λ = 1)

P (Y > 3) = 1 − P (Y ≤ 3) = 1 − FY (3) = 1 − (1 − e−3 ) = e−3

Ejemplo
En una red de ordenadores, los accesos al sistema por parte de los usuarios se modelizan

Reservados todos los derechos.


mediante una variable aleatoria Poisson con media igual a 25 accesos por hora. ¿Cuál es la
probabilidad de que el siguiente acceso ocurran entre los próximos 2 ó 3 minutos?.
Si X es el tiempo entre accesos, entonces, X es una variable exponencial con λ = 25. Estamos
3m
interesados la probabilidad de que X esté entre 2 y 3 minutos. Dado que λ viene dado en
accesos por hora, necesitamos expresar todo el tiempo en horas. Por lo tanto:
Z 0.05
0.05
P (2/60 < X < 3/60) = 25e−25x dx = −e−25x 0.033 = 0.152
0.033

Ahora, calculamos el intervalo tal que la probabilidad de que no haya accesos en ese intervalo
uc

sea 0.9

P (X > x) = 1 − FX (x) = e−25x = 0.9 → x = 0.00421 horas → x = 0.25 minutos

Una propiedad inportatente2 Poisson Process


de la variable Exponencial es que no tiene memoria. Esto
significa que el futuro es independiente del pasado, es decir, el hecho de que algo no haya
pasado aún no nos dice nada sobre cuánto tiempo más tardará en suceder. Supongamos que
el tiempo de vida de un componenteProperty
electrónico sigue una variable Exponencial, y que el
componenta ya ha durado un tiempo t1 , y queremos calcular la probabilida de que dure al
menos otras t2 unidades de tiempo, es decir, P (T > t1 + t2 |T > t1 ):

Pr(T > t1 +t 2 / T > t1 ) = Pr( T > t 2 )

Pr(T > t1 +t 2 I T > t1 ) Pr( T > t1 +t 2 ) e − λ ( t1 +t 2 )


= = − λ t1
= e − λ t2
Pr( T > t1 ) Pr( T > t1 ) e
If there hasn’t been any clients in 4 minutes, what is the probability
that there
vemos que are no clients in no
la probabilidad thedepende
next 3 minutes?
de t1 (el tiempo de vida anterior). Éste no es
un buen modelo por ejemplo, para el tiempo de vida humana ya que implicarı́a que la
Pr(Y > 7 | Y > 4) = Pr(Y > 3) = 1 − F (3) = e −3
31
Estadística, Profesora: María Durbán 43

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
probabilidad de que una persona de 20 años viva otros 10 más, es igual a la probabilidad
de que una persona de 80 años viva 10 años más, lo cual es ridı́culo. Existen otras variables
aleatorias para medir el tiempo de vida donde el tiempo de vida anterior condiciona el tiempo
de vida restante.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo
Sea X el tiempo entre llamadas a una centralita, suponemos que X es una variable Exponen-
cial con media 1.4 minutos. La probabilidad de que una llamada llegue en los 30 segundos
siguientes a abrir la centralita es:
P (X < 0.5) = FX (0.5) = 1 − e−0.5/1.4 = 0.3
(recuerda que si E[X] = 1.4 = 1/λ, entonces λ = 1/1.4).

Supongamos ahora que la centralita ha abierto y han pasado 3 minutos sin que haya lle-
gado ninguna llamada. ¿Cuál es la probabilidad de que llegue una llamada en los próximos

Reservados todos los derechos.


30 segundos?.
P (X < 3.5 ∩ X > 3) P (3 < X < 3.5)
P (X < 3.5|X > 3) = =
P (X > 3) P (X > 3)
3m
P (3 < X < 3.5) = P (X < 3.5) − P (X ≤ 3) = FX (3.5) − FX (3)
= (1 − e−3.5/1.4 ) − (1 − e−3/1.4 ) = 0.0035
P (X > 3) = 1 − P (X ≤ 3) = 1 − FX (3) = 1 − (1 − e−3/1.4 ) = 0.117
0.0035
P (X < 3.5|X > 3) = = 0.3 = P (X < 0.5)
0.117
uc

Esta probabilidad es la misma que la obtenida si la llamada hubiera llegado a los 30 segundos
de abrir debido a la falta de memoria de la Exponencial.

3 Variable aleatoria Normal o Gaussiana


Es el modelo de probabilidad usado con más frecuencia. Se llama también Gaussiana debido
a Carl Friedrich Gauss (1777-1855). Alrededor de 1820, ocupado en la correcta determi-
nación matemática de la forma y el tamaño del globo terráqueo, Gauss desarrolló numerosas
herramientas para el tratamiento de los datos observacionales, entre las cuales destaca la
curva de distribución de errores, la llamada distribución Normal. Este modelo se utiliza
para diversos fenómenos, la velocidad de las moléculas de gas, el peso de una persona, la
temperatura, etc. Además, siempre que una variable es replicada muchas veces, la variable
formada por las medias de dichas variables se puede aproximar por una varaible Normal
(siempre que el número de réplicas sea elevado), esta propiedad la la veremos al final de este
capı́tulo cuando estudiemos el Teorema central del lı́mite.

La función de densidad de la variable Normal depende de dos parámetros: µ, la media,


y σ, la desviación tı́pica (donde −∞ < µ < ∞ y σ > 0):
1 2 2
f (x) = √ e−(x−µ) /2σ , −∞ < x < ∞

44

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3 Normal distribution
© Maria Durban 2016
La función de densidad tiene forma de campana y es simétrica con respecto a la media,
además la media, la mediana y la moda
It is bell shaped coinciden:with respect to the mean
and symmetric

f ( x)

Reservados todos los derechos.


µ

0.5 0.5

35
El valor de Estadística,
µ determina el centro de la función de densidad, y el valor de σ determina
Profesora: María Durbán
la
anchura.
3m
Un caso importante es en el que una variable Normal tiene µ = 0 y σ = 1,en este caso
se llama Variable Normal Estándar y se le nombra con la letra Z.
Z ∼ N (0, 1)
La función de distribución de la variable Normal se denota como:
uc

Φ(z) = P (Z ≤ z)
Hoy en dı́a, la mayorı́a de los programas informáticos estadı́sticos permiten el cálculo de prob-
abilidades para una variable Normal con cualquier media y desviación tı́pica, sin embargo,
no hace tanto esto no era posible. Si queremos calcular
Z b
P (a < X < b) = fX (x)dx
a
pero esta integral no tiene una solución analı́tica. Para solucionarlo se puede probar fácilmente
que si X es una variable Normal con E(X) = µ y V ar(X) = σ 2 , entonces la variable
X −µ
Z=
σ
es una variable Normal con E(Z) = 0 y V ar(Z) = 1, es decir, una variable Normal estándar.
E[X] − µ µ−µ
E[Z] = = =0
σ σ
V ar[X] σ2
V ar[Z] = 2
= 2 =1
σ σ
Por lo tanto, cualquier variable Normal se puede transformar en Normal estándar (cuya
probabilidades están tabuladas, ver tabla al final del tema). Las probabilidades que son de
la forma P (Z ≤ z) se calculan utilizando las propiedades básica de la probabilidad. Por
ejemplo:

45

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016

1. P (Z > 1.26) = 1 − P (Z ≤ 1.26) = 1 −


0.08961 = 0.1038

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. P (Z < −0.86) = P (Z > 0.86) = 1 −
P (Z ≤ 0.86) = 0.1949

3. P (Z > −1.37) = P (Z < 1.37) = 0.9146

4. P (−1.25 < Z < 0.37) = P (Z < 0.37) −


P (Z < −1.25) = 0.6443 − 0.1056 =

Reservados todos los derechos.


0.5386 (Figura tomada de Montgomery and Runger
(2003))
3m
Ejemplo
El tiempo de vida de un semiconductor sigue una distribución Normal con media de 7000
horas y desviación estándar de 600 horas. ¿Cuál es la probabilidad de que un semiconductor
falle antes de las 600 horas?.
 
uc

6000 − 7000
P (Z < 6000) = P = P (Z < −1.66) = P (Z > 1.66)
600
= 1 − P (Z ≤ 1.66) = 1 − 0.9515 = 0.0485

¿Cuál es el tiempo de vida que es exceidio por el 95.05% de semiconductores?


 
 a − 7000 
P (X > a) = 0.9505 → P 
Z >
 = 0.9505

600
| {z }
negativo=−b
 
 −(a − 7000) 
= P Z <  = 0.9505
| 600
{z }
b
−(a − 7000)
= 1.65
600
a = 6010

95.05% de los semiconductores dura más de 6010 horas.

46

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
3.1 La función Q
La función Q es una forma apropiada de representar las probabilidades en la cola derecha
de la variable Normal. Para x ∈ <, Q(x) se define como la probabildiad de que una variable
Normal estándar exceda el valor x:

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Z +∞
1 2
Q(x) = P (X > x) = √ e−x /2 dx
2π x
Q tambı́en se llama función de distribución complementaria ya que:

Q(x) = 1 − P (X ≤ x) = 1 − Φ(x) Q(−x) = 1 − Q(x)
erf(x) = 1 − 2Q( 2x)
There is also the complementary error function erfc(x) which is defined as
erfc(x) = 1 − erf(x). With the use of erfc we can write:
Al igual que en el caso de la función de distribución   Φ(), la integral anterior es difı́cil de
1 x
calcular, y en su lugar se utilizan unas cotasQ(x) =
2
erfc que

2 nos permiten no tener que calcular dicha
integral. Para x > 0:
The erfc(x) can be approximated by the following series:
  −x2

1 erfc(x) = xe1√π 1 −−x2x12 /2+ 21.3x − 1.3.5 + ... 1 2
√ 1− 2 e < Q(x) < √ e−x /2
2 2 x2 4 3 6

x following x the Q-function and its lower andxhigher


2π figure presents 2πbounds.

Reservados todos los derechos.


The
As it can be seen the bounds are quite tight for x > 2.

2
10
3m
Upper bound
1
Exact
10 Lower bound

0
10

−1
10

−2
10

−3
10
uc

−4
10

−5
10

−6
10

−7
10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Figure 1: Q-function and its bounds


La función Q se utiliza con frecuencia para calcular la tasa de error de bits (BER) . En una
transmisión digital, el número de errores de bits es el número de bits recibidos que han sido
alterados por el ruido o interferencias en un canal de cominicación y la tasa de error es igual
al número de errores de bits dividido por el número total de bits transmitidos durante el
intervalo estudado. El número de errores 2dependerá de la cantidad de ruido que entra en
el sistema. El ruido de fondo (background noise) tiene un valor promedio que es excedido
periódicamente por picos que sumeran la media muchas veces. Estos picos sólo duran un
periodo corto de tiempo. Cuando el pico es igual o excede el valor de la señal hay una
probabilidad del 50/50 de error. Los periodos de tiempo en los que ocurren los picos se
pueden calcular mediante la función Q.

3.2 Teorema Central del Lı́mite


El teorema central del lı́mite explica por qué muchas distribuciones tienden a acercarse a
la Normal. La clave es que la variable aleatoria observada ha de ser la suma o la media de

47

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
muchas variable aleatorias independientes y con la misma distribución.

Por ejemplo, supongamos que tenemos una variable X ∼ U [50, 70] y generamos 200 val-
ores. La media de la muestra de valores es 17. El histograma (abajo a la izquierda) y la

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
función de densidad no se parecen a la de una variable normal con la misma media y varianza
(en rojo). Si elegimos de forma aleatoria grupos de 10 observaciones (de entre las 200 simula-
dos) y calculamnos la media de la muestra para cada uno de los grupos, la distribución de las
medias muestrales sigue aproximadamente una distribución Normal (figura a la derecha). la
media de esta nueva variable es similar a la media de la variable original, pero la desviación
estándar es más baja, 1.92, ya que las observaciones de la nueva variable están más próximas
entre si.
0.08

0.7
0.6
0.06

0.5
0.4
Density

Density
0.04

Reservados todos los derechos.


0.3
0.2
0.02

0.1
3m
0.00

0.0

50 55 60 65 70 58 59 60 61 62

x Means

Formalmente: Supongamos que tenemos n variables independientes Xi with con medias


µi , y desviaciones tı́picas σi , y todas ellas siguen la misma distribución, es decir, todas son
uc

exponenciales, o Poisson, etc.). entonces, cuando n aumenta, la distribución de la suma


Y = X1 + . . . + Xn
es aproximadamente Normal y,
 v 
u n P
X n
uX Y − ni µi
Y ≈N µi , t σi2  pPn
2
≈ N (0, 1)
i i I σ i

3.3 Aproximación Binomial-Normal


Una variable Binomial proviene de la suma de variables Bernoulli independientes que toman
valores 0 ó 1
Y = X1 + . . . + Xn E[Xi ] = p V ar[Xi ] = p(1 − p)
El teorema central del Lı́mite dice que

Y ≈ N (np, np(1 − p)
Pero cuándo. Cuando n ≥ 30 y np(1 − p) > 5.

El siguiente gráfico muestra el histograma de una muestra de una variable Binomial con
parámetros n = 50 y p = 0.3, y la densidad corerspondiente la variable Normal aproximada.

48

Compra Coins y descarga sin publicidad.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
4 Normal as an approximation of other distributions

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Binomial-Normal
© Maria Durban 2016

0.12

0.08 n = 50 p = 0.3
npq = 10.5

0.04

(
N 15, 10.5 )

Reservados todos los derechos.


0.00
5.000 7.625 10.250 12.875 15.500 18.125 20.750 23.375 26.000
x
58
Estadística, Profesora: María Durbán
Ejemplo
Un fabricante de semiconductores admite que el 2% de los chips producidos es defectuoso.
Los chips se empaquetan en lotes de 2000 unidade. Un comprador rechazará un lote si hay
25 o más chips defectuosos. ¿Cuál es la probabilidad de que se rechace el lote?.
X = Número de chips defectuosos
3m
X ∼ B(2000, 0.02) np(1 − p) = 39.2 ⇒ X ≈ N (40, 6.26)

 
25 − 40
P (X ≥ 25) ≈ P Z ≥ = P (Z ≥ −2.4)
6.24
uc

= P (Z ≤ 2.4) = 0.9918

3.4 Aproximación Poisson-Normal


Recordemos que la variable Poisson se obtenı́a como lı́mite de la Binomial cuando el número
de experimentos tendı́a a infinito. Consecuentemente, la variable Normal también puede
usarse para aproximar las probabilidades de la variable Poisson. Si X es una variable Poisson
con E[X] = V ar[X] = λ,
Z −λ
Z= √ ≈ N (0, 1)
λ
La aproximación es apropiada si λ > 5 (condiciones similares a la Binomial). En la siguiente
figura se representa una muestra de una variable Poisson con λ = 20 y la función de densidad
de la variable Normal aproximada.

49

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
Poisson distribution, lambda=20
0.08

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
0.06
Density

0.04
0.02
0.00

5 10 15 20 25 30 35

Ejemplo

Reservados todos los derechos.


El número de defectos por metroc cuadrado en la superficie de un metalsigue una distribución
Poisson con media de 100 defectos. Si analizamos un metros cuadrado de esa superficie, ¿cuál
es la probabilidad de encontrar 95 o más defectos?.
3m
 
95 − 100
P (X ≥ 95) ≈ P Z ≥ = P (Z ≥ −0.5)
10
= P (Z ≤ 0.5) = 0.6915
uc

50

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
4 Ejercicios
Los siguientes ejercicios son fáciles de resolver y tienen el objetivo de ayudarte a comprender
los conceptos explicados en este tema. Para poder aprobar debes saber resolver los ejercicios

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de exámenes que aparecen al final de la lista y que encontrarás en la página web de la
asignatura:

1. Sabemos que en una ciudad, de cada 50000 personas, 1500 están viendo un cierto pro-
grama de TV. ¿Cuál es la probabilidad de que de 100 personas elegidas aleatoriamente,
menos de 4 estén viendo el programa?.

2. Una universidad sabe que el 75% de sus graduados tiene trabajo a los 12 meses de su
graduación. Se eligen 8 graduados al azar. Se pide:

• Probabilidad de que al menos 6 tengan empleo a las 12 meses.


• Probabilidad de que como máximo 6 tengan empleo.

Reservados todos los derechos.


3. Un examen tipo test consiste en 20 preguntas, cada una de ellas con 4 posibles re-
spuestas. Un estudiante es capaz de identificar y eliminar como incorrecta una de las
opciones de cada pregunta y elige aleatoriamente entre las otras tres. El examen se
3m
aprueba si hay 12 o más preguntas correctas.

• ¿Cuál es la probabilidad de que el estudiante apruebe?.


• ¿Cuál es la probabilidad de que el estudiante apruebe si puede eliminar dos op-
ciones de cada pregunta?.
uc

4. Las llamadas de teléfono recibidas en una casa siguen un proceso de Poisson con
parámetro λ = 2 cada hora.

• Si una persona toma una ducha de 10 minutos, cuál es la probabilidad de que el


teléfono suene durante ese tiempo?.
• Durante cuánto tiempo puede tomar una ducha si desea que la probabilidad de
no recibir ninguna llamada sea como mucho 0.5?.

5. En la realización de un programa, el número de errores cometidos por página sigue


una distribución de Poisson de varianza 2. Cuál será la probabilidad de no cometerlos
en un programa de 20 páginas?.

6. Un aparcamiento tiene dos entradas. Los coches llegan a la entrada I según una Poisson
con 3 coches por hora y a la entrada II con 4 coches por hora. Si el número de coches
que llega a cada entrada son independientes, ¿cuál es la probabilidad de que en una
hora lleguen 3 coches al aparcamiento?.

7. Se supone que una persona cualquiera contrae en promedio 3 resfriados durante el


invierno y se distribuye según una P (λ).

• Calcular la probabilidad de que una persona en un invierno determinado, contraiga


por lo menos 1 resfriado.

51

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
• Calcular la probabilidad de que de 5 personas elegidas al azar, 4 contraigan 2
resfriados en un invierno.

8. Supongamos que el tiempo de vida de un componente electrónico sigue una exponencial

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
con λ = 0.1.

• Calcular la probabilidad de que el tiempo de vida sea menor que 10.


• Calcular la probabilidad de que el tiempo de vida esté entre 5 y 15.
• Calcular t para que la probabilidad de que el tiempo de vida sea mayor que t sea
0.01.

9. Una máquina consta de 12 componentes cuya duración sigue una distribución exponen-
cial de media 500 horas. La polı́tica de mantenimiento preventivo consiste en sustituir
todos los componentes simultáneamente cada 700 horas. La máquina se averı́a cuando
uno cualquiera de sus componentes lo hace, sustituyéndose en ese caso dicho compo-
nente por uno nuevo. Se supone que los componentes funcionan independientemente.

Reservados todos los derechos.


• ¿Cuál es la probabilidad de que una máquina se averı́e en el intervalo comprendido
entre dos renovaciones?.
3m
• Si han transcurrido 500 horas desde la última sutitución de todos los componentes,
¿cuál es la probabilidad de que la máquina se averı́e antes de la próxima renovación
?, ¿depende esta probabilidad del número de averı́as que haya habido en las 500
horas?.

10. La duración de un componente eléctrico sigue una distribución exponencial con media
uc

10000 horas. Se pide:

• Calcular la probabilidad de que si el componente ha durado más de 20000, dure


más de 21000 horas. Comparar esta probabilidad con la probabilidad de que dure
entre 0 y 1000 horas. Comentar razonadamente el resultado.
• Si se instalan 4 de esos componentes en serie en un aparato, calcular la probabil-
idad de que el aparato siga funcionando al cabo de 10000 horas.

11. Sea X una variable aleatoria normal con µ = 5 y σ = 10. Calcular: a) Pr(X > 10), b)
Pr(−20 < X < 15), c) el valor de x tal que Pr(X > x) = 0.05.

12. La longitud L de las piezas fabricadas en un proceso es una variable aleatoria N (32, 0.3),
considerándose aceptables aquellas cuya medida se encuentra en el intervalo (31.1,32.6).

• Calcular la probabilidad de que una pieza elegida al azar sea aceptable.


• Si se toma al azar una muestra de tres piezas, ¿cuál es la probabilidad de que la
primera y la tercera sean aceptables y la segunda no lo sea?.
• ¿Cuál es la probabilidad de que en una muestra de 3 piezas al menos una sea
aceptable?.
• Las piezas se embalan en lotes de 500 piezas. Calcular la probabilidad de que un
lote tenga más de 15 defectuosas.

52

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
© Maria Durban 2016
13. Un sistema tiene tres componentes conectados en serie. Los componentes C1 y C2
tienen un tiempo de vida T1 yT2 que se distribuye como una esponencial de media
28000 horas. El tiempo de vida de C3, T3, es N (3000, 200). Los tiempos de vida de
las tres componentes son independientes.

• Calcular la probabilidad de que el componente C1 dure más de 3000 horas.


• Calcular la probabilidad de que el componente C1 dure más de 6000 horas, si ha
durado ya 3000 horas.

Reservados todos los derechos.


• Calcular la probabilidad de qu el sistema dure más de 3000 horas.
• Para reforzar el componente C3 se instala un componente gemelo en paralelo,
con un interruptor que hace entrar en funcionamiento a la pareja cuando el com-
ponente C3 falla. Calcular la probabilidad de que el sstema dure más de 3000
horas.
3. Los circuitos integrados (chips) se obtienen a partir de obleas
fabricación,
14. Los circuitos integrados (chips) los chips
se optienen son
a partir demuy susceptibles
obleas a cualquier
de silicio y son muy defecto en la
como
susceptibles a culaquier fallo en ladefecto
superficiefatal
de laaquel
[Link]
Se definede la oblea
como defectoque
fatalpueda echar a per
de pista
aquel defecto que pueda echar de un
a perder loschip.
chips que se están produciendo a partir de dicha oblea
El número de defectos fatales por 100 milı́metros cuadrados de oblea de silicio viene
El número
aleatoriade
de defectos
media 0.1 fatales por 100 milímetros cuadrados de ob
m
caracterizado por una variable
por una variable aleatoria de media 0,1.

a) ¿Cuál es la probabilidad de que


3

haya más de un defecto fatal?

b) Si se toman 25 chips diferentes


uc

probabilidad de que más de


defectos?

c) Si se pretenden obtener chi


obleas de 100 milímetros de d
58 chips de 10x10 mm2 de encontrar más de 12 defe
total de 4 obleas?

defectuosos por 100 mm2 =2 ℘(0,1)


X: Nºdedeque
a) ¿ Cuál es la probabilidad en un chip de 20 × 20 mm haya más de un
defecto fatal?.
a)
b) Si se toman 25 chips diferentes de 10 × 10 mm2 , ¿cuál es la probabilidad de que
más de 22 de esos chips no tengan defectos?. De la figura se observa que un chip de 20x20 tie
de 10x10. Tenemos pues:
c) Si se pretenden obtener chips de 10×10 mm2 de las obleas de 100 mm de diámetro, 4
¿cuál es la probabilidad de encontrar más de 12 defectos fatales en la superficie 2
útil total de 4 obleas?.
Y: Nº de defectuosos por 400 mm = ∑X
i =1
i =℘

15. El valor de una determinada señal s producida por un aparato sufre pequeñas pertur-
( ) ( ( ) ) ( (
p Y > 1 = p ℘ 0,4 > 1 = 1 − p ℘ 0,4 ≤ 1 = 1 − e −0, 4
baciones que consideramos aleatorias. ) ) − 0,4e

b)
p ( X = 0 )53
= p (℘(0,1) = 0 ) = e −0,1 = 0,9048 ≅ 0,9

p (B (25; p ) > 22 ) ≅ p (B (25;0,9 ) > 22 ) = 1 − p (B (25;0,9 ) ≤ 22 ) =


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161
© Maria Durban 2016
a) Supongamos que la distribución de los valores de s se puede aproximar por una
distribución Normal con media 12 y desviación tı́pica 0.5. Entre los valores de la
señal que son mayores que 12.5, ¿cuál es la proporción de valores que son mayores
que 13?.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
b) Queremos ahora medir la señal s con un aparato de medición. Sea X la v.a. valor
proporcionado por el aparato al realizar una medición y  la variable error cometido
por el aparato al realizar la medición. Suponiendo que  sigue una distribución
normal con media 0 y desviación tı́pica 0.4, y es independiente de s. ¿Cuál es la
relación entre s, X y , ¿cuál es la distribución de X?.
c) Se planifica realizar varias mediciones y proporcionar su media para aproximar el
valor de la señal. ¿Cuántas mediciones habrá que tomar para que nos aseguremos
con una probabilidad mayor o igual a 0.95 que el valor proporcionado no se alejará
en más de 0.1 unidades de la señal promedio?.
d) Después de ser producida la señal entra en un dispositivo que la transforma en
una señal saliente con tres estado: -1, 0, 1. La señal sout toma el valor -1 si la

Reservados todos los derechos.


señal entrante es menor que 11.5, toma el valor 0 si la señal entrante está entre
11.5 y 12.5, y toma el valor 1 si la señal entrante es mayor que 12.5. Calcula
la función de probabilidad de sout . Si se toman 1124 valores de sout , ¿cuál es en
3m
promedio el número de valores no nulos de sout ?

DEBES HACER: P1 Mayo 2012, C3 Mayo 2013, C3 Junio 2013; C1 Junio 2014, C2
Junio 2014, C2 Mayo 2015, P1 Junio 2015, C3 Mayo 2016, C2 Junio 2016
uc

54

Estudiar sin publi es posible. Compra Coins.


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-451161

También podría gustarte