Probabilidad II
Tema 1: Espacios de probabilidad
José R. Berrendero
Departamento de Matemáticas
Universidad Autónoma de Madrid
Estructura de este tema
Álgebras, σ-álgebras.
Espacios de probabilidad.
Propiedades elementales.
Lı́mites de sucesiones de conjuntos.
π-sistemas, λ-sistemas. Teorema de Dynkin.
Función de distribución.
Probabilidad condicionada.
Variables y vectores aleatorios.
σ-álgebra generada por una variable aleatoria.
σ-álgebras
Sea Ω un conjunto no vacı́o.
Un álgebra F es una clase de subconjuntos de Ω que verifica
Ω ∈ F.
Si A ∈ F, entonces Ac ∈ F, donde Ac := Ω − A.
Si A, B ∈ F, entonces A ∪ B ∈ F.
Una σ-álgebra F es una clase de subconjuntos de Ω que verifica
Ω ∈ F.
Si A ∈ F, entonces Ac ∈ F.
Si An ∈ F, n ≥ 1, entonces ∪∞
n=1 An ∈ F.
σ-álgebras
Ejemplos
El conjunto de las partes de Ω, F = P(Ω).
F = {∅, Ω}.
F = {∅, Ω, A, Ac }, donde A ⊂ Ω.
F = {A ⊂ R : A numerable} {A ⊂ R : Ac numerable}.
S
Observación: La intersección de σ-álgebras es una σ-álgebra. En general
la unión de σ-álgebras no es una σ-álgebra.
σ-álgebra generada por una clase de conjuntos
Sea C ⊂ P(Ω). Se define la σ-álgebra generada por C como la intersección
de todas las σ-álgebras que contienen a C (la “mı́nima” σ-álgebra que
contiene a C).
σ-álgebra de Borel
σ-álgebra de Borel
Sea (Ω, τ ) un espacio topológico. La σ-álgebra de Borel B := B(Ω) es la
generada por los conjuntos abiertos de Ω.
σ-álgebra de Borel en R
B(R) =σ((a, b], a, b ∈ R) = σ((a, b), a, b ∈ R) = σ([a, b), a, b ∈ R)
=σ((−∞, b], b ∈ R) = σ((−∞, b), b ∈ R)
=σ((a, ∞], a ∈ R) = σ([a, ∞), a ∈ R).
Espacio de probabilidad
Un espacio de probabilidad es una terna (Ω, F, P), donde Ω es un
conjunto no vacı́o, F es una σ-álgebra de subconjuntos de Ω y P es una
medida de probabilidad sobre F, es decir, P : F → [0, 1] tal que
P(Ω) = 1.
Si A1 , A2 , . . . son sucesos en F tales que Ai ∩ Aj = ∅ si i 6= j, entonces
∞ ∞
!
[ X
P An = P(An ).
n=1 n=1
Propiedades elementales
Paso al complementario: P(Ac ) = 1 − P(A).
Probabilidad del vacı́o: P(∅) = 0.
Monotonı́a: Si A ⊂ B, entonces P(A) ≤ P(B).
Subaditividad:
∞ ∞
!
[ X
P An ≤ P(An ).
n=1 n=1
Fórmula de inclusión-exclusión:
n n
!
[ X X
P Ai = P(Ai ) − P(Ai ∩ Aj )
i=1 i=1 i<j
X
+ P(Ai ∩ Aj ∩ Ak ) − · · · + (−1)n+1 P(A1 ∩ · · · ∩ An ).
i<j<k
Lı́mites de sucesiones de conjuntos
Lı́mite inferior de una sucesión de conjuntos:
∞ \
[ ∞
lim inf An = Ak .
n=1 k=n
Lı́mite superior de una sucesión de conjuntos:
∞ [
\ ∞
lim sup An = Ak .
n=1 k=n
Comprueba lim inf An ⊂ lim sup An .
Expresa de forma alternativa (lim inf An )c y (lim sup An )c .
Lı́mites de sucesiones de conjuntos
Lı́mite de una sucesión de conjuntos
La sucesión An tiene lı́mite A (An → A) si lim inf An = lim sup An = A.
Lı́mites de sucesiones monótonas
Si A1 ⊂ A2 ⊂ · · · , entonces An ↑ A = ∪∞
n=1 An .
Si A1 ⊃ A2 ⊃ · · · , entonces An ↓ A = ∩∞
n=1 An .
Continuidad para sucesiones monótonas
Si An ↑ A, entonces P(An ) ↑ P(A). Si An ↓ A, entonces P(An ) ↓ P(A).
Relación entre la probabilidad del lı́mite inferior y superior
P(lim inf An ) ≤ lim inf P(An ) ≤ lim sup P(An ) ≤ P(lim sup An ).
Continuidad
Si An → A, entonces P(An ) → P(A).
π-sistemas y λ-sistemas
Un π-sistema C es una clase de subconjuntos de Ω tal que si A, B ∈ C,
entonces A ∩ B ∈ C.
Un λ-sistema es una clase L de subconjuntos de Ω tal que:
(a) Ω ∈ L, (b) si A ∈ L, entonces Ac ∈ L, (c) si An ∈ L, n ≥ 1, y
Ai ∩ Aj = ∅ para i 6= j, entonces ∪∞
n=1 An ∈ L.
Observaciones
Un álgebra es un π-sistema.
Una σ-álgebra es un λ-sistema.
C es una σ-álgebra si y solo si C es π-sistema y λ-sistema.
Teorema de Dynkin
Teorema de Dynkin
Sea C un π-sistema y L un λ-sistema. Si C ⊂ L entonces σ(C) ⊂ L.
Aplicación habitual de este teorema
Supongamos que L contiene los conjuntos que satisfacen cierta propiedad.
Para demostrar que la propiedad se cumple para todos los conjuntos de
una σ-álgebra (σ(C) ⊂ L) basta probarla para los conjuntos de un
π-sistema que la genera (C ⊂ L).
Teorema de Dynkin: esquema de la demostración
Basta demostrar que el mı́nimo λ-sistema que contiene a C, λ(C), es
un π-sistema.
Dado A ⊂ Ω, definimos GA := {B ⊂ Ω : A ∩ B ∈ λ(C)}.
Si A ∈ λ(C), entonces GA es λ-sistema.
Si A ∈ C, entonces λ(C) ⊂ GA . Para esto basta ver que C ⊂ GA .
(Por tanto, si A ∈ C y B ∈ λ(C), entonces A ∩ B ∈ λ(C)).
Cambiando los papeles de A y B tenemos que si A ∈ λ(C), entonces
C ⊂ GA . Como consecuencia, λ(C) ⊂ GA y hemos terminado.
Función de distribución
Sea P una medida de probabilidad sobre (R, B), donde B es la σ-álgebra
de Borel. La función de distribución F : R → [0, 1] correspondiente a P
se define como
F (x) = P((−∞, x]), x ∈ R.
Observaciones
(a) Una función de distribución F tiene las tres propiedades siguientes:
Es continua por la derecha.
Es monótona no decreciente.
F (∞) := limx→∞ F (x) = 1; F (−∞) := limx→−∞ F (x) = 0.
(b) Si F es una función de distribución, Cont(F )c es numerable, donde
Cont(F ) es el conjunto de puntos en los que F es continua.
(c) Si F1 y F2 son dos funciones de distribución tales que F1 (x) = F2 (x),
para todo x ∈ Cont(F1 ) ∩ Cont(F2 ), entonces F1 (x) = F2 (x), para
todo x ∈ R.
Extensión de medidas
Teorema
Sea F : R → [0, 1] una función continua por la derecha, monótona no
decreciente, con F (∞) = 1, F (−∞) = 0. Definamos
P((a, b]) = F (b) − F (a), para a < b. Existe una única medida de
probabilidad que extiende P a B(R).
Teorema de extensión de Carathèodory
Sea µ una medida σ-finita sobre un álgebra F0 ⊂ P(Ω). Entonces existe
una extensión única de µ a la σ-álgebra F generada por F0 .
La unicidad se puede deducir directamente de:
Teorema
Sean P1 y P2 medidas de probabilidad sobre σ(C), donde C es un
π-sistema. Si P1 (A) = P2 (A) para todo A ∈ C, entonces P1 (A) = P2 (A)
para todo A ∈ σ(C).
Probabilidad condicionada
Sea (Ω, F, P) un espacio de probabilidad y A, B ∈ F con P(B) > 0.
Se llama probabilidad de A condicionada a B a
P(A ∩ B)
P(A|B) := .
P(B)
La aplicación:
P(·|B) : F −→ [0, 1]
A 7−→ P(A|B)
es una medida de probabilidad sobre (Ω, F).
Probabilidad condicionada
Fórmula del producto
Si A1 , . . . , An ∈ F con P(A1 ∩ · · · ∩ An ) > 0, se tiene
P(A1 ∩ · · · ∩ An ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩ A2 ) · · · P(An |A1 ∩ · · · ∩ An−1 ).
Una colección de sucesos disjuntos {Ai }∞
i=1 ⊂ F es una partición de Ω si:
(a) P(Ai ) > 0, i ≥ 1.
(b) Ω = ∪∞
i=1 Ai .
Fórmula de la probabilidad total
Sea (Ω, F, P) un espacio de probabilidad y {Ai }∞
i=1 ⊂ F una partición.
Entonces, para cualquier B ∈ F,
∞
X
P(B) = P(Ai )P(B|Ai ).
i=1
Probabilidad condicionada
Fórmula de Bayes
Sea (Ω, F, P) un espacio de probabilidad, {Ai }∞
i=1 ⊂ F una partición y
B ∈ F con P(B) > 0, entonces
P(Aj )P(B|Aj )
P(Aj |B) = P∞ .
i=1 P(Ai )P(B|Ai )
P(An ) se llaman probabilidades a priori
P(An |B) se llaman probabilidades a posteriori
Variables aleatorias
Una variable aleatoria sobre un espacio de probabilidad (Ω, F, P) es una
función X : Ω → R medible respecto a F y la σ-álgebra de Borel B(R).
X −1 (B) ∈ F, para todo B ∈ B(R).
Intuitivamente, X (ω) representa una cantidad numérica relacionada
con el resultado ω ∈ Ω de un experimento aleatorio.
Queremos calcular probabilidades de sucesos de la forma
{a < X ≤ b} := {ω : a < X (ω) ≤ b} = X −1 (a, b].
Es necesario X −1 (a, b] ∈ F, para todo a, b ∈ R, lo que implica
X −1 (B) ∈ F para todo B ∈ B(R).
A veces hace falta considerar v.a. extendidas X : Ω → R, donde
R = [−∞, ∞]. Aquı́, B(R) es generada por intervalos (a, b], con
−∞ ≤ a < b ≤ ∞ y [−∞, b], con −∞ ≤ b ≤ ∞.
Distribución inducida por una v.a.
Una variable aleatoria X induce una medida de probabilidad PX sobre
(R, B):
PX (B) := P(X ∈ B) = P{ω : X (ω) ∈ B}, B ∈ B.
Es fácil comprobar que PX es en efecto una medida de probabilidad
sobre (R, B).
La función de distribución de una v.a. X es la función de distribución
de la medida de probabilidad PX :
FX (x) = PX ((−∞, x]) = P(X ≤ x), x ∈ R.
Dada una función F monótona no decreciente y continua por la
derecha con F (∞) = 1 y F (−∞) = 0, siempre existe una v.a. X tal
que F = FX .
Observaciones
Si X1 , . . . , Xn son v.a. y g : Rn → R es medible (Borel), entonces
g (X1 , . . . , Xn ) es una v.a. Por ejemplo: X1 + . . . + Xn es una v.a.
Si X1 , X2 , · · · son v.a. entonces supn Xn e inf n Xn son v.a.
Si X1 , X2 , · · · son v.a. entonces lim supn Xn y lim inf n Xn son v.a.
Si X1 , X2 , · · · son v.a. tales que Xn (ω) converge para todo ω ∈ Ω,
entonces limn Xn es una v.a.
Algunos tipos de variables aleatorias
(1) Una v.a. X es degenerada en c ∈ R si P(X = c) = 1. ¿Cuál es su
función de distribución?
(2) Una v.a. X es discreta si el conjunto de valores que toma X es finito
o numerable.
(3) Una v.a. X es absolutamente continua si existe una
R x función medible
(Borel) y no negativa f : R → R tal que FX (x) = −∞ f (t)dt. Se
dice que f es la función de densidad de X . Se verifica:
R∞
−∞
f (t)dt = 1.
R
P(X ∈ B) = B f (t)dt, para todo B ∈ B.
(4) Una v.a. X es singular si existe B ∈ B tal que λ(B) = 0 y
PX (B) = 1, donde λ es la medida de Lebesgue.
Vectores aleatorios
Un vector aleatorio sobre un espacio de probabilidad (Ω, F, P) es una
función X : Ω → Rn medible respecto a F y la σ-álgebra de Borel B(Rn ).
Observación
X = (X1 , . . . , Xn ) es un vector aleatorio si y solo si Xi es una variable
aleatoria para todo i = 1, . . . , n.
Distribución y función de distribución de un vector aleatorio
Distribución:
PX (B) := P(X ∈ B) = P{ω : X (ω) ∈ B}, B ∈ B(Rn ).
Función de distribución: F : Rn → R tal que
FX (x) = F (x1 , . . . , xn ) := P(Xi ≤ xi , i = 1, . . . , n).
Las funciones de distribución de las v.a. Xi , i = 1, . . . , n se llaman
funciones de distribución marginales.
Vectores aleatorios absolutamente continuos
Una vector aleatorio X es absolutamente continuo si existe una función
medible (Borel) y no negativa f : Rn → R tal que
Z xn Z x1
FX (x1 , . . . , xn ) = ··· f (t1 , . . . , tn )dt1 · · · dtn .
−∞ −∞
Se dice que f es la función de densidad de X . Se verifica:
Z
P(X ∈ B) = f (t1 , . . . , tn )dt1 · · · dtn , para todo B ∈ B(Rn ).
B
σ-álgebra generada por una variable aleatoria
Sea X : (Ω, F) → (R, B) una v.a. La clase de conjuntos
σ(X ) := {X −1 (B) : B ∈ B}
es una sub σ-álgebra de F denominada σ-álgebra generada por X .
σ(X ) es la mı́nima σ-álgebra que hace medible a X .
Determina σ(X ) para las siguientes v.a.:
X (ω) = a para todo ω ∈ Ω.
X = IA , donde A ∈ F.
X es una v.a. simple, es decir, X toma un número finito de valores
{a1 , . . . , ak } ⊂ R.
σ-álgebra generada por una variable aleatoria
Intuitivamente, σ(X ) recoge la información que se obtiene al observar la
v.a. X .
Dada una familia de v.a. {Xi : i ∈ I }, se define σ(Xi , i ∈ I ) como la
mı́nima σ-álgebra que hace medibles a todas las Xi simultáneamente, es
decir, !
[
σ(Xi , i ∈ I ) := σ σ(Xi ) .
i∈I
Un proceso en un intervalo de tiempo [0, T ], determina una familia de v.a.
{Xt : t ∈ [0, T ]}. Entonces, σ(Xt , t ∈ [0, T ]) representa la información
obtenida al observar el proceso.
σ-álgebra generada por una variable aleatoria
Proposición
Si X es una v.a. y C es una clase de subconjuntos de R
X −1 [σ(C)] = σ[X −1 (C)].
Demostración:
X −1 [σ(C)] ⊃ σ[X −1 (C)] ya que X −1 [σ(C)] es σ-álgebra que contiene
a X −1 (C).
A = {B ⊂ R : X −1 (B) ∈ σ[X −1 (C)]} es una σ-álgebra tal que
C ⊂ A. Por tanto σ(C) ⊂ A.
Esta inclusión implica X −1 [σ(C)] ⊂ σ[X −1 (C)] por definición de A.
Corolario
σ(X ) = σ({{X ≤ x} : x ∈ R)} = σ({X −1 ((−∞, x]) : x ∈ R}).