Procesos Estocásticos
Introducción a los procesos estocásticos
Pablo I. Fierens
Instituto Tecnológico de Buenos Aires
9 de abril de 2021
Procesos Estocásticos
Proceso estocástico en una figura
ω X (t)
Procesos Estocásticos
Proceso estocástico
Varias visiones
1 Sample path (realización): ω fijo → una función o una
secuencia x(t).
2 Ensemble: conjunto de realizaciones, {ω ∈ A : x(t, ω)}.
3 Variable aleatoria: fijado t, X (t) es una variable aleatoria.
4 Un número: fijados t y ω, x(t, ω) es un número.
Procesos Estocásticos
Especificación
Probabilidades conjuntas
Para especificar adecuadamente un proceso estocástico, es
necesario dar las probabilidades (o densidades de probabilidad)
conjuntas de X (t1 ), X (t2 ), · · · , X (tn ) para todo conjunto finito de
ı́ndices t1 , t2 , · · · , tn .
Notación confusa
Hay autores que escriben f (x1 , · · · , xn ; t1 , · · · , tn ) como la densidad
de probabilidad conjunta de X (t1 ), · · · , X (tn ) evaluada en x1 , · · · ,
xn . Otros escriben f (x1 , t1 ; · · · ; xn , tn ). Cuestión de gustos. El
hecho es que depende tanto de los valores xi como de los tj .
Procesos Estocásticos
Medidas habituales
Media
µ(t) = X (t) = hX (t)i = E [X (t)]
Autocorrelación
R(t1 , t2 ) = hX (t1 )X (t2 )i .
La potencia media del proceso viene dada por R(t, t) = X 2 (t) .
Autocovarianza
C (t1 , t2 ) = R(t1 , t2 ) − µ(t1 )µ(t2 ).
La varianza del proceso: var(X (t)) = σX2 = C (t, t).
Procesos Estocásticos
Ruido blanco
Definición habitual
C (ti , tj ) = 0 ∀ti 6= tj .
Definición estricta
X (ti ) es independiente de X (tj ) para todo par ti , tj tales que
ti 6= tj .
Procesos Estocásticos
Un ejemplo: caminata aleatoria
Idea
X (t) es la posición de una partı́cula en 1D que, comenzando de
X (0) = 0, en cada instante se mueve un lugar a la derecha con
probabilidad p o un lugar a la izquierda con probabilidad
q = (1 − p).
P(X (0) = 0) = 1
p
x =y +1
P( X (n + 1) = x| X (n) = y ) = q x =y −1
0 |x − y | =
6 1
Procesos Estocásticos
Un ejemplo: caminata aleatoria
Llamemos D(t) al número de pasos a la derecha hasta tiempo t
(incluido). Es claro que:
X (n) = D(n) − (n − D(n)) = 2D(n) − n.
Como D(n) ∼ Binomial(n, p),
n+k n n+k n−k
P(X (n) = k) = P D(n) = = n+k p 2 q 2
2 2
para k = {−n, −n + 2, · · · , n − 2, n}.
Procesos Estocásticos
Un ejemplo: caminata aleatoria
P(X (n+1) = x, X (n) = y ) = P( X (n + 1) = x| X (n) = y )P(X (n) = y )
P(X (n + 1) = x, X (n) = y ) =
!
n n+y +
+1 n−y
x = y + 1, y ∈ {−n, −n + 2, · · · , n − 2, n}
n+y p 2 q 2
2 !
n n+y n−y
+1
n+y p 2 q 2 x = y − 1, y ∈ {−n, −n + 2, · · · , n − 2, n}
2
0 todo otro caso
Procesos Estocásticos
Un ejemplo: caminata aleatoria
µ(n) = hX (n)i = 2 hD(n)i − n = 2np − n = n(p − q),
σ 2 (n) = var (2D(n) − n) = 4var (D(n)) = 4npq,
R(n, n) = X 2 (n) = σ 2 (n) + µ2 (n) = 4npq + n2 (p − q)2 ,
R(n + 1, n) = hX (n + 1)X (n)i = h h X (n + 1)X (n)| X (n)i i
= h h X (n + 1)| X (n)i X (n) i = h (X (n) + (p − q)) X (n) i
= R(n, n) + (p − q)µ(n)
= 4npq + n2 (p − q)2 + n(p − q)2
= 4npq + n2 (p − q)2 + n(p 2 − 2pq + q 2 )
= n2 (p − q)2 + n(p 2 + 2pq + q 2 )
= n + n2 (p − q)2 .
Procesos Estocásticos
Un ejemplo: caminata aleatoria
C (n, n) = σ 2 (n) = 4npq,
C (n + 1, n) = n + n2 (p − q)2 − ((n + 1)(p − q)) · (n(p − q))
= n + q − p.
La caminata aleatoria no es ruido blanco. Sı́ lo es
∆(n) = X (n + 1) − X (n) → tarea.
Procesos Estocásticos
Otro ejemplo: procesos Gaussianos
Definición
Para todo conjunto finito t1 , t2 , · · · , tn , las variables son
conjuntamente normales (Gaussianas).
Teorema
Dada una función µ(t) y una función definida positiva C (t1 , t2 ),
existe un único proceso Gaussiano con media µ(t) y covarianza
C (t1 , t2 ).
Sea X (t) dicho proceso. La función caracterı́stica de X (t1 ), · · · ,
X (tn ) es
X 1X
φ(~ ω ) = exp i µ(tk )ωk − C (tk , tm )ωk ωm .
2
k k,m
Procesos Estocásticos
Otro ejemplo: procesos Gaussianos
Función definida positiva
C (t1 , t2 ) es d.p. si la matriz A con componentes Aij = C (ti , tj ) es
definida semi-positiva.
Ruido blanco
Para que un proceso Gaussiano sea ruido blanco, debe ser
C (t1 , t2 ) = 0 para todo t1 , t2 . En ese caso, la función caracterı́stica
de X (t1 ), · · · , X (tn ) es
( )
X
φ(~ω ) = exp i µ(tk )ωk ,
k
si tk 6= tm .
Procesos Estocásticos
Pares de procesos
Correlación cruzada
RXY (t1 , t2 ) = hX (t1 )Y (t2 )i .
Dos procesos son ortogonales sii RXY (t1 , t2 ) = 0 ∀t1 , t2 .
Covarianza cruzada
CXY (t1 , t2 ) = RXY (t1 , t2 ) − µX (t1 )µY (t2 ).
Dos procesos están decorrelacionados sii CXY (t1 , t2 ) = 0 ∀t1 , t1 .
Independencia
Dos procesos X (t) e Y (t) son independientes si para todo par de
conjuntos finito t1 , t2 , · · · , tn y t10 , t20 , · · · , tm
0 , las variables X (t ),
1
X (t2 ), · · · , X (tn ) son independientes de Y (t10 ), Y (t20 ), · · · , Y (tm 0 ).
Procesos Estocásticos
Procesos estacionarios
Sentido estricto
Idea: ∀τ , X (t) y X (t + τ ) son equivalentes. Más especificamente:
para todo τ y para todo conjunto finito t1 ,· · · , tn ,
f (x1 , t1 ; · · · ; xn , tn ) = f (x1 , t1 + τ ; · · · , xn , tn + τ ),
donde el lado izquierdo es la densidad de probabilidad conjunta de
X (t1 ), · · · , X (tn ) evaluada en x1 , · · · , xn .
Consecuencias inmediatas
f (x, t) es independiente de t → µ(t), σ 2 (t) son constantes.
f (x1 , t1 ; x2 , t2 ) = f (x1 , 0; x2 , t2 − t1 ) = f (x1 , t1 − t2 ; x2 , 0) →
R(t1 , t2 ) = R(|t1 − t2 |).
Procesos Estocásticos
Procesos estacionarios
Sentido amplio
1 µ(t) = constate.
2 R(t1 , t2 ) = R(|t1 − t2 |).
Tiempo de correlación
Z∞
1
τc = C (τ )dτ.
C (0)
0
Aplicación: si el tiempo de correlación es mucho menor que los
tiempos caracterı́sticos de observación, ¿se puede modelar como
ruido blanco?
Procesos Estocásticos
Procesos estacionarios
Asintóticamente
Para todo τ y para todo conjunto finito t1 ,· · · , tn ,
lı́m f (x1 , t1 + τ ; · · · , xn , tn + τ ),
τ →∞
existe (y es independiente de τ ).
Idea: luego de pasado un transitorio, X (t) se comporta como
estacionario.
Incrementos estacionarios
Un proceso X (t) es de incrementos estacionarios si para cada τ
∆τ (t) = X (t + τ ) − X (t) es estacionario (no depende de t, pero
(tal vez) sı́ de τ ).
Procesos Estocásticos
Ejemplos
Caminata aleatoria
No estacionario: ni en sentido estricto, ni sentido amplio, ni
asintóticamente.
Sı́ es de incrementos estacionarios.
Procesos Gaussianos
Estacionario en sentido estricto ⇔ es estacionario en sentido
amplio.
Procesos Estocásticos
Densidad Espectral
Definición: estacionarios en sentido amplio
+∞
Z
S(ω) = F {R(τ )} = R(τ )e −iωτ dτ.
−∞
Luego,
+∞
Z
−1 1
R(τ ) = F {R(τ )} = S(ω)e iωτ dω.
2π
−∞
Procesos Estocásticos
Densidad Espectral
Teorema de Wiener-Khinchin
+∞
Z
2 1
R(0) = X (t) = S(ω)dω.
2π
−∞
Más aún: S(ω) ≥ 0.
Corolario
R(τ ) alcanza su máximo en τ = 0.
Idea de demo
+∞
Z
1
|R(τ )| ≤ S(ω)e iωτ dω = R(0).
2π
−∞
Procesos Estocásticos
Densidad Espectral
Ruido blanco
R(τ ) = cδ(τ ) ⇒ S(ω) = c.
El espectro es constante: “tiene todas las frecuencias”, es blanco.
Espectros cruzados
+∞
Z
SXY (ω) = F {RXY (τ )} = RXY (τ )e −iωτ dτ.
−∞
Procesos Estocásticos
Sistemas con entradas estocásticas
Y (t) = T(X (t)).
Determinı́stico
Si opera sobre t, con ω tratado como un parámetro (o constante).
Estocástico
Si opera sobre tanto sobre t como con ω.
Procesos Estocásticos
Sistemas sin memoria
Definición
Hay una función g (·) tal que
Y (t) = g (X (t)).
Teorema
Si X (t) es estacionario en sentido estricto, entonces Y (t) también
lo es.
Ojo: no vale para procesos estacionarios en sentido amplio.
Procesos Estocásticos
Lineales e invariantes en el tiempo
Y (t) = L(X (t)).
Lineal
L(a1 X1 (t) + a2 X2 (t)) = a1 L(X1 (t)) + a2 L(X2 (t)).
Invariante en el tiempo
Para todo τ y todo X (t),
Y (t) = L(X (t)) ⇒ L(X (t + τ )) = Y (t + τ ).
Procesos Estocásticos
Lineales e invariantes en el tiempo
Respuesta al impulso
h(t) = L(δ(t)).
Hecho:
+∞
Z
y (t) = L(x(t)) = x(t) ∗ h(t) = x(τ )h(t − τ )dτ.
−∞
Respuesta en frecuencia
H(ω)e −iωt = L(e −iωt ) = F {h(t)} e −iωt .
Hecho:
y (t) = L(x(t)) ⇒ X (ω) = X (ω)H(ω).
Procesos Estocásticos
Lineales e invariantes en el tiempo
Teorema: procesos estacionarios
Si X (t) es estacionario en sentido estricto, entonces
Y (t) = L(X (t)) también lo es.
Ojo: sı́ vale para estacionarios en sentido amplio.
Teorema: procesos Gaussianos
Si X (t) es Gaussiano, entonces Y (t) = L(X (t)) también lo es.
Teorema fundamental
hL(X (t))i = L (hX (t)i) = L (µ(t)) .
Procesos Estocásticos
Lineales e invariantes en el tiempo
Teorema sobre correlación 1
RXY (t1 , t2 ) = L2 (RXX (t1 , t2 )) .
L2 actúa sobre la segunda variable, tomando la primera como
parámetro constante.
Idea demo:
X (t1 )Y (t2 ) = X (t1 )L(X (t2 )) = L2 (X (t1 )X (t2 ))
hX (t1 )Y (t2 )i = hL2 (X (t1 )X (t2 ))i = L2 (hX (t1 )X (t2 )i)
Procesos Estocásticos
Lineales e invariantes en el tiempo
Teorema sobre correlación 2
Para un proceso X estacionario en sentido amplio:
RXY (τ ) = RXX (τ ) ∗ h∗ (−τ ), RYY (τ ) = RXY (τ ) ∗ h(τ ),
∗
SXY (ω) = SXX (ω)H (ω), SYY (ω) = SXY (ω)H(ω).
Corolario
SYY (ω) = SXX (ω)|H(ω)|2 .
Procesos Estocásticos
Lineales e invariantes en el tiempo
Caracterización por ruido blanco
Si X es ruido blanco, entonces SYY (ω) = c|H(ω)|2 .
Idea: si introduzco ruido blanco en el sistema, entonces la salida
tiene (en el espectro) la “forma” de la respuesta en frecuencia.
Procesos Estocásticos
Procesos ergódicos
Idea
Si se desea caracterizar un proceso estocástico, hay que observar
un conjunto de realizaciones. ¿No estarı́a bueno poder
caracterizarlo a partir de una sola? Los procesos ergódicos son
aquellos en los que esto es posible.
Ergódico en media
Sea X (t) estacionario. El promedio temporal es
ZT
1
µT = X (τ )dτ.
2T
−T
X (t) es ergódico en media si lı́mT →∞ µT = µ, donde la
convergencia es cuadrática media.
Procesos Estocásticos
Procesos ergódicos
Es común usar promedios de ventana móvil:
t+T
Z
1
µT (t) = X (τ )dτ.
2T
t−T
Importante: El promedio temporal es µT (0).
Si consideramos una ventana rectangular
(
1
|t| < T
h(t) = 2T
0 |T | ≥ T
entonces
+∞
Z
µT (t) = X (τ )h(t − τ )dτ = X (t) ∗ h(t).
−∞
Procesos Estocásticos
Procesos ergódicos
µT (t) es la salida de un sistema lineal con respuesta al impulso h(t)
cuando la entrada es X (t). Por tanto, µT (t) es estacionario y
+2T
|t 0 |
Z
1 0
Rµµ (τ ) = RXX (τ ) ∗ h(−τ ) ∗ h(τ ) = RXX (τ − t ) 1 − dt 0 ,
2T 2T
−2T
+2T
|t 0 |
Z
1
Cµµ (τ ) = CXX (τ ) ∗ h(−τ ) ∗ h(τ ) = CXX (τ − t 0 ) 1 − dt 0 .
2T 2T
−2T
En particular,
+2T
|t 0 |
Z
D
2
E 1 0
σT2 = (µT (0) − µ) = CXX (t ) 1 − dt 0 ,
2T 2T
−2T
donde usamos la paridad de CXX . Ergódico en media sii σT2 → 0.
Procesos Estocásticos
Procesos ergódicos
Teorema de Slutsky
X (t) es ergódico en media sii
ZT
1
lı́m CXX (τ )dτ = 0.
T →∞ T
0
Procesos Estocásticos
Procesos ergódicos - Demo. de Slutsky
Para hacerlo simple: µ = 0.
Primero: Asumimos que es ergódico.
Z+T Z+T * Z+T
+
1 1 1
CXX (τ )dτ = hX (τ )X (0)i dτ = X (τ )dτ X (0)
2T 2T 2T
−T −T −T
p
= |cov(µT (0), X (0))| ≤ σT CXX (0) → 0.
Procesos Estocásticos
Procesos ergódicos - Demo. de Slutsky
Segundo: Asumimos que se cumple el lı́mite.
Queremos mostrar que lı́m σT2 ≤ ε para todo ε > 0. Sabemos que existe
T 0 tal que
ZT
1
CXX (τ )dτ ≤ ε.
T
T0
Fijemos un T0 > T 0 /2,
Z2T0 Z2T
1 1 τ
σT2 = + CXX (τ ) 1 − dτ
T T 2T
0 2T0
Z2T
2T0 1
≤ CXX (0) + CXX (τ ) (2T − τ ) dτ
T 2T 2
2T0
Procesos Estocásticos
Procesos ergódicos - Demo. de Slutsky
Z2T
2T0 1
σT2 ≤ CXX (0) + CXX (τ ) (2T − τ ) dτ
T 2T 2
2T0
Z2T Z2T
2T0 1
≤ CXX (0) + CXX (τ ) dt 0 dτ
T 2T 2
2T0 τ
0
Z2T Zt
2T0 1
≤ CXX (0) + CXX (τ )dτ dt 0
T 2T 2
2T0 2T0
Z2T
2T0 1
≤ CXX (0) + εt 0 dt 0
T 2T 2
2T0
2T0 T − T02
2
≤ CXX (0) + ε → ε.
T T2
Procesos Estocásticos
Procesos ergódicos - Demo. de Slutsky
2T
2T0
2T0 2T t0
Procesos Estocásticos
Procesos ergódicos: ejemplo
X (t) = A cos(ω0 t) + B sin(ω0 t),
con A, B dos variables aleatorias de media cero, varianza σ 2 y
decorrelacionadas. Claramente, hX (t)i = 0 y var(X (t)) = σ 2
(¡demostrar!). Luego (¡hacerlo!)
CXX (τ ) = σ 2 cos(ω0 τ ),
ZT
1 σ2
CXX (τ )dτ = sin(ω0 T ) → 0.
T ω0 T
0
Procesos Estocásticos
Procesos ergódicos
Ergódico en covarianza
Sea X (t) estrictamente estacionario y con media conocida (o
casi). La covarianza temporal es
ZT
1
X (t 0 + τ ) − µ X (t 0 ) − µ dt 0 .
CT (τ ) =
2T
−T
X (t) es ergódico en covarianza si lı́mT →∞ CT (τ ) = CXX (τ ), donde
la convergencia es cuadrática media.
Slutsky otra vez
Se puede usar el teorema de Slutsky para el proceso
Y (t) = (X (t + τ ) − µ) (X (t) − µ).
Beyond the scope of these slides...
Procesos Estocásticos
Procesos ergódicos: ejemplo
X (t) = A cos(ω0 t) + B sin(ω0 t),
No es ergódico en covarianza.
X 2 (t) = A2 cos2 (ω0 t) + B 2 sin2 (ω0 t) + 2AB cos(ω0 t) sin(ω0 t)
A2 + B 2 A2 cos(2ω0 t) − B 2 sin(2ω0 t)
= + + AB sin(2ω0 t).
2 2
A2 + B 2 A2 A2 + B 2
CT (0) = + sin(2ω0 T ) → 6= σ 2
2 4ω0 T 2
Procesos Estocásticos
Procesos ergódicos
Ergódico en distribución
Idea: se puede estimar la distribución de X (t) a partir de una sola
realización. Beyond the scope of these slides...
La distribución de probabilidades temporal viene dada por
ZT
1
FT (x) = Θx (X (t))dt,
2T
−T
donde (
1 X (t) ≤ x
Θx (X (t)) =
0 X (t) > x
X (t) es ergódico en distribución si lı́mT →∞ FT (x) = F (x), la
función de distribución acumulada de X , donde la convergencia es
cuadrática media.
Procesos Estocásticos
Fuentes
Básicamente, Secciones 9.1-9.3 y 12.1 de [1].
Athanasios Papoulis and S. Unnikrishna Pillai.
Probability, random variables, and stochastic processes.
McGraw-Hill, Boston, 4th. edition, 2002.