Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025
Mec Anica Cu Antica II: An Ibal Iucci 25 de Abril de 2025
Anı́bal Iucci
25 de abril de 2025
Índice general
2. Dispersión de partı́culas 49
2.1. Condiciones de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2. Amplitud de dispersión y sección eficaz . . . . . . . . . . . . . . . . . 54
2.3. Funciones de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.1. Cálculo de la función de Green . . . . . . . . . . . . . . . . . 56
2
ÍNDICE GENERAL 3
3. Partı́culas Idénticas 88
3.1. Permutaciones y simetrı́as . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2. Interacción de intercambio . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3. Partı́culas Independientes . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4. Átomos con dos electrones . . . . . . . . . . . . . . . . . . . . . . . . 101
3.5. El método del “campo autoconsistente” a vuelo de pájaro . . . . . . . 104
3.6. El método variacional de Hartree-Fock . . . . . . . . . . . . . . . . . 106
3.7. Cálculo perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
d
iℏ |ψ(t)⟩ = [H0 + V (t)] |ψ(t)⟩. (1.3)
dt
La solución que buscamos de esta ecuación diferencial de primer orden corresponde
al estado inicial
|ψ(t = t0 )⟩ = |ψ0 ⟩ (1.4)
y es única.
El problema consiste entonces en encontrar la solución a la ecuación (1.3) que
corresponde a la condición inicial (1.4). Como método general, podemos representar
5
6
dAH 1
= [AH , H] (1.17)
dt iℏ
se convierte en
AH (t)U † (t, t0 )|a⟩ = a U † (t, t0 )|a⟩ (1.15)
de modo que los kets de la base evolucionan con el “signo contrario” |a(t)⟩H = U † (t, t0 )|a⟩. Sólo
los autoestados de H no evolucionan.
8 1.1 Representación de Interacción
donde |⟩I representa la misma situación fı́sica que |⟩S pero en la RI. Análogamente,
en la RI, los operadores se definen como:
= eiH0 (t−t0 )/ℏ V e−iH0 (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |ψ(t)⟩S
Potenciales dependientes del tiempo 9
Es decir que:
∂
iℏ |ψ(t)⟩I = VI (t) |ψ(t)⟩I (1.28)
∂t
También se puede demostrar que para un observable A (que no depende explı́cita-
mente del tiempo en la RS) vale:
dAI 1
= [AI , H0 ] , (1.29)
dt iℏ
que es una ecuación del tipo Heisenberg con H reemplazado por H0 . En resumen,
la RI en muchos aspectos es intermedia entre la RS y la RH.
Trabajemos la evolución temporal del estado, ahora en la representación de in-
teracción:
|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = cn (t)e−iEn (t−t0 )/ℏ eiH0 (t−t0 )/ℏ |n⟩
X
(1.30)
n
X
= cn (t)|n⟩. (1.31)
n
⟨n|VI (t)|m⟩ = ⟨n|eiH0 (t−t0 )/ℏ V (t)e−iH0 (t−t0 )/ℏ |m⟩ = ⟨n|V (t)|m⟩ei(En −Em )(t−t0 )/ℏ .
(1.34)
Finalmente, insertando 1.32 y 1.34 en 1.33 se encuentra la ecuación buscada,
∂
Vnm (t)eiωnm (t−t0 ) cm (t)
X
iℏ cn (t) = (1.35)
∂t m
donde
En − Em
Vnm (t) ≡ ⟨n|V (t)|m⟩; ωnm ≡ = −ωmn (1.36)
ℏ
10 1.2 Problemas con dos estados
Explı́citamente
Si bien estas expresiones son validas para un estado inicial arbitrario, una situa-
ción realista usual supone que un sistema se prepara inicialmente en algún autoes-
tado |ψ0 ⟩ → |i⟩ de H0 . En ese caso escribimos
donde γ y ω son reales y positivos. Esto significa que los elementos de matriz de
(1.37) son:
V12 (t) = V21∗ (t) = γeiωt ; V11 (t) = V22 (t) = 0. (1.42)
Potenciales dependientes del tiempo 11
Este potencial da origen a las transiciones |1⟩ ⇐⇒ |2⟩ entre los dos estados. Si
inicialmente, en t = 0, está ocupado solamente el nivel más bajo, los coeficientes de
(1.5) serán:
c1 (0) = 1; c2 (0) = 0. (1.43)
Utilizando (1.42) y (1.43) es inmediato escribir la ecuación (1.35):
! ! !
d c1 (t) 0 γei(ω−ω21 )t c1 (t)
= −i(ω−ω21 )t , (1.44)
dt c2 (t) γe 0 c2 (t)
que constituye un sistema de dos ecuaciones lineales de primer orden acopladas que
pueden resolverse con los métodos usuales. La solución da lugar a la probabilidad
de ocupación de los dos estados en t > 0 y está dada por la fórmula de Rabi,
" #1/2
γ 2 /ℏ2 γ2 (ω − ω21 )2
|c2 (t)|2 = 2 2 sin 2
+ t , (1.45)
γ /ℏ + (ω − ω21 )2 /4 ℏ2 4
En la Figura 1.1 están representadas las probabildades |c1 (t)|2 y |c2 (t)|2 en función
del tiempo. Entre t = 0 y t = πℏ/(2γ) el sistema absorbe energı́a del potencial V (t).
En t = πℏ/(2γ) solo el estado superior está poblado y entre t = πℏ/(2γ) y t = πℏ/γ
12 1.2 Problemas con dos estados
0 t
πℏ/2γ πℏ/γ 3πℏ/2γ 2πℏ/γ
| {z }| {z }| {z }
absorción emisión absorción
Figura 1.1: Representación gráfica de |c1 (t)|2 y |c2 (t)|2 para ω = ω21 .
|c2 (t)|2max
0 ω
ω21
para estar de acuerdo con (1.41). De (1.42) vemos, además, que la frecuencia carac-
terı́stica del sistema es:
|e|B0
ω21 = (1.56)
me c
que es la frecuencia de precesión del spin en el campo B0 (cuando B1 = 0). Notemos
que, aún cuando los valores de expectación ⟨Sx ⟩ y ⟨Sy ⟩ varı́an debido a la precesión
del spin, las cantidades |c+ (t)|2 y |c− (t)|2 permanecen constantes mientras que el
campo rotante no actúa.
De la comparación de (1.41) con (1.53) vemos que:
eℏB1
− → γ; ω→ω (1.57)
2me c
y que al aparecer el campo rotante las probabilidades |c+ (t)|2 y |c− (t)|2 varı́an de la
manera indicada en la Figura 1.1 para ω = ω21 . Es decir que además de la precesión
del spin ocurren transiciones |+⟩ ⇐⇒ |−⟩. La condición de resonancia se satisface
cuando la frecuencia del campo magnético rotante coincide con la frecuencia de
precesión del spin determinada por la intensidad del campo magnético uniforme.
|ψ(t)⟩I = eiH0 (t−t0 )/ℏ |ψ(t)⟩S = eiH0 (t−t0 )/ℏ U(t, t0 )|ψ0 ⟩ ≡ UI (t, t0 )|ψ0 ⟩, (1.59)
o
UI (t, t0 ) = eiH0 (t−t0 )/ℏ U(t, t0 ). (1.60)
Potenciales dependientes del tiempo 15
De modo que aquı́ ⟨n |UI (t, 0)| i⟩ no es otra cosa que los coeficientes cn (t) en (1.30),
cn (t) = ⟨n |UI (t, t0 )| i⟩ , (1.68)
y esta es la expresión que utilizaremos para evaluar las amplitudes cn (t) dado que
contamos con un desarrollo perturbativo para UI (t, t0 ). Al insertar la expansión
(1.58) y las expresiones para los coeficientes que se obtienen de la serie de Dyson
(1.64) obtenemos:
c(0)
n (t) = δin
ˆ t ˆ
−i ′ ′ −i t ′ iωni i′
c(1)
n (t) = dt ⟨n |VI (t )| i⟩ = dt e Vni (t′ )
ℏ t0 ℏ t0 (1.69)
2 X ˆ t ˆ t′
−i
′ ′′
c(2)
n (t) = dt′ dt′′ eiωnm t Vnm (t′ ) eiωmi t Vmi (t′′ ) ,
ℏ m t0 t0
Vni iωni t
2 |Vni |2
Pi→n (t) = 1−e = (2 − 2 cos ωni t) (1.75)
ℏωni |ℏωni |2
!2
4 sin ωni t/2
= 2 |Vni |2 (1.76)
ℏ ωni
Esta probabilidad depende del elemento de la matriz de V entre los estados inicial y
final, que a su vez función de todas las propiedades del estado final |n⟩, por ejemplo,
su cantidad de movimiento, spin , etc. Además depende de la diferencia de energı́a
En − Ei = ℏωni entre ambos estados.
el estado final posee energı́a mayor a la del estado inicial, y se trata por lo tanto de
un proceso de absorción. La probabilidad de transición se escribe
" #2
t2 sin(ωni − ω)t/2 2
abs
Pi→n = 2 Vni† . (1.83)
ℏ (ωni − ω)t/2
Estas fórmulas se pueden comparar con la ecuación (1.76). En todos los casos,
Pi→n tiene una dependencia temporal similar, con ωni → ωni ± ω, lo que significa
que el análisis que realizamos anteriormente sigue siendo válido.
energı́a, ωni se vuelve más pequeño, el perı́odo de oscilaciones se vuelve más largo y
la amplitud crece.
Si hay un estado final |n⟩ degenerado en energı́a con el estado inicial |i⟩ (no el
mismo estado ya que asumimos n ̸= i), entonces ωni = 0 y el factor dependiente del
tiempo en la ecuación (1.76) toma su valor lı́mite, que es:
t2
lı́m Pi→n (t) = 2
|Vni |2 . (1.84)
ωni →0 ℏ
Now let us fix the time t and examine how the expression for Pn (t) in first order perturbation
theory, Eq. (38), depends on the energy En of the final state |n" (working for simplicity with the
case of a time-independent perturbation). We shall concentrate on the energy dependence of the
time-dependent factor in the parentheses, remembering that the matrix element also depends on the
energy (and other parameters) of the final state. To do this we plot the function sin2 (ωt/2)/ω 2 as
a function of ω, as shown in Figs. 1 and 2 for two different times. In the plot, ω is to be identified
20 1.6ω specifies
with ωni = (En − Ei )/h̄, so that Primer theorden perturbativo
energy of the final state and ω = 0 is the resonance
(energy conserving) condition.
sin2 ωt/2
t2 ω2
4
1 1
ω2 ω2
sin2 ωt/2
ω2
t2
4
ω ω
− 4π
t
− 2π
t
2π
t
4π
t
− 6π
t − 4π
t
− 2π
t
2π
t
4π
t
6π
t
Fig. 1. The function sin2 (ωt/2)/ω2 as a function of Fig. 2. Same but for a larger value of t. The area of
ω for 1.3:
Figura
fixed t. The dotted curve is the envelope 1/ω2 . the curve is dominated by the central lobe, and grows in
proportion to t.
con
2π
Γi→n = |Vni |2 δ(ωni ). (1.90)
ℏ2
En el caso del potencial armónico, esta ecuación se escribe
2π
Γi→n = |Vni |2 δ(ω − ωni ). (1.91)
ℏ2
Esta es la llamada regla de oro de Fermi y posee numerosas aplicaciones. Podrı́a
ser preocupante que apareciera una función δ, que es infinita en ω = ωni lo que
podrı́a invalidar la teorı́a de perturbaciones. En la práctica esta función tiene que
ser integrada por una razón u otra, y en general la validez de la fórmula a primer
orden de perturbaciones depende del área bajo la función δ.
La función δ en la ecuación (1.88) impone la conservación de energı́a en el lı́mite
t → ∞, es decir, en ese lı́mite solo se permiten transiciones a estados finales de la
misma energı́a que el estado inicial. En tiempos finitos se producen transiciones a
estados en un rango de energı́as alrededor de la energı́a inicial del orden de ∆E ∼ 1/t.
Dicho de manera simple: si perturbamos un sistema fı́sico con un potencial
armónico de frecuencia ω, para tiempos muy largos (infinitos) vamos a inducir tran-
siciones de estados iniciales |i⟩ a estados finales |n⟩ tales que ω = ±(En − Ei )ℏ,
es decir que se conserva la energı́a. Sin embargo, a tiempos más cortos, también es
probable inducir transiciones a estados |n⟩ que que no la conserven.
Figura 1.4: Dispersión elástica de una onda plana por un potencial de rango finito.
E
En
..
N (E) .
E2
E1
E0
Figura 1.5: Niveles de energı́a En . N (E) representa el número de niveles con energı́a
menor a E
que nos permite reemplazar las energı́as En de las que depende el coeficiente cn por
la variable de integración E. Luego
ˆ
Pi→n (t) = dEn ρ(En )|cn (t)|2
X
Pi (t) = (1.97)
n
donde
2π h i
Γi = |Vni |2 ρ (En ) (1.102)
ℏ En =Ei
es la probabilidad de transición por unidad de tiempo.
−η −1 ≲ t ≲ η −1 . (1.104)
Al final del cálculo hacemos η → 0 de tal modo que el potencial crezca muy lenta-
mente.
De (1.69) tenemos ˆ
(1) iVin t ′ iωni t′ ηt′
cn (t) = − dt e e (1.105)
ℏ t0
Para t ≲ −η −1 , eηt se hace muy pequeño y podemos reemplazar t0 por −∞, o sea
ˆ
iVni t ′ ′
(1)
cn (t) = − dt′ eiωni t ent (1.106)
ℏ −∞
eηt+iωni t
c(1)
n (t) = Vni (1.107)
ℏ (−ωni + iη)
y la probabilidad de transición es:
2 e2ηt
Pi→n (t) = c(1)
n (t) = 2 |Vni |2 . (1.108)
(En − Ei ) + (ηℏ)2
que nos lleva al resultado (1.90) que habı́amos obtenido antes cuando el potencial
era “conectado” de repente. Vemos por lo tanto que la probabilidad de transición
Γ(i → n) no depende de los detalles de cómo actúa el potencial.
con: ˆ
′ ′
⟨k|k ⟩ = δ (k − k ) ; dk |k⟩⟨k| = 1 (1.116)
Las autofunciones para este problema de autovalores se obtiene facilmente por medio
de la separación de variables:
1
ψk (r) = eik·r (1.119)
ℓ3/2
donde las componentes de k están dadas por:
2π 2π 2π
kx = nx , ky = ny , kz = nx , (1.120)
ℓ ℓ ℓ
con nx , ny , nz = 0, ±1, ±2, . . .. Si
q 2π q 2 2π
k = |k| = kx2 + ky2 + kz2 = nx + n2y + n2z ≡ n, (1.121)
ℓ ℓ
los autovalores de energı́a de los estados (1.117) son:
2
ℏ2 k 2 ℏ2 2πn
E= = (1.122)
2me 2me ℓ
Cada triplete de números enteros (nx , ny , nz ) corresponde a una onda plana o a un
estado de la partı́cula en el espacio k ≡ (kx , ky , kz ). Notar que cuando ℓ → ∞, kx , ky
8
Dado que un sistema fı́sico real está siempre en algún sentido localizado, la introducción de un
contenedor con dimensiones suficientemente grandes, en comparación con con las que son relevantes
para el sistema considerado, no afectará al sistema en forma significativa. Es decir que podemos
tener dentro de una caja una “onda plana fı́sica”, si la caja es muy grande en comparación con la
longitud de onda de la partı́cula.
Potenciales dependientes del tiempo 27
2π 2
|⟨k′ |V |k⟩| δ (Ek′ − Ek ) .
X
Γk = Γk→k′ ; Γk→k′ = (1.126)
k′ en dΩ′
ℏ
De (1.117)
ˆ ′ ˆ
′ e−ik ·r eik·r 1 ′ Vk−k′
⟨k |V |k⟩ = dr 3/2 V (r) 3/2 = 3 dr V (r)ei(k−k )·r = (1.127)
ℓ ℓ ℓ ℓ3
obtenemos de (1.126):
dΩ′ mk
Γk = |Vk′ −k |2 , (1.129)
ℓ3 4π 2 ℏ3
donde k′ es un vector en dΩ′ de longitud k. Dividiendo finalmente por el flujo de
partı́culas incidentes ℏk/mℓ3 se obtiene la sección eficaz10 :
dσ m2
′
= 2 4
|Vk′ −k |2 (1.130)
dΩ 4π ℏ
9
Esto equivale a tomar un estado por cubo drdp/(2πℏ)3 en el espacio de las fases.
La densidad de las de partı́culas incidentes es ℓ−3 (una partı́cula en el volumen ℓ3 ) y su
10
velocidad es ℏk/m.
28 1.7 Transiciones de segundo orden
Luego
ci (t) = e−i∆i t/ℏ ; |i(t)⟩I = e−i∆i t/ℏ |i⟩ (1.139)
Cuando los estados |n⟩ son discretos, y el estado |i⟩ no está degenerado, el término
iηℏ no tiene ningún efecto en el lı́mite η → 0. En esta situación ∆i es precisamente la
expresión para el corrimiento de energı́a, en segundo orden perturbativo, producido
por una perturbación estacionaria V .
Comparando
|i(t)⟩S = e−i(Ei +∆i )t/ℏ |i⟩ (1.140)
con el ket no perturbado (para V (t) = 0), |i, t0 ; t⟩S = e−iEi t/ℏ |i⟩, podemos concluir
que, al conectar el potencial muy lentamente y cuando el espectro es discreto, los
autoestados de H0 se transforman adiabáticamente en autovalores de H0 + V (t). Es
decir que la teorı́a de perturbaciones estacionarias pueden ser consideradas como un
caso especial de la teorı́a de perturbaciones dependientes del tiempo.
Supongamos ahora que el estado |n⟩ es uno de los niveles del contı́nuo con En ≈
Ei . En tal caso
´ la sumatoria en (1.138) hay que interpretarla como una integral, o
sea: n̸=i → dEn ρ (En ), como se habı́a hecho antes. Recordando, además, que
P
1 1
lı́m = Pr − iπδ(x) (1.141)
δ→0 x + iδ x
30 1.8 Decaimiento del estado inicial
Figura 1.8: Forma de la distribución en energı́a de los estados finales una vez que
haya decaı́do el estado inicial.
|Vni |2
Pi→n (t → ∞) = (1.149)
[En − Ei − Re (∆i )]2 + Γ2i /4
La distribución en energı́a de los estados finales, Pi→n (t → ∞), está representada en
la Figura 1.8. Vemos que el máximo está en En = Ei − Re (∆i ) y que tiene forma
Lorenziana con un ancho igual a Γi .
1 ∂A(r, t)
E(r, t) = − , B(r, t) = ∇ × A(r, t). (1.157)
c ∂t
La densidad de la energı́a del campo electromagnético es
E 2 (r, t) + B 2 (r, t)
U (r, t) = (1.158)
8π
ω2 h 2
2 2 2ik·r−2iωt
i
U= |a| − Re a ϵ e (1.159)
2πc2
El último término oscila con el tiempo y su promedio es nulo para un perı́odo. Luego
ω2
U= |a|2 (1.160)
2πc2
c ω2 2
P = E(r, t) × B(r, t) = k̂cU = k̂ |a| , (1.161)
4π 2πc
Enfaticemos que si bien las partı́culas son objetos cuánticos ya que sus posiciones
y momentos están representadas por operadores ri y pi , el campo electromagnético
es clásico, es decir, obedece las ecuaciones clásicas de Maxwell. No obstante, las
cantidades A(ri , t) y ϕ(ri , t) en la expresión anterior son operadores por depender
de las posiciones y momentos de las partı́culas.
Vamos a utilizar además una aproximación en la que A es pequeño y quedarnos
con el término lineal en el potencial vector, de manera que si denotamos
N
X p2i
H0 = (1.163)
i 2m
entonces el Hamiltoniano de interacción se escribe
2
1 e
V (t) = pi − A(ri , t) − H0 (1.164)
2m c
X e
=− [pi · A(ri , t) + A(ri , t) · pi ] + O(A2 ) (1.165)
2mc
i
ˆ
e 1 X
=− dr [pi δ(r − ri ) + δ(r − ri )pi ] · A(r, t) + O(A2 ) (1.166)
c 2m i
ˆ
e
=− dr j(r) · A(r, t) (1.167)
c
donde hemos definido el operador corriente en la forma
N
1X pi pi
j(r) = δ (r − ri ) + δ (r − ri ) (1.168)
2 i=1 m m
Este operador es la suma de términos que representan la velocidad de las partı́culas
multiplicadas por los operadores densidad δ(r − ri ). Debido a la forma simétrica de
(1.168), j(r) es un operador hermı́tico. Observemos que p · A(ri , t) ̸= A(ri , t) · p, y
lo mismo vale para ambos términos en la corriente. Solo en el gauge transversal de
Coulomb, para el cual vale (1.150), tendremos que p · A(r, t) = A(r, t) · p. Nótese
además que en la ecuación (1.167) A(r, t) no es más un operador ya que todos los
operadores de posición ri están contenidos en j(r)
16
El electron posee carga e < 0.
17
Se podrı́a incluir también un potencial U que describiera a todos los demás potenciales que
que ven las partı́culas, por ejemplo, los que mantienen al sistema en un volumen finito, o si se
tratara de electrones en átomos, las interacción Coulombianas con el núcleo atómico, o incluso
entre electrones del mismo o de diferentes átomos.
1.9 Interacción del campo electromagnético clásico con un sistema de partı́culas
34 cargadas
1.9.1. Absorción de la luz
Para fuentes luminosas usuales los campos eléctricos generados por A son gene-
ralmente pequeños comparados con los campos atómicos (∼ e/a20 ). En esta situación
el efecto del término ρA2 , de segundo orden en A, es pequeño comparado con el
efecto de j · A y podemos despreciarlo en el cálculo de la absorción de la luz por un
sistema de partı́culas cargadas, tales como átomos. En tal caso:
ˆ
e
V (t) = − dr j(r) · A(r, t) (1.169)
c
Si representamos a A(r, t) por una ondas planas como en (1.153) el potencial resulta
e
V (t) = − aj−k · ϵe−iωt + a∗ jk · ϵ∗ eiωt (1.170)
c
donde ˆ N
1X pi −ik·ri pi
−ik·r
jk ≡ dr e j(r) = e + e−ik·ri . (1.171)
2 i=1 m m
son los operadores. Vamos a calcular ahora la probabilidad de que un haz de luz,
representado por (1.153), sea absorbido por el sistema, que está en un estado |i⟩.
Vemos de inmediato que cada sumando de V (t) es de la forma (1.77) con
e
− a∗ j k · ϵ ∗ → V
c (1.172)
e
− aj−k · ϵ → V †
c
Luego, podemos utilizar los resultados (1.83) y (1.81), que para tiempos grandes
resultan en la probabilidad por unidad de tiempo
2π e2
Γabs
i→n (kϵ) = δ (En − Ei − ℏω) 2 |a|2 |⟨n |j−k · ϵ| i⟩|2 (1.173)
ℏ c
En general la radiación no es monocromática (con una única ω) sino una mezcla
incoherente de ondas con distintos ϵ, k y ω. Supongamos entonces una superposición
de ondas planas de la forma (1.153) donde cada modo posee su porpia amplitud.
Supondremos que el haz es incoherente de tal modo de que no exista ninguna co-
rrelación entre las diferentes componentes de Fourier del haz. Por ejemplo, la luz
emitida por un gas caliente, tal como el vapor de mercurio, resulta de las contribu-
ciones de todos los átomos del gas, entere cuyas componentes no hay ningún tipo
de correlación. (Se dice que la distribución de fases es al azar.) En esta situación
podemos calcular el efecto de cada una de las componentes de Fourier del haz in-
cidente por separado y luego sumar sobre todas las contribuciones. (No hay efectos
de interferencia en la interacción de la luz con el átomo.).
Potenciales dependientes del tiempo 35
1 e2 2π X
Γabs
i→n = |akϵ |2 |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.174)
V c2 ℏ kϵ
donde ahora ℏω = En − Ei .
Supongamos ahora que la luz incidente está polarizada según ϵ y que está com-
prendida dentro de un ángulo sólido dΩ. De (1.176) la correspondiente probabilidad
de transición (diferencial) será:
2πe2 ω 2
Γabs
i→n (ϵ) = 2 2 3
|⟨n |j−k · ϵ| i⟩|2 |akϵ |2 dΩ
ℏ c (2πc)
(1.177)
(2π)2 e2
= 2 2 |⟨n |j−k · ϵ| i⟩|2 I(ω)dΩ,
ℏω c
donde
ω4
I(ω) = 4
|akϵ |2 . (1.178)
(2πc)
Se verifica que I(ω) es la intensidad de la luz incidente dentro de un ángulo sólido
dω por unidad de frecuencia. En efecto, según (1.161), y pasando al continuo de
acuerdo a (1.175) el flujo de energı́a transportada es:
ˆ ˆ ˆ ˆ
c X ω2 2 ω4 2
|akϵ | = dΩ dω |akϵ | = dΩ dω I(ω) (1.179)
V k 2πc2 (2πc)4
De una forma análoga se obtiene que la probabilidad de emisión por unidad tiempo,
inducida por el haz incidente desde el estado inicial |i⟩ al estado final |n⟩ de menor
energı́a, es
(2π 2 )e2
Γ[Link]
i→n (ϵ) = |⟨n |jk · ϵ∗ | i⟩|2 I(ω)dΩ (1.180)
ℏ2 ω 2 c
siendo aquı́ ω = (Ei − En ) /ℏ. Notemos que, como
donde nkϵ es el número de fotones en el modo {kϵ} del haz incidente. Comparando
esta última expresión con la energı́a del campo electromagnético
ω2
|akϵ |2
X
E= (1.185)
kϵ 2πc2
vemos que la amplitud akϵ está relacionada con el número de fotones por
2πℏc2
|akϵ |2 = nkϵ (1.186)
ω
Luego en lugar de (1.183) podemos escribir
4π 2 e2
nkϵ |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω)
X
Γi⇄n = (1.187)
kϵ ωV
un haz son los números nkϵ , no tenemos ninguna información sobre las fases entre
las diferentes componentes de Fourier del haz18 .
La probabilidad de transición total por unidad de tiempo producida por un haz
de nkϵ fotones incidentes será, de (1.187)
4π 2 e2 cnkϵ X
Γabs
i (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.188)
ωc V n
4π 2 e2 X
σiabs (ϵ; ω) = |⟨n |j−k · ϵ| i⟩|2 δ (En − Ei − ℏω) (1.189)
ωc n
Ze2 Ze2
ℏω ∼ ≈ (1.190)
a0 /Z Rátomo
Esto conduce a:
ω Ze2 Z
k= ∼ = (1.191)
c ℏcRátomo 137Rátomo
o sea
kRátomo = Rátomo /λ ∼ Z/137, (1.192)
donde λ = 1/k es la longitud de onda del campo de radiación. Si ahora expandimos la
exponencial eik·r en la integral (1.171) con respecto a la posición del núcleo átomico
r0 = 0, i.e.,
eik·r = 1 + ik · r + · · · (1.193)
18
En una descripción cuántica completa de la radiación, los nkϵ y las fases de akϵ son cantidades
complementarias (como el impulso y la posición) y cuanto mejor especificamos a una de ellas tanto
menos información tenemos sobre la otra.
38 1.10 Aproximación dipolar eléctrica
k · r ≲ kRátomo ≪ 1 (1.194)
donde
P 1
=
j0 = [d, H0 ] . (1.196)
m −eiℏ
P
Aquı́, P = i pi es el operador de impulso total, H0 es el Hamiltoniano del átomo
en ausencia de la radiación [ver (1.163)] y d = −e i ri es el operador del momento
P
dipolar eléctrico.
Luego, como ℏω = En − Ei , en la aproximación dipolar será:
iω
⟨n |j−k | i⟩ ≈ dni ; dni = ⟨n|d|i⟩ (1.197)
−e
donde dni es el elemento de matriz no-diagonal del momento dipolar eléctrico. La
sección eficaz es ahora
(2π)2 ω X
σiabs;dip (λ; ω) = |dni · ϵ|2 δ (En − Ei − ℏω) (1.198)
c n
y la sección eficaz total se obtiene integrando la anterior sobre todas las frecuencias:
ˆ ∞
(2π)2 X
abs;dip
σi (ϵ) = dω σiabs;dip (ϵ; ω) = 2 (En − Ei ) |dni · ϵ|2 , (1.199)
0 ℏc n
2π 2 e2
σiabs;dip ( pol. lineal ) = N. (1.204)
mc
19
La ecuación (1.199) es una consecuencia de la relación de conmutación entre r y p. En efecto,
Potenciales dependientes del tiempo 39
cambia ante una transformación de paridad, los elementos de matriz serán no nulos
solo si la paridad P de los estados |i⟩ y |n⟩ es opuesta. Es decir, debe ser
∆P = Pn − Pi ̸= 0 (1.205)
ó X X
⟨i|P · û|n⟩⟨n|d · û|i⟩ − ⟨i|d · û|n⟩⟨n|P · û|i⟩ = ieℏN. (1.203)
n n
∆J = 0, ±1
J = 0 → J = 0 está prohibida
∆mJ = 0, ±1
∆L = 0, ±1
∆ML = 0, ±1
∆S = 0
∆MS = 0
Notemos que está permitido que ∆L = 0. Pero este L nada tiene que ver con la
paridad del estado (No es el L que aparece en un armónico esférico determinando
su paridad a través de algún (−1)L .
Potenciales dependientes del tiempo 41
ie X
vs = − (ϵ · pi ) (k · ri ) (1.214)
mc i
vs = vM + vQ (1.215)
con
ie X
vM = − ((ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ))
2mc i
(1.216)
ie X
vQ = − ((ϵ · pi ) (k · ri ) + (ϵ · ri ) (k · pi ))
2mc i
Es fácil ver que
(ϵ · pi ) (k · ri ) − (ϵ · ri ) (k · pi ) = (k × ϵ) · Li (1.217)
de manera que
ie
vM = −
X
(k × ϵ) · Li (1.218)
2mc i
ie
vQ = − Ei kj Qij (1.221)
mc
donde Qij es el momento cuadrupolar eléctrico.
42 1.12 Fórmula de Kubo
además de inducirse las transiciones a los estados excitados estudiadas antes. Resulta
mas conveniente trabajar en la representación de interacción, es decir, escribirlo en
términos del operador de evolución en la representación de interacción UI (1.61):
⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )eiH0 (t−t0 )t/ℏ Oi e−iH0 (t−t0 )t/ℏ UI (t, t0 )|ψ0 ⟩ (1.228)
⟨Oi ⟩(t) = ⟨ψ0 |UI† (t, t0 )Oi (t)UI (t, t0 )|ψ0 ⟩. (1.229)
Potenciales dependientes del tiempo 43
i
χij (t, t′ ) = − Θ(t − t′ )⟨[Oi (t), Oj (t′ )]⟩ , (1.235)
ℏ
que, debido a la función de Heaviside, naturalmente emerge como una función res-
puesta causal. Dado que en representación de interacción la evolución temporal de
los operadores (1.12) es con H0 y que |ψ0 ⟩ es autoestado de H0 , no es difı́cil conven-
cerse de que
χij (t, t′ ) = χij (t − t′ )
44
1.13 Fórmula de Kubo para la conductividad eléctrica: hacia una teorı́a de campos
este operador, un observable, al ser una función de la posición, está describiendo una
teorı́a cuántica de campos, que es el lenguaje en el que los sistemas de partı́culas
se expresan naturalmente. Una extensión natural de la fórmula de Kubo (1.235)
al continuo, es decir, cuando los ı́ndices i se convierten en un continuo en tres
dimensiones, el valor medio del operador corriente está dado por
ˆ
dr ′ dt′ χαβ (r − r ′ , t − t′ ) Aβ (r ′ , t′ )
X
⟨jα (r, t)⟩ = ⟨jα (r)⟩0 + (1.240)
β
20
Un eventual término de potencial escalar en el Hamiltoniano se puede escribir como
N
X ˆ
eϕ(ri , t) = e drρ(r)ϕ(r, t) (1.248)
i=1
y una expresión análoga para el potencial vector. Por un lado, la relación entre
campo eléctrico y potencial vector (en el gauge de Coulomb, donde ϕ = 0) se escribe
iω
E(r, ω) = A(r, ω), (1.254)
c
y por otro, para el valor de expectación de la corriente fı́sica tenemos
en
⟨Jα (r, ω)⟩ = ⟨jα (r, ω)⟩ − Aα (r, ω) (1.255)
ˆ mc
en
dr ′ χαβ (r − r ′ , ω)Aβ (r ′ , ω) −
X
= Aα (r, ω) (1.256)
β mc
ˆ
en c
′ ′ ′
Eα (r ′ , ω)
X
= dr χαβ (r − r , ω) − δ(r − r )δαβ (1.257)
β mc iω
(1.258)
donde
c en
σαβ (q, ω) = −i χαβ (q, ω) − δαβ (1.260)
ω + iη mc
Finalmente, hemos agregado una pequeña parte imaginaria ε a la frecuencia porque
la función respuesta causal debe ser analı́tica en el semiplano superior.
En un gas de electrones libres, el operador corriente conmuta con el Hamilto-
niano. En consecuencia,
j(0, t) = eiH0 t j(0, 0)e−iH0 t = j(0, 0) y [jα (0, t), jβ (0, 0)] = 0. (1.261)
De este modo,
" #
ne2 ne2 ne2
σαβ (0, ω) = iδαβ = δ αβ πδ(ω) + i . (1.262)
mω + m mω
τ −1
πδ(ω) = lı́m ,
τ →∞ (ωτ )2 + 1
colisiones; para electrones libres, sin embargo, este tiempo de vida medio es infini-
to y lo mismo para la conductividad dc21 . Si incluyéramos interacciones entre los
electrones obtendrı́amos un tiempo de vida finito. La parte imaginaria de σαβ (0, ω)
describe la absorción óptica (aquı́ entra la disipación) que decrece como 1/ω.
21
En ingles se utiliza la sigla dc, o direct current para la corriente continua y ac o alternate
current para la acorriente alterna.
Capı́tulo 2
Dispersión de partı́culas
y en general consideraremos potenciales que decaen más rápido que 1/|r|, a los
que llamamos de corto alcance. Hablaremos de la dispersión de una partı́cula por
49
50 2.1 Condiciones de Contorno
detector
dA
dΩ
haz dispersado
r
θ
haz incidente
z
Para un vector de onda incidente k dado, el efecto del potencial será dispersar esta
onda, de manera que en el detector, a grandes distancias del potencial, la función
de onda será
ψ|r|→∞ ∼ ψi + ψd = eik·r + ψd (2.6)
donde ψd representa el efecto del potencial dispersor. De acuerdo con la imagen de
la figura 2.2, requerimos que a grandes distancias la onda dispersada sea puramente
saliente, es decir, que sea una onda esférica que se propague en dirección radial,
pero que el efecto de la dispersión dependa de los ángulos (θ, φ) . Por esta razón
suponemos que la forma asintótica de la función de onda será
eikr
ψ|r|→∞ ∼ eik·r + fk (θ, φ) . (2.7)
r
Suponiendo que V (r) puede ignorarse a grandes distancias y observando que la
ecuación solo se aplica asintóticamente, requerimos que la onda dispersada satisfaga
la ecuación de Schrödinger para partı́culas libres a orden dominante en 1/r, lo cual
se verifica debido a que
eikr ikr
" # " #
2 e 1
2
∇ fk (θ, φ) = −k fk (θ, φ) + O 3 , (2.8)
r r r
donde el termino dominante proviene del término radial del Laplaciano en coorde-
nadas esféricas1
Las condiciones de contorno están completamente parametrizadas por el vector
de onda incidente k, que también determina el valor de la energı́a E a través de la
relación (2.5). Una misma energı́a incidente puede obtenerse con muchas números
de onda diferentes, variando su dirección. La familia está parametrizada por puntos
en una esfera (la dirección de k). (En la dispersión unidimensional, esta familia se
reduce a dos miembros, ondas de dispersión que inciden desde la derecha o desde
la izquierda). Por esta razón, de ahora en adelante denotaremos las soluciones de
dispersión de la ecuación de Schrödinger ψk , donde se entiende que k y el valor
propio de la energı́a E están conectados por la relación de partı́culas libres (2.5).
Es plausible que para cada k existe una única solución a la ecuación de Schrödin-
ger con energı́a (2.5) y que satisface las condiciones de contorno (2.7). Este es un
hecho que se puede probar con la teorı́a de las ecuaciones integrales de Fredholm.
Observamos que en la teorı́a de la dispersión las únicas cantidades que son intere-
santes fı́sicamente son aquellas definidas por las propiedades asintóticas (r grande)
1
El Laplaciano en coordenadas esféricas posee la forma
∂2ψ
2 1 ∂ 2 ∂ψ 1 ∂ ∂ψ 1
∇ ψ= 2 r + 2 sin θ + 2 2 . (2.9)
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂φ2
Dispersión de partı́culas 53
t= 0
Figure 13.2. Scattering of a wave packet incident from the left with mean momentum hko.
In elastic scattering, the wave packet is scattered with equal energy but varying amplitudes
Figura 2.2: Dispersión de un paquete de ondas incidente desde la izquierda con
in different directions (indicated by the thickness of the arrows). In the forward direction,
impulso the
medio
scattered 0 . En
ℏkwave la dispersión
interferes elástica,
with the advancing el paquete
incident wave. de ondas se dispersa con
igual energı́a pero con amplitudes variables en diferentes direcciones (indicadas por
el grosorof-mass
de las frame
flechas). En la dirección de avance, la onda dispersada interfiere con
in which the total momentum of the system is zero, or with the use
la onda of
incidente que avanza.
relative coordinates appropriate to the interaction between two particles. The cross
section depends on the collision parameters (incident energy, polarization, etc.) and
the particular variables (scattering angle, energy loss, etc.) which quantify the out-
come X. If these variables are denoted by x in the theoretically preferred frame-of-
reference, a transformation to the corresponding variables, x', in the laboratory
frame must be carried out. Formally, the differential cross-sections in the two frames
are related by
dax = dax dx
(13.6)
dx' dx dx'
This relation cautions us that the two differential cross sections do not have the same
value. A numerical example at the end of this section illustrates this for the angular
distribution.
We now turn to the theoretical calculation of a scattering cross section. In an
idealized scattering process, a single fixed scattering center or target particle is bom-
barded by particles incident along the z axis. It is assumed that the effect of the
scattering center on the particles can be represented by a potential energy V(r) which
is appreciably different from zero only within a finite region. Although this as-
sumption excludes as common a long-range force as the Coulomb field, represented
by a potential proportional to 1/r and observable as Rutherford scattering, this lim-
itation is not severe. In actual fact, the Coulomb field is screened at large distances
by the presence of electrons in atoms and by other particles, and for large r the
potential falls off faster than 1/r.
54 2.2 Amplitud de dispersión y sección eficaz
ℏ ℏk
Ji = (ψi∗ ∇ψi − ψi ∇ψi∗ ) = k̂ ≡ vi k̂ (2.10)
2mi m
con vi = ℏk/m nes la velocidad de las partı́culas incidentes. En cuanto al dispersado,
toma la forma, a grandes distancias2
2
ℏ ℏ
Jd = [ψd∗ ∇ψd − ψd ∇ψd∗ ) = 2
|fk (θ, φ)|2 iker
2mi 2mi r
∂fk∗ (θ, φ)
!
1 ∗ ∂f k (θ, φ)
+ 3 fk (θ, φ) − fk (θ, φ) eθ +
r ∂θ ∂θ
∗
! #
1 ∂f k (θ, φ) ∂f (θ, φ)
f ∗ (θ, φ) − fk (θ, φ) k eφ (2.12)
r3 sin θ k ∂φ ∂φ
∂ψ 1 ∂ψ 1 ∂ψ
∇ψ(r, θ, φ) = er + eθ + eφ . (2.11)
∂r r ∂θ r sin θ ∂φ
Dispersión de partı́culas 55
y refleja la probabilidad total de que una partı́cula sea dispersada, dividida por el
flujo de probabilidad incidente.
Hemos pasado de esta manera del problema de resolver una ecuación diferencial,
(2.18), al problema de resolver la ecuación integral. Veremos que la solución, que
será iterativa, nos permitirá en particular, calcular fk (θ, φ) y ası́ podremos calcular
la sección eficaz de dispersión.
obtenemos
1 1
gk (r) = ′2
. (2.26)
2π k − k 2
2
k' = +VJ?-
- + i1'/ "'" +(k
- + 2k
i1'/)
for small 1'/. The path of integration leads along the real axis from - 00 to + 00.
Since r is necessarily positive, a closed contour may be used if we complete
the path by a semicircle of very large radius through the upper half k' -plane. It
encloses the pole in the right half plane. The result of the integration is not altered
Dispersión
by introducing detours avoiding the two de k' = +k and k' = -k, as indicated
partı́culas
points 57
Imk'
,,"
.". ... -- ---- ----- ......... ....
.... .
/"""" "
"
;
"....
,
;
;
;
..
,, , "",,
I
I ,
\
\
I
I
f \
I \
,,
I
,,
\
,
I I
I
----'------L-_:---I.----+---.,----+---r--_-...L.--Re k'
o
X.
-k- 17J
2k
Figure 13.5. Path of integration in the complex k' plane.
Figura 2.3: Camino de integración en el plano complejo k ′ .
donde θ′ es el ángulo que forma k con el eje z. Luego de integrar trivialmente sobre
φ′ y sobre θ′ , llegamos a
ˆ ∞
i 1 h ′
−ik′ r
i
Gk (r) = k ′ dk ′ ′2 e ik r
− e
πr 0 k − k2
ˆ ∞ ik′ r (2.29)
1 ′ ′ e
= k dk ′2
iπr −∞ k − k2
Esta es una integral que tiene singularidades en el camino de integración. Se trata
de un problema que tiene una solución muy simple en la teorı́a de una variable
compleja y que consiste en deformar ligeramente el camino de manera de esquivar
los polos. Alternativamente se pueden desplazar esos polos del eje real.
ˆ ∞ ′
± 1 ′ ′ eik r
Gk (r) = k dk ′2
iπr −∞ k − (k 2 ± iε)
ˆ ∞ ′ (2.30)
1 ′ ′ eik r
= k dk √ √
iπr −∞ k ′ − k 2 ± iε k ′ + k 2 ± iε
′
Si consideramos que k ′ es una variable compleja con parte imaginaria positiva, eik r
decrece exponencialmente cuando r → ∞. En tal caso, si consideramos un camino
de integración en el semiplano positivo como el de la figura 2.3, la integral sobre el
semicı́rculo se anula.
Los polos corresponden a los valores de k ′ tales que
′
√
iε
k = ± k ± iε ≈ ±k 1 ± 2 + O ε2 .
2 (2.31)
2k
58 2.3 Funciones de Green
Para el caso en que se suma +ε a la parte imaginaria los polos están en k ′ = k + iε̄ y
en k ′ = −k − iε̄ por lo que, en el camino de la figura 2.3 solo contribuye el primero.
En este caso se obtiene fácilmente, utilizando el teorema de Cauchy,
eikr
G+
k (r) = (2.32)
r
Análogamente, para el caso en que se suma −ε solo contribuye el polo que co-
rresponde a k ′ = −k + iε y se obtiene
e−ikr
G−
k (r) = (2.33)
r
Lo mismo se hubiera obtenido de considerar un camino en el semiplano inferior.
Tenemos entonces para la solución (2.23),
ˆ ±ik|r−r ′ |
± 1 3 ′e
ψk (r) = eik·r
− dr u (r ′ ) ψk± (r ′ ) (2.34)
4π |r − r ′ |
Que existan dos soluciones se debe a que la ecuación a resolver es de segundo
orden. Debemos entonces elegir la solución que se adecue a la condición de contorno
que impusimos, i. e. a una onda esférica saliente a grandes distancias. Es fácil con-
vencerse que, para r → ∞, es la solución ψk+ la que tiene el buen comportamiento.
En efecto, desarrollando el argumento del exponencial se tiene
√
k|r − r ′ | = k r2 − 2rr′ cos α + r′2 (2.35)
!1/2
2r′ r′2
= kr 1 − cos α + 2 (2.36)
r r
′
!
r·r 1
≈ kr 1 − 2 +O 2 (2.37)
r r
de manera que
ˆ
1 e±ikr ′ ′
ψk± (r) ik·r
=e − d3 r′ e∓ik ·r u (r ′ ) ψk± (r ′ ) (2.38)
4π r
donde hemos llamado k′ = k r̂. Tenemos entonces como solución acorde con las
condiciones de contorno a aquella que se escribe
ˆ
1 eikr ′ ′
+
ψk (r) = eik·r
− d3 r′ e−ik ·r u (r ′ ) ψk+ (r ′ ) . (2.39)
4π r
De esta expresión podemos identificar a la amplitud de dispersión fk (θ, φ), ya que
la habı́amos definido ası́:
eikr
ψr→∞ ∼ eik·r + fk (θ, φ) . (2.40)
r
Dispersión de partı́culas 59
Tendremos entonces
ˆ
m ′ ′
fk (θ, φ) = − d3 r′ V (r ′ ) ψk+ (r ′ ) e−ik ·r . (2.41)
2πℏ2
dσ
= |fk (θ, φ)|2 (2.43)
dΩ
obtendremos la sección eficaz diferencial en la aproximación de Born
ˆ 2
dσ (0) 2 m2 3 ′ ′ i(k−k′ )·r ′
= fk (θ, φ) = 2 4 d r V (r ) e (2.44)
dΩ 4π ℏ
obtenemos ˆ ∞
4π
V (q) ≡ V (q) = dr V (r)r sin qr (2.46)
q 0
Por lo tanto, la amplitud de dispersión sólo depende q ≡ |q| (recordar que k ′ = k):
h i1/2 θ
q = |k − k′ | = 2k 2 (1 − cos θ) = 2k sin (2.47)
2
El ángulo θ está ilustrado en la figura 2.4.
solo depende de q = lql (recordar que k' = k):
q = lk- k'I . J 2k 2 (1 - cos 0)] 112 = 2k sin;, (2.54)
~El. ángulo-0.. está ilustrado [Link] figura 2.6. Notemos que-en la aproximación de Bornes .
n -- •-···-·
conveniente considerar a la sección eficaz diferencial, no como una función del ángulo 0,
60 sino como función del momento transferido ·q. de Born
2.4 Aproximación
obtenemos,
2mV0 1
f (1) (q) = − (2.50)
µℏ q + µ2
2 2
2. f (1) es siempre real. Notemos que esto lleva, en principio, a una dificultad
con respecto al teorema óptico (2.83). Como éste esencialmente expresa la
Dispersión de partı́culas 61
ukl (r)
Rkl (r) = , (2.58)
r
donde ukl es solución de la ecuación radial,
!
d2 2m l(l + 1)
− 2 + 2 V (r) + − k 2 ukl (r) = 0, (2.59)
dr ℏ r2
que satisface
ukl (0) = 0. (2.60)
Aquı́ hemos parametrizado a la energı́a positiva usando (2.5). En los problemas de
dispersión, tı́picamente V (r) es de rango finito b (es decir, que V (r) ≃ 0 para r > b
y por lo tanto puede despreciarse), y entonces para r grande las soluciones son de
la forma
Rkl (r) = Al jl (kr) + Bl nl (kr), r ⩾ b, (2.61)
donde jl y nl son las funciones de Bessel esféricas, relacionadas con las funciones de
Bessel de primera y segunda especie (o función de Neumann):
π
r
jl (x) = Jl+1/2 (x), (2.62)
2x
π
r
nl (x) = Nl+1/2 (x). (2.63)
2x
Al y Bl son dos constantes que deberı́an determinarse (para cada l) para que la
solución sea continua y bien comporatada en todo el espacio, para lo cual se necesi-
tarı́a resolver la ecuación para r < b, lo cual es muy engorroso. Para evitar este paso
concentrémonos en el comportamiento asintótico de la solución radial en r ⩾ b, que
es de la forma
sin(kr − lπ/2) cos(kr − lπ/2)
Rkl (r) = Al (k) − Bl (k) , r ⩾ b. (2.64)
kr kr
Dispersión de partı́culas 63
Figura 2.4: δl > 0 implica que la onda asintótica es empujada hacia adentro, mientras
que para δl < 0 es empujada hacia afuera.
Si el problema fuera el de una partı́cula libre, la solución (2.61) serı́a válida para
todo r y no sólo en forma asintótica. En este caso deberı́amos tomar Bl = 0 ya que
la función nl es divergente en el origen y buscamos soluciones regulares. La presencia
de un Bl no nulo viene determinada por el potencial, y cuanto más intenso sea éste,
mayor la dispersión que produce y más importante el Bl . Si escribimos en (2.61)
obtenemos
sin(kr − lπ/2 + δl )
Rkl (r) ≃ Cl (2.66)
kr
donde Cl = Al / cos δl es otra constante. Observamos que el comportamiento asintóti-
co de la onda parcial l es el mismo que el de la partı́cula libre, pero con una fase
corrida en δl . Por ello δl se denomina corrimiento de fase producido por el potencial.
Estos corrimientos de fase (o phase shifts en inglés) dependen de la energı́a, o del
número de onda k en módulo. Veremos que la amplitud de dispersión y por lo tanto
las secciones eficaces ¡sólo dependen de los corrimientos de fase! y por lo tanto éstos
poseen toda la información que nos interesa. Entonces, en lugar de resolver la ecua-
ción diferencial completa para todos los valores de r, utilizaremos las expresiones
asintóticas (2.61), a las que le impondremos las condiciones de contorno.
Dado que en ausencia de potencial la función radial es
sin(kr − lπ/2)
Rkl (r) ∝ (2.67)
kr
Observamos que el efecto del potencial consiste en “empujar hacia dentro” a la
función de onda cuando δl > 0 o “empujarla para fuera” cuando δl < 0 (ver la figura
2.4).
La solución más general posible de energı́a definida (k fijo) es la superposición
X
ψk (r) = aklm Ylm (θ, φ)Rkl (r). (2.68)
lm
64 2.5 Ondas parciales
Tomemos al vector incidente k en la dirección del eje polar, por ser el eje de
simetrı́a rotacional del sistema. En tal caso, k · r → kr cos θ = kz. En ese caso,
además, el ángulo γ se reduce al ángulo θ, y entonces
eikr
il (2l + 1)jl (kr)Pl (cos θ) + fk (θ)
X
ψ|r|→∞ ∼ , (2.73)
l r
Por otro lado, la forma asintótica de la solución general (2.75), para k en la dirección
del eje z es
X sin(kr − lπ/2 + δl )
ψk (r, θ) = akl Pl (cos θ) , r grande. (2.75)
l kr
La integral sobre Ω de esta sección eficaz diferencial da la sección eficaz total. Uti-
lizando la ortogonalidad de los polinomios de Legendre se obtiene finalmente:
ˆ ˆ 1 ∞
dσ dσ 4π X
σ = dΩ = 2π du = 2 (2l + 1) sin2 δl (k) (2.81)
dΩ −1 dΩ k l=0
Vemos que hemos obtenido una expresión muy simple para la sección eficaz de
dispersión en términos de los corrimientos de fase,
∞
4π X
σ= (2l + 1) sin2 δl (k), (2.82)
k 2 l=0
Si comparamos esta expresión con la ec. (16.43) que da fk (θ), se tiene la importante
relación
4π
σ= Im fk (θ = 0) (2.83)
k
66 2.5 Ondas parciales
4π(2l + 1)
σl ⩽ 2
= 4π(2l + 1)λ̄2 (2.85)
k
Para visualizar el significado fı́sico de las ondas parciales es conveniente pensar
por un momento en términos clásicos, dividiendo el haz de partı́culas incidentes en
zonas cilı́ndricas de radios: (l + 1)λ̄ = λ̄, 2λ̄, 3λ̄ · · · (λ̄ = 1/k), como se muestra en
la Fig. (2.5). Todas las partı́culas con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l3 y
Figura 2.5: Las partı́culas con con el parámetro de impacto clásico ℓ entre lλ̄ y
(l + 1)λ̄ viajarán en la zona cilı́ndrica l. El alcance del potencial es b.
Esfera rı́gida
Es interesante mencionar la dispersión por una esfera rı́gida de radio b. El po-
tencial es
∞ para r ⩽ b
V (r) = (2.93)
0 para r > b
En este problema ni siquiera necesitamos de los αl (que valen ∞). Solamente tenemos
que saber que en r = b la función de onda se anula ya que la esfera es impenetrable.
Será Rl (r)|r=b = 0 y de (2.89),
con V0 > 0 para el potencial atractivo. La solución externa para la función de onda
estará de nuevo dada por (2.89),
>
Rkl (r) = Cl [cos δl (k)jl (kr) − sin δl (k)nl (kr)] . (2.102)
jl′ (k̄b)
αl (k) = k̄ , (2.105)
jl (k̄b)
y por lo tanto
kb + k̄b cot k̄b cot kb
cot δ0 (k) = . (2.108)
kb cot kb − k̄b cot k̄b
Figura 2.7: Un potencial atractivo “empuja para dentro” a la función de onda dis-
persada. Para esto, disminuye la longitud de onda dentro del pozo.
72 2.5 Ondas parciales
Sl (k) = − × ′ . (2.116)
hl (kb) αl (k) − k hl (kb)
hl (kb)
Se deja como ejercicio mostrar que este resultado coincide con (2.95). Usando es-
te resultado para reemplazar el primer factor del lado derecho de la ec. (2.116).
Entonces
h̄′ (kb)
αl (k) − k h̄l (kb)
Sl (k) = Sl (k)[Link]. × l
h′l (kb)
. (2.118)
αl (k) − k hl (kb)
Otra forma útil de escribir la matriz S en términos de los corrimientos de fase
es la siguiente: escribimos
eiδl cos δl + i sin δl cot δl + i
Sl = e2iδl = = = (2.119)
e−iδl cos δl − i sin δl cot δl − i
con esta podemos obtener una expresión para Sl a partir de cot δl . Por ejemplo, para
el pozo finito y l = 0, usando (2.108) obtenemos
k → k = k + iκ, (2.125)
h′l (kb)
αl (k) = k . (2.126)
hl (kb)
Como la derivada logarı́tmica interior αl es la misma para ambos problemas, esto
significa que la matriz S, pensada como una función en todo el plano complejo Sl (k)
tiene polos en cada uno de los estados ligados k = iκn .
Existe entonces una ı́ntima relación entre los estados ligados y los estados de
dispersión, y la descripción teórica que engloba tanto a las soluciones de la ecua-
ción de Schrödinger con energı́as positivas como con energı́as negativas proviene de
considerar la extensión analı́tica de la matriz de dispersión (2.113).
De (2.119),
cot δl + i
Sl = (2.127)
cot δl − i
observamos que la condición sobre el corrimiento de fase para que Sl (k) tenga un
polo es
cot δl (k) = i, (2.128)
de manera que si disponemos de los corrimientos de fase, a partir de ellos podemos
buscar los estados ligados del potencial.
Para entender fı́sicamente por qué aparecen los estados ligados como polos de Sl
volvamos por un momento al comportamiento asintótico de la función de dispersada
en el lenguaje de las funciones de Hankel (2.109), que para l = 0 es proporcional a
e−ikr eikr
+ Sl=0 (k) . (2.129)
r r
Comparémosla con la función de onda para un estado ligado para r > b
e−κL r
(2.130)
r
La existencia de un estado ligado implica que existe una solución no trivial de la
ecuación de de Schrödinger con E < 0 para un valor particular (discreto) de κL .
Podemos argumentar que e−κL r /r es como e−ikr /r excepto que k es ahora imaginario
puro. Una diferencia importante entre (2.129) y (2.130), además de k → iκL , es que
en el caso del estado ligado no tenemos el análogo de la onda incidente e−ikr /r. Lo
Dispersión de partı́culas 75
que es de interés fı́sico es el cociente entre los coeficientes de eikr /r y e−ikr /r que
es Sl=0 (k). En el caso del estado ligado podemos sostener la onda saliente (con k
imaginario) sin que exista la onda incidente. Por lo tanto el cociente es ∞, lo que
significa que Sl=0 (k) tiene un polo en k = iκL . Es decir que el estado ligado implica
un polo (que se puede mostrar que es un polo simple) sobre el eje positivo imaginario
del plano complejo de k. La región para la dispersión fı́sica corresponde a k real y
positivo (k = k) y a δ0 (k) real.
La estructura de la matriz S, sin embargo, es incluso más rica y puede contener
polos fuera del eje imaginario. Consideremos la esfera rigida, cuya matriz S es (2.117)
Usando expresiones explicitas para las funciones de Hankel esféricas, obtenemos para
la extension analı́tica de los distintos valores de l,
Por un lado sabemos que la esfera rı́gida no pose estados ligados, y observamos que
los polos de Sl no están en el eje imaginario positivo (es facil verlo para l = 0, 1, 2
pero se puede mostrar para todo valor de l). Por otro lado, vemos que su S1 posee
polos para k = −i/b, es decir, para κ = −1/b que resulta ser negativo. S2 también
tiene polos con parte imaginaria negativa. Si los estados ligados correspondı́an a
polos en el eje k imaginario positivo, y sus funciones de onda resultaban soluciones
normalizables de energı́a negativa de la ecuación de Schrödinger, los estados con
κ < 0 corresponden a polos de la matriz S en el semiplano inferior de k. En este
caso, las soluciones de la ecuación de Schrödinger no son normalizables (divergen
exponencialmente), y por lo tanto, no son fı́sicas. En general se denominan virtuales
o antiligadas. Sin embargo, veremos que hay un tipo particular de solución del
semiplano inferior que sı́ resulta ser fı́sica y que corresponde a estados metaestables
o cuasiestacionarios, llamados resonancias. Antes de estudiarlas analicemos algunas
propiedades de la matriz S.
76 2.5 Ondas parciales
donde en la segunda lı́nea sacamos −S(k) como factor común (que ignoramos, ya
que se lo asignamos a la constante de proporcionalidad).
Consideremos el reemplazo k → −k. La ec. (2.137), incluyendo las condiciones
de contorno en r = 0, es invariante con respecto a este cambio, mientras que para
u(−k, r) obtenemos
u(−k, r) ∝ −S(−k)e−ikr + eikr . (2.140)
Vemos que (2.139) y esta son la misma solución de la misma ecuación y por lo tanto,
al igualarlas, obtenemos
Sl (k)Sl (−k) = 1 (2.141)
Del mismo modo escribimos (2.137) para k∗
2m
u′′ (k∗ , r) − V (r)u (k∗ , r) + k∗2 u (k∗ , r) = 0 (2.142)
ℏ2
y tomamos el complejo conjugado, resulta
2m
u′′∗ (k∗ , r) − V (r)u∗ (k∗ , r) + k2 u∗ (k∗ , r) = 0 (2.143)
ℏ2
donde, una vez más, u∗ (k∗ , r) es una función de k y no de k∗ . De nuevo la última
ecuación es la misma que (2.137) y (2.138) toma la forma
que al comparar con (2.139) nos lleva a (2.136). De (2.136) y (2.141) es fácil ver que
también se satisface la relación
Sl (k) ∝ (k − k1 ). (2.146)
Luego,
Sl∗ (k∗ ) ∝ (k − k1∗ ). (2.147)
Y por lo tanto, de (2.136)
1 1
Sl (k) = ∝ . (2.148)
S ∗ (k∗ ) k − k1∗
De (2.145), si Sl (k) tiene un polo para un valor complejo k1 , tendrá que tener
necesariamente otro polo en −k1∗ .
2.5.5. Resonancias
Para un potencial atractivo V (r), el potencial efectivo que ve la partı́cula inci-
dente es:
ℏ2 l(l + 1)
Vefec (r) = V (r) + (2.149)
2mr2
donde el último término es la barrera centrı́fuga (ver la figura 2.8). Los estados
con energı́a corresponden a los estados ligados. Sin embargo, podrı́an existir esta-
dos cuasi ligados, con energı́a positiva, dentro de la barrera, estos corresponden a
los estados resonantes. ¿Por qué cuasi ligados? En general, salvo que posean una
energı́a mayor que la barrera, las partı́culas incidentes son detenidas por la barrera
centrı́fuga. Eventualmente, sin embargo, puede atravesar la barrera por el efecto
túnel y permanecer un cierto tiempo dentro del pozo. Cuando la partı́cula incidente
llega con una energı́a próxima a la energı́a resonante tiene una mayor probabilidad
de ser atrapada en un estado cuasi-ligado. Esta mayor probabilidad, a su vez, se
verá refleja en el aumento de la sección eficaz, como veremos más adelante.
78 2.5 Ondas parciales
E ℏ2 l(l+1)
2mr 2
Vefec (r)
n
Estados resonantes r
n
Estados ligados
V (r)
ℏ2 l(l+1)
Figura 2.8: Potencial efectivo resulta de sumar el término centrı́fugo 2mr2
al po-
tencial V (r).
Aunque un estado con κ > 0 crece exponencialmente con la r, observamos que para
k > 0, Γ resulta positivo, y entonces la función de onda se atenúa exponencialmente
en el tiempo y resulta ser fı́sicamente aceptable; se trata de un estado en decaimiento
(véase la figura 2.9). Como además debe tener energı́a positiva, de (2.151) tenemos
que |k| > |κ|. Entonces estos estados resonantes en decaimiento corresponden a polos
de S(k) en el sector entre el eje k real positivo y la bisección del cuarto cuadrante.
6
Valores complejos de energı́a son usados en la fı́sica para describir los estados no-estacionarios
de un sistema. Como ya vimos en la sección 1.8, la cantidad Γ determina la probabilidad de
decaimiento y se llama constante de decaimento; Γ será positiva si la función de onda decrece con
el tiempo (que es el caso de un decaimieto radioactivo) o negativa si la norma de la función de
onda aumenta con el tiempo, que corresponde a los procesos de captura (por ejemplo, cuando el
núcleo átomico captura a un nucleón).
Dispersión de partı́culas 79
r = vT
r=b
Por otra parte, la relación (2.145) nos dice que tiene que existir también un
polo en el tercer cuadrante. Este necesariamente debe corresponder al proceso de
captura de la partı́cula, o a la formación de la resonancia. Sin embargo, para este polo
la función de onda resulta, además de exponencialmente creciente con r, creciente
con t. Esto debemos entenderlo de la siguiente forma: Con nuestro requerimiento
S = ∞, las ondas entrantes están siempre excluidas, pero durante el perı́odo de
formación del estado, estas últimas tienen que estar presentes también. Por lo tanto,
no estamos describiendo una situación fı́sicamente realizable. Pero, podemos obtener
una realización fı́sica aproximada del decaimiento del estado resonante, suponiendo
que el sistema fue formado en un tiempo muy anterior al momento de la medición.
Finalmente para relacionar los polos de S(E) con los de S(k) tenemos que hacer
la transformación de k en E. El plano k se trasformará en una superficie de Riemann
de dos hojas en el plano E. Si estas hojas se juntan a lo largo del semi eje 0 < E < ∞,
donde se encuentran los estados fı́sicos de dispersión, la primera hoja corresponde
al semi-plano superior de k:
S(k) = S(E); (κ ⩾ 0). (2.153)
Los valores de S(E), en la primera y segunda hoja de Riemann, para la lı́nea de
ramificación 0 < E < ∞, están relacionados por
S(E + iϵ) = S ∗ (E − iϵ); (E > 0) (2.154)
ya que en lı́mite ϵ → 0, E ± iϵ corresponde, respectivamente, a ±k.
En resumen, los polos de la matriz S están distribuidos de la siguiente manera:
80 2.5 Ondas parciales
se aproxima como
(2l − 1)!!(2l + 1)!! l + 1 + bαl (k)
cot δl (k) ≃ . (2.158)
(kb)2l+1 l − bαl (k)
Cuando kb → 0, αl (k) → αl (0) que resulta ser finito en la mayorı́a de los casos
de interés8 . Como cot x ∼ 1/x para x chico, tenemos que
Longitud de dispersión
Si tenemos en cuenta con cuidado las constantes α0 (0) el resultado para el corri-
miento de fase de la onda s es
donde definimos
b2 α0 (0)
a= (2.162)
1 + bα0 (0)
como la longitud de dispersión. La sección eficaz a bajas energı́as se escribe en
términos de esta en la forma
σ ≈ σ0 = 4πa2 1 + O(k 4 ) (2.163)
8
Puede verificarse que αl (0) es finita en el pozo cuadrado, ecuación (2.105) y lo es en general
para cualquier potencial.
82 2.5 Ondas parciales
de donde también vemos que es correcto ignorar todos los δl con l ̸= 0 y que además,
en especial
δ[Link]. (k) = −kb, (2.165)
y
σ[Link]. = 4πb2 , para kb ≪ 1. (2.166)
Comparando los resultados generales (2.161) y (2.163) con los de la esfera rı́gida
(2.165) y (2.166) Podemos concluir que a muy bajas energı́as el potencial actúa,
cualquiera sea su forma, como una esfera rı́gida de radio igual a la longitud de
dispersión. Puesto que las longitudes de onda son muy grandes, las partı́culas no
logran ver los detalles del potencial.
Es interesante comparar este resultado con el que se obtiene a altas energı́as
kb ≫ 1. Para ello, necesitamos propiedades adicionales de las funciones esféricas
de Bessel. Aquı́ simplemente enunciamos los resultados. Los corrimientos de fase δl
varı́an entre 0 y 2π para l ≲ kb. Sin embargo, cuando l < kb, los corrimientos de
fase caen rápidamente a cero. La intuición detrás de esto se desprende del análisis
semiclásico, que indica que para l ≫ kb, el parámetro de impacto es ℓ ≫ b. Por
lo tanto, no sorprende que no se produzca dispersión en este régimen. Resulta que,
cuando kb → ∞, la sección eficaz total se convierte en σ → 2πb.
Para profundizar el significado fı́sico de a partimos de la solución externa para
la onda s (2.100) para el problema de dispersión por un potencial de corto alcance
en el lı́mite kr ≪ 1:
sin(kr + δ0 ) C0
u0 (r) = C0 → (kr cos δ0 + sin δ0 ) (2.167)
k k
Recordando que ul (0) = 0, podemos dibujar tres diferentes casos, como muestra la
figura 2.10. Si nos preguntamos para que otro valor de r se anula la función de onda,
encontramos de (2.167) que eso ocurre en r = −k −1 tan δ0 , que es exactamente la
relación (??) que define a la longitud de dispersión. Tenemos entonces una interpre-
tación geométrica para a y una manera de visualizar a la relación (2.163). Mientras
que para la esfera rı́gida u0 (r) se anula en r = b y la sección eficaz está dada por
(2.166), en el caso general u0 (r) se anula en r = a y σ está dada por (2.163). La
única deferencia es que a puede ser negativa.
Para ver el significado del signo de a, analicemos de la ecuación radial
2m
u′′0 (r) − V (r)u0 (r) + k 2 u0 (r) = 0; u0 (0) = 0 (2.168)
ℏ2
Dispersión de partı́culas 83
Figura 2.10: Función de onda u0 (r) para (a) potencial repulsivo, (b) para potencial
atractivo, y (c) para una atracción major. La intersección de lı́mkb→0 u0 (r) con el eje
r se muestra en cada uno de los tres casos.
para k = 0. En la región donde V (r) es atractivo (negativo) u′′ (r) es negativa (si u(r)
es positiva) y por lo tanto tiene que ser cóncava hacia abajo. Cuanto más negativo es
V (r) tanto major es la concavidad. La cuestión es si la concavidad es suficiente para
curvar a u(r) y orientarla hacia abajo mientras que actúa el potencial, Esto, a su vez,
está ı́ntimamente relacionado con la existencia del estado ligado, ya que para que
haya un estado ligado es necesario que, para r > b, u(r) se junte con una función de
la forma e−κL r , cuya pendiente es negativa. (Notemos que para valores pequeños de
−κL r −1
κL , e es también esencialmente una recta y a = κL . En resumen, si el potencial
es suficientemente atractivo producirá un estado ligado y a será positiva. En el caso
contrario a es negativa y la función de onda crece exponencialmente para distancias
grandes. En ese caso estamos en presencia de un estado virtual.
84 2.5 Ondas parciales
(2l − 1)!!
hl (x) ∼ −i , x ≪ 1, (2.169)
xl+1
y obtener de (2.124):
l+1
αl (iκL ) = − (2.170)
b
o equivalentemente
Esta es la condición, a orden κL b, para que exista un estado ligado con EL ≃ 0. Más
precisamente, (2,171) es la condición para tener un estado ligado con
ℏ2 κ2L ℏ2
|EL | = ≪ . (2.172)
2m 2mb2
Luego, en el caso de existir un tal estado, por la continuidad de αl (k), la cantidad
(l + 1 + bαl (k = 0)) será pequeña. La expresión (2.158) para cot δl (k),
nos indica que cot δl (k) será pequeño, y por lo tanto la sección eficaz parcial
4π 4π 1
σl (k) = sin2 δl (k) = 2 . (2.174)
k 2 k 1 + cot2 δl (k)
esto implica que el valor relativo de sin δl (y por lo tanto de σl ) será incrementado
con respecto al valor que tendrı́a de no existir el estado ligado9 .
σl
0 E
ER
siga siendo válida. De esta vemos que si estamos cerca de la energı́a ER = kR2 ℏ2 /2m,
para la cual l + 1 + bαl (k) pasa por cero, i. e. si
cot δl (E) también pasará por cero. [Nótese la similitud con (2.171)]. En esta situación
σl será proporcional a k −2 y por lo tanto relativamente grande. Este tipo de salto
en la sección eficaz se denomina resonancia (o dispersión resonante); véaser la figura
2.11.
Expandiendo αl (E) en torno a ER , obtenemos:
!
∂αl (E)
αl (E) = αl (ER ) + (E − ER ) + ··· , (2.177)
∂E E=ER
y de (2.176) resulta:
!
∂αl (E)
l + 1 + bαl (E) ≃ (E − ER ) b . (2.178)
∂E E=ER
86 2.5 Ondas parciales
δl
π
2
0 E
ER
Luego la ec. (2.158) se puede ahora expresar en la forma (l − bαl (E) ≃ 2l + 1):
2 (E − ER )
cot δl (E) ≃ − , (2.179)
ΓR
donde
2k 2l+1 b2l
ΓR = −
∂αl (E)
(2.180)
[(2l − 1)!!]2 ∂E E=ER
∂αl (E)
(Se puede demostrar que para el decaimiento de un estado resonante ∂E
<
E=ER
0 y por lo tanto ΓR > 0.) Es decir que cerca de una resonancia
4π Γ2R
σl (E) = (2l + 1) (2.181)
k2 4 (E − ER )2 + Γ2R
que es la formula de Breit-Wigner representada en la figura 2.11 De la ecuación
(2.180) vemos que, cuanto más rápidamente varı́a αl (E) con respecto a E tanto más
angosta será la resonancia. También se ve que cuanto menor sea el valor de kb y
mayor el valor de l para el cual ocurre la resonancia, tanto mayor será el ancho ΓR .
Para l ⩾ 1 la resonancia se produce cada vez que cot δl (E) se anula, o cuando:
1
δl (ER ) = +n π (2.182)
2
donde n es un entero. Además de (2.178) vemos que cerca de la resonancia δl (E) se
comporta como: !
π E − ER
δl (E) = + arctan . (2.183)
2 ΓR /2
Dispersión de partı́culas 87
Partı́culas Idénticas
88
Partı́culas Idénticas 89
Esto resultado es interesante dado que si bien el observable fı́sico permanece inva-
riante frente a la permutación de partı́culas, ¡la función de onda no tiene por que
hacerlo! Sin embargo, esta condición es demasiado débil. La indistinguibilidad im-
pone que el Hamiltoniano sea invariante frente a la permutación de partı́culas, y
esto a su vez impone valores precisos que puede tomar el valor de α.
p21 p2
H= + 2 + Vpar (|r1 − r2 |) + Vext (r1 ) + Vext (r2 ) (3.1)
2m 2m
es simétrico con respecto al intercambio de los indices 1 y 2. Aquı́ Vpar es la in-
teracción entre las dos partı́culas, y Vext representa el acoplamiento con un campo
externo.
Es conveniente introducir en este punto un operator P12 , cuya acción consiste
en intercambiar o permutar a la partı́cula 1 y la partı́cula 2, i.e. un operador de
permutación de partı́culas:
[P12 , H] = 0 (3.6)
HΨ(2, 1) = HP12 Ψ(1, 2) = P12 HΨ(1, 2) = EP12 Ψ(1, 2) = EΨ(2, 1). (3.10)
Salvo que correspondan a la misma autoestado(cosa que podrı́a ocurrir) forman un espacio dege-
nerado
Partı́culas Idénticas 91
1
ΨS (1, 2) = √ [Ψ(1, 2) + Ψ(2, 1)] , (3.17)
2
1
ΨA (1, 2) = √ [Ψ(1, 2) − Ψ(2, 1)] , (3.18)
2
√
donde hemos introducido el factor 1/ 2 por razones de normalización. Obviamente
si Ψ(1, 2) es una autofunción de H, las funciones de onda ΨS (1, 2) y ΨA (1, 2) lo son
de H y de P12 .
Podemos también definir los operadores de simetrización y de antisimetrización
como:
1
S12 ≡ √ (1 + P12 ) , (3.19)
2
1
A12 ≡ √ (1 − P12 ) , (3.20)
2
Al aplicar S12 o A12 a una combinación lineal arbitraria de Ψ(1, 2) y Ψ(2, 1) la función
de onda resultante es necesariamente simétrica o antisimétrica respectivamente; en
efecto:
( )
S12 1 1
[aΨ(1, 2) + bΨ(2, 1)] = √ [aΨ(1, 2) + bΨ(2, 1)] ± √ [aΨ(2, 1) + bΨ(1, 2)]
A12 2 2
(3.21)
a±b
= √ [Ψ(1, 2) ± Ψ(2, 1)]. (3.22)
2
y los autovalores permitidos de Pij son +1 y −1. Es importante notar que en general
[Pij , Pki ] ̸= 0 (3.25)
aunque sı́ conmutan en el caso en que i, j ̸= k, l. Un Hamiltoniano H(1, 2, . . . , N )
totalmente simétrico debe verificar
[H, Pki ] = 0 (3.26)
Decimos que una función de onda Ψ (1, 2, . . . N ) es totalmente simétrica o totalmente
antisimétrica si:
Pij ΨS (1, 2, . . . , i, . . . , j . . . N ) = +ψS (1, 2, . . . , i, . . . , j, . . . N ) , (3.27)
Pij ΨA (1, 2, . . . , i, . . . , j, . . . N ) = −ψA (1, 2, . . . , i, . . . , j, . . . N ) (3.28)
para todo Pij . Para construirlas, extendemos las definiciones de los proyectores de
simetrización y antisimetrización en la forma
N! N!
1 X 1 X
S=√ Pν , A= √ (−1)sν Pν (3.29)
N ! ν=1 N ! ν=1
donde la suma se extiende sobre todas las N ! permutaciones Pν de las N partı́culas y
sν es la firma o signatura de la permutación Pν (es decir, el número de transposiciones
en Pν ), de manera que (−1)sν es igual +1 si la permutación es par o a −1 para una
permutación impar. Las funciones simetrizadas resultan entonces,
N!
1 X
ΨS (1, 2, . . . , N ) = √ Pν Ψ(1, 2, . . . , N ) (3.30)
N ! ν=1
N!
1 X
ΨA (1, 2, . . . , N ) = √ (−1)sν Pν Ψ(1, 2, . . . , N ). (3.31)
N ! ν=1
Por ejemplo, para tres partı́culas,
1
S = √ (1 + P12 + P12 P13 + P13 + P23 P13 + P23 ) , (3.32)
3!
1
A = √ (1 − P12 + P12 P13 − P13 + P23 P13 − P23 ) . (3.33)
3!
Y entonces las funciones simétricas y antisimétricas resultan
1
ΨS (1, 2, 3) = √ [Ψ(1, 2, 3) + Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.34)
6
+ Ψ(3, 2, 1) + Ψ(3, 1, 2) + Ψ(1, 3, 2)] (3.35)
1
ΨA (1, 2, 3) = √ [Ψ(1, 2, 3) − Ψ(2, 1, 3) + Ψ(2, 3, 1) (3.36)
6
− Ψ(3, 2, 1) + Ψ(3, 1, 2) − Ψ(1, 3, 2)]. (3.37)
Partı́culas Idénticas 93
1
ΨI (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(2, 3, 1) − Ψ(3, 2, 1)] (3.38)
2
1
ΨII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(2, 1, 3) − Ψ(3, 1, 2) − Ψ(1, 3, 2)] (3.39)
2
1
ΨIII (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(2, 1, 3) − Ψ(3, 1, 2)] (3.40)
2
1
ΨIV (1, 2, 3) = [Ψ(1, 2, 3) + Ψ(3, 2, 1) − Ψ(1, 3, 2) − Ψ(2, 3, 1)] (3.41)
2
no son totalmente simétricas ni totalmente antisimétricas.
Experimentalmente se verifica que la función de onda que describe a un sistema
de N partı́culas idénticas es o bien totalmente simétrica, o totalmente antisimétrica.
En el primer caso se dice que las partı́culas obedecen la estadı́stica de Bose-Einstein
(BE) y se conocen como bosones, y en el segundo caso decimos que satisfacen la
estadı́stica de Fermi-Dirac (FD) y hablamos de fermiones. Resumiendo,
Si el punto r está en La Plata, será P (r) = |ϕL (r)|2 , ya que un electrón que está en
Parı́s tiene probabilidad nula de encontrarse en La Plata. De tal modo obtenemos
el mismo resultado como si de entrada nos hubiésemos olvidado de todos los demás
electrones. La regla es: tenemos que antisimetrizar o simetrizar la función de onda de
un conjunto de fermiones o bosones solamente para las partı́culas que son relevantes.
Otra pregunta: ¿Cómo son las funciones de onda de sistemas formados por
partı́culas idénticas compuestas, tales como átomos? Consideremos, por ejemplo,
la función de onda Ψ(re1 , rp1 , re2 , rp2 ), que describe a dos átomos de hidrógeno; re1
es la posición del electrón del primer átomo, rp1 es la posición del protón del primer
átomo, etc. Ψ(re1 , rp1 , re2 , rp2 ) cambiará de signo si intercambiamos las coordenadas
de los electrones o de los protones. En cambio, no habrá ningún cambio de signo si
intercambiamos las coordenadas de un electrón con las coordenadas de un protón,
por ser partı́culas diferentes. Por otro lado, si intercambiamos los dos átomos entre
sı́, será
Ψ(re1 , rp1 , re2 , rp2 ) = −Ψ(re2 , rp1 , re1 , rp2 ) = Ψ(re2 , rp2 , re1 , rp1 ) (3.50)
Partı́culas Idénticas 95
y por lo tanto los átomos de hidrógeno se comportan como bosones. Es fácil con-
vencerse que la regla general es: las partı́culas compuestas que contienen un número
par de fermiones y cualquier número de bosones se comportan como bosones, mien-
tras que áquellas con un número impar de fermiones y cualquier número de bosones
se comportan como fermiones. Por ejemplo, los átomos de 4 He se comportan como
bosones y los de 3 He como fermiones.
En este punto conviene detenerse un poco para preguntarse: ¿Que significa la
palabra partı́cula, o más bien que es una partı́cula elemental? Supongamos que es-
tamos haciendo un experimento con el helio lı́quido, que está formado por átomos de
4
He. A muy bajas temperaturas las colisiones en el fluido no son lo suficientemente
energéticas como para excitar al átomo desde su estado fundamental y el átomo
de 4 He puede ser tratado como una partı́cula elemental de spin cero. En cambio,
cuando irradiamos el lı́quido con luz ultravioleta aparecen en el espectro de absor-
ción los estados excitados del átomo y el 4 He ya no podrá ser tratado como una
partı́cula elemental. Los datos experimentales en este caso los podemos interpretar
satisfactoriamente utilizando un modelo de tres partı́culas: un núcleo atómico con
spin igual a cero (partı́cula α) y dos electrones de spin 21 . Al cambiar la sonda que
usamos para estudiar el sistema, por otra de energı́a ⩾ 25 MeV (por ejemplo rayos γ)
descubrimos que la descripción anterior ya no es más válida: la partı́cula α se puede
romper y entramos al dominio de la fı́sica nuclear, donde las partı́culas elementales
son los nucleones. Para energı́as ⩾ 140 MeV hay producción de piones, que tam-
bién tienen que ser considerados. Aumentando más todavı́a la energı́a de la sonda
hallamos que el nucleón tiene varios estados excitados. Por lo tanto no podrá seguir
siendo tratado como una partı́cula elemental; se recurre al modelo de los quarks en
el cual el nucleón está formado por tres quarks. Podemos concluir entonces que: el
concepto de partı́cula elemental y el tamaño espacio de Hilbert necesario para una
descripción adecuada del sistema depende del dominio de energı́a en el cual stamos
trabajando.
La antisimetrı́a de la función de onda para fermiones idénticos implica que la pro-
babilidad de hallar dos fermiones idénticos en el mismo punto es nula. Más precisa-
mente: dos fermiones idénticos no pueden ocupar el mismo punto espacial si sus spi-
nes están orientados en la misma dirección. Este es el principio de exclusión de Pauli,
que se demuestra muy fácilmente. En efecto, como ΨA (2, 1, 3, . . .) = −ΨA (1, 2, 3, . . .)
vemos que si 1 = 2, resulta ΨA (1, 1, 3, . . .) ≡ 0.
con un Hamiltoniano en el que el operador de spin está ausente (no hay interacción
spin-órbita, no hay campo magnético, etc). Es decir un Hamiltoniano que podemos
escribir ası́:
H = Hc ⊗ Is (3.53)
donde los subı́ndices c y s indican los factores de coordenadas y de spin del producto
tensorial con el que debe escribirse el Hamiltoniano. En el caso presente el factor de
spin actúa trivialmente como la identidad en el espacio de las funciones de onda del
sistema.
Si escribimos a la función de onda como un producto,
entonces, para determinar los niveles de energı́a del sistema se estudia el problema
estacionario para el factor dependiente de las coordenadas.
α=d
α=3
α=2
α=1
E = εα 1 + εα 2 + · · · εα N (3.66)
para bosones, donde de las N partı́culas, nα1 están en el nivel α1 , nα2 están en el
nivel α2 , etc., y por supuesto que se verifica que nα1 + nα2 + · · · + nαN = N .
Como ejemplo, consideremos solamente dos bosones de spin cero y dos fermiones
de spin 21 que pueden ocupar solo dos niveles. Usaremos la notación: φ(1) ≡ φ(r, s) =
ϕ(r)Υ(s). Si los bosones fueran partı́culas distinguibles tendrı́amos 4 estados distin-
tos:
con energı́as 2εα1 , εα2 y εα1 + cα2 ; el último nivel de energı́a es dos veces degenerado.
Sin embargo, los dos últimos estados son fisicamente indistinguibles y el único estado
permitido de 2 bosones idénticos [uno en ϕα1 (r) y el otro en ϕα2 (r)] es:
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] (3.77)
2
o sea que no existe la degeneración del nivel εα1 + εα2 . En el caso de fermiones,
a cada estado (3.76) le corresponderı́an 4 estados debido al spin. Sin embargo, el
Partı́culas Idénticas 101
principio de exclusión nos dice que los únicos estados permitidos son:
ϕα1 (r1 ) ϕα1 (r2 ) Υ00 (s1 , s2 ) (3.78)
ϕα2 (r1 ) ϕα2 (r2 ) Υ00 (s1 , s2 ) (3.79)
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) + ϕα1 (r2 ) ϕα2 (r1 )] Υ00 (s1 , s2 ) (3.80)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ11 (s1 , s2 ) (3.31)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,0 (s1 , s2 ) (3.81)
2
1
√ [ϕα1 (r1 ) ϕα2 (r2 ) − ϕα1 (r2 ) ϕα2 (r1 )] Υ1,−1 (s1 , s2 ) (3.82)
2
con energı́as 2εα1 (singlete), 2εα2 (singlete) y εα1 + εα2 (un singlete y 3 tripletes).
(0) Z 2 e2
E0 = 2ε1s = − = −2Z 2 Ry. (3.89)
a0
La corrección de primer orden se obtiene del valor medio de V12 para el estado (3.86):
ˆ
e2
∆E0 = d1d2 Ψ†0 (1, 2) Ψ0 (1, 2), (3.90)
|r1 − r2 |
donde ˆ ˆ
X
d1 ≡ dr1 . (3.91)
s1
Como
Υ†SM (s1 , s2 ) ΥSM (s1 , s2 ) = 1
X
(3.39)
s1 s2
obtenemos: 6 ˆ
e2 Z e−2Z(r1 +r2 )/a0
∆E0 = 2 dr1 dr2 (3.40)
π a0 |r1 − r2 |
Para hacer la integral usamos la relación:
ˆ
1 dk eik·(r1 −r2 )
= (3.92)
|r1 − r2 | 2π 2 k2
y entonces
6 ˆ ˆ 2
Z dk
∆E0 = e 2
dre−2Zr/a0 +ik·r . (3.93)
a0 2π 4 k 2
Como además, ˆ
16πZ/a0
dre−2Zr/a0 +ik·r = (3.94)
[k 2 + (2Z/a0 )]2
resulta: ˆ ∞
4Ze2 dx 5 Ze2
∆E0 = = (3.44)
πa0 0 (x2 + 1)4 8 a0
Es decir que la energı́a del estado fundamental en primer orden perturbativo es:
Ze2 5
(1) (0)
E0 = E0 + ∆E0 = − Z− (3.95)
a0 8
(1)
Para el átomo de helio Z = 2 y E0 = −5,5 Ry = −74, 8 eV, mientras que el valor
experimental es E0exp = −78,8 eV.
2
El Ry es una unidad de energı́a que corresponde a 1 Ry = e2 /2a0 = 13,6056923 eV.
Partı́culas Idénticas 103
donde ( )
ΦS (r1 , r2 ) 1
= √ [ϕ1s (r1 ) ϕ2s (r2 ) ± ϕ1s (r2 ) ϕ2s (r1 )]
ΦA (r1 , r2 ) 2
y
3/2
1 Z Zr − 2a
Zr
ϕ2s (r) = √ 2− e 0 (3.98)
4 2π a0 a0
(1) (0)
La energı́a perturbada es: E1 (S) = E1 + ∆E1 (S) donde3
(0) 3 Z 2 e2
E1 = ε1s + ε2s = −
4 a0
y * +
e2
∆E1 (S) = = D ± I,
|r1 − r2 |
con
ˆ
e2
D= dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r1 ) ϕ2s (r2 ) (3.99)
|r1 − r2 |
ˆ
e2
I = dr1 dr2 ϕ∗1s (r1 ) ϕ∗2s (r2 ) ϕ1s (r2 ) ϕ2s (r1 ) (3.50)
|r1 − r2 |
ψ1 (2) · · · ψ1 (N )
ψ1 (1)
1 ψ2 (2) · · · ψ2 (N )
ψ2 (1)
Ψ= √ ..
.. .. .. (3.107)
N! .. . .
ψN (1) ψN (2) · · · ψN (N )
Cada función de onda de una partı́cula (se las llama orbitales para el caso de
electrones en un átomo) es el producto de una parte espacial u y una de spin χ :
ˆ N N
D E 1 ∗
ψiA (Qi ) F̂ ψPBj (j)d3 xj
XX Y Y
ΨA |F̂ |ΨB = εP εQ (3.112)
N! P Q i=1 j=1
donde hemos usado en el segundo factor que, bajo el producto, vale que ψjB (Pj ) =
∗
Es decir, para ψiA permutamos los electrones y para ψPBj los estados.
ψPBj (j).
Vamos ahora a escribir al producto doble como un único producto. Para ello
notemos que podemos escribir j = Qi, ya que de ambas maneras se recorren los N
valores posibles de las funciones de onda de cada electrón. Se tendrá entonces
ˆ N
D E 1 ∗
ψiA (Qi)F̂ ψPBQi (Qi)d3 xQi
XX Y
ΨA |F̂ |ΨB = εP εQ (3.113)
N! P Q i=1
o, haciendo P Q → P
ˆ N
∗
d3 xi ψiA (i)F̂ ψPBi (i)
X Y
⟨F ⟩ = εP (3.116)
P i=1
⟨1⟩ = 1 (3.117)
2. F̂ = fˆj : donde fˆj es un operador de un electrón. Al insertar este F̂ en cada
P
j-ésima por lo que el resto debe, por ortogonalidad, acomodarse de manera que los
ı́ndices coincidan. Simplificando la notación podemos escribir
XD E
⟨F̂ ⟩ = i fˆi i (3.118)
i
⟨i|fˆ|i⟩
X
⟨F̂ ⟩ = (3.119)
i
P
3. F̂ = ij ĝij : es decir, ĝ es un “operador de dos electrones”. Con argumentos
similares a los anteriores se tendrá
X
⟨F ⟩ = (⟨ij |gij | ij⟩ − ⟨ij |gij | ji⟩) (3.120)
i<j
X 1 2 Z X 1
Ĥ = ∇ − + (3.121)
i 2 i ri i<j rij
| {z
P } |P{z }
fi gij
Podemos escribir
ˆ
d3 ru∗i (r)f ui (r) +
X X
⟨Ĥ⟩ = (⟨ij|g|ij⟩ − ⟨ij|g|ji⟩) = h1 + h2
i i<j
(3.122)
1 Z
f = − ∇2 −
2 r
1
g= (3.123)
r
Además de las funciones de onda espaciales u(r), deberemos tener en cuenta las
funciones de onda de spin χ(σ) ya que sobre la parte que contiene g no se factorearán
trivialmente. Las tomaremos ortogonales según
ˆ
1
d3 r1 d3 r2 u∗i (r1 ) u∗j (r2 ) ui (r1 ) uj (r2 ) |χi (σ1 )|2 |χj (σ2 )|2 −
X X
h2 =
i<j σ1 σ2 r12
ˆ 3
1
r1 d3 r2 ui (r2 ) uj (r1 ) χ∗i (σ1 ) χj (σ1 ) χ∗j (σ2 ) χi (σ2 )
u∗i (r1 ) u∗j (r2 )
X X
i<j σ1 σ2 r12
(3.125)
Después de un poco de álgebra tendremos
ˆ
1
d3 r1 d3 r2 |ui (r1 )|2 |uj (r2 )|2 −
X
h2 =
i<j r12 (3.126)
∗ ∗
δmsi msj ui (r1 ) uj (r2 ) ui (r2 ) uj (r1 )
A esta altura, utilizaremos un método variacional, exigiendo
!!
ℏ2 2 ℏ2 2 e2 e2 Z e2 Z
− ∇1 − ∇2 + − − −E ψ (r1 , r2 ) = 0 (3.131)
2me 2me r12 r1 r2
Hemos utilizado aquı́ unidades atómicas (“ua”) en que me = 1, e = 1, ℏ = 1, que
fue utilizado por Douglas Hartree4 para resolver el problema. Al final del cálculo se
4
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Central Field. Part I.
Theory and Methods, Mathematical Proceedings of the Cambridge Philosophical Society 24 (1928)
89 Cambridge Univ. Press.
110 3.6 El método variacional de Hartree-Fock
pueden restituir ambos parámetros fácilmente. Como las masas de los electrones son
iguales a 1 en estas unidades, podemos reacomodar la ecuación ası́
Z Z 1
∇21 + ∇22 +2 E+ + − ψ (r1 , r2 ) = 0 (3.132)
r1 r2 r12
Vemos que el cambio r1 ↔ r2 deja invariante al hamiltoniano por lo que las
autofunciones pueden ser escritas como autofunciones de energı́a y paridad definida,
con autovalor +1 (simétrica) o -1 (antisimétrica),
! ! ! ! !
1 1 0 0 1
χp = √ − parahelio, singulete s = 0 (3.135)
2 0 1
1 2
1 1
0 2
24
D.R. Hartree, The Wave Mechanics of an Atom with a Non-Coulomb Cen-
tral Field. Part I. Theory and MethodsMathematical Proceedings of the Cambridge
Philosophical Society 24 (1928) 89 Cambridge Univ. Press. Aplicando el operador
ŝ2 escrito en la forma (9.12) a la autofunción (9.23) se ve fácilmente que s = 0.
También es fácil ver que cuando los spines se acoplan para dar s = 1, las funciones
de onda de spin son simétricas y el factor espacial entonces debe ser antisimétrico,
(ortohelio):
! !
0 0
χ−1
o = ortohelio, triplete sz = −1
1 1
1 2
! ! ! ! !
1 1 0 0 1
χ0o =√ + ortohelio, triplete sz = 0 (3.136)
2 0 1
1 2
1 1
0 2
! !
1 1
χ1o = ortohelio, triplete sz = +1
0 1
0 2
Partı́culas Idénticas 111
Con esto, la única perturbación a tratar es 1/r12 y la funciones de onda sin per-
turbar para el estado fundamental corresponderá al productos de dos funciones de
onda ψ (0) del estado fundamental de átomos hidrogenoides. Como se trata de un pro-
ducto de funciones idénticas ya que ambos electrones están en el estado fundamental,
el resultado solo puede ser simétrico (parahelio). Debe ir acompañado entonces por
una función de onda de spin que es antisimétrica y está dada por (9.23).
Tendremos entonces, para el nivel fundamental, como función de onda de coor-
denadas, sin perturbar, el producto de las soluciones obtenidas para átomos hidro-
genoides
Z3
ψp(0) (r1 , r2 ) = ψ (0) (r1 ) ψ (0) (r2 ) = exp (−Z (r1 + r2 )) (3.140)
π
En cuanto a la energı́a E, escribiendo
(Z = 2)2
E (0) = −2 = −4 ua (3.143)
2(n = 1)2
se tendrá, como corrección al primer orden
5
E = −4 += −2,75 ua (3.144)
4
un valor en buen acuerdo con la medida experimental que es un 5 % menor,
exp
E = −2,904 ua. El cálculo perturbativo se puede mejorar teniendo en cuenta que
cada electrón apantalla la carga del núcleo.
En cuanto a los estados excitados del helio, que como dijimos corresponde a un
electrón en el estado fundamental y el otro en uno excitado, discutiremos en lo que
sigue un aspecto importante del cálculo perturbativo. Para comenzar, si r1 = r2
la función de onda espacial antisimétrica (ortohelio) se anula. Esto no sucede para
la simétrica (parahelio) por lo que la probabilidad de que los dos electrones estén
muy cerca es más pequeña para los estados orto que en los estados para. Luego,
en el estado “para” los electrones pueden llegar a estar muy cerca y por lo tanto la
Partı́culas Idénticas 113
energı́a de tales estados tiene que ser más alta. En resumen, el esquema de niveles
del átomo de helio o iones con dos electrones tiene un estado de energı́a mı́nima que
corresponde al parahelio. En cuanto a los estados excitados, (que corresponderán a
uno de los electrones en el estado fundamental y el otro en uno excitado), es mayor
la energı́a de los estados para que de los estados orto.
Capı́tulo 4
Segunda cuantificación
sabemos que para N partı́culas tenemos un espacio de Hilbert que se construye como
el producto directo (tensorial) de los espacios individuales:
N
O
HN = H1 ⊗ H2 ⊗ · · · ⊗ HN = Hi , (4.2)
i=1
114
Segunda cuantificación 115
de onda de N partı́culas indistinguibles, para las que sólo se permiten las funcio-
nes de onda totalmente simétricas (para bosones) o antisimétricas (para fermiones).
Esto significa que incluso para partı́culas que no interactúan no podemos usar di-
rectamente estados producto de la forma (4.3) y debemos lidiar con sus versiones
simetrizadas o antisimetrizadas,
1 X
|α1 . . . αN ⟩S = q Pν |α1 . . . αN ), (4.5)
N !nα1 ! . . . nαN ! ν
1 X
|α1 . . . αN ⟩A = √ (−1)sν Pν |α1 . . . αN ), (4.6)
N! ν
que se obtienen del estado factorizado (4.3) aplicando los operadores de simetrización
o antisimetrización (3.29), al igual que las funciones de onda (3.28) y (3.28). En
cierto modo, el hecho de que tengamos que tratar con partı́culas indistinguibles
ya introduce correlaciones en la función de onda incluso cuando las interacciones
no están presentes. La función de onda se vuelve bastante complicada ya que deben
estar correctamente (anti-)simetrizadas y normalizadas, lo que las hace muy difı́ciles
de manejar. que se escriban en la forma de un determinante ayuda un poco para los
cálculos prácticos, pero no mucho. En resumen, incluso para los electrones que no
interactúan, ¡habrı́a que tratar con funciones de onda que contienen 1023 ! términos,
lo cual es realmente desagradable.
El segundo problema está relacionado con la forma en que representamos a los
operadores en la mecánica cuántica estándar. Si consideramos, por ejemplo, un ope-
rador que mide el momento total de un sistema de partı́culas, este tiene que escribirse
como una suma de operadores que actúan sobre cada partı́cula individualmente:
N
X
Ptot = Pi (4.7)
i=1
donde Pi es el operador que actúa sobre la partı́cula i-ésima. Téngase en cuenta que
esto es un abuso de notación ya que Ptot es un operador de HN , que rigurosamente
se debe escribir como
Pi = 1 ⊗ 1 ⊗ . . . ⊗ P ⊗ . . . ⊗ 1, (4.8)
donde 1 es la identidad y P se inserta en la posición i-ésima. El operador y las fun-
ciones de onda dependen ası́ explı́citamente del número de partı́culas. Por lo tanto,
uno deberı́a cambiar completamente todo el cálculo dependiendo de si miramos 2
o 20000 partı́culas, lo que nuevamente es particularmente molesto. También impide
tomar de manera directa el lı́mite termodinámico N → ∞ cuando el volumen de los
sistemas también tiende a infinito. Dada la gran cantidad de partı́culas, está claro
que tomar este lı́mite es lo deseable ya que simplificarı́a mucho los cálculos1 .
1
Trabajar en el lı́mite termodinámico es deseable, además, porque es allı́ donde ocurren verda-
deramente las transiciones de fase.
116 4.1 Espacio de Fock
Una tercera razón, quizás más profunda y más fı́sica, y que definitivamente liqui-
da la posibilidad de utilizar la mecánica cuántica usual, es que ¡en muchos sitemas el
número de partı́culas no se conserva! Esto puede ocurrir por varias razones, por ejem-
plo, en sistemas de altas energı́as, porque buscamos describir sistemas de partı́culas
que pueden aniquilarse y convertirse en otras, tales como electrones y positrones. O
para un ejemplo más ligado a los materiales, mencionemos el modelo BCS para un
superconductor, que discutiremos en el capı́tulo siguiente. Veremos que las cuasi-
partı́culas fermiónicas que son responsables de la superconductividad se forman por
una superposición de electrones y huecos y no se conservan en número.
Por estas razones, debemos buscar una reformulación de la representación estándar
de la mecánica cuántica (también conocida como primera cuantificación) para siste-
mas de varias partı́culas indistinguibles. Idealmente deberı́amos hallar un formalismo
que se ocupe automáticamente de lo siguiente:
+∞
M
F = H0 ⊕ H1 ⊕ H2 . . . = Hj (4.10)
j=0
que es la suma directa de todos los espacios de Hilbert con 0, 1, 2, etc. partı́culas.
Tal espacio se llama espacio de Fock. En este espacio definamos ahora el estado
|n1 , n2 , n3 , . . . , nd ⟩ (4.11)
como los estados simetrizados o antisimetrizados (4.5) y (4.6). Es. decir, en lugar de
rotular a esos estados mediante el conjunto αi de estados estados de partı́cula inde-
pendiente en el que está cada. partı́cula, los rotulamos por el número de partı́culas
que contiene cada uno de ellos. Dos estados de la forma (4.11) que tienen un número
diferente de partı́culas N pertenecen a dos espacios de Hilbert diferentes y, por lo
tanto, son obviamente ortogonales en el espacio de Fock. Para sistemas con el mismo
número total de partı́culas, se puede verificar usando (4.5) y (4.6) que los estados
(4.11) para una base ortogonal y normalizada satisfacen
⟨n1 , n2 , . . . , nd |n′1 , n′2 , . . . , n′d ⟩ = δn1 ,n′1 δn2 ,n′2 · · · δnd ,n′d (4.12)
Por lo tanto, podemos usar la base (4.11) para caracterizar cada operador y elemento
de matriz en el espacio de Fock. Como se mencionó antes, esta base es extremada-
mente conveniente ya que se basa en la cantidad mı́nima de información necesaria
para describir un sistema de partı́culas indistinguibles. En particular, el número de
“contadores” ni necesarios no crece con el número total de partı́culas.
118 4.2 Operadores de creación y destrucción
Bosones
Introducimos los operadores de creación a†i y destrucción ai por su acción sobre
todos los estados de una base completa en el espacio de Fock, en la forma
√
a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩,
√ (4.13)
ai |n1 , . . . , ni , . . . , nd ⟩ = ni |n1 , . . . , ni − 1, . . . , nd ⟩.
Estas definiciones determinan por completo a los operadores por sus elementos de
matriz en la base de números de ocupación (4.11). Comprobemos que los operadores
a†i y ai son efectivamente hermı́ticos conjugados uno del otro. Dado que (4.11) es
una base ortogonal, el único elemento de matriz distinto de cero para a†i es
√
⟨n1 , . . . , ni + 1, . . . , nd |a†i |n1 , . . . , ni , . . . , nd ⟩ = ni + 1. (4.14)
ai |n1 , . . . , ni = 0, . . . , nd ⟩ = 0, (4.16)
se verifica que a partir de este vacı́o |0⟩ y los operadores a†i podemos construir todos
los vectores de la base completa del espacio de Fock, ya que
Por lo tanto, uno puede generar completamente el espacio de Fock desde el estado
único |0⟩ mediante los operadores de creación (y destrucción ya que son conjugados
hermı́ticos). El vacı́o verifica la propiedad de que para cualquier i
ai |0⟩ = 0 (4.19)
Debemos tener cuidado de no mezclar el vacı́o |0⟩, que es un vector del espacio de
Fock, y uno sobre el que los operadores pueden actuar para dar otros estados del
espacio de Fock, con el cero 0.
Los operadores de creación y destrucción constituyen ası́ una manera muy conve-
niente de describir el espacio de Fock. En lugar de definirlos a partir de sus elementos
de matriz en una base dada, tal como (4.11), es más conveniente definirlos a par-
tir de sus propiedades intrı́nsecas. Mostremos que la definición (4.13) implica que
los operadores a†i y ai poseen ciertas relaciones de conmutación especı́ficas. Y a la
inversa, si se obedecen estas relaciones de conmutación, entonces los operadores, y
el vacı́o correspondiente definido por (4.17), servirán para construir un espacio de
Fock a partir de (4.18) en el que tendrán los elementos de matriz (4.14) y (4.15).
Calculemos primero la acción de un producto de dos operadores de creación a†i
†
y aj en estados distintos (i ̸= j) sobre un estado arbitrario de la base:
q
a†i a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj + 1|n1 , . . . , ni , . . . , nj + 1, . . . , nd ⟩
√ q (4.20)
= ni + 1 nj + 1|n1 , . . . , ni + 1, . . . , nj + 1, . . . , nd ⟩.
y es fácil comprobar que la acción de a†j a†i producirá exactamente el mismo resultado.
Ası́, para cualquier elemento de la base se tiene
h i
a†i , a†j |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = 0, (4.21)
Dado que un operador conmuta consigo mismo, esto también es cierto cuando i = j.
Tomando el hermı́tico conjugado del conmutador anterior obtenemos
[ai , aj ] = 0. (4.23)
Veamos ahora qué ocurre si calculamos la acción del producto de un operador
de destrucción con uno de creación, siempre con (i ̸= j):
√
a†i aj |n1 , . . . , ni , . . . , nj , . . . , nd ⟩ = a†i nj |n1 , . . . , ni , . . . , nj − 1, . . . , nd ⟩
√ √ (4.24)
= ni + 1 nj |n1 , . . . , ni + 1, . . . , nj − 1, . . . , nd ⟩
†
y deh manera i similar la acción de aj ai (con i ̸= j ) darı́a el mismo resultado. Se tiene
ası́ a†i , aj = 0 cuando i ̸= j. El caso i = j es especial. Por un lado tenemos que
√
a†i ai |n1 , . . . , ni , . . . , nd ⟩ = a†i ni |n1 , . . . , ni − 1, . . . , nd ⟩
q √
= (ni − 1) + 1 ni |n1 , . . . , ni , . . . , nd ⟩ (4.25)
= ni |n1 , . . . , ni , . . . , nd ⟩,
y por otra parte
√
ai a†i |n1 , . . . , ni , . . . , nd ⟩ = ai ni + 1|n1 , . . . , ni + 1, . . . , nd ⟩
√ √
= ni + 1 ni + 1|n1 , . . . , ni , . . . , nd ⟩ (4.26)
= (ni + 1)|n1 , . . . , ni , . . . , nd ⟩.
Concluimos entonces que
h i
ai , a†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩. (4.27)
Juntando los dos resultados, encontramos finalmente que el conmutador es
h i
ai , a†j = δi,j . (4.28)
Se puede entonces resumir las propiedades de los operadores de creación y des-
trucción mediante el conjunto de relaciones fundamentales
h i
ai , a†j = δi,j ,
h i
a†i , a†j = 0, (4.29)
[ai , aj ] = 0.
llamado también álgebra de los operadores. Junto con la acción de los operadores de
destrucción sobre el vacı́o (4.19), son equivalentes a las definición de los elementos
de matriz (4.15) y (4.14). Esto implica que si disponemos de
Segunda cuantificación 121
Aunque este es un ejemplo especı́fico, veremos que generalmente todos los observa-
bles fı́sicos se reducen al promedio en el vacı́o de un determinado producto de los
operadores de creación y destrucción, por lo que el método que describimos se puede
aplicar de manera general. Para calcular el promedio, lo único que necesitamos usar
es el hecho de que el vacı́o es destruido por tods los ai . Por tanto, utilizando las
122 4.2 Operadores de creación y destrucción
Aunque los cálculos pueden volverse tediosos cuando crece el número de operadores,
la mecánica siempre es la misma, y con un poco de práctica se pueden acelerar.
Fermiones
Pasemos ahora a los operadores de creación y destrucción de fermiones. De ma-
nera similar que para los bosones, definimos
donde ϵi = i−1
P
j=1 nj y ϵ1 = 0. El orden de los elementos en la base debe fijarse una
vez, y utilizar siempre la misma convención, pero, por supuesto, es arbitraria.
En estas definiciones, algunos términos son bastante transparentes: dado que
para los fermiones el principio de Pauli impide que dos fermiones estén en el miso
estado, los números de ocupación ni están restringido a toar los valores 0 o 1 . Por
lo tanto, es importante que el operador de creación no pueda crear dos partı́culas en
un estado, lo cual queda asegurado por el factor 1 − ni que garantiza que si c†i actúa
sobre un estado con ni = 1 entonces la acción del operador dará cero. De manera
similar, el factor ni asegura que el operador de destrucción no puede destruir una
partı́cula en el estado para el cual ni = 0. La fı́sica del factor extraño (−1)ϵi no es
obvia por el momento, y uno podrı́a tener la tentación de definir los operadores sin
tal factor de fase. Veremos su utilidad un poco más adelante.
Procedemos ahora exactamente como con los bosones: comprobemos primero
que los operadores c†i y ci son efectivamente hermı́ticos conjugados uno del otro. De
Segunda cuantificación 123
hecho, los cálculos con fermiones son más simples en cierto sentido, ya que para cada
estado αi solo hay dos posibilidades ni = 0 o ni = 1 para el estado correspondiente.
El único elemento de matriz distinto de cero para el operador c†i es
ci c†i |n1 , . . . , ni = 1, . . . , nd ⟩ = 0
(4.41)
c†i ci |n1 , . . . , ni = 1, . . . , nd ⟩ = |n1 , . . . , ni = 1, . . . , nd ⟩.
h i
Se observa entonces que ci , c†i no tiene ninguna expresión simple. En cambio, el
anticonmutador n o
ci , c†i = ci c†i + c†i ci (4.42)
conduce a n o
ci , c†i |n1 , . . . , ni , . . . , nd ⟩ = |n1 , . . . , ni , . . . , nd ⟩, (4.43)
y por lo tanto n o
ci , c†i = 1 (4.44)
Por lo tanto, se puede adivinar que en lugar del conmutador, es el anticonmutador el
que jugará un papel importante. El rol del factor (−1)ϵi será, por lo tanto, asegurar
que para las otras combinaciones también se obtengan relaciones simples para el
124 4.2 Operadores de creación y destrucción
{ci , cj } = 0.
Por otro lado, de la misma forma que para los bosones, se puede construir todos los
estados del espacio de Fock a partir de un vacı́o |0⟩ que es destruido por todos los
ci (ci |0⟩ = 0) usando la relación (4.18)
Las funciones de onda y los promedios se pueden calcular también con las mismas
técnicas que antes„ veamos como ejemplo la función de onda de dos fermiones en
los estados α1 y α2 :
|ψ⟩ = c†1 c†2 |0⟩. (4.49)
y entonces, de (??) la función de onda resulta
1
⟨r1 r2 |ψ⟩ = √ [α1 (r1 )α2 (r2 ) − α1 (r2 )α2 (r1 )] , (4.50)
2
que es, por supuesto, la función de onda correctamente antisimetrizada para fermio-
nes. Sin ir a la función de onda, se puede ver directamente la antisimetrización a
Segunda cuantificación 125
= ⟨0|1|0⟩ = 1.
Generalizando el cálculo anterior puede mostrarse el mar de Fermi está crrectamente
normalizado, ⟨F|F⟩ = 1.
Definición
Comencemos primero con los operadores de un cuerpo. De manera bastante
general, llamemos O a un operador que representa alguna propiedad de una partı́cula
a la vez. Por supuesto, si O actúa en el espacio de Hilbert con N partı́culas, debe
actuar sobre cada partı́cula del sistema. Llamemos O(1) al operador que actúa en
el espacio de Hilbert de una sola partı́cula; el operador O correspondiente a las N
partı́culas debe ser
(1) (1) (1)
O = O1 ⊗ 12 ⊗ . . . ⊗ 1N + 11 ⊗ O2 ⊗ . . . ⊗ 1N + . . . + 11 ⊗ . . . ⊗ ON (4.54)
(1)
donde Oi es el operador que actúa sobre la partı́cula i-ésima. El hecho de que
en la suma anterior, todos los coeficientes sean idénticos, es la consecuencia directa
del hecho de que las partı́culas son indistinguibles, y no podemos distinguir en una
medida si un cierto conjunto de números cuánticos corresponeden a una u otra
partı́cula del sistema. La forma (4.54) es por lo tanto la forma más general posible
de un operador de un solo cuerpo para partı́culas indistinguibles.
Para expresar (4.54) en segunda cuantficación, debemos comenzar por analizar
qué sucede si tenemos un sistema con una sola partı́cula (si no hay ninguna partı́cula,
un operador de un cuerpo es trivialmente nulo). En ese caso O = O(1) y usando la
base completa α podemos escribir
|α⟩⟨α|O(1) |β⟩⟨β|,
X
O= (4.55)
α,β
⟨α|O(1) |β⟩c†α cβ
X
O= (4.57)
α,β
Segunda cuantificación 127
Ejemplos
Comencemos con el operador que mide la densidad de partı́culas en un punto
r0 , que para una partı́cula se escribe
debido a que ⟨ψ|ρ(1) (r0 )|ψ⟩ = |ψ(r0 )|2 . En segunda cuantificación la forma del ope-
rador dependerá de la elección de la base completa α que tomemos. Empecemos
tomando la base de autoestados de posición |r⟩, en cuyo caso, el operador c†r es el
operador que crea una partı́cula en el punto r. Usando esta base y la relación (4.57)
se obtiene ˆ
ρ(r0 ) = drdr ′ ⟨r|r0 ⟩⟨r0 |r ′ ⟩c†r cr′ ,
ˆ
= drdr ′ δ(r − r0 )δ(r0 − r ′ )c†r cr′ , (4.59)
= c†r0 cr0 .
La expresión c†r0 cr0 es particularmente simple de interpretar. El operador c†r0 cr0
destruye y recrea una partı́cula en el mismo estado cuántico. Por lo tanto, no ha
cambiado nada en el sistema. Sin embargo, la acción del operador cr0 dará cero si
no hay ninguna partı́cula a destruir en el estado cuántico correspondiente (aquı́ una
partı́cula en el punto r0 ). El operador c†r0 cr0 da cero si no hay ninguna partı́cula en el
128 4.2 Operadores de creación y destrucción
estado cuántico correspondiente y uno si hay una partı́cula. Por tanto, simplemente
cuenta el número de partı́culas en el punto r0 . Generalmente, el operador
ˆ
N̂ = dr c†r cr . (4.61)
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 |r ′ σ ′ ⟩c†rσ cr′ σ′ ,
X
ρ(r0 ) =
σ,σ ′
ˆ
=
X
drdr ′ δ(r − r0 )δ(r0 − r ′ )δσσ′ c†rσ cr′ ,σ′ , (4.63)
σ,σ ′
1
= (c†r0 ↑ cr0 ↑ − c†r0 ↓ cr0 ↓ ).
2
De manera similar, la densidad de spin a lo largo de la dirección x es
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sx |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sx (r0 ) =
σ,σ ′
1
= (c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
y para la dirección y,
ˆ
drdr ′ ⟨rσ|r0 ⟩⟨r0 | ⊗ Sy |r ′ σ ′ ⟩crσ† cr′ σ′ ,
X
Sy (r0 ) =
σ,σ ′
i
= (−c†r0 ↑ cr0 ↓ + c†r0 ↓ cr0 ↑ ),
2
Alternativamente, podrı́amos haber usado la base de los autoestados del operador
momento, |k⟩, cuyas funciones de onda son
1
⟨r|k⟩ = √ eikr . (4.68)
Ω
4
Recordemos que las expresiones de los operadores de spin en la base |±⟩ son
1
Sx = [|+⟩⟨−| + |−⟩⟨+|] ,
2
i
Sy = [−|+⟩⟨−| + |−⟩⟨+|],
2
1
Sz = [|+⟩⟨+| − |−⟩⟨+|].
2
130 4.2 Operadores de creación y destrucción
Dado que el spin y la parte orbital son independientes, solo daremos las expresiones
para el caso sin espı́n. Incorporar el spin se realiza exactamente de la misma forma
que en la base de coordenadas. El operador ck ahora destruye una partı́cula momento
k (es decir, en un estado de onda plana con momento k). La ecuación (4.57) da lugar
a
⟨k1 |r0 ⟩⟨r0 |k2 ⟩c†k1 ck2 ,
X
ρ(r0 ) =
k1 k2
(4.69)
1 X −ik1 r0 ik2 r0 †
= e e ck 1 ck 2 .
Ω k1 k2
1 X ikr
cr = √ e ck . (4.70)
Ω k
densidad: ˆ
ρ(q) = dr e−iqr ρ(r),
ˆ
1 X −ik1 r ik2 r †
= dr e−iqr e e ck 1 ck 2 ,
Ω k1 k2
(4.72)
δk2 ,k1 +q c†k1 ck2 ,
X
=
k1 k2
X †
= ck−q ck .
k
Otro operador importante es, por supuesto, la energı́a cinética de las partı́culas.
p2
Para una partı́cula se tiene H (1) = 2m , y de manera más general, podrı́amos tener
(1)
cualquier función del momento H = ϵ(p). Por lo tanto, es muy conveniente utilizar
la base de momentos. La energı́a cinética se expresa ası́ como
εk c†k ck ,
X
=
k
ε(k)c†kσ ckσ ,
X
H= (4.74)
kσ
asumiendo que la energı́a cinética no depende del espı́n (en ausencia de acoplamiento
espı́n-órbita).
ξ(k)c†kσ ckσ ,
X
H= (4.76)
kσ
Definición
Con un espı́ritu similar al de los operadores de un solo cuerpo, llamemos O(2) al
operador correspondiente que actua en el espacio de Hilbert de sólo dos partı́culas.
El operador de dos cuerpos que actua en HN debe tener la forma
X (2) O 1 X (2) O
O= Oi,j 1k = O 1k , (4.78)
i<j k̸=i,j 2 i̸=j i,j k̸=i,j
para que el operador O(2) pueda operar sobre cada par de partı́culas en el sistema.
De manera similar que para los operadores de un solo cuerpo, los coeficientes en la
suma anterior deben ser todos iguales, de lo contrario significarı́a que las partı́culas
podrı́an distinguirse.
Para entender cómo escribir O en segunda cuantificación, veamos el caso en el
que hay exactamente dos partı́culas en el sistema. Debemos definir el operador O
por sus elementos de matiz en el espacio fı́sico de las funciones (anti)simetrizadas
|α, β⟩, lo que significa que debemos conocer todos los elementos
⟨α, β|O(2) |γ, δ⟩ = (α, β|O(2) |γ, δ) ± (α, β|O(2) |δ, γ). (4.81)
Segunda cuantificación 133
Como |α0 , β0 ⟩ = c†α0 c†β0 |0⟩ tenemos que calcular promedios de la forma
⟨0|cβ0 cα0 c†α c†β cδ cγ c†γ0 c†δ0 |0⟩ = [δα0 ,α δβ0 ,β ± δα0 ,β δβ0 ,α ] [δγ0 ,γ δδ0 ,δ ± δγ0 ,δ δδ0 ,γ ] . (4.85)
cδ cγ |γ0 , δ0 ⟩, (4.86)
tienen que destruir las dos partı́culas en los dos estados cuánticos posibles y ası́ δ
tiene que ser uno de los estados y γ el otro con el signo adecuado dependiendo de la
(anti)simetrı́a de la función de onda. Usando (4.85) en (4.83) de hecho recuperamos
los mismos elementos de matriz que (4.81).
Fı́sicamente, la fórmula (4.82) tiene una interpretación similar a la de los opera-
dores de un solo cuerpo. El término c†α c†β cδ cγ destruye dos partı́culas con los números
cuánticos γ y δ, para esto es necesario que el sistema contenga dos partı́culas (que
es lo que debe ocurrir para que un operador de dos cuerpos pueda actuar). Lue-
go recrea las dos partı́culas con dos nuevos números cuánticos α y β. La amplitud
para este proceso está dada por los elementos de matriz del operador O(2) en una
transición donde la primera partı́cula va del estado γ al estado α y la segunda del
estado δ al estado β. El elemento de matriz se escribir para kets ordenados (son kets
producto y por lo tanto más simples); los operadores de creación y destrucción se
encargan de todas las permutaciones y de realizar esta transición para cualquier par
de partı́culas en el sistema.
134 4.2 Operadores de creación y destrucción
Ejemplos
La interacción más común entre los electrones es aquella que depende de la
distancia entre las dos partı́culas. Los dos operadores de tal interacción son, por lo
tanto,
O(2) = V (r̂1 − r̂2 ), (4.87)
donde r̂1 y r̂2 son los operadores que miden la posición de la primera y la segunda
partı́cula respectivamente. Exepcionalmente utilizaremos aquı́ la notaión con el som-
brero para indicar que son operadores. Por ejemplo, para la interacción de Coulomb
es
e2
V (r) = , (4.88)
4πϵ0 r
pero otros tipos de interacciones como una interacción local V (r) = U δ(r) también
son opciones posibles. Mantendremos V como función general en lo que sigue.
Para expresar el operador en segunda cuantificación, tenemos nuevamente que
realizar la elección de la base. Debido a que el operador V (r̂1 − r̂2 ) es diagonal en
la base de posición, comencemos con ésta. Usando (4.82) y el hecho de que α es la
base de posiciones, obtenemos
ˆ
1
V = dr1 dr2 dr3 dr4 (r3 r4 |V (r̂1 − r̂2 )|r1 r2 )c†r3 c†r4 cr2 cr1 ,
2
ˆ
1
= dr1 dr2 d r3 dr4 V (r1 − r2 )δ(r3 − r1 )δ(r4 − r2 )c†r3 c†r4 cr2 cr1 , (4.89)
2
ˆ
1
= dr1 dr2 V (r1 − r2 )c†r1 c†r2 cr2 cr1 .
2
La expresión (4.90) puede escribirse en una forma más familiar utilizando las
relaciones de (anti)conmutación para fermiones
(para bosones se obtiene una expresión similar, con signo +). El segundo término
da lugar a la expresión
ˆ
1 X
V = dr1 dr2 V (r1 − r2 )ρσ1 (r1 )ρσ2 (r2 ), (4.92)
2 σ1 σ2
que es la forma familiar de la interacción entre dos densidades de partı́culas (o
cargas) en dos puntos diferentes. La diferencia es que ahora los ρ son operadores que
miden la densidad en lugar de variables clásicas. El primer término se reduce a
ˆ
X
drV (r = 0)ρσ1 (r1 ) = V (r = 0)N, (4.93)
σ
que es simplemente un término de potencial quı́mico. Téngase en cuenta que puede
ser infinito para algunas interacciones, como la interacción de Coulomb. Este primer
término está ahı́ para corregir el hecho de que la expresión (4.92) contrariamente a
(4.90) no contiene solo la interacción entre dos partı́culas diferentes. Efectivamente,
(4.90) tiene dos operadores de destrucción a la derecha, lo que significa que los ope-
radores solo pueden actuar en estados que contienen dos partı́culas. Por el contrario,
(4.92) es de la forma
c†r1 σ1 cr1 σ1 c†r2 σ2 cr2 σ2 , (4.94)
y por lo tanto puede actuar incluso si solo hay una partı́cula en el sistema. Por lo
tanto, contiene una falsa “autointeracción” de la partı́cula consigo misma. Es esta
interacción la que conduce al potencial quı́mico (4.93) que debe incluirse adecuada-
mente junto con (4.92). No obstante, si se fija el número de partı́culas del sistema,
entonces esta modificación es irrelevante ya que simplemente se absorbe en una
redefinición del potencial quı́mico y se puede usar (4.90) o (4.92) indistintamente.
Reescribamos ahora la interacción en la base del impulsos. Usando (4.82) y una
base α = (k, σ) se tiene
1 X
V = (k3 σ3 , k4 σ4 |V (r̂1 − r̂2 )|k1 σ1 , k2 σ2 )c†k3 σ3 c†k4 σ4 ck2 σ2 ck1 σ1 . (4.95)
2 k1 σ1 ,k2 σ2 ,
k3 σ3 ,k4 σ4
Figura 4.1: Visualización pictórica del término (3.97). Cada operador de destrucción
está representado por una flecha entrante, cada creación por una saliente. Uno ve que
la interacción puede verse como la dispersión de una partı́cula que va del estado k1 σ1
al k1 +q, σ1 por otra que va del estado k2 σ2 al estado k2 −q, σ2 . La amplitud de estos
elementos de matriz es la transformada de Fourier del potencial de interacción V (q).
Dado que el potencial es invariable por traslación en el espacio, el impulso se conserva
a lo largo de la interacción. Dado que el potencial no depende de los grados de
libertad del espı́n, la interacción conserva individualmente el espı́n de cada partı́cula.
Esta representación se conoce como diagramas de Feynman. Es extremadamente útil
cuando se construye la teorı́a de la perturbación.
Finalmente, integramos en r y R,
1
δk1 +k2 ,k3 +k4 V (q = k3 − k1 )c†k3 σ1 c†k4 σ2 ck2 σ2 ck1 σ1 ,
X
V = (4.99)
2d σ1 σ2
k1 k2 k3 k4
1 X
V = V (q)c†k1 +q,σ1 c†k2 −q,σ2 ck2 σ2 ck1 σ1 (4.100)
2d k1 k2 q
σ1 σ2
Ahora que tenemos las herramientas para expresar todos los operadores que ne-
cesitamos en segunda cuantificación, ya sea para el Hamiltoniano u otros observables
fı́sicos, y que sabemos calcular promedios de un número arbitrario de tales opera-
dores de creación y destrucción en el vacı́o, podemos preguntarnos cómo resolver
en la práctica un problema cuando conocemos el Hamiltoniano. En el equema usual
de la mecánica cuántica, escribimos la ecuación de Schrödinger y, a partir de ella,
encontramos tanto los autovalores como las autofunciones, pero la esencia misma de
la segunda cuantificación es evitar tener que lidiar con la función de onda, por lo
que queremos seguir otra ruta para obtener tales cantidades. Cómo hacer esto es lo
que examinaremos ahora.
d
Aα c†α cα
X
H= (4.101)
α
donde α es una base completa y los coeficientes Aα son números arbitrarios. Varios
Hamiltonianos de sistemas fı́sicos tienen tales formas, por ejemplo, la energı́a cinéti-
ca de un sistema de partı́culas (4.74) y (4.76). Para Hamiltonianos cuadráticos y
diagonales de la forma (4.101) el problema está resuelto. De hecho cada vector de p
partı́culas de la forma
p
X
E= Ai (4.103)
i=1
138 4.3 Resolviendo con segunda cuantificación
Para mostrar esto, ilustremos el cálculo en un estado de dos fermiones |ψ⟩ = c†α1 c†α2 |0⟩
(se puede realizar un cálculo análogo para bosones):
!
Hc†α1 c†α2 |0⟩ Aα c†α cα c†α1 c†α2 |0⟩,
X
=
α
N
c†αi |0⟩,
Y
|F⟩ = (4.105)
i=1
h i
Tr e−βH c†αp cαp
⟨c†αp cαp ⟩ = ,
Tr [e−βH ]
(4.106)
Aα c†α cα †
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e cαp cαp |n1 , . . . , nd ⟩
P
α
= .
Aα c†α cα
P
−β
n1 ,...,nd ⟨n1 , . . . , nd |e |n1 , . . . , nd ⟩
P
α
n i
Usando el hecho de que (tanto para fermiones como para bosones) c†α cα , cγ = 0 si
α ̸= γ y una relación similar para c†γ , vemos que el término e−βH se factoriza en la
forma
d
−βH −βAαj c†αj cαj
Y
e = e . (4.107)
j=1
e−βAαp np np
P
nαp
⟨c†αp cαp ⟩ = P . (4.110)
nαp e−βAαp np
e−βAαp 1
⟨c†αp cαp ⟩ = −βAαp = , (4.111)
1+e 1 + eβAαp
y se recupera el factor de Fermi. Vemos que este es un resultado totalmente general
(no limitado a autoestados del impulso) para Hamiltonianos bilineales y se está en
equilibrio térmico.
140 4.3 Resolviendo con segunda cuantificación
∂ 1
=− log ,
∂β 1 − e−βAαp (4.112)
−βAαp
e
= ,
1 − e−βAαp
1
= βAαp ,
e −1
y se recupera el factor de Bose.
c†α = dα ,
(4.113)
cα = d†α .
Para los fermiones es fácil comprobar, por sustitución de los operadores d verifican
Segunda cuantificación 141
c†α |0c ⟩.
Y
|0d ⟩ =
α
Destruir una partı́cula d sobre este vacı́o es equivalente a crear una de tipo c. Pero
esto no es posible, porque todos los estados están ocupados.
Más generalmente, consideremos un Hamiltoniano cuadrático, no diagonal, arbi-
trario:
Ns
†
X
H= ci Aij cj (4.115)
i,j=1
donde Aij son los elementos de una matriz hermı́tica A, y Ns es un número del
orden del volúmen del sistema, d, que especifica la cantidad de estados accesibles
de partı́cula independiente. Para simplificar la notación conviene escribir en forma
matricial:
H = c† Ac (4.116)
donde
c1
c2
c† = c†1 c†2 · · · c†Ns
c=
..
, (4.117)
.
cNs
es un vector de Ns elementos, donde cada elemento es un operador de creación, y su
transpuesto conjugado. Obsérvese que hemos introducido la notación con una barra
sobre c para indicar la operación de transposición sobre el vector en conjunto con
el dagado de sus elementos. La utilidad de esta notación quedará más clara en la
142 4.3 Resolviendo con segunda cuantificación
próxima sección. La matriz A, al ser hermı́tica, puede ser diagonalizada por una
matriz unitaria U ,
U † AU = Ã (4.118)
donde à es la matriz diagonal que contiene a los autovalores de A, A1 , . . . , ANs
y U se construye ordenando los autovectores de A en columnas. Una vez hallada
la matriz U , podemos utilizarla para definir un nuevo conjunto de operadores dα
mediante la transformación
Ns
† ∗
X
d = U c, (en componentes, dα = Uiα ci ) (4.119)
k=1
cNs +1 ≡ c1 , (4.126)
donde hemos usado un nombre diferente d para enfatizar que se trata de nuevos
operadores, e introducido las posiciones rj = aj donde a es la constante de red, y
2πnk
k= , nk ∈ Z.
Ns a
144 4.3 Resolviendo con segunda cuantificación
= δkq .
Los operadores dk son, por lo tanto, buenos operadores de Fermiones. Hay exacta-
mente Ns operadores diferentes (el tamaño del espacio de Hilbert no puede cambiar)
y k está confinado dentro de la primera zona de Brillouin k ∈ [−π/a, π/a] como se
discutió para la solución en primera cuantificación. Además, como resulta obvio de
la definición (4.127), |0d ⟩ = |0c ⟩. La transformación (4.127) se invierte fácilmente
1 X −ikrj †
c†j = √ e dk , (4.129)
Ns k
Ahora que el Hamiltoniano es diagonal, podemos usar los operadores dk para obtener
el estado fundamental y los diversos promedios. A nivel fı́sico, hemos utilizado que,
dado que la cantidad de movimiento se conserva, se pueden diagonalizar simultánea-
mente los operadores de impulso y el Hamiltoniano. Por lo tanto, el Hamiltoniano es
una matriz diagonal por bloques en la base a los autovectores del operador impulso.
Como esta base es de tamaño Ns (Ns diferentes k valores en la primera zona de
Brillouin) nos queda para cada valor de k una matriz de 1 × 1 a diagonalizar, con
lo cual el problema está completamente resuelto.
H = −σx H ∗ σx , (4.141)
Hψ = λψ,
Este tipo de operadores, al igual que los operadores unitarios, no cambia el resultado de una
medida, es decir que
|⟨x|K † K|y⟩|2 = |⟨x|y⟩|2 . (4.143)
Segunda cuantificación 147
Dado que son vectores distintos, de otro modo tendrı́an distinto autovalor (a menos
que λ = 0), si escribimos al autovector en la forma
!
u
ψ=
v
El estdo de mı́nima energı́a para un cierto potencial quı́mico es entonces aquel con
M = 0 cuasipartı́culas, es decir, el vacı́o mismo de los Bogoliubones.
Si bien el número de partı́culas no es una cantidad conservada, el operador de
paridad global,
P = (−1)N = eiπN (4.151)
conmuta con H, y por lo tanto los autoestados de energı́a poseen paridad fermiónica
definida ±1.
1
φκ (rs) = √ eik·r χσ (s); κ = {k, σ} (4.152)
Ω
Para construir el estado fundamental del gas de Fermi ocupamos a cada uno
de los estados disponibles de partı́cula independiente más bajos con un fermión, de
acuerdo con el principio de exclusión de Pauli. Esta ocupación es de a pares ya que
las energı́as de partı́cula independiente no depende de spin y por cada εk tenemos
un fermión con σ = + 21 y uno con σ = − 12 . Los niveles llenos conforman el mar de
h2 k2
Fermi y el último nivel lleno, con impulso kF y energı́a εF = 2mF , se llama nivel de
Fermi o superficie de Fermi (en el espacio de los impulsos). La estructura del estado
fundamental es:
c†kσ |0⟩.
Y
|F ⟩ = (4.153)
k⩽kF ,σ
se obtiene, ˆ kF
Ω kF3
N= 2 k 2 dk = Ω (4.156)
π 0 3π 2
o sea,
N k3
= F2
ρ0 = (4.157)
Ω 3π
donde ρ0 es la densidad media de partı́culas.
Calculemos ahora la densidad de partı́culas en el estado fundamental, que es
⟨F |c†rσ crσ |F ),
X X
ρ(r) = ⟨F |ρ̂(rσ)|F ⟩ = (4.158)
σ s
o
1 X X ir·(k′ −k)
ρ(r) = e ⟨F |c†kσ ck′ σ |F ⟩. (4.159)
Ω σ kk′
El último valor medio será nulo a menos que k = k′ , ya que si removemos del estado
fundamental una partı́cula con impulso ℏk′ , podremos volver de nuevo a ese estado
sólo creando una partı́cula con el mismo impulso. Por lo tanto,
y
1X
ρ(r) = nkσ = ρ0 . (4.161)
Ω kσ
Como era de esperar, la densidad del gas es uniforme. Una cantidad muy útil, como
veremos más adelante, es la matriz densidad de una partı́cula definida como
es deicr, la amplitud de remover del estado fundamental una partı́cula que está en el
punto r ′ con spin σ para luego ponerla de nuevo al estado fundamental, pero ahora
en la posición r. Utilizando (4.70),
1 X ik·r
crσ = √ e ckσ , (4.163)
Ω kσ
ρ0 3 3j1 (u)
Gσ (r − r ′ ) = C(kF |r − r ′ |); C(u) = 3
(sin u − u cos u) = . (4.169)
2 u u
A la cantidad C(kF |r − r ′ |) se la denomina función de correlación y tiene las
propiedades de tener un máximo para r = r ′ , con C(0) = 1, y de decaer rápidamente
para kF |r − r ′ | > 1 (ver Fig. 4.4).
6
ˆ kF ˆ kF ˆ 1
dk −ik·(r−r′ ) 1 ′ ′
Gσ (r − r ′ ) = 3
e = 2
k 2
dk e−ik|r −r |u du (4.166)
0 (2π) 4π 0 −1
ˆ kF
1 1
= kdk sin k|r − r ′ | (4.167)
2π 2 |r − r ′ | 0
1 1
= (sin kF |r − r ′ | − kF |r − r ′ | cos kF |r − r ′ |). (4.168)
2π |r − r ′ |3
2
Segunda cuantificación 151
0,8
0,6
0,4
0,2
−0,2
0 2 4 6 8 10
2
ρ0
gσσ′ (r − r ′ ) ≡ ⟨F |c†rσ c†r′ σ′ cr′ σ′ crσ |F ⟩. (4.170)
2
2
ρ0 1
′ ′
gσσ′ (r − r ′ ) = e−ik1 ·r e−ik2 ·r eik3 ·r eik4 ·r ⟨F |c†k1 σ c†k2 σ′ ck3 σ′ ck4 σ |F ⟩.
X
2 Ω2 k1 k2 k3 k4
(4.171)
Dado que ckσ |F ⟩ = 0, si k > kF (i. e., no podemos destruir partı́culas que no
están), vemos de inmediato que la sumatoria está restringida a los estados con
|k3 |, |k4 | ⩽ kF . Además, el valor de expectación se anula a menos que las partı́culas
que repongamos tengan los mismos impulsos y spines que las partı́culas removidas.
La forma de hacerlo es emplear los anticonmutadores, y escribir
⟨F |c†κ c†λ cµ cν |F ⟩ = ⟨F |c†κ (δλ,µ − cµ c†λ )cν |F ⟩ = δλµ ⟨F |c†κ cν |F ⟩ − ⟨F |c†κ cµ c†λ cν |F ⟩
= δλ,µ δκ,ν − δκ,µ δλ,ν (4.172)
152 4.4 Gas de Fermi
εk c†kσ ckσ ,
X
T̂ = (4.180)
kσ
con ˆ
(1) 1 e2 ρ20
′
ED = drdr , (4.188)
2 |r − r ′ |
y ˆ
(1) e2 ρ2 C 2 (kF |r − r ′ |)
EI =− 0 drdr ′ . (4.189)
4 |r − r ′ |
(1)
ED representa la interacción media de las partı́culas entre sı́ y se denomina energı́a
(1)
directa ó energı́a de Hartree, mientras que EI es la energı́a de intercambio y se
debe al principio de exclusion de Pauli. Haciendo el cambio de variables: r → r ′ y
r − r ′ → r, también resulta,
ˆ
(1) N ρ0 e2 dr
ED = v0 ; v0 = , (4.190)
2 r
8
ˆ kF
X X dk ℏ2 k2 ℏ2 kF5 3
⟨F |T̂ |F ⟩ = εk nkσ = εk θ(k − kF ) → 2Ω 3
=Ω 2
= εF N (4.181)
0 (2π) 2m 2m 5π 5
k,σ kσ
154 4.4 Gas de Fermi
y ˆ
(1) N ρ0 e2 C 2 (kF r)
=−
EI dr . (4.191)
4 r
Los electrones de conducción en un metal corresponden al gas de electrones que
estamos considerando. Notemos que en cualquier situación fı́sica nunca se tiene un
gas aislado, sino que hay siempre un número suficiente de cargas positivas, que hacen
que el sistema, como un todo, sea neutro. En una primera aproximación, todos los
iones positivos dentro del metal o dentro de un plasma, se pueden reemplazar por
un fondo (o “background”) de densidad de cargas positivas ρ0 e. La autoenergı́a de
ese fondo es: ˆ
1 e2 ρ20
drdr ′ (4.192)
2 |r − r ′ |
que junto con la energı́a electrostática media entre el fondo positivo y los electrones,
ˆ
e2 ρ20
− drdr ′ (4.193)
|r − r ′ |
cancela exactamente la energı́a de Hartree de los electrones. Por lo tanto, en primer
orden de aproximación, la interacción neta en un gas de electrones es precisamente
la energı́a de intercambio (4.191), que integrando resulta:
(1) 3 2
EI = − e kF . (4.194)
4π
Definiendo ahora la distancia media entre las partı́culas, d, por medio de
4πd3
Ω=N , (4.195)
3
resulta,
3π 2 N 9π 1/3 1 ∼
kF = = = 1,92d−1 , (4.196)
Ω 4 d
es decir que kF−1 ∼
= d/2. Otra longitud caracterı́stica es el radio de Bohr, a0 = ℏ2 /me2 .
Introducimos entonces un parámetro sin dimensiones,
d
rs = (4.197)
a0
por medio del cual escribimos
3 ℏ2 kF2 N 3 9π 2/3 c2 2,12 e2
(0)
E = N= 2 =N 2 (4.198)
5 2m rs 5 4 2a0 rs 2a0
1/3 2
N 3 9π e 0,916 e2
(1)
EI =− = −N (4.199)
rs 2π 4 2a0 rs 2a0
Segunda cuantificación 155
E/N
0,1
HF
0 rs
−0,1
RPA
−0,2
2 4 6 8 10 12
Figura 4.2: Energı́a por partı́cula, en unidades de Ry (e2 /2a0 ), para el estado fun-
damental del gas de Fermi.
De la Fig. 4.2 vemos que para rs ≳ 2 resulta EHF < 0, lo que indica que el
sistema se torna ligado. El principio de exclusión juega un papael importante en
esto, evitando que los electrones con los mismos spines se acerquen y de este modo
hace disminuir su energı́a electrostática. Notemos que la aproximación de HF es solo
válida para gases densos (rs ≪ 1) y no para los metales con 1, 8 ⩽ rs ⩽ 5, 5.
La energı́a se puede bajar más todavı́a por el hecho de que también los electrones
con spines opuestos tienden a separarse, debido a la interacción Coulombiana. Esta
aproximación se denomina de fases al azar o “random phase approximation” (RPA)
y lleva al resultado9
!
2,21 0,916 e2
ERP A = N − + 0,062 ln rs − 0,142 + · · · (4.201)
rs2 rs 2a0
cuya solución más general se puede expresar como una superposición de ondas planas
con número de onda k y polarización ϵ,
1 X
A(r, t) = bkα ϵα eik·r−iωk t + b∗kα ϵ∗α e−ik·r+iωk t (4.203)
Ω k,α
ωk = ck. (4.204)
ϵα · k = 0, (4.205)
De estas reglas es facil deducir las reglas de conmutación las que obedecen b̂ y b̂† .
Conviene antes adimensionalizar estos operadores definiendo
s
2ωk
âkα = b̂kα (4.211)
c2 ℏ
s
2ωk †
â†kα = b̂ (4.212)
c2 ℏ kα
Vemos entonces que con este procedimiento, el campo A pasa a ser un objeto que
tiene un desarrollo en términos de operadores â y ↠que obedecen un álgebra de
operadores de aniquilación y creación bosónica,
s
1 X ℏ ik·r−iωk t
Â(r, t) = √ c ϵα e âkα + ϵα e−ik·r+iωk t â†kα (4.217)
Ω kα 2ωk
Las ondas planas de la teorı́a clásica que representan el campo de radiación jue-
gan aquı́ el rol de las funciones de onda cuando tomábamos un sistema cuántico de
partı́culas, bosones o fermiones, que obedecı́an la ecuación de Schrödinger y pro-
cedı́amos a la segunda cuantificación del mismo.
Es importante notar que aquı́ el campo de radiación no obedece una ecuación
cuántica (como era el caso de las funciones φn (r) que obedecı́an la ecuación de
Schrödinger), como vimos para el caso que ya discutimos para los bosones de spin
cero y los fermiones. En este caso son directamente soluciones de las ecuaciones
Segunda cuantificación 159
clásicas de Maxwell. Pero, como en los casos anteriores, los coeficientes del desarrollo
son operadores de segunda cuantificación, en este caso en el esquema de Heisenberg
puesto que el campo Â(r, t) ha pasado a ser un operador dependiente del tiempo.
El Hamiltoniano (4.206) se vueve ahora un operador cuántico:
1
X
Ĥ = ℏωk n̂kα +
kα 2
donde, como antes, hemos definido el operador número de partı́cula como
n̂kα = â†kα âkα
El hamiltoniano cuántico (4.5) corresponde a un sistema de infinitos osciladores de
frecuencia ωk = ck.
B = ∇ × A = ∇ × A⊥ + 0 ⇒ B = B (A⊥ )
∂E⊥
∇ × B (A⊥ ) + = 4πj⊥ (4.218)
∂t
∂E∥
= 4πj∥ (4.219)
∂t
De aquı́ concluimos que el campo E∥ es creado por las cargas y corrientes mientras
que el campo magnético solo depende de A⊥ y E∥ . Es decir que para B en ningun
momento necesitamos hacer referencia a A∥ para determinar cantidades fı́sicas. Es
por ello que, si se elige desde un principio el gauge de Coulomb,
∇·A=0
e2 X Ze2 1
2
1 e 1
X X
H= pj − A⊥ (rj ) + − + Hrad
j 2m c i>j 4π |xi − xj | i 4π ri
con ˆ !2
1 1 ∂A⊥
Hrad = dr (∇ × A⊥ )2 + 2
2 c ∂t
Segunda cuantificación 161
Si Ĥint fuera nulo, las autofunciones del hamiltoniano podrı́an escribirse como |
Atomo ⟩ | radiación ⟩ Aquı́ es natural identificar —radiación ⟩ con un ket en el
espacio de los números de ocupación de fotones,
| radiación ⟩ = |n1 n2 . . . ni . . .⟩
Podemos ahora pensar que Ĥint produce, como perturbación, transiciones entre los
niveles no perturbados descriptos por (22.34). Como trabajaremos en la represen-
tación de Schrödinger en la que los operadores no dependen del tiempo, se trata
de una perturbación constante pero como ya lo discutimos, puede ser tratada en
el marco de la teorı́a de perturbaciones dependientes del tiempo. Dado que la per-
turbación corresponde a una constante de acoplamiento suficientemente pequeña,
e2 /(ℏc) ≈ 1/137, calcular la primera corrección al problema libre es una buena
aproximación por lo que trabajaremos al primer orden.
En términos de operadores de creación y aniquilación ↠y â tendremos entonces
una perturbación lineal en la que se crearán o destruirán fotones. Para obtener la
probabilidad de transición entre un estado inicial i y uno final f utilizaremos la
fórmula dada por la regla de oro que obtuvimos oportunamente,
2π D E2
f Ĥint i δ (ϵf − ϵi )
Wi→f =
ℏ
Supongamos estudiar un proceso de absorción de un fotón de impulso ℏk y polari-
zación α. En tal caso
|i⟩ =| Atomo A + nkα fotones ⟩ (4.223)
|f ⟩ =| Atomo B + (nkα − 1) fotones ⟩ (4.224)
162 4.6 Emisión y absorción de fotones por un átomo
donde A indican el estado incial del átomo y B el estado final luego de absorber un
fotón. Es fácil entonces calcular
E
⟨B; nkα − 1 Ĥint A; nkα = (4.225)
s
N
* +
e ℏ
akα exp (ik · rj ) pj · ϵ(α) A; nkα
X
− B; nkα − 1 c (4.226)
mc j=1 2ωV
4π 2 c 2
WfAi = 2
I vf† i δ (Ei + ℏω − Ef ) Absorción
ℏω
coincida con la actual, en que la intensidad de la radiación es ahora proporcional al
número nk de fotones.
Segunda cuantificación 163
A + nkα −→ B + (nkα + 1)
Notemos que en este caso, aún si nkα = 0 (es decir, cuando no hay fotones en el
estado inicial) el átomo puede puede emitir un fotón. Se trata en tal caso de una
emisión espontánea que es observable experimentalmente y que no puede obtenerse
cuande se trata a la radiación de manera clásica. Cuando nkα ̸= 0 habrá emisión
inducida por los fotones de la radiación incidente.
La contribución de emisión espontánea corresponde a un fenómeno puramente
cuántico que se obtiene limpiamente al tratar a la radiación de manera cuántica.
Finalmente, también existe la llamada emisión estimulada. Para comprenderla,
comencemos por recordar que cuando un electrón se encuentra en un estado excita-
do, tiende a decaer a un nivel más bajo emitiendo un fotón portador de una energı́a
que es la diferencia entre la de los dos niveles. Para lograr tener muchos electrones
en un dado nivel excitado de los átomos debe existir una fuente de energı́a exterior
de manera de que los estados excitados estén más poblados que los del más bajo.
Se habla de “bombeo de población” y de “inversión de población” que puede ser un
generador eléctrico o la accion de otro laser (bombeo óptico). En respuesta al cam-
po electromagnético externo que corresponde a la misma energı́a, la probabilidad
de transición al estado más bajo es grandemente aumentada, más allá de la emi-
sión espontánea. Esos átomos pueden desexcitarse emitiendo fotones de frecuencias
extremadamente próximas. en un proceso que se conoce como emisión estimulada.
Los cáculos relativos a la emisión y absorción de fotones en los átomos fueron
hechos en 1916 por Einstein 40 . Estos resultados, que 40 Einstein, A., 18 (1916) 318
“Strahlungs-emission und -absorption nach der Quantentheorie”. Verhandlungen der
Deutschen Physikalischen Gesellschaft. Einstein, A., Physikalische Zeitschrift. 18
(1917) 121. “Zur Quantentheorie der Strahlung”
Einstein obtuvo en su incansable búsqueda de contradicciones de la mecánica
cuántica tuvieron una confirmación trascendental a principios la década de 1950
cuando Charles Townes pudo generar experimentalmente luz amplificada por emisión
de radiacin estimulada con un aparato precursor de lo que hoy llamamos Laser.
No pudo hacer este experimento en los laboratoriosde llamados por entonces “Bell
Laboratories” donde trabajaba porque los directivos no vieron una posible utilidad
164 4.6 Emisión y absorción de fotones por un átomo
p → (−iℏ)∇, (5.2)
∂
E → iℏ , (5.3)
∂t
se obtiene la ecuación de Schrödinger para la función de onda ψ(r, t) que contiene
toda la información posible sobre el estado de una partı́cula libre de masa m,
ℏ2 2 ∂
− ∇ ψ(r, t) = iℏ ψ(r, t). (5.4)
2m ∂t
Esta ecuación es obviamente no covariante relativista (i.e. frente a trasnformaciones
de Lorentz): el tiempo y las coordenadas espaciales no son tratados en un pie de
igualdad; incluye una derivada primera en el tiempo y derivadas segundas espaciales.
Conviene aquı́ precisar lo que entendemos por una ecuación covariante relativista.
Dada una función f (r, t) y un operador diferencial Dr,t diremos que la ecuación
165
166 5.1 La ecuación de Klein-Gordon
es covariante relativista si, dada una solución fs (x, t) en cierto sistema de coorde-
nadas de espacio-tiempo, cuando por ejemplo hacemos una rotación espacial o un
boost (i.e., transformación del grupo deLorentz propio) para pasar a otro sistema
de coordenadas, la función transformada satisface la misma ecuación, expresada en
términos de las nuevas coordenadas r ′ , t′
c2 p2 + m2 c4 = E 2 . (5.7)
La aplicación de las reglas de cuantificación canónica (5.2) y (5.3) lleva a una ecua-
ción cuántica relativista, la ecuación de Klein-Gordon [2]-[4] para una partı́cula libre
(i.e. sin potencial) de masa m,
ℏ2 ∂ 2 ψ(r, t)
ℏ2 ∇2 ψ(r, t) − m2 c2 ψ(r, t) = . (5.8)
c2 ∂t2
No es inesperado que, habiendo partido de la ecuación relativista (5.7), se llegue
a una ecuación en la que el orden de las derivadas espaciales y temporal sea el mismo.
Si introducimos el operador d’Alembertiano2 □
1 ∂2
□≡ − ∇2 (5.9)
c2 ∂t2
entonces la ecuación(5.8) se puede escribir de manera compacta como
m 2 c2
□ψ(r, t) + ψ(r, t) = 0. (5.10)
ℏ2
2
Este operador diferencial lleva el nombre de Jean Le Rond d’Alambert quien lo introdujo en
1747 en un trabajo sobre cuerdas vibrantes.
Mecánica cuántica Relativista 167
p2
Ep ≃ . (5.13)
2m
En contraste con las argumentación de la fı́sica clásica y de la cuántica no relativista
para desechar el signo negativo de la energı́a de una partı́cula libre, notemos que
las discontinuidades en los valores posibles de la energı́a son precisamente una de
las caracterı́sticas fundamentales de la mecánica cuántica, por lo que en este caso
relativista no hay razón alguna para descartar una de las dos ramas, aún para el
caso de una partı́cula libre.
Pero se plantea en este caso un problema serio: de no descartarse la solución
con signo negativo la energı́a de la partı́cula libre no estarı́a acotada por abajo y se
podrı́a entonces extraer una cantidad arbitrariamente grande de energı́a tomando
simplemente una partı́cula en reposo con energı́a +mc2 y perturbándola de manera
3
Ansätze: del alemán, propuesta.
168 5.1 La ecuación de Klein-Gordon
de que saltara el “gap”4 de 2mc2 y cayera en un estado con más y más energı́a
negativa. Volveremos a este asunto más adelante.
Ahora bien, utilizando la ecuación relativista propuesta por Schrödinger (y que
hoy se conoce ecuación de Klein Gordon), se obtienen resultados razonables para
las series de Balmer y Lyman del átomo de hidrógeno pero los resultados eran
inaceptables para la constante de estructura fina α determinada ya en esa época
con bastante precisión por F. Paschen y E. Back en el estudio de la acción de
un campo magnético intenso sobre los niveles de energı́a del átomo de hidrógeno
(α = e2 / (4πϵ0 ℏc).
Es importante aquı́ recordar que Schrödinger no ignoraba la existencia del spin
del electrón, sugerido por G. Uhlenbeck y S. Goudsmit en 1925 para dar cuenta del
desdoblamiento de niveles atómicos en un campo magnético externo (efecto Zee-
man). Comprendı́a correctamente que las discrepancias que encontraba provenı́an
de que su ecuación no tenı́a en cuenta el spin del electrón. De tenerlo, la función
de onda asociada al electrón no debı́a tomarse como un escalar frente, en particu-
lar, a rotaciones, y la ecuación que rija su dinámica cuántica tendrı́a que incluir
interacciones que tengan en cuenta a este momento angular intrı́nseco.
Existı́a además un problema conceptual más básico que mostraba la invalidez de
la ecuación de Klein-Gordon para describir la dinámica del electrón en el contexto
de la fı́sica cuántica en la que |ψ|2 se interpreta como una densidad de probabilidad.
Fue este problema, que tiene que ver con la imposibilidad de definir una densidad de
probabilidad consistente a partir de la ecuación de Klein-Gordon, el que llevó a Paul
Dirac a cambiar radicalmente el frente de ataque y proponer la ecuación que lleva
su nombre y que sı́ daba cuenta de todos los resultados experimentales conocidos al
momento (1928) sobre el átomo de hidrógeno.
Para comprender la contradicción entre la ecuación de Klein-Gordon y una den-
sidad de probabilidad consistente, recordemos que en el caso no relativista descripto
por la ecuación (5.4), a partir de la función de onda ψ(r, t) se puede construir la
densidad de probabilidad ρ y la corriente de probabilidad J . La densidad ρ(r, t) re-
sulta ser una función real, semidefinida positiva y de carácter escalar que satisface,
junto a J (r, t), que tiene carácter vectorial, una ecuación de continuidad:
∂ρ
∇·J + = 0, (5.14)
∂t
donde
Es decir, existe en la mecánica cuántica una invarianza global U(1) (el grupo unitario
U(N ) representado por matrices es el grupo de las matrices U unitarias de N ×N –i.e.
U † U = U U † = I. El caso N = 1 puede identificarse con el de los números complejos
de módulo 1. que es el caso de la transformación (5.19). Cuando se trata de una
partı́cula cargada eléctricamente en interacción con el campo electromagnético, esta
invarianza pasa a ser una invarianza local (es decir, α = α(r, t) ) donde un cambio
con fase α(x) en la función de onda va acompañado de un cambio de gauge en el
campo electromagnético.
Planteada la ecuación de conservación (5.18), la interpretación de ρ, definida
positiva, como densidad de probabilidad se vuelve natural. A ello se agrega que la
probabilidad de encontrar a la partı́cula en algún lugar de todo el espacio resulta
constante en el tiempo –conservada– (e igual a 1 con una adecuada normalización
de la función de onda).
Para obtener tal ecuación de continuidad se multiplica la ecuación de Schrödinger
por ψ ∗ (r, t) y se resta el resultado de multiplicar la ecuación conjugada por ψ(r, t). Si
procedemos de la misma manera con la ecuación de Klein-Gordon (5.8), obtenemos
∂ρR
∇ · JR + =0 (5.20)
∂t
donde JR (con R indicamos que se trata del caso relativista) tiene la misma forma
que en el caso no relativista mientras que la densidad de carga ρR cambia radical-
170 5.2 La ecuación de Dirac
mente:
∂ψ ∗ (r, t)
" #
iℏ ∗ ∂ψ(r, t)
ρR = ψ (r, t) − ψ(r, t) , (5.21)
2mc2 ∂t ∂t
ℏ
JR = [ψ ∗ (r, t)∇ψ(r, t) − ψ(r, t)∇ψ ∗ (r, t)] . (5.22)
2mi
Haber forzado la covarianza implica que ρR tenga una forma funcional análoga a las
componentes de JR con t jugando un rol idéntico al de las coordenadas.
Es evidente que ρR es una función escalar real pero, a diferencia de ρ = |ψ(r, t)|2 ,
puede ser negativa y por ello se pierde la posibilidad de asociarla con una densidad
de probabilidad. Esto es consecuencia de que siendo la ecuación de Klein-Gordon de
segundo orden en el tiempo, es en principio necesario dar dos condiciones iniciales
(para ψ(r, t)y para ∂ψ(r, t)/∂t) para determinarla y no queda excluı́da la posibilidad
de elegir la función y su derivada de manera que ρR < 0. De hecho, dada una
elección de ψ(r, t) y ∂ψ(r, t)/∂t en el instante inicial que haga a ρR positiva, la
elección igualmente aceptable de ψ(r, t) y −∂ψ(r, t)/∂t como condición inicial hará
que ρR < 0.
Otra manera de ver el problema señalado arriba es la siguiente: si se considera
un estado estacionario, puede reemplazarse en (5.21) iℏ ∂ψ(r, t)/∂t por Eψ(r, t),
obteniéndose
E
ρR = |ψ(r, t)|2 (5.23)
mc2
y las soluciones con energı́a negativa (rama negativa de la raı́z (5.12)) correspon-
derán, evidentemente a ρR < 0. De esta última fórmula vemos que, en el lı́mite no
relativista, cuando E → mc2 , ρR deviene la densidad de probabilidad no relativista
habitual,
ρR → |ψ(r, t)|2 = ρ. (5.24)
E 2 = p 2 c2 + m 2 c4 (5.25)
Dirac lo hizo con la idea de que relativı́sticamente la energı́a se elaciona con la
masa y el impulso a través de una raı́z cuadrada,
q
E = ± p2 c2 + m2 c4 (5.26)
Pero como no era razonable abandonar la linealidad de la ecuación de ondas
escribiendo para la ecuación de ondas una en que ψ apareciera dentro de raı́ces cua-
dradas, lo que vioları́a el principio de superposición), Dirac no planteó una ecuación
con raı́ces cuadradas sino que propuso una que, “elevada al cuadrado”, reproduje-
ra (5.25) de manera que en el lı́mite c → ∞ se recupera el resultado no relativista
E = p2 /(2m) (El sentido de de escribir “elevar al cuadrado” una ecuación diferencial
quedará aclarado más adelante).
En este punto recordemos que cuando en la mecánica cuántica no relativista
se pretende describir al electrón incluido su spin, debe considerarse una función de
onda que no es un escalar sino que tiene 2 componentes (más precisamente se trata
de un espinor de dos componentes χ que suele llamarse espinor de Pauli),
!
χ1 (r, t)
χ(r, t) = . (5.27)
χ2 (r, t)
eléctrico
r dϕ
E = −e (5.28)
r dr
con ϕ el potencial escalar. Vimos en el primer curso de mecánica cuántica que el
hamiltoniano del electrón, tratado como un espinor de 2 componentes toma en este
caso la forma
!
p2 /2m + eϕ(r) 0
H= 2 + w(r)σ · L (5.29)
0 p /2m + eϕ(r)
con
e2 ℏ dϕ
w(r) = − (5.30)
4m2 c2 rdr
donde σ = (σ 1 , σ 2 , σ 3 ) son las matrices de Pauli, de 2 × 2.
! ! !
0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = (5.31)
1 0 i 0 0 −1
Para mayor generalidad que la de los espinores de Pauli, Dirac consideró a la
función de onda como un objeto no de 2 sino de N componentes, esperando que
ciertas propiedades básicas a exigir a la teorı́a fijaran N y el carácter espinorial de
ψ. Escribió entonces
1
ψ (r, t)
2
ψ (r, t)
·
= (ψ α ) ,
ψ(r, t) = α = 1, 2, . . . , N (5.32)
·
·
ψ N (r, t)
La ecuación diferencial lineal de primer orden con coeficientes constantes6 más
general que puede escribirse para el caso de un electrón libre en un espacio-tiempo
de 3 + 1 dimensiones es entonces:
1 ∂ψ ∂ψ ∂ψ ∂ψ imc
+ α1 1 + α2 2 + α3 3 + βψ = 0. (5.33)
c ∂t ∂x ∂x ∂x ℏ
Las constantes c (velocidad de la luz), m (masa de la partı́cula) y ℏ (constante de
Planck) aparecen por conveniencia posterior. La arbitrariedad de los coeficientes
i
está dada por constantes αρσ y βρσ que, dado que ψ es un vector columna de N
elementos, pueden considerarse 4 matrices de N × N a determinar por razones
fı́sicas. La ecuación (5.33) puede reescribirse de manera más compacta en la forma
1 ∂ψ imc
+ α · ∇ψ + βψ = 0 (5.34)
c ∂t ℏ
6
Es la homogeneidad del espacio-tiempo la que implica que sean constantes.
Mecánica cuántica Relativista 173
Nótese que las componentes αi de α = (α1 , α2 , α3 ) son cada una una matriz de
N × N . En este caso poner los ı́ndices arriba o abajo es solamente una cuestión de
estética pues se trata de ı́ndices “espinoriales”.
En camino de obtener una ecuación de continuidad, analicemos el resultado de
conjugar la ecuación (5.34) (Utilizaremos la notación f ∗ para indicar el conjugado
de una función f ). Para el caso de espinores, introducmos la notación
ψ † ≡ ψ ∗T = ψ 1∗ , ψ 2∗ , . . . , ψ N ∗ , (5.35)
1 ∂ψ † imc † †
+ ∇ψ † · α† − ψ β = 0. (5.36)
c ∂t ℏ
†
Aquı́ αi es la traspuesta conjugada de la matriz αi .
Multiplicando (5.34) a izquierda por ψ † , (5.36) a derecha por ψ y luego sumando
ambos resultados se obtiene
1 ∂|ψ|2 † imc †
+ ψ α · ∇ψ + ∇ψ † · α† ψ + ψ β − β † ψ = 0, (5.37)
c ∂t ℏ
donde hemos introducido a la función real |ψ|2 , semidefinida positiva, de la manera
siguiente:
|ψ|2 = ψ † (r, t)ψ(r, t). (5.38)
Basta pedir que las matrices αi y β sean hermı́ticas para que la ecuación (5.37) se
simplifique considerablemente y tenga las caracterı́sticas de una tı́pica ecuación de
continuidad. En efecto, si
αi = αi† , β = β † , (5.39)
la ecuación (5.37) toma la forma simple
1 ∂|ψ|2
+ ∇ ψ † αψ = 0. (5.40)
c ∂t
Entonces, si se define
ρ(r, t) = |ψ(r, t)|2 , (5.41)
y
J (r, t) = ψ † (r, t)cαψ(r, t), (5.42)
y se puede escribir a (5.40) como una ecuación de continuidad e interpretar a ρ como
una densidad de probabilidad semidefinida positiva,
∂ρ
+ ∇ · J = 0. (5.43)
∂t
174 5.2 La ecuación de Dirac
∂ψ h i
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ, (5.44)
∂t
que nos permite identificar al operador p con −iℏ∇, la misma expresión que la de
la cuantificación canónica no relativista. En cuanto al operador H,
αk β + βαk = 0, (5.51)
β 2 = I, (5.52)
ℏ2 ∂ 2 ψ(r, t)
2 2
− ℏ2 ∇2 ψ(r, t) + m2 c2 ψ(r, t) = 0 (5.53)
c ∂t
y por lo tanto es consistente con la relación energı́a impulso relativista que vimos
era verificada por esta última.
La derivación anterior aclara el sentido que tenı́a la frase que se referı́a a “elevar
al cuadrado” una ecuación.
Las condiciones que ya hemos impuesto a las matrices α y β implican varias
propiedades. En particular, si reescribimos la ecuación (5.51) en la forma
calculamos el determinante,
det βαk = det −αk β = (−1)N det αk β , (5.55)
tr βαk β = − tr αk (5.58)
k 2 k k k
tr βα β = tr β α = tr α = − tr α . (5.59)
tr αk = 0. (5.60)
γ 0 = β, (5.62)
γ i = βαi , (5.63)
γ µ γ ν + γ ν γ µ = 2g µν IN , (5.65)
con la métrica g µν definida a partir de la identidad g µν gνρ = δρµ con gνρ dada matri-
cialmente por la ec. (5.72).
Si multiplicamos la ecuación de Dirac (5.34) por iℏβ y usamos la nueva notación
tendremos
∂ψ(r, t)
iℏγ µ − mcψ(r, t) = 0. (5.66)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente covariante, la
ecuación matricial que describe la dinámica relativista de una partı́cula libre de
masa m. Se puoede lograr una forma más compacta utilizando la notación (), lo
cual arroja
iℏγ µ ∂µ ψ − mcψ = 0. (5.67)
∂/ = γ µ ∂µ , / = γ µ Aµ
A (5.68)
o
γ µ = (β, γ i ) (1.74)
Puede verse fácilmente que
µ ν ν µ µν
γ γ cuántica
Mecánica + γ γ = Relativista
2g IN ×N (1.75) 177
µν µν
con la métrica g definida a partir de la identidad g gνα = δαµ
con gνα
dada por la fórmula (1.29).
Si multiplicamos la ecuación de Dirac (1.45) por ih̄β y usamos la
nueva notación tendremos
∂ψ(&x, t)
ih̄γ µ − mcψ(&x, t) = 0 (1.76)
∂xµ
Esta es la manera compacta de escribir, de manera explı́citamente co-
variante, la ecuación matricial que describe la dinámica relativista de
una partı́cula libre de masa m.
Resta confirmar la covarianza y determinar explı́citamente las cu-
atro matrices γ µ (llamadas matrices de Dirac). En particular, su or-
den (por ahora N × N es arbitrario) o, lo que es lo mismo, cuál es el
número N de componentes de ψ(&x, t). Luego, deberemos analizar las
propiedades de ψ(&x, t) ante transformaciones de Lorentz, determinar el
spin de la partı́cula que describe y buscar las soluciones.
El grupo de todas las transformaciones que dejan invariante ds2 se denomina el grupo
homogéneo de Lorentz7 . Restringiremos nuestra discusión a este tipo de transforma-
ciones y en lo que sigue omitiremos la palabra homogéneo al referirnos al grupo de
Lorentz (GL).
En un espacio 3-dimensional (x, y, z) son componentes de un 3-vector, y dr2 =
dx + dy 2 + dz 2 se puede escribir en la forma
2
dr2 = (dxi )2 , x1 = x, x2 = y, x3 = z
X
(5.71)
i=1,2,3
que resulta ser una forma bilineal definida positiva por ser suma de cuadrados,
e invariante respecto de las rotaciones en el espacio usual. Para generalizar a 4
dimensiones esta manera de escribir el intervalo ds2 tenemos el problema de que ya
no resulta positivo definido, y necesitamos introducir algún objeto que contenga la
información del signo de cada coordenada. La forma usual de hacerlo es introducir
la “métrica” del espacio, gµν , como los elementos de la matriz diagonal
1 0 0 0
0 −1 0 0
g=
(5.72)
0 0 −1 0
0 0 0 −1
donde las filas y las columnas corresponden a las componentes 0 ,1, 2 y 3. De esta
forma el intervalo puede escribirse
7
El grupo homogéneo excluye las traslaciones
Mecánica cuántica Relativista 179
que inducen una transformación análoga en los dxµ (atención que el orden en que
aparecen los ı́ndices µ y ν es importante). Dado que tienen que mantener invariante
el intervalo ds2 , se debe satisfacer que
Observemos que si pensamos a Λµν como los elementos de una matriz Λ, entonces
podemos escribir (5.81) como un producto matricial9 ,
ΛT gΛ = g. (5.82)
Esto significa que el grupo de transformaciones que dejan invariante al intervalo
ds2 , lo que se conoce como grupo de Lorentz, es lo que se denomina grupo pseudo-
ortogonal O(1,3), usualmente denotado L para los fı́sicos.
Para hallar la regla de transformación del tetravector covariante, primero subimos
su ı́ndice, luego lo transformamos de acuerdo a la regla que para tetravectroes con-
travariantes (5.80), y luego bajamos su ı́ndice:
x′µ = gµν x′ν = gµν Λν ρ g ρσ xσ , (5.83)
Para simplificar esta expresión, multiplicamos (5.81) por g σλ , y usamos (5.79):
gµν Λν σ g σλ Λµρ = δρλ (5.84)
y entonces observamos que
gµν Λν σ g σλ = (Λ−1 )λµ (5.85)
es decir, las componentes µ, ν de la transformación de Lorentz inversa. Solo por
cuestiones de notación, definimos
Λν µ = (Λ−1 )µν (5.86)
Y entonces resulta10
10
Notemos la siguiente sutileza: La suma implı́cita en el lado derecho de
x′µ = Λµν xν = (Λ−1 )ν µ xν (5.87)
corre sobre un ı́ndice de fila de la matriz Λ−1 . Luego, en términos de matrices, esta transformación
debe pensarse como la inversa transpuesta de Λ actuando sobre el vector columna xµ . Es decir, en
notación matricial,
x′ = (Λ−1 )T x. (5.88)
Mecánica cuántica Relativista 181
y su version contravariante
!
µ µν 1∂
∂ = g ∂ν = , −∇ (5.92)
c ∂t
∂ ∂ ∂xν
∂µ′ = = (5.94)
∂x′µ ∂xν ∂x′µ
y de (5.80),
xµ = (Λ−1 )µν x′ν = Λν µ x′ν . (5.95)
y entonces
∂µ′ = Λµν ∂ν . (5.96)
El tetravector energı́a-impulso de una partı́cula es:
E E
µ
p = ,p , pµ = , −p (5.97)
c c
dando lugar al invariante
E2
p2 = p µ pµ = − p · p = m2 c2 (5.98)
c2
o, cuando c = 1
p2 = E 2 − p 2 = m 2 . (5.99)
Usaremos la notación p · x para el producto escalar de los tetravectores pµ y xν :
p · x = pµ xν = Et − p · r (5.100)
182 5.3 Transformaciones de Lorentz
0 V1 V2 V3
−V 1 0 −A 3
A2
T µν = ≡ {V , A};
Tµν = {−V , A} (5.101)
−V 2 A3 0 −A1
−V 3 −A2 A1 0
F µν = ∂ µ Aν − ∂ ν Aµ = {−E, B} (5.102)
donde
L=r×p (5.104)
es el impulso angular orbital y
es invariante con respecto a las TL. Por ejemplo, para el campo electromagnético:
F · F = 2 B 2 − E 2 = inv. (5.107)
1 0 0 0
0 −1 0 0
ΛP = , (5.108)
0 0 −1 0
0 0 0 −1
Mecánica cuántica Relativista 183
0 0 0 1
rotaciones, por ejemplo de un ángulo θ alrededor del eje z:
1 0 0 0
0 cos θ − sin θ 0
ΛR (θ) = , (5.110)
0 sin θ cos θ 0
0 0 0 1
y tranformaciones propias de Lorentz o “boosts” temporales, que afectan a una de
las coordenadas y al tiempo, por ejemplo para el caso en que la velocidad relativa
entre los dos sistemas es v en la dirección del eje x, se escriben
cosh ω sinh ω 0 0
sinh ω cosh ω 0 0
ΛB (ω) = (5.111)
0 0 1 0
0 0 0 1
−1/2 −1/2
donde tanh ω = v/c y por lo tanto cosh ω = (1 − v 2 /c2 ) y sinh ω = v/c (1 − v 2 /c2 ) .
Los boosts y las rotaciones pueden formarse mediante transformaciones infinitesi-
males consecutivas a partir de la identidad ΛI (están “continuamente conectadas” a
ΛI ), mientras que ΛT y ΛP no pueden (están “desconectadas” de ΛI , o se dice que
son transformaciones “discretas”). Cualquier producto de boosts, rotaciónes, ΛT y
ΛP pertenece al grupo de Lorentz, y resulta que saturan el grupo de Lorentz.
Adoptaremos la convención seguida hasta ahora, que corresponde a las rotaciones
activas. Esto significa que la rotación afecta al sistema fı́sico, mientras que los ejes
de coordenadas quedan fijos. Lo mismo hacemos con los boosts de Lorentz, y para
una TL en la dirección x con velocidad relativa v.
Consideremos un sistema invariante relativista que obedece la ecuación covarian-
te de Klein-Gordon. Si pretendemos que el módulo cuadrado de la función de onda,
ligado a una cantidad medible, no cambie frente a este grupo de transformaciones,
la función de onda deberá permanecer invariante a menos de una posible fase:
Λ
ψ(r, t) → ψ ′ (r ′ , t′ ) = exp(iα)ψ(r, t) (5.112)
Supongamos que α representa una inversión espacial. Entonces, si se consideran dos
inversiones espaciales, se tendrá que exp(2iα) = 1 y por lo tanto α = 0, π. Luego,
ante una inversión espacial
ψ ′ (−r, t) = ±ψ(r, t) (5.113)
184 5.4 La ecuación de continuidad
Es decir que ψ(r, t ) puede ser un escalar (signo +) o pseudoescalar (signo −).
En cuanto a rotaciones, que son continuas, debemos incluir, por continuidad, a la
identidad. Al hacer una rotación de 2π si α no se mantuviera constante tendrı́amos
una inconsistencia (lo mismo sucede para boosts, que pueden considerarse como
rotaciones hiperbólicas).
Luego ψ(r, t) es un escalar o pseudoescalar frente a reflexiones espaciales y un
escalar frente a transformaciones propias de Lorentz y rotaciones. Tal función de
onda sólo puede describir partı́culas que no tengan otros grados de libertad que
los asociados con el espacio-tiempo. Es decir, la ecuación de Klein-Gordon describe
partı́culas de spin 0. Fueron Pauli y Weisskopf [5] quienes justamente propusieron
utilizar la ecuación de Klein-Gordon para describir la dinámica cuántica de bosones.
γ µ γ ν + γ ν γ µ = 2g µν IN , (5.115)
tr γ µ = 0. (5.116)
J 0 (r, t) = cρ(r, t) = cψ(r, t)† ψ(r, t) = cψ(r, t)† γ 0 γ 0 ψ(r, t), (5.117)
J = cψ(r, t)† αψ(r, t) = cψ(r, t)† γ 0 γψ(r, t), (5.118)
podemos escribir
J µ = cψ(r, t)† γ 0 γ µ ψ(r, t), (5.119)
donde hemos usado la ecuación (5.115) para escribir las igualdades (5.118).
Si en este punto se introduce la importante definición
∂J µ
= ∂µ J µ = 0. (5.122)
∂xµ
Veremos que ψ̄(r, t) jugará un papel más importante que ψ(r, t)† en el análisis
de la mecánica cuántica relativista. Más aun, en el marco de la cuantificación de las
teorı́as de campos vı́a el método de la integral funcional11 reaparecerá en un pie de
igualdad con ψ como una función independiente de ψ.
Conviene por lo anterior determinar qué ecuación satisface ψ̄(r, t). Para ello
conjugamos y trasponemos la ecuación (5.114). Luego la multiplicamos por γ 0 a
derecha y usamos que12
γ 0 γ µ† γ 0 = γ µ , (5.127)
para obtener
iℏ ∂µ ψ̄γ µ + mcψ̄ = 0. (5.128)
Recordemos que la ecuación de Dirac para ψ, ec. (5.114) tiene la forma
Notemos que estas ecuaciones difieren solo en el signo relativo. De hecho, toman-
do a ψ y ψ̄ como variables independientes, las ecuaciones pueden ser obtenidas a
partir de la acción ˆ
S= d4 x L (5.130)
11
El método de la integración funcional, desarrollado por R. Feynmann a partir de una idea de
Dirac provee una manera alternativa a la cuantificación de las teorı́as de campos.
12
A partir de las definiciones
γ 0 = β, (5.123)
i i
γ = βα , (5.124)
γ i† = αi β (5.125)
y entonces
γ 0 γ i† γ 0 = βαi β 2 = γ i . (5.126)
γ 0 es hermı́tica, entonces γ 0† = γ 0 = γ 0 γ 0 γ 0 .
186 5.5 Los valores posibles de N
(la derivada respecto de ∂µ ψ̄ del lado izquierdo de esta ecuación se anula porque en
el Lagrangiano no aparecen derivadas de ψ̄). Para obtener la ecuación que obedece ψ̄
conviene integrar por partes la acción (5.130)) y luego se procede de manera análoga
al caso de ψ. Finalmente, hay otra manera de escribir el Lagrangiano de Dirac, por
ejemplo, poniendo un factor 1/2 a la suma de dos términos, uno en el que es ψ quien
aparece derivada, el otro en el que es ψ̄ quien aparece derivada.
γ 0γ 1 γ 0γ 2 γ 0γ 3 iγ 1 γ 2 iγ 1 γ 3 iγ 2 γ 3 (5.134)
iγ 0 γ 1 γ 2 iγ 0 γ 1 γ 3 iγ 0 γ 2 γ 3 γ 1γ 2γ 3 (5.135)
Finalmente, existe un único producto de a cuatro que juega un rol muy importantes
en la mecánica cuántica relativista por lo que se le asigna un sı́mbolo especı́fico, γ5
iγ 0 γ 1 γ 2 γ 3 ≡ γ5 (5.136)
asociado a una simetrı́a muy importante que discutiremos más en detalle luego y
que se denomina “quiralidad” (del griego χϵιρ, (kheir), mano).
Mecánica cuántica Relativista 187
para algún l (nótese que por la propiedad 2, Γl ̸= I para m ̸= k.) Ahora tomamos
la traza de esta igualdad
X
tr bm I + bk akm Γl = 0 (5.146)
k̸=m
γ̃ µ = S −1 γ µ S (5.149)
16
X
S= Γ̃i F Γi (5.150)
i=1
γ 0 γ µ† γ 0 = γ µ , (5.151)
γ̃ 0 γ̃ µ† γ̃ 0 = γ̃ µ , (5.152)
escribimos
S −1 γ 0 S(S −1 γ µ S)† S −1 γ 0 S = S −1 γ µ S (5.153)
o,
γ 0 SS † γ µ† (S † )−1 S −1 γ 0 = γ µ (5.154)
1 0 0 0
!
0 1 0 0 I2 0
γ0 = = (5.156)
0 0 −1 0 0 −I2
0 0 0 −1
En cuanto a las γ i , es facil ver que una elección consistente con (5.156) y con todos
los requerimientos de las matrices de Dirac es
!
i 0 σi
γ = (5.157)
−σ i 0
Buscamos que la ecuación de Dirac sea covariante, es decir, que tome la misma forma
en las variables primadas x′µ que en las originales xµ . Para ello definiremos un nuevo
conjunto de matrices
γ̃ ν = Λν µ γ µ (5.168)
Es fácil ver que, dadas las condiciones que cumple Λµν , las γ̃ µ satisfacen todas las
condiciones de las matrices de Dirac, de manera que podemos tomarlas como un
nuevo conjunto de matrices de Dirac y escribir
iℏγ̃ µ ∂µ′ ψ − mcψ = 0. (5.169)
Ahora bien, por el teorema fundamental de Pauli sabemos que si {γ µ } y {γ̃ µ }
son dos conjuntos aceptables de matrices de Dirac, debe existir S tal que
γ̃ µ = S −1 γ µ S (5.170)
Notemos que de las ecs. (5.170) y (5.170) resulta
S −1 γ µ S = Λµν γ ν , (5.171)
lo que constituye una ecuación para S dada una transformación de Lorentz Λ. Po-
demos reescribir (5.169) en la forma
iℏS −1 γ µ S∂µ′ ψ − mcψ = 0 (5.172)
o
iℏγ µ ∂µ′ Sψ − mcSψ = 0 (5.173)
Basta que identifiquemos Sψ con la función de onda transformada ψ ′ para que
podamos escribir
iℏγ µ ∂µ′ ψ ′ − mcψ ′ = 0 (5.174)
O sea que hemos mostrado que la ecuación de Dirac es covariante frente a las trans-
formaciones de Lorentz (5.346) si la función de onda cambia según
ψ ′ (x′ ) = Sψ(x) (5.175)
Es importante notar que las γ µ que aparecen en la ecuación de Dirac son las
mismas en ambos sistemas inerciales. De hecho, por más que el ı́ndice µ puede
inducir a pensar que γ µ es un tetravector cuyas componentes son matrices de 4 × 4,
hacerlo serı́a incorrecto. En efecto, si lo fuera, deberı́a transformarse como tal al
pasar de un sistema de referencia al otro, pero este no es el caso. Veremos luego,
al considerar cómo transforma la corriente jµ frente a transformaciones de Lorentz
cuál es la ley de transformación general de tetravectores.
En resumen, en la ec. (5.174) solo aparecen transformadas de Lorentz las coor-
denadas del espacio-tiempo y la función de ondas. Las matrices de Dirac son un
conjunto de matrices que permanecen inalteradas.
Mecánica cuántica Relativista 193
Pero para que el producto entre paréntesis conmute con todas las matrices γ λ , debe
ser un múltiplo de la identidad17
Sγ 0 S † γ 0 = bI (5.184)
17
Podemos demostrar esta afirmación de la siguiente manera:
194 5.9 Transformación de Lorentz de la corriente
o
Sγ 0 S † = bγ 0 (5.185)
Tomando el adjunto en esta ecuación,
Sγ 0 S † = b∗ γ 0 (5.186)
de donde resulta que b = b∗ . Calculamos ahora el determinante en la igualdad
(5.185),
(det S)2 = b4 (5.187)
de manera que si elegimos que det S = 118 , se tendra b4 = 1 por lo que b = ±1.
Ahora, escribamos la serie de igualdades
3
S † S = γ 0 γ 0 S † γ 0 γ 0 S = bγ 0 S −1 γ 0 S = bγ 0 Λ0ν γ ν = bΛ00 I − bΛ0k γ 0 γ k .
X
(5.188)
k=1
y por lo tanto
(Λ00 )2 − Λi0 Λi0 = 1, (5.197)
Λ = ΛI + εΩ + O(ϵ2 ), (5.199)
o bien
(gΩ)T = −gΩ (5.201)
Es decir, gΩ resulta una matriz antisimétrica. Sólo debemos entonces elegir una base
de matrices antisimétricas de 4 × 4 para descomponer gΩ, y multiplicar por g −1 la
base para obtener la descomposición de Ω. Una elección conveniente y simple es el
conjunto
0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 i 0 0 −i 0
L1 = , L2 = , L3 = ,
0 0 0 −i 0 0 0 0 0 i 0 0
0 0 i 0 0 −i 0 0 0 0 0 0
(5.202)
0 i 0 0 0 0 i 0 0 0 0 i
i 0 0 0 0 0 0 0 0 0 0 0
K1 = , K2 = , K3 = .
0 0 0 0 i 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 i 0 0 0
[Li , Lj ] = iϵijk Lk
[Li , Kj ] = iϵijk Kk (5.207)
[Ki , Kj ] = −iϵijk Lk
lo que se denomina el álgebra de Lie del grupo, Li y Ki son los generadores del
grupo, y las constantes ϵijk las constantes de estructura. Conocer estas constantes
(que obtuvimos analizando transformaciones próximas a la identidad) implica que
conocemos la ley de composición de todo el grupo, ya que dados dos elementos del
grupo g1 = eA y g2 = eB , su producto se obtiene aplicando la fórmula de Hausdorff,
1
eA eB = eA+B+ 2 [A,B]+... . (5.208)
donde
ω0i = ωi , ωij = ϵijk θk , ωαβ = −ωβα (5.210)
contiene a los 6 parámetros, y
[M αβ , M µν ] = −ig βµ M αν + ig αµ M βν + ig βν M αµ − ig αν M βµ . (5.212)
198 5.11 Generadores y álgebra del grupo L↑+
que es una representación de dimensión infinita. Cada generador actúa sobre fun-
ciones en vez de sobre un espacio vectorial de dimensión finita. Estos son los gene-
radores clásicos del momento angular generalizados para incluir el tiempo. Se puede
comprabar que Lµν satisface las relaciones de conmutación del álgebra, ec. (5.212).
Para encontrar las representaciones matriciales irreducibles de L↑+ (en realidad
de su grupo de cubrimiento universal) es conveniente considerar las combinaciones
lineales complejas de los generadores
1
Jk± = (Lk ± iKk ), (5.214)
2
cuyos conmutadores se reducen a
Esto corresponde a dos subálgebras de SU(2) que conmutan entre sı́, caracterizadas
cada una de ellas por un entero o semientero j ± , y enntonces las representaciones
matriciales irreducibles de L↑+ están caracterizadas por un par de enteros o semien-
teros (j+ , j− ), siendo su dimensión (2j+ + 1)(2j− + 1). Las transformaciones están
entonces representadas por matrices D(j+ ,j− ) . Una cantidad que transforma según
1
D(0,0) se llama escalar de Lorentz. Una que transforma según D( 2 ,0) corresponde a un
espinor de dos componentes (que se conoce como espinor de Weyl) de polarización
1
izquierda χL y uno que transforma según D(0, 2 ) corresponde a un espinor de Weyl
de polarización derecha χR ). Estos espinores de dos componentes son los que usamos
en la teorı́a de Pauli de dos componentes para representar a la función de onda en
el caso no relativista cuando se incluyó el spin. Los objetos de 4 componentes que
aparecen en la ecuación de Dirac son, por construcción, objetos que corresponden a
la suma directa ( 21 , 0) ⊕ (0, 12 , ). El espinor resultante es un espinor de 4 componentes
o espinor de Dirac, !
ψL
χ= . (5.216)
ψR
La representación ( 12 , 21 ) es una representación vectorial. Un objeto que transfor-
ma según ella es entonces lo que conocemos como tetravector.
Es importante notar que los boosts del grupo de Lorentz en una dimension
espacial y la temporal están parametrizados por tanh ω = v/c y por lo tanto la
transformación es homeomorfa a un espacio topológico en un intervalo abierto de R
Mecánica cuántica Relativista 199
que es no-compacto en la topologı́a generada por la métrica (esto contrasta con las
rotaciones en el plano como ejemplo de un grupo compacto: están parametrizadas
por un ángulo 0 ⩽ θ ⩽ 2π en el que el 0 es identificado con 2π).
5.12. El carácter de ψ
Hemos escrito a la ecuación de Dirac para una partı́cula libre de masa m de
manera explı́citamente covariente en la forma
donde las matrices γ µ son cuatro matrices de 4 × 4 que satisfacen lo que los ma-
temáticos llaman un álgebra de Clifford22
γ µ γ ν + γ ν γ µ = 2g µν IN . (5.218)
Vimos que la representación más pequeña posible para que la ecuación de Dirac para
una partı́cula libre de masa m cumpla la relación relativista entre energı́a e impulso
es la que corresponde a matrices γ µ de 4 × 4. Si la adoptamos, ψ será necesariamente
un objeto de cuatro componentes, un espinor de 4 componentes23
1
ψ
ψ 2
ψ= = [ψ α (x)] . (5.219)
3
ψ
ψ4
¿Qué tiene que ver el álgebra de Clifford con el grupo de Lorentz? Veamos.
Dada una transformación de Lorentz para las coordenadas del espacio tiempo que
anotamos como
x′µ = Λµν xν , (5.220)
ya hemos mostramos que la ley de transformación de de la función de onda ψ (el
espinor ψ ) debı́a estar dada por
o, de manera compacta
ψ ′ (x′ ) = S(Λ)ψ(x). (5.222)
22
El matemático y filósofo inglés William K. Clifford fue quien introdujo este álgebra cuadrática
multilineal en la década de 1870.
23
Formalmente, un espinor es un elemento de un espacio de representación para el “grupo espi-
norial”. En en el contexto de la mecánica cuántica relativista, los espinores son elementos de un
espacio vectorial complejo asociado al espacio de Minkowski. Los espinores fueron introducidos en
la matemática por Elie Cartan en 1913 y originalmente utilizados en la fı́sica por Pauli, en 1920.
200 5.12 El carácter de ψ
S = I + ϵT (5.228)
Se trata ahora de determinar T para luego escribir, como hacemos siempre en el
caso finito, S = exp(ϵT ). Utilizando la relación (5.224),
Λλµ γ µ = S −1 γ λ S, (5.229)
24
Como ya indicamos, el ı́ndice α, con α = 1, . . . , 4, de (ψ α ) nada tiene que ver con los ı́ndices
de Lorentz de espacio-tiempo).
Mecánica cuántica Relativista 201
se tiene
(δνµ + ϵω µν ) γ ν = (I − ϵT )γ µ (I + ϵT ), (5.230)
y al orden ϵ en que trabajamos resulta entonces
ω µν γ ν = γ µ T − T γ µ . (5.231)
con
i µ ν
Σµν ≡
[γ , γ ] . (5.235)
4
De manera más general, Σµν satisface el álgebra del grupo de Lorentz cuando se
construye a partir de cualquier conjunto de matrices γ que satisfaga el álgebra de
Clifford. Es decir, se puede derivar de {γµ , γν } = 2gµν que
Es importante apreciar que las matrices Σµν son diferentes de las matrices M µν
correspondientes a los generadores en la representación vectorial. En especial, Σµν
son complejos. Ası́ que hemos encontrado dos representaciones de dimensión 4 no
equivalentes. En cada caso, el elemento del grupo está determinado por seis ángulos
reales ωµν (tres rotaciones y tres boosts). La representación vectorial, o ( 21 , 12 ) es
irreducible y los elementos del grupo que se obtienen por exponenciación son (5.209)
i αβ
Λ = e 2 ωαβ M , (5.237)
det(1 + ϵA) = 1 + ϵ tr(A) + ϵ2 21 tr2 A − tr A2 + . . .
25
202 5.12 El carácter de ψ
y entonces
1 !
e 2 ω·σ 0
S(ΛB ) = − 12 ω·σ
. (5.241)
0 e
Por otro lado, definimos
i i
Σi ≡ ϵijk Σjk = ϵijk [γ j , γ k ] = ϵijk γ j γ k (5.242)
4 2
i ijk i
= ϵ [βαj , βαk ] = − ϵijk [αj , αk ] (5.243)
4 4
i ijk j k
=− ϵ α α , (5.244)
2
o26 ,
i
Σ=− α×α (5.245)
2
Para una rotación en el espacio tenemos [ec. (5.210)] ωij = ϵijk θk y
i
S(ΛR ) = e− 2 θ·Σ (5.246)
Quedan ası́ identificados los Σµν como los generadores de las transformaciones de
Lorentz mientras que los ωµν son los parámetros de las diferentes transformaciones
26
Nótese que este producto vectorial, al ser entre matrices, no se anula
Mecánica cuántica Relativista 203
En la representación quiral,
!
σ 0
Σ= . (5.247)
0 σ
Se trata de una matriz diagonal por bloques de 2 × 2 y que cada uno de esos bloques
coincide con el generador de rotaciones de los espinores de Pauli de 2 componentes
que estudiamos en el caso de la mecánica cuántica no relativista. La matriz S(Λ) se
escribe en la forma sugestiva
i !
e− 2 θ·σ 0
S(ΛR ) = − 2i θ·σ
. (5.248)
0 e
ψ → ψ ′ = Sψ (5.251)
′ −1
ψ̄ → ψ̄ = ψ̄S (5.252)
y por lo tanto
ψ̄ψ → ψ̄ ′ ψ ′ = ψ̄ψ (5.253)
204 5.12 El carácter de ψ
1 0 0 0
0 cos θ sin θ 0
ΛR = (5.254)
0 − sin θ cos θ 0
0 0 0 1
0 0 0 1
mientras que
1 eω/2 0 0
1 1 !
e 2 ωσ 0 eω/2 1 0 0
S(ΛB ) = = (5.258)
− 21 ωσ 1 0 0 1 e−ω/2
0 e
−ω/2
0 0 e 1
Mecánica cuántica Relativista 205
En esta representación, las rotaciones sobre los espinores S(ΛR ) y los boosts S(ΛB )
que obtuvimos en (5.248) y (5.241) son diagonales por bloques,
i ! 1 !
e− 2 θ·σ 0 e 2 ω·σ 0
S(ΛR ) = − 2i θ·σ
, S(ΛB ) = − 12 ω·σ
. (5.260)
0 e 0 e
Es decir que χ+ y χ− transforman bajo rotaciones y boosts como los espinores de dos
componentes que introdujimos en la mecánica cuántica no-relativista del electrón.
En el lenguaje de la teorı́a de grupos, χ+ está en la representación ( 21 , 0) del grupo
de Lorentz, mientras que χ− está en la representación (0, 12 ). El espinor de Dirac se
encuentra ası́ en la representación ( 12 , 0) ⊕ (0, 12 )27 .
Es sólo cuando se incluyen reflexiones espaciales (cambio de paridad) que la
representación deviene irreducible. El requerir que una teorı́a sea invariante bajo
reflexiones espaciales implica la necesidad de usar espinores de 4 componentes. En
efecto, una inversión lleva un espinor de dos componentes que pertenece a la re-
presentación ( 12 , 0) a uno que pertenece a la representación (0, 21 ). Esto puede verse
27
Estrictamente del grupo de cubrimiento SL(2, C)
206 5.14 La solución de partı́cula libre
fácilmente recordando que para el caso de una inversion espacial se tiene que (Λλµ )
son los elementos de una matriz diagonal,
1 0 0 0
0 −1 0 0
ΛP = . (5.264)
0 0 −1 0
0 0 0 −1
Luego, usando la relación (5.224)
Λλµ γ µ = S −1 γ λ S, (5.265)
para λ = i, se tiene
Λiµ γ µ = Λii γ i = −γ i = S −1 γ i S. (5.266)
Y entonces Sγ i + γ i S = 0. Mientras que para el caso de λ = 0 resulta que debe
conmutar. Esto implica que se puede tomar a S proporcional a γ 0 . En la represen-
tación quiral (que es la que permite caracterizas a las dos primeras componentes
frente a las 2 últimas) γ 0 es una matriz con dos bloques en la antidiagonal (cada
uno proporcional a la identidad, ver ec. (5,159), y entonces para una transformación
de paridad en la representación quiral,
!
0 I2
0
S=γ = (5.267)
I2 0
y por eso se cambian las componentes de arriba respecto de las de abajo e inversa-
mente.
Para el resto de las transformaciones del grupo de Lorentz, χ+ y χ− transforman
separadamente.
Entonces, necesitamos 4 componentes y no solamente dos porque los espinores
de dos componentes y su transformado por inversiones espaciales no se transforman
de la misma manera bajo transformaciones de Lorentz.
(γ µ pµ − mcI4 ) u = 0. (5.271)
(γ µ pµ − mc)−1 (5.273)
no puede existir. Para encontrar los puntos singulares reescribamos esta inversa en
la forma
(γ ν pν + mc)
(γ µ pµ − mc)−1 = . (5.276)
pµ pµ − m2 c2
p µ p µ − m 2 c2 = 0 (5.277)
E2
pµ pµ = − p2 , (5.278)
c2
208 5.14 La solución de partı́cula libre
Con esta notación es claro que podemos identificar a las componentes del tetravector
pµ con con la energı́a E y las 3 componentes del impulso p de manera que la condición
(5.278) deviene la relación entre energı́a E e impulso p de una partı́cula libre de masa
m, según la forma clásica de la relatividad restringida,
E 2 = c2 p 2 + m 2 c4 (5.279)
Vemos entonces que la ecuación de Dirac libre tiene soluciones de partı́cula libre
con energı́a positiva y ¡negativa!. Volvamos a mencionar que en la ecuación de Dirac
la masa puede tener cualquier signo puesto que en la fórmula (5.280) aparece al
cuadrado.
Resta determinar las soluciones u del sistema homogéneo (5.271). Aquı́ resulta
útil dividir al espinor de cuatro componentes en dos espinores de dos componentes,
φ y χ,
u1
!
u φ
2
u= = (5.281)
u3 χ
u4
con ! !
u1 u3
φ= y χ= (5.282)
u2 u4
y utilizando nuevamente la representación de Dirac de las matrices γ µ , la ecuación
(5.271) se escribe en forma de dos ecuaciones para ϕ y χ:
(E − mc2 )φ − c σ · p χ = 0, (5.283)
(E + mc2 )χ − c σ · p φ = 0. (5.284)
Dado que el determinante de este sistema es cero, sabemos que las cuatro ecua-
ciones no pueden ser linealmente independientes. Una de ellas tiene que ser una
combinación de las tres restantes. Mostraremos más tarde que estrictamente sólo
dos ecuaciones son linealmente independientes, debido a que existe otra cantidad
que conmuta con el Hamiltoniano dando lugar a una degeneración. De manera que
podemos tomar sólo la ecuación de arriba o sólo la de abajo. Es usual tomar la de
arriba para las soluciones de energı́a positiva y la de abajo para las negativas. De
este modo, si tomamos a φ como arbitrario (y complejo), con la normalización
y E = +Ep , χ resulta
cσ · p
χ= φ. (5.286)
E + mc2
y entonces la solución es de la forma
!
φ
u+ = N+ c σ·p (5.287)
Ep +mc2
φ
y resulta !−1
c2 p 2
|N± |2 = 1 + ≡ |N |2 . (5.290)
(Ep + mc2 )2
la misma para las dos ernergı́as y φ arbitrario, y normalizado.
El lı́mite no relativista (v/c → 0) corresponde a |E± | → mc2 , y N ∼ 1. En este
caso las soluciones toman la forma
! !
φ O(v/c) × φ
u+ = , u− = . (5.291)
O(v/c) × φ φ
Suponiendo que las componentes de φ y χ sean de orden 1 (ambos están normali-
zados a 1), se distingue ası́ a las “grandes componente”, que son las que sobreviven
al lı́mite v/c → 0, de las “pequeñas componentes” que se anulan en este lı́mite. Se
observa entonces que en el lı́mite no relativista, la parte no trivial de los espinores
de 4 componentes se reduce a espinores de 2 componentes (espinores de Pauli, φ y
χ), que corresponden, para el caso de energı́a positiva, a la solución de la ecuación
no relativista de Schrödinger para una partı́cula libre con spin 1/2:
u = ei(p·r−Et)/ℏ × φ. (5.292)
5.15. Spin
Recordemos que a partir de la ecuación de Dirac,
∂ψ(r, t)
iℏγ µ − mcψ(r, t) = 0, γ µ = γ 0, γ1, γ2, γ3 (5.293)
∂xµ
210 5.15 Spin
γ0 = β (5.294)
γ i = βαi , (5.295)
se tiene
∂ψ
iℏ = cα · (−iℏ)∇ + βmc2 ψ ≡ Hψ. (5.296)
∂t
Escrita de esta manera señalamos anteriormente una evidente analogı́a de esta ecua-
ción con la ecuación de Schrödinger no-relativista si identificamos al hamiltoniano
en la forma H,
H = cα · (−iℏ)∇ + βmc2 (5.297)
Esta identificación es consistente con el hecho de que el lado izquierdo de la ec.
(5.296) puede ser asociado a una traslación temporal infinitesimal de la función de
onda con lo que el operador H del lado derecho cumple el rol de generador de dicha
traslación.
Es fácil ver que H según la definición (5.297) no conmuta con el operador L =
r×p, asociado al momento angular orbital según las reglas de cuantificación canónica
que aceptamos en la mecánica cuántica no-relativista y que hasta aquı́ consideramos
que son consistentes en el caso relativista. En efecto, si reescribimos (5.297) usando
que (−iℏ)∇ = p se tiene
H = cα · p + βmc2 (5.298)
y se encuentra
dL i
= − [L, H] = cα × p. (5.299)
dt ℏ
Es decir que L no se conserva, no está asociado a una constante de movimiento: ¡De
aquı́ se podrı́a inferir la ausencia de invarianza bajo rotaciones, y esto aún en el caso
de la partı́cula libre!28
Por otro lado, en el caso de la partı́cula libre encontramos 4 soluciones lineal-
mente independientes, dos de energı́a positiva y dos de energı́a negativa y que, en
lo que respecta a rotaciones, ambos estaban relacionados con los espinores de Pauli
que representan a las funciones de onda para partı́culas de spin 1/2, con las dos
componentes distinguiendo a las soluciones con igual energı́a según el el signo de la
proyección a lo largo del eje z.
28
Nótese que la cantidad cα jugaba el rol de “velocidad” en la interpretación clásica de la
corriente de probabilidad de Dirac. Si la fórmula (5.299) fuera clásica, como los vectores velocidad
e impulso son paralelos resultarı́a que dL/dt = 0.
Mecánica cuántica Relativista 211
Lo anterior sugiere que debe existir algún otro operador, ligado al spin, tal que
sus autovalores distingan a estas soluciones con la misma energı́a. Ese operador
sumado al del momento orbital L deberı́a conmutar con el hamiltoniano. Es decir
que con la experiencia adquirida con la teorı́a de Pauli para el electrón no relativista
es natural adelantar tal operador debe estar asociado con un operador momento
angular total total J , al que deben contribuir el momento angular orbital y el spin.
En analogı́a con el caso no relativista, en que se tiene J = L + ℏ2 σ, es natural definir
en el caso relativista
ℏ
J =L+ Σ (5.300)
2
dado que Σ, como fue definida en la ec. (5.247) tiene la forma
!
σ 0
Σ= (5.301)
0 σ
Hemos propuesto entonces a Σ, que implementa las rotaciones espaciales sobre los
espinores, como el operador asociado al spin de la partı́cula de masa m. No es casual
que cada bloque de Σ corresponda al operador de spin de la teorı́a de Pauli.
Usando la ec. (5.244),
i
Σi = − ϵijk αj αk , (5.303)
2
calculemos el siguiente conmutador:
ℏ ℏ i
[ Σi , H] = [− ϵijk αj αk , cα · p + βmc2 ] (5.304)
2 2 2
i cℏ
= − ϵijk pl [αj αk , αl ] (5.305)
2 2
Luego de un poco de álgebra, se obtiene
" #
ℏ
Σ, H = −iℏcα × p (5.306)
2
Vemos entonces del resultado de la ec. (5.307), para el caso del Hamiltoniano de una
partı́cula libre, que J está asociado con una constante de movimiento del sistema y
es por ello natural relacionarlo con un operador de momento angular total. Contiene
al momento angular orbital L y, en cuanto a Σ, basta asociarlo al spin de la partı́cula
libre de masa m que aparece en la ecuación de Dirac para que todo sea consistente.
Los autovalores de Σ son ±1/2 (como lo son los de σ por lo que podemos
interpretar a las soluciones de la ecuación de Dirac como soluciones con spin 1/2.
Nótese que el hecho de que la ecuación de Dirac describa partı́culas de spin 1/2 es
una consecuencia de la estructura de la ecuación relativista y no una imposición
como la que hizo Pauli en el caso de la teorı́a no-relativista.
Vimos que en el lı́mite no relativista las soluciones con energı́a positiva coincidı́an
con las de la teorı́a de Pauli para proyección del spin ±1/2. Lo mismo sucede con las
de energı́a negativa. En el caso lı́mite de una partı́cula en reposo en que las cuatro
autofunciones lo son también de Σz , podemos afirmar que estas cuatro soluciones
linealmente independientes corresponden a energı́a positiva y spin ±1/2 y energı́a
negativa y spin ±1/2. (ver más adelante la discusión sobre helicidad).
5.16. Helicidad
Vimos que el spin de las partı́culas relativistas no se conserva separadamente del
momento angular orbital, en particular Σz no lo hace aún en el caso más simple de
una partı́cula libre. Por ello, la proyección del spin sobre un eje dado (al que lla-
maremos z por analogı́a con la direccion que suele elegirse en la mecánica cuántica
no-relativista) no servirá para caracterizar un estado dado. Sin embargo la proyec-
ción del spin en la dirección del movimiento sı́ se conserva, como veremos ahora.
Indicaremos a tal dirección a la direccion del movimiento como el vector unitario n,
p
n= (5.308)
|p|
donde p es el operador vectorial momento y el denominador indica que cuando se
aplique a una función de onda, el resultado (pψ) debe normalizarse con el autovalor
de manera de que n sea un versor. Partiendo de la proyección de Σ en la dirección
de n se tiene
!
ℏ ℏ p ℏ p
Σ·n= Σ· = Σ+r×p · = J · n. (5.309)
2 2 |p| 2 |p|
Luego, la cantidad
ℏ
h= Σ·n (5.310)
2
llamada helicidad es un operador que, a diferencia de Σz , sı́ conmuta con el hamil-
toniano ya que cada componente de J lo hace y, por lo tanto, se conserva.
Mecánica cuántica Relativista 213
como autoestado de σ · n,
σ · n φ = ϵφ (5.315)
entonces automáticamente las soluciones de partı́cula libre son autoestados de heli-
cidad, con autovalor ϵℏ/2. Para hallarlas, conviene expresar al versor n en término
de variables angulares (φ, θ), con 0 ⩽ φ < 2π, 0 ⩽ θ ⩽ π,
5.17. Paridad
Un cambio de paridad se define a partir de la transformación de coordenadas
r → −r, (5.322)
t → t. (5.323)
Es decir, la transformación de paridad corresponde a una reflexión espacial. Vimos
que esta transformación de las coordenadas espacio-temporales puede representarse
como uno de los elementos del grupo de Lorentz cuando actúa sobre el tetravector
posición
1 0 0 0
0 −1 0 0
ΛP = ,
x′µ = Λµν xν . (5.324)
0 0 −1 0
0 0 0 −1
No se trata de una transformación de las catalogadas como “propias” del grupo de
Lorentz pues det ΛP = −1.
Dada Λµν según (5,324), trataremos de asociarla con la matriz S, que ahora
llamamos P , según la cual transforman los espinores utilizando la fórmula (5.224)
Λµν γ ν = P −1 γ µ P (5.325)
Mecánica cuántica Relativista 215
γ 0 = P −1 γ 0 P (5.326)
i −1 i
γ = −P γP (5.327)
P γ 0 = γ 0P (5.328)
i i
P γ = −γ P. (5.329)
Es decir que la matriz que representa una transformación de paridad para los espi-
nores debe conmutar con γ 0 y anticonmutar con las γ i . Basta entonces una relación
de proporcionalidad entre P y γ 0 para que esto se cumpla, segun vimos al estudiar
las propiedades de las matrices de Dirac
P = ηγ 0 (5.330)
y escribiendo !
χ+
ψ= (5.336)
χ−
la ecuaciones devienen
!
∂
iℏ 0 + iℏσ · ∇ χ− = 0, (5.337)
∂x
!
∂
iℏ 0 − iℏσ · ∇ χ+ = 0, (5.338)
∂x
que son las ecuaciones de Weyl. Observemos que en este caso de masa cero, son
ecuaciones desacopladas para las componentes χ±
Mecánica cuántica Relativista 217
5.19. Quiralidad
Las matrices S[Λ] en (5.260) resultaron ser diagonal por bloques porque elegimos
una representación especı́fica de las matrices γ (5.259). De hecho esta representa-
ción se llama quiral porque descompone explı́citamente al espinor de Dirac en la
forma (5.336). Podrı́amos preguntarnos qué ocurre si elegimos otra representación
del álgebra de Clifford, donde en general S[Λ] no va a ser diagonal por bloques.
¿Existe alguna forma invariante de definir espinores quirales? Después de todo, el
hecho de que si consideramos sólo boosts y rotaciones la representación de 4 compo-
nentes sea reducible no puede depender de la representación de las matrices γ que
elijamos.
Podemos hacer esto introduciendo la “quinta” matriz γ,
γ 5 = iγ 0 γ 1 γ 2 γ 3 , (5.339)
que satisface
{γ 5 , γ µ } = 0, y (γ 5 )2 = +1. (5.340)
Además, se verifica que
[Σµν , γ 5 ] = 0 (5.341)
lo que implica que ψ̄γ 5 ψ es un escalar frente a rotaciones y boosts. No es invarian-
te frente a transformaciones de paridad, por ello se dice que es un pseudoescalar.
Definimos entonces los operadores
1
P± = (1 ± γ 5 ) (5.342)
2
que satisfacen P+2 = P+ , P−2 = P− y P+ P− = 0, es decir, son proyectores. En la
representación quiral la matriz γ 5 es
!
5 −I 0
γ = , (5.343)
0 I
ψ± = P± ψ (5.344)
que se transforman frente a rotaciones y boosts con una representación irreducible del
grupo de Lorentz. Estos dos espinores se intercambian mediante una transformación
de paridad (5.324), ψ → P ψ, donde P = γ 0 ,
ψ± → ψ∓ (5.345)
218 5.20 Una interpretación fı́sica de las matrices de Dirac
2
Ahora bien, como (αi ) = 1, los autovalores de αi son ±1 y los autovalores de
cada componente de la “velocidad”, según la fórmula (5.350) serı́an ±c, en clara
contradicción con el hecho de que en la mecánica relativista una partı́cula masiva no
puede viajar a la velocidad de la luz. Además, dado que [αi , αj ] ̸= 0, de hacerse una
interpretación ingenua de la ecuación (5,350), se tendrı́a que no es posible medir las
tres componentes de la velocidad simultáneamente.
Volvamos a utilizar la ecuación de Heisenberg (5.348) pero ahora tomando A =
α1 = αx . Se tiene
dαx i 2 2i
= [H, αx ] = (cpx − αx H) = (Hαx − cpx ) . (5.352)
dt ℏ iℏ ℏ
Para escribir esta fórmula hemos utilizado que
Hαx = cp · ααx + βαx mc2 (5.353)
= cpx + cpy αy αx + cpz αz αx x + βαx mc2 (5.354)
= 2cpx − cαx px αx + py αy + pz αz − βmc2 (5.355)
de donde
Hαx = 2cpx − αx H (5.356)
y
[H, αx ] = 2 (cpx − αx H) (5.357)
Tanto H como px son independientes del tiempo por lo que, derivando otra vez
se tiene
d2 αx 2 dαx 2 dαx
2
= H=− H . (5.358)
dt iℏ dt iℏ dt
Aquı́ hemos usado la fórmula (5.356) y que d ⟨px ⟩ /dt = 0. Imponiendo una condición
inicial,
dαx
= αx0 (5.359)
dt t=0
se puede integrar (5.358) y se obtiene
dαx 2iHt 2iHt
= αx0 exp − = exp αx0 . (5.360)
dt ℏ ℏ
Luego, usando (5.352),
iℏ 0 2iHt
αx H = αx exp − + cpx . (5.361)
2 ℏ
Si multiplicamos por cH −1 = H/E 2 a derecha se tiene
dx iℏc 0 2iHt H H
= αx exp − 2
+ c2 p x 2 (5.362)
dt 2 ℏ E E
220 5.21 La ecuación de Dirac en presencia de un campo electromagnético
e e µ
γν γµ p − Aν pµ −
ν
A − m2 c2 ψ = 0 (5.371)
c c
e e µ
γν γµ pν − Aν pµ − 2 2
A − m c ψ = 0. (5.372)
c c
Podemos descomponer al producto γ ν γ µ en sus partes simétrica y antisimétrica,
se obtiene
e e eℏ
p − Aµ
µ
pµ − Aµ ψ − σ µν Fµν ψ − m2 c2 ψ = 0 (5.377)
c c 2c
222 5.22 El lı́mite no-relativista
eℏ α · E ℏ vEp v2
≈ = 2 (5.384)
2mc eϕ 2mc c E ℏ 2c
Entonces, en la aproximación no relativista tendremos
2 !
1 e eℏ
p− A + eϕ − Σ · B ψ = E ′ψ (5.385)
2m c 2mc
que no es otra cosa que la ecuación de Pauli para el electrón norelativista31 sólo que
el término que habı́a tenido que ajustarse de manera ad hoc en el caso no relativista,
por provenir de un análisis semiclásico, aquı́ aparece automáticamente. Si µs es el
momento magnético del electrón y µB = eℏ/(2mc) el magnetón de Bohr, se tiene la
relación
eℏ
µs = σ = µB σ (5.386)
2mc
Si aceptamos por el momento que, como en el caso de la ecuación para la partı́cula
libre las componentes se separan en grandes y pequeñas, tendremos para las grandes
exactamente la ecuación de Pauli, con una relación entre momento magnético y spin
dada por
µs e µB
= =2 (5.387)
s mc ℏ
que es el doble que la que resulta en el análisis clásico de la relación entre momento
angular orbital y momento magnético,
µl e µB
= = (5.388)
l 2mc ℏ
Pero justamente el factor 2 en (5.387) habı́a debido incluirse manu militari en la
formulación de Pauli del electrón no relativista para reproducir los resultados ex-
perimentales de la época. En otras palabras, debı́a postularse un factor llamado
giromagnético, que se denota como g, que multiplica la fórmula clásica (5.388),
µs µB
=g . (5.389)
s ℏ
31
Recordemos que en las soluciones de la ecuación de Dirac para una partı́cula libre las compo-
nentes de energı́a negativa eran del orden O(v 2 /c2 )
224 5.22 El lı́mite no-relativista
¿Quiere decir esto que la teorı́a de Dirac del electrón es incorrecta? La respuesta es
que en realidad, la teorı́a de Dirac es incompleta, en el sentido de que describe la
dinámica cuántica del electrón en el campo electromagnético clásico del núcleo (en
el caso de la descripción de un átomo).
Es recién cuando se hace un tratamiento completamente cuántico, tanto para el
electrón como para el campo electromagnético asociado al campo de gauge Aµ en
el que se mueve, que el valor predicho por la ecuación de Dirac recibe correcciones
(llamadas radiativas). En lo que se considera uno de los grandes triunfos de la elec-
trodinámica cuántica (la teorı́a cuántica de los campos electromagneticos asociados
al núcleo y el electrón) el valor teórico que se calcula en teorı́a de perturbaciones
resulta
gteor = 2 × (1,001159652459 ± 0,000000000123). (5.391)
Dejemos ahora a la ecuación de Klein-Gordon que es obedecida por las soluciones
de la ecuación de Dirac y analicemos directamente a esta última ab initio
e
γµ p − Aµ − mc ψ = 0
µ
(5.392)
c
Para estudiar la manera en que las componentes “grandes” (ψA ) y “pequeñas”
(ψB ) se separan, vamos a considerar una representación explı́cita para las matrices
γ µ . Conviene elegir la representación de Dirac que lleva a la ecuación (multiplicando
por γ 0 = β y recordando que γ = βα )
" ! ! # ! !
0 I I 0 ψA ψA
σ · (cp − eA) + mc2 = (E − eϕ) (5.393)
I 0 0 −I ψB ψB
Este sistema es equivalente al sistema acoplado para los espinores de dos com-
ponentes ψ A y ψ B
−1
ψ B = E − eϕ + mc2 σ · (cp − eA)ψ A (5.395)
o, escribiendo nuevamente E = E ′ + mc2 ,
−1
ψ B = E ′ − eϕ + 2mc2 σ · (cp − eA)ψ A . (5.396)
Para simplificar los cálculos nos restringiremos al caso puramente eléctrico, A = 0,
y denotaremos eϕ = V ). El lı́mite no relativista corresponde a que
y por lo tanto,
cσ · p A v
B
ψ ≈ 2
ψ ∼O ψA. (5.398)
2mc c
Es decir que la solución de 4 componentes tiene dos grandes componentes ψ A y dos
pequeñas componentes ψ B como sucedı́a para la partı́cula libre. Notemos además
que, si bien ψ está normalizada, esto no implica que cada una de las componentes
ψA y ψB lo esté. En efecto, de la condición de normalización,
con lo cual podemos introducir una componente grande con la normalización ade-
cuada, Ψ (spinor de dos componentes), en la forma
!
p2
ψA = 1 − Ψ. (5.401)
8m2 c2
(σ · p)(σ · p) = p2 , (5.406)
E′ − V
" ! # !
p2 1 ′ p2
− σ·p σ·p+V −E 1− Ψ = 0. (5.407)
2m 2m 2mc2 8m2 c2
p2 V = pi pi V = pi V pi + pi (−iℏ)∂i V = V p2 − 2iℏ ∇V · p − ℏ2 ∇2 V
dV (r) dV (r) r
∇V = ∇r = (5.410)
dr dr r
32
De la relación entre matrices de Pauli
obtenemos
(σ · p)(σ · p) = σi σj pi pj = δij pi pj + iεijk σk pi pj = p2 . (5.405)
El segundo término se anula por ser contracción de un tensor simétrico y uno antisimétrico.
Mecánica cuántica Relativista 227
Ze2
V (r) = −
4πr
tenemos que (V = eϕ, E = −∇ϕ)
tiene una invarianza muy importante, llamada de gauge, asociada con las transfor-
maciones de gauge que dejan invariante al tensor de campo electromagnético. En
efecto, recordemos que
Fµν = ∂µ Aν − ∂ν Aµ (5.413)
permanece invariante ante el cambio del campo de gauge Aµ
con Λ(x) una función real arbitraria. Que Fµν permanezca invariante frente a las
transformaciones de gauge (5.414) quiere decir que ni la medida experimental del
campo eléctrico ni la del magnético, que son las cantidades fı́sicas justamente medi-
bles detectan si trabajamos con Aµ o con A′µ : Recordemos que
1
B i [A] = εijk Fjk [A] (5.415)
2
i
E [ϕ, A] = F 0i [ϕ, A] (5.416)
donde
B =∇×A
1 ∂A (5.418)
E = −∇ϕ − .
c ∂t
Esta invarianza implica que los campos Aµ y sus transformados de gauge son
todos admisibles para describir a los campos eléctrico y magnético. Por ello, según
el problema que enfrentemos podemos trabajar usando “un dado gauge” u otro. Por
ejemplo podemos elegir una función Λ tal que anule la componente A0 simplemente
utilizando un Λ tal que ∂0 Λ cancele ese A0 . Ese gauge se conoce como “gauge de
Coulomb”. En otras circunstancias puede convenir elegir Λ tal que ∂ µ Λµ = 0 (gauge
de Lorenz34 ).
Ahora bien, podrı́a suceder que al interactuar estos campos con un electrón
descripto por una función de onda que obedece la ecuación de Dirac, la función de
onda detectara de una manera medible el cambio. Veremos que en general este no
es el caso35 .
Para analizar lo anterior, comencemos por notar que al cambiar Aµ por A′µ en
la ecuación de Dirac, se agrega un término, el gradiente de ψ. Si la transformación
34
Este Lorenz no es el Lorentz de las transformaciones relativistas sino Ludvig Lorenz, un fı́sico
y matemático danés.
35
Véase el experimento de Aharanov-Bohm para una descripción más precisa de este asunto
Mecánica cuántica Relativista 229
Puede verse que no solo la acción (5.421) sino el Lagrangiano, su integrando, es inva-
riante frente a las transformaciones de gauge (5.419). Es válido entonces recurrir al
teorema de Noether que establece que, como pasa con toda invarianza de un Lagran-
giano, existe una carga conservada asociada a esa invarianza. Para encontrarla, en
230 5.23 Invarianza de gauge
δL e
jµ (x)ϵ(x) = δψ = − ψ̄γ µ ψϵ(x) (5.424)
δ∂µ ψ c
¡Es decir que la corriente conservada de Noether asociada con la invarianza de gauge
coincide, a menos de un factor constante, con la corriente de probabilidad cuya
componente temporal da la densidad de probabilidad! Para ello basta reescribir a la
corriente jµ como
e
jµ (x) = − Jµ (x) (5.425)
c
con
Jµ (x) = ψ̄(x)γ µ ψ(x), ∂µ J µ (x) = 0. (5.426)
´
Luego, la carga conservada, la integral de J0 sobre todo el espacio, Q = dr ψ ∗ ψ,
no es otra cosa que la expresión de que la probabilidad de encontrar a la partı́cula
descripta por la ecuación de Schrödinger es 1.
Volviendo a la transformación de gauge (5,414) con parámetro real arbitrario
Λ(x),
Aµ (x) → A′µ = Aµ (x) + ∂µ Λ(x) (5.427)
podrı́amos escribirla en una forma en apariencia más complicada,
1
Aµ (x) → A′µ = Aµ (x) + g −1 (x)∂µ g(x) (5.428)
i
con
g(x) = exp(iΛ(x)) (5.429)
En esta forma, g(x) puede ser identificado como uno de los elementos del grupo
unitario U(1) formado por los complejos de módulo 1. Esto podrı́a pensarse que es un
detalle irrelevante para las transformaciones de gauge del electromagnetismo. Pero
no es ası́: La teorı́a de las interacciones electrodébiles, que unifican a los fenómenos
electromagnéticos con los débiles está basado en la extensión de las invarianzas de
la teorı́a agregando otro grupo unitario con determinante 1 , el identificado como
SU(2) cuya representación fundamental es el de matrices de 2×2 (por ejemplo, dada
por las 3 matrices de Pauli). Y para describir las interacciones fuertes, también se
Mecánica cuántica Relativista 231
∂2 2 ∂ 1
∇2 = 2
+ − 2 2 L2 (5.432)
∂r r ∂r ℏ r
L2 ψn,l,m = ℏ2 l(l + 1)ψn,l,m . (5.433)
232 5.24 Átomos hidrogenoides
m(Zα)2
ϵn = − (5.436)
2n2
con
mα2
= 13,6eV (5.437)
2
y
n ⩾ 1, l = 0, 1, 2, . . . n − 1, −l ⩽ m ⩽ l. (5.438)
La degeneración d(n) del estado n es
n−1
(2l + 1) = n2
X
d(n) = (5.439)
l=0
Veremos que, con el tratamiento relativista, esta degeneración decrece y aparece una
estructura fina en el espectro, no prevista por el tratamiento no-relativista.
Pasemos ahora al estudio detallado del mismo problema pero utilizando la ecua-
ción relativista de Dirac. Como se trata del potencial Coulombiano en átomos hi-
drogenoides (con un número de protones Z ) tendremos
Ze
A0 = − (5.440)
4πr
y, como no hay campo magnético, pondremos nuevamente A = 0.
En lo que sigue conviene utilizar la representación de Weyl (quiral) de las matrices
de Dirac, ! !
0 0 I 0 σ
γ =− γ= (5.441)
I 0 −σ 0
En lugar de estudiar directamente la ecuación de Dirac, escribiremos la que
resulta de aplicar a esa ecuación el operador de Dirac (con el signo relativo entre
Mecánica cuántica Relativista 233
con
!
σi 0
σ 0i = i . (5.443)
0 −σ i
Con esto, el término ligado al spin que aparece en la ecuación (5.442) puede escribirse
según sea el signo con que aparecen las matrices de Pauli de 2 × 2 σ i en la matriz
σ 0i de 4 × 4,
e σ·r
− σ 0i F0i = ±iZα 3 (5.444)
2 r
(téngase en cuenta que para escribir el vector contravariante r a partir de la deri-
vada covariante ∂i hay que incluir un signo − debido a la signatura elegida para la
métrica.)
En la ec. (5.444) debe tomarse el signo + cuando se trate de la componente χ+ y
el signo − cuando se trate de la componente χ− en que descomponemos al espinor
de 4 componentes. Las componentes χ± son cada una un espinor de Weyl de 2
componentes,
!
χ+
ψ= (5.445)
χ−
Ecuación de Schrödinger
!
∂2 2 ∂ L2 2mZα
− 2− + 2 − − 2mϵ ψ = 0 (5.448)
∂r r ∂r r r
Ahora bien, si comparamos las ecuaciones de Klein-Gordon y la de Schrödinger,
vemos que formalmente son idénticas si se hacen las siguientes sustituciones en la
de Schrödinger:
en el término que contiene L2
L2 → L′2 = L2 − Z 2 α2 (5.449)
en el que contiene a α
ϵ
α → α′ = α (5.450)
m
-
Mecánica cuántica Relativista 235
y el álgebra de Clifford,
{αi , αj } = 2δij , (5.465)
verifican la relación
αi αj = δij + 2iϵijk αk . (5.466)
De aquı́ se sigue que para dos vectores arbitrarios a y b se cumple que
(α · a)(α · b) = a · b + iα · (a × b) (5.467)
J = L + S, (5.475)
238 5.26 Potencial coulombiano
Es decir, calcular ⟨jml|H|jml⟩. Ahora bien, dado que estos autoestados tienen una
paridad definida, ligada a l36 , tendremos que los elementos de matriz del operador
hermı́tico σ · r̂ (de paridad impar) se anulan entre estados con el mismo l,
para insertarla en
1 = (σ · r̂)2 =
X
σ · r̂ |jml± ⟩ ⟨jml± | σ · r̂. (5.484)
±
para cancelar los brackets entre estados + + y − −y, además, que las matrices de
Pauli son, por supuesto, hermı́ticas.
36
La parte angular de los kets, proyectados en la representación de coordenadas son armónicos
esféricos que, ante un cambio de paridad r → −r, que corresponde en coordenadas esféricas a
(r, θ, φ) → (r, π − θ, φ + π), satisfacen que Ylm (θ, φ) = (−1)l Ylm (π − θ, φ + π).
Mecánica cuántica Relativista 239
Los brackets del tercero, cuarto y quinto término puede escribirse ası́:
D E
jml± | L2 − Z 2 α2 ∓ iZασ · r̂ |jml± =
1 3
j+ 2
j+ 2
− Z 2 α2 ∓iZα
1
1
. (5.489)
∓iZα j− 2
j+ 2
− Z 2 α2
n′ = (n − δj ) − λ − 1 (5.492)
que formalmente coincide con la fórmula (5.458) para el caso de Klein-Gordon, pero
con δj dado en este caso por (5.491)
s
2
1 1
δj = j + − j+ − Z 2 α2 . (5.498)
2 2
Vemos que la energı́a no depende de l de manera que en principio habrá una
degeneración de los niveles. Para cada valor de j hay dos valores posibles de l, l =
j ± 1/2 excepto en el caso en que j = n − 1/2 en que l = n − 1 (la otra posibilidad
llevarı́a a n = l siendo que l ⩽ n − 1. Salvo para este caso habrá entonces una
degeneración doble de los niveles.
Desarrollando en potencias de α2 tendremos
mc2 Z 2 α2 mc2 Z 4 α4 3 mc2 Z 4 α4
En,j ≈ mc2 − − + + ... (5.499)
2n2 n3 (2j + 1) 8 n4
con n = 1, 2 . . . y j = 1/2, 3/2, . . . , n − 1/2.
Vemos entonces que, para un dado n, diferentes valores de j implican diferentes
valores de la energı́a de los niveles. Esto produce la llamada estructura fina (por ello
a la constante α se la llame constante de estructura fina).
Queda, como vemos, una degeneración de estados que se distinguen por su mo-
mento angular orbital l, que puede ser j ±1/2 excepto para el caso en que j = n−1/2
en el que l = n − 1.
Para tener una idea de la magnitud del desdoblamiento en niveles con el mismo
n y j diferente, consideremos el caso en que Z = 1; n = 2; j = 1/2, 3/2; l = 1
(correspondiendo este valor a la letra P en la notación espectroscópica). Se tiene
mα4
ϵ 2P3/2 − ϵ 2P1/2 ≈ = 4,53 × 10−5 eV → 10,9GHz (5.500)
32
Mecánica cuántica Relativista 91241
2P3/2
triplete
mc2
-mc2
fotón
electrón de energía
negativa que es
excitado y salta a
un estado de
energía positiva
e-
e+
Señala Pais [10], fı́sico y biógrafo de Dirac que este, inicialmente, no vio clara-
Se puede interpretar entonces al agujero como una ver
mente lo que sucedı́a: a principios de 1928 propuso simplemente descartar la solución
con energı́a negativa. En junio de ese año admitió en una conferencia que no se la
cula con carga positiva.
podı́a ignorar y calificó por ello a su ecuación como aproximada. Hacia principios
Señala Pais [10], fı́sico y biógrafo de Dirac que este, ini
de 1929 , junto con Weyl, comienzó a especular que la solución de energı́a negativa,
como podı́a verse como una partı́cula con carga positiva, corresponderı́a a un protón
vio claramente lo que sucedı́a: a principios de 1928 propuso
y pensó que la masa de su ecuación debı́a ser un promedio de las masas del electrón
y del protón (!!). De hecho, el tı́tulo de su trabajo en 1930 era A theory of electrons
descartar la solución con energı́a negativa. En junio de es
and protons [11]. Recién en mayo de 1931 descartó esto y escribió , en lo que él llamó
en una conferencia que no se la podı́a ignorar y calificó
a small step forward (!!!) [12]:
A hole,ecuación como
if there were one, wouldaproximada. Haciaunknown
be a new kind of particle, principios
to experi- de 1929, jun
mental physics, having the same mass and opposite charge of the electron.
comienzó a especular que la solución de energı́a negativa
Antes verse
de fin decomo una
año (y de que partı́cula
Dirac cumplieracon carga
29 años) Carlpositiva,
Anderson, quecorresponderı́
aparentemente ignoraba la teorı́a de Dirac, anunció evidencia experimental para el
y pensó
anti-electrón o positrón que lapor
sugerido masa
Dirac. de su ecuación
Se trataba debı́a
de la observación de la ser
traza un promedio
dejada pordel rayoselectrón y del aprotón
cósmicos sometidos un campo(!!). De hecho,
magnético, el tı́tulo
en una cámara de de su tra
Wilson. La dirección en que se curvaba la traza correspondı́a a una partı́cula con
eray masa
carga positiva A theory
mucho menorof que
electrons
un protón. and protons [11]. Recién en m
Una vez creado el agujero, un electrón con energı́a positiva (el mismo que fuera
eyectado, udescartó esto alyestado
otro), puede “caer” escribió , en
con energı́a lo que
negativa eél llamó
correspondiente, que “ a small s
(!!!)
se encontraba [12]: Se aniquilan ası́ el electrón que cae y el positrón asociado
desocupado.
con el agujero; la energı́a disponible al desaparecer el par electrón-positrón se ma-
nifiesta como emisionón de un fotón. Usando nuevamente un diagrama, tendrı́amos,
para el proceso completo, en el cual un fotón “crea” originalmente un par electrón-
A hole, if there were one, would be a new kind of part
positrón, que luego se aniquila dando un fotón:
to experimental physics, having the same mass and oppo
De hecho, un proceso como el de la figura anterior puede suceder aún si el
fotón tiene energı́a menor que la mı́nima necesaria (Emin = 2mc2 ) para crear un
the electron.
par electrón-positrón. Esto sucede cuando un campo electromagnético produce un
reacomodamiento de carga dando origen a una “polarización del vacı́o”. Esto, que
e-
e+
La figura
“marmuestra
de Dirac”eloespectro de de
un electrón energı́a
Dirac de
libreuncon
electrón
energı́a de Dirac:Ena la
positiva. la parte
izquierda
de en el
la derecha,
caso libre, en el cuando
derechoactúa
en elel caso
potencial el potencialCoulombiano
del potencial de Coulomb sobre un electron,
atractivo. Nótese que
vemos que el espectro comprende una franja continua de energı́a positiva que se
mc2 =extiende
511 kev mientras que el nivel ms bajo del atomo de hidrógeno
desde mc hasta +∞, una serie discreta de energı́a positiva inferior a mc2
2 corresponde
a una (el
energı́a deobservado
espectro 13.6 eV en el átomo de hidrógeno) y una franja continua de energı́a
negativa desde −mc2 hasta −∞.
La figura muestra el espectro de energı́a de un electrón de Dirac: a la izquierda en
Conjugación de carga
el caso libre, en el derecho en el caso del potencial Coulombiano atractivo. Nótese que
mc2 = 511 KeV mientras que el nivel más bajo del átomo de hidrógeno corresponde
a una energı́a de 13,6 eV
La teorı́a de agujeros para explicar el rol de los estados de energı́a ne-
gativa de la teorı́a relativista de Dirac para el electrón, implica la exis-
tencia5.28. Conjugación
de partı́culas con la misma de carga masa, el mismo spin y carga opuesta,
los electrones
La teorı́a yde positrones. La ecuación
agujeros para explicar el rol de losde Dirac
estados debenegativa
de energı́a entonces
de la admi-
teorı́a relativista de Dirac para el electrón, implica la existencia de partı́culas con la
tir una nueva simetrı́a que corresponda al intercambio entre partı́cula
misma masa, el mismo spin y carga opuesta, los electrones y positrones. La ecuación
(electrón)
de Diracydebe
antipartı́cula
entonces admitir(positrón).
una nueva simetrı́a que corresponda al intercambio
entre partı́culaentonces
Busquemos (electrón) y una
antipartı́cula (positrón).
transformación que pase de un espinor ψ,
Busquemos entonces una transformación que pase de un espinor ψ, que describa C
que describa
una partı́culaunaconpartı́cula con auna
una dada carga, dada carga,
otro espinor a otrouno
ψ c que describe espinor
con cargaψ que
describe uno
opuesta. con
Estos cargadeben
espinores opuesta. Estos
obedecer las espinores
siguientes ecuacionesdeben obedecer
(tomamos unida- las
des naturales, c = 1 y ℏ = 1)
siguientes ecuaciones
(iγ µ ∂µ − eγ µ Aµ − m) ψ = 0 para el electrón (5.501)
(iγ µ ∂µ −(iγ
eγµ∂µµA+µeγ− µ
Am) ψ ψc ==0 0para el positrón
µ − m) para el electrón
(5.502) (7.32)
µ µ
(iγ una
Buscamos ∂µ + eγ Aµ −
transformación m) ψ C = 0 para el positrón (7.33)
c
ψ→ψ (5.503)
Buscamos
que sea una
local ytransformación
que, hecha dos veces sucesivamente deje a ψ sin cambiar, a menos
ψ → ψC (7.34)
que sea local y que, hecha dos veces sucesivamente deje a ψ sin cam-
biar, a menos de una fase inobservable. Para obtenerla, tomemos (7.32),
246 5.28 Conjugación de carga
γ µ∗ = −C −1 γ µ C. (5.505)
0
0
ψ= exp(imt) (5.509)
0
1
1
0
ψ c = −iγ 2 ψ ∗ = exp(−imt)
. (5.510)
0
0
en la que las matrices γ son reales, (γ µ )∗ = γ µ . Esto significa que los generadores
(5.235) Σµν = 4i [γ µ , γ ν ] son imaginarios puros, y la transformación (5.234) S[Λ] =
i µν
e− 2 ωµν Σ es real. Entonces en esta base del álgebra de Clifford podemos trabajar
con un espinor real, imponiendo la condición
ψ = ψ∗ (5.512)
ψ c = Cψ ∗ (5.513)
ψc = ψ (5.514)
1 n−1
f˜k = √ fj e−2πijk/n ,
X
k = 0, . . . , n − 1.
n j=0
Conocidos los n valores f˜k , los n valores fj pueden recuperarse exactamente mediante
la transformación inversa, dada por
1 n−1
f˜k e2πijk/n ,
X
fj = √ j = 0, . . . , n − 1
n k=0
k=0
para j − j ′ entero.
Bibliografı́a
250
BIBLIOGRAFÍA 251